Lines Matching refs:D2

392 my ($D0,$D1,$D2,$D3,$D4,$T0,$T1,$T2)=map("xmm$_",(0..7));
408 &movdqa ($D2,$D4);
412 &psrldq ($D2,6);
414 &movdqa ($D3,$D2);
415 &psrlq ($D2,4)
417 &pand ($D2,$MASK);
426 &movdqa (&QWP(16*2,"esp"),$D2);
431 &movdqa ($T0,$D2);
435 &paddd ($T0,$D2); # *5
450 &pshufd ($D2,$D2,0b01000100);
455 &movdqa (&QWP(16*2,"edx"),$D2);
468 &pmuludq ($D2,$D0); # h2*r0
492 &paddq ($D2,$T2);
508 &paddq ($D2,$T1);
524 &paddq ($D2,$T0);
544 &paddq ($D2,$T1);
578 &paddq ($T1,$D2); # h1 -> h2
581 &movdqa ($D2,$T1);
583 &pand ($D2,$MASK);
601 &punpcklqdq ($D2,&QWP(16*2,"esp"));
609 &psllq ($D2,32);
614 &por ($D2,&QWP(16*2,"esp"));
620 &pshufd ($D2,$D2,0b10001101);
626 &movdqu (&QWP(16*2,"edi"),$D2);
631 &movdqa ($T0,$D2);
635 &paddd ($T0,$D2); # *5
694 &movd ($D2,"edx");
705 &movd ($D2,&DWP(4*2,"edi"));
743 &paddd ($D2,$T1);
758 &movdqa (&QWP(16*2,"esp"),$D2);
771 &pmuludq ($D2,$T1); # h2*r0
848 &movdqa (&QWP($offbase+16*2,"esp"),$D2);
852 &movdqa ($D2,$T0); # splat input
854 &psrldq ($D2,6);
857 &punpcklqdq ($D2,$D3); # 2:3
861 &movdqa ($D3,$D2);
862 &psrlq ($D2,4);
869 &pand ($D2,$MASK); # 2
893 &movdqa (&QWP(16*2,"eax"),$D2);
908 &pmuludq ($D2,$T2); # h2*r0
924 &paddq ($D2,$T2);
934 &paddq ($D2,$T2);
963 &paddq ($D2,$T2);
976 &paddq ($D2,$T1);
986 &paddd ($D2,&QWP(16*(5+2),"esp"));
996 &movdqa (&QWP(16*2,"eax"),$D2);
1012 &pmuludq ($D2,$T2); # h2*r0
1017 &paddq ($D2,&QWP(16*2,"esp"));
1039 &paddd ($D2,&QWP(16*7,"esp"));
1047 &movdqa (&QWP(16*2,"eax"),$D2);
1060 &pmuludq ($D2,$T2); # h2*r0
1078 &paddd ($D2,&QWP(16*7,"esp"));
1090 &movdqa ($T0,$D2);
1091 &pmuludq ($D2,$T2); # h2*r0
1095 &paddq ($D2,&QWP(16*2,"esp"));
1122 &pshufd ($T1,$D2,0b01001110);
1123 #&paddq ($D2,$T1);
1125 &lazy_reduction (sub { &paddq ($D2,$T1) });
1130 &movd (&DWP(-16*3+4*2,"edi"),$D2);
1190 &movd ($D2,"ecx");
1207 &movd ("ecx",$D2);
1251 &vpsrlq ($D2,$D3,4)
1253 &vpand ($D2,$D2,$MASK);
1262 &vmovdqa (&QWP(16*2,"esp"),$D2);
1267 &vpslld ($T0,$D2,2);
1269 &vpaddd ($T0,$T0,$D2); # *5
1282 &vpshufd ($D2,$D2,0b01000100);
1287 &vmovdqa (&QWP(16*2,"edx"),$D2);
1300 &vpmuludq ($D2,$D2,$D0); # h2*r0
1309 &vpaddq ($D2,$D2,$T0);
1323 &vpaddq ($D2,$D2,$T0);
1336 &vpaddq ($D2,$D2,$T2);
1354 &vpaddq ($D2,$D2,$T0);
1368 &vpaddq ($D2,$D2,$T1); # h1 -> h2
1371 &vpsrlq ($T1,$D2,26);
1372 &vpand ($D2,$D2,$MASK);
1387 &vpunpcklqdq ($D2,$D2,&QWP(16*2,"esp"));
1395 &vpsllq ($D2,$D2,32);
1400 &vpor ($D2,$D2,&QWP(16*2,"esp"));
1406 &vpshufd ($D2,$D2,0b10001101);
1412 &vmovdqu (&QWP(16*2,"edi"),$D2);
1417 &vpslld ($T0,$D2,2);
1419 &vpaddd ($T0,$T0,$D2); # *5
1437 my ($D0,$D1,$D2,$D3,$D4,$T0,$T1,$T2)=map("ymm$_",(0..7));
1511 &vmovdqu (&X($D2),&QWP(16*(3+2),"edi"));
1517 &vpermq ($D2,$D2,0b01000000);
1522 &vpshufd ($D2,$D2,0b11001000);
1529 &vmovdqa (&QWP(32*2-128,"edx"),$D2);
1530 &vmovdqu (&X($D2),&QWP(16*7,"edi"));
1536 &vpermq ($D2,$D2,0b01000000);
1540 &vpshufd ($D2,$D2,0b11001000);
1546 &vmovdqa (&QWP(32*7-128,"edx"),$D2);
1547 &vmovd (&X($D2),&DWP(-16*3+4*2,"edi"));
1609 &vmovdqa (&QWP(32*2,"esp"),$D2);
1610 &vpsrldq ($D2,$T0,6); # splat input
1616 &vpunpcklqdq ($D2,$D2,$D0); # 2:3
1618 &vpsrlq ($D0,$D2,30);
1619 &vpsrlq ($D2,$D2,4);
1622 &vpand ($D2,$D2,$MASK); # 2
1636 &vpaddq ($D2,$D2,&QWP(32*2,"esp")); # add hash value
1649 &vpmuludq ($D3,$D2,&$addr(1)); # d3 = h2*r1
1651 &vpmuludq ($D4,$D2,&$addr(2)); # d4 = h2*r2
1653 &vpmuludq ($D0,$D2,&$addr(7)); # d0 = h2*s3
1655 &vpmuludq ($D1,$D2,&$addr(8)); # d1 = h2*s4
1656 &vpmuludq ($D2,$D2,&$addr(0)); # d2 = h2*r0
1668 &vpaddq ($D2,$D2,$T0); # d2 += h0*r2
1680 &vpaddq ($D2,$D2,$T2); # d2 += h1*r1
1692 &vpaddq ($D2,$D2,$T1); # d2 += h3*s4
1704 &vpaddq ($D2,$D2,$T0); # d2 += h4*s3
1722 &vpaddq ($D2,$D2,$T1); # h1 -> h2
1725 &vpsrlq ($T1,$D2,26);
1726 &vpand ($D2,$D2,$MASK);
1762 &vpsrldq ($T0,$D2,8);
1765 &vpaddq ($D2,$D2,$T0);
1772 &vpermq ($T1,$D2,2);
1774 &vpaddq ($D2,$D2,$T1);
1787 &vpshufd (&X($D2),&X($D2),0b11111100);
1795 &vmovd (&DWP(-16*3+4*2,"edi"),&X($D2));