Lines Matching refs:D3

392 my ($D0,$D1,$D2,$D3,$D4,$T0,$T1,$T2)=map("xmm$_",(0..7));
414 &movdqa ($D3,$D2);
416 &psrlq ($D3,30);
418 &pand ($D3,$MASK);
427 &movdqa (&QWP(16*3,"esp"),$D3);
438 &movdqa ($T1,$D3);
442 &paddd ($T1,$D3); # *5
451 &pshufd ($D3,$D3,0b01000100);
456 &movdqa (&QWP(16*3,"edx"),$D3);
467 &pmuludq ($D3,$D0); # h3*r0
489 &paddq ($D3,$T1);
505 &paddq ($D3,$T0);
521 &paddq ($D3,$T2);
537 &paddq ($D3,$T1);
559 &movdqa ($T0,$D3);
560 &pand ($D3,$MASK);
584 &paddd ($T1,$D3); # h2 -> h3
587 &movdqa ($D3,$T1);
591 &pand ($D3,$MASK);
602 &punpcklqdq ($D3,&QWP(16*3,"esp"));
610 &psllq ($D3,32);
615 &por ($D3,&QWP(16*3,"esp"));
621 &pshufd ($D3,$D3,0b10001101);
627 &movdqu (&QWP(16*3,"edi"),$D3);
638 &movdqa ($T1,$D3);
642 &paddd ($T1,$D3); # *5
695 &movd ($D3,"esi");
706 &movd ($D3,&DWP(4*3,"edi"));
749 &paddd ($D3,$T0);
759 &movdqa (&QWP(16*3,"esp"),$D3);
773 &pmuludq ($D3,$T1); # h1*r0
849 &movdqa (&QWP($offbase+16*3,"esp"),$D3);
853 &movdqa ($D3,$T1);
855 &psrldq ($D3,6);
857 &punpcklqdq ($D2,$D3); # 2:3
861 &movdqa ($D3,$D2);
863 &psrlq ($D3,30);
870 &pand ($D3,$MASK); # 3
894 &movdqa (&QWP(16*3,"eax"),$D3);
909 &pmuludq ($D3,$T2); # h3*r0
927 &paddq ($D3,$T0);
937 &paddq ($D3,$T0);
950 &paddq ($D3,$T1);
969 &paddq ($D3,$T1);
987 &paddd ($D3,&QWP(16*(5+3),"esp"));
997 &movdqa (&QWP(16*3,"eax"),$D3);
1013 &pmuludq ($D3,$T2); # h3*r0
1018 &paddq ($D3,&QWP(16*3,"esp"));
1040 &paddd ($D3,&QWP(16*8,"esp"));
1048 &movdqa (&QWP(16*3,"eax"),$D3);
1063 &pmuludq ($D3,$T2); # h3*r0
1079 &paddd ($D3,&QWP(16*8,"esp"));
1093 &movdqa ($T1,$D3);
1094 &pmuludq ($D3,$T2); # h3*r0
1098 &paddq ($D3,&QWP(16*3,"esp"));
1115 &pshufd ($T0,$D3,0b01001110);
1117 &paddq ($D3,$T0);
1131 &movd (&DWP(-16*3+4*3,"edi"),$D3);
1192 &movd ($D3,"edx");
1209 &movd ("edx",$D3);
1249 &vpsrldq ($D3,$D4,6);
1251 &vpsrlq ($D2,$D3,4)
1252 &vpsrlq ($D3,$D3,30);
1254 &vpand ($D3,$D3,$MASK);
1263 &vmovdqa (&QWP(16*3,"esp"),$D3);
1272 &vpslld ($T1,$D3,2);
1274 &vpaddd ($T1,$T1,$D3); # *5
1283 &vpshufd ($D3,$D3,0b01000100);
1288 &vmovdqa (&QWP(16*3,"edx"),$D3);
1299 &vpmuludq ($D3,$D3,$D0); # h3*r0
1307 &vpaddq ($D3,$D3,$T2);
1320 &vpaddq ($D3,$D3,$T2);
1334 &vpaddq ($D3,$D3,$T0);
1347 &vpaddq ($D3,$D3,$T1);
1358 &vpsrlq ($T0,$D3,26);
1359 &vpand ($D3,$D3,$MASK);
1374 &vpaddd ($D3,$D3,$T1); # h2 -> h3
1375 &vpsrlq ($T1,$D3,26);
1378 &vpand ($D3,$D3,$MASK);
1388 &vpunpcklqdq ($D3,$D3,&QWP(16*3,"esp"));
1396 &vpsllq ($D3,$D3,32);
1401 &vpor ($D3,$D3,&QWP(16*3,"esp"));
1407 &vpshufd ($D3,$D3,0b10001101);
1413 &vmovdqu (&QWP(16*3,"edi"),$D3);
1422 &vpslld ($T1,$D3,2);
1424 &vpaddd ($T1,$T1,$D3); # *5
1437 my ($D0,$D1,$D2,$D3,$D4,$T0,$T1,$T2)=map("ymm$_",(0..7));
1512 &vmovdqu (&X($D3),&QWP(16*(3+3),"edi"));
1518 &vpermq ($D3,$D3,0b01000000);
1523 &vpshufd ($D3,$D3,0b11001000);
1531 &vmovdqa (&QWP(32*3-128,"edx"),$D3);
1532 &vmovdqu (&X($D3),&QWP(16*8,"edi"));
1537 &vpermq ($D3,$D3,0b01000000);
1541 &vpshufd ($D3,$D3,0b11001000);
1548 &vmovdqa (&QWP(32*8-128,"edx"),$D3);
1549 &vmovd (&X($D3),&DWP(-16*3+4*3,"edi"));
1629 # returned in $D1-2, while $D3-4 are preserved;
1639 &vpaddq ($D0,$D0,$D3);
1649 &vpmuludq ($D3,$D2,&$addr(1)); # d3 = h2*r1
1659 &vpaddq ($D3,$D3,$T2); # d3 += h0*r3
1671 &vpaddq ($D3,$D3,$T1); # d3 += h1*r2
1683 &vpaddq ($D3,$D3,$T0); # d3 += h3*r0
1695 &vpaddq ($D3,$D3,$T2); # d3 += h4*s4
1712 &vpsrlq ($T0,$D3,26);
1713 &vpand ($D3,$D3,$MASK);
1728 &vpaddq ($D3,$D3,$T1); # h2 -> h3
1729 &vpsrlq ($T1,$D3,26);
1732 &vpand ($D3,$D3,$MASK);
1756 &vpsrldq ($T1,$D3,8);
1759 &vpaddq ($D3,$D3,$T1);
1766 &vpermq ($T0,$D3,2);
1769 &vpaddq ($D3,$D3,$T0);
1788 &vpshufd (&X($D3),&X($D3),0b11111100);
1796 &vmovd (&DWP(-16*3+4*3,"edi"),&X($D3));