Lines Matching refs:src0

284     __m256i src0, src1, src2, src3, src4, src5, src6, src7;
290 src0 = __lasx_xvld(_src, 0);
298 DUP4_ARG3(__lasx_xvpermi_q, src1, src0, 0x20, src3, src2, 0x20, src5,
299 src4, 0x20, src7, src6, 0x20, src0, src1, src2, src3);
300 src0 = __lasx_xvavg_bu(src0, src2);
302 __lasx_xvstelm_d(src0, dst, 0, 0);
303 __lasx_xvstelm_d(src0, dst, 8, 1);
305 __lasx_xvstelm_d(src0, dst, 0, 2);
306 __lasx_xvstelm_d(src0, dst, 8, 3);
315 src0 = __lasx_xvld(_src, 0);
323 DUP4_ARG3(__lasx_xvpermi_q, src1, src0, 0x20, src3, src2, 0x20, src5, src4,
324 0x20, src7, src6, 0x20, src0, src1, src2, src3);
325 src0 = __lasx_xvavg_bu(src0, src2);
327 __lasx_xvstelm_d(src0, dst, 0, 0);
328 __lasx_xvstelm_d(src0, dst, 8, 1);
330 __lasx_xvstelm_d(src0, dst, 0, 2);
331 __lasx_xvstelm_d(src0, dst, 8, 3);
340 src0 = __lasx_xvld(_src, 0);
348 DUP4_ARG3(__lasx_xvpermi_q, src1, src0, 0x20, src3, src2, 0x20, src5, src4,
349 0x20, src7, src6, 0x20, src0, src1, src2, src3);
350 src0 = __lasx_xvavg_bu(src0, src2);
352 __lasx_xvstelm_d(src0, dst, 0, 0);
353 __lasx_xvstelm_d(src0, dst, 8, 1);
355 __lasx_xvstelm_d(src0, dst, 0, 2);
356 __lasx_xvstelm_d(src0, dst, 8, 3);
365 src0 = __lasx_xvld(_src, 0);
372 DUP4_ARG3(__lasx_xvpermi_q, src1, src0, 0x20, src3, src2, 0x20, src5, src4,
373 0x20, src7, src6, 0x20, src0, src1, src2, src3);
374 src0 = __lasx_xvavg_bu(src0, src2);
376 __lasx_xvstelm_d(src0, dst, 0, 0);
377 __lasx_xvstelm_d(src0, dst, 8, 1);
379 __lasx_xvstelm_d(src0, dst, 0, 2);
380 __lasx_xvstelm_d(src0, dst, 8, 3);
393 __m256i src0, src1, src2, src3, src4, src5, src6, src7;
399 src0 = __lasx_xvld(_src, 0);
407 DUP4_ARG3(__lasx_xvpermi_q, src1, src0, 0x20, src3, src2, 0x20, src5, src4,
408 0x20, src7, src6, 0x20, src0, src1, src2, src3);
409 src0 = __lasx_xvavg_bu(src0, src2);
411 __lasx_xvstelm_d(src0, dst, 0, 0);
412 __lasx_xvstelm_d(src0, dst, 8, 1);
414 __lasx_xvstelm_d(src0, dst, 0, 2);
415 __lasx_xvstelm_d(src0, dst, 8, 3);
424 src0 = __lasx_xvld(_src, 0);
431 DUP4_ARG3(__lasx_xvpermi_q, src1, src0, 0x20, src3, src2, 0x20, src5, src4,
432 0x20, src7, src6, 0x20, src0, src1, src2, src3);
433 src0 = __lasx_xvavg_bu(src0, src2);
435 __lasx_xvstelm_d(src0, dst, 0, 0);
436 __lasx_xvstelm_d(src0, dst, 8, 1);
438 __lasx_xvstelm_d(src0, dst, 0, 2);
439 __lasx_xvstelm_d(src0, dst, 8, 3);
462 __m256i src0, src1, src2, src3, src4, src5, src6, src7, src8;
469 src0 = __lasx_xvld(_src, 0);
488 DUP4_ARG3(__lasx_xvpermi_q, src1, src0, 0x20, src2, src1, 0x20, src3, src2,
489 0x20, src4, src3, 0x20, src0, src1, src2, src3);
496 DUP4_ARG2(__lasx_xvavg_bu, src0, src1, src2, src3, src4, src5, src6, src7,
497 src0, src2, src4, src6);
501 __lasx_xvstelm_d(src0, dst, 0, 0);
502 __lasx_xvstelm_d(src0, dst, 8, 1);
504 __lasx_xvstelm_d(src0, dst, 0, 2);
505 __lasx_xvstelm_d(src0, dst, 8, 3);
554 __m256i src0, src1, src2, src3, src4, src5, src6, src7, src8;
560 src0 = __lasx_xvld(_src, 0);
570 DUP4_ARG3(__lasx_xvpermi_q, src1, src0, 0x20, src2, src1, 0x20, src3, src2,
571 0x20, src4, src3, 0x20, src0, src1, src2, src3);
574 DUP4_ARG2(__lasx_xvavg_bu, src0, src1, src2, src3, src4, src5, src6, src7,
575 src0, src2, src4, src6);
577 __lasx_xvstelm_d(src0, dst, 0, 0);
578 __lasx_xvstelm_d(src0, dst, 8, 1);
580 __lasx_xvstelm_d(src0, dst, 0, 2);
581 __lasx_xvstelm_d(src0, dst, 8, 3);
616 __m256i src0, src1, src2, src3, src4, src5, src6, src7, src8, src9;
624 src0 = __lasx_xvld(_src, 0);
644 DUP4_ARG3(__lasx_xvpermi_q, src0, src4, 0x02, src1, src5, 0x02, src2,
645 src6, 0x02, src3, src7, 0x02, src0, src1, src2, src3);
650 DUP4_ARG2(__lasx_xvilvl_h, src5, src0, src6, src1, src7, src2, src8, src3,
652 DUP4_ARG2(__lasx_xvilvh_h, src5, src0, src6, src1, src7, src2, src8, src3,
658 sum3, sum3, src0, src1, src2, src3);
663 DUP4_ARG2(__lasx_xvadd_h, src0, src2, src1, src3, src2, src4, src3, src5,
698 src0 = __lasx_xvld(_src, 0);
718 DUP4_ARG3(__lasx_xvpermi_q, src0, src4, 0x02, src1, src5, 0x02, src2, src6, 0x02,
719 src3, src7, 0x02, src0, src1, src2, src3);
724 DUP4_ARG2(__lasx_xvilvl_h, src5, src0, src6, src1, src7, src2, src8, src3,
726 DUP4_ARG2(__lasx_xvilvh_h, src5, src0, src6, src1, src7, src2, src8, src3,
732 sum3, sum3, src0, src1, src2, src3);
737 DUP4_ARG2(__lasx_xvadd_h, src0, src2, src1, src3, src2, src4, src3, src5,
776 __m256i src0, src1, src2, src3, src4, src5, src6, src7, src8, src9;
784 src0 = __lasx_xvld(_src, 0);
804 DUP4_ARG3(__lasx_xvpermi_q, src0, src4, 0x02, src1, src5, 0x02, src2,
805 src6, 0x02, src3, src7, 0x02, src0, src1, src2, src3);
810 DUP4_ARG2(__lasx_xvilvl_h, src5, src0, src6, src1, src7, src2, src8, src3,
812 DUP4_ARG2(__lasx_xvilvh_h, src5, src0, src6, src1, src7, src2, src8, src3,
818 sum3, sum3, src0, src1, src2, src3);
823 DUP4_ARG2(__lasx_xvadd_h, src0, src2, src1, src3, src2, src4, src3, src5,
873 __m256i src0, src1, src2, src3, src4, src5, src6, src7;
883 src0 = __lasx_xvld(_src, 0);
900 DUP4_ARG2(__lasx_xvpickev_d, src1, src0, src3, src2, src5, src4, src7,
901 src6, src0, src1, src2, src3);
904 DUP4_ARG3(__lasx_xvpermi_q, src1, src0, 0x20, src3, src2, 0x20, src5, src4,
905 0x20, src7, src6, 0x20, src0, src1, src2, src3);
906 src0 = __lasx_xvavg_bu(src0, src2);
908 __lasx_xvstelm_d(src0, dst, 0, 0);
909 __lasx_xvstelm_d(src0, dst + dst_stride, 0, 1);
910 __lasx_xvstelm_d(src0, dst + dst_stride_2x, 0, 2);
911 __lasx_xvstelm_d(src0, dst + dst_stride_3x, 0, 3);
923 __m256i src0, src1, src2, src3, src4, src5, src6, src7;
930 src0 = __lasx_xvld(_src, 0);
937 DUP4_ARG2(__lasx_xvpickev_d, src1, src0, src3, src2, src5, src4, src7, src6,
938 src0, src1, src2, src3);
939 DUP2_ARG3(__lasx_xvpermi_q, src1, src0, 0x20, src3, src2, 0x20, src0, src1);
940 src0 = __lasx_xvavg_bu(src0, src1);
941 __lasx_xvstelm_d(src0, dst, 0, 0);
942 __lasx_xvstelm_d(src0, dst + dst_stride, 0, 1);
943 __lasx_xvstelm_d(src0, dst + dst_stride_2x, 0, 2);
944 __lasx_xvstelm_d(src0, dst + dst_stride_3x, 0, 3);
960 __m256i src0, src1, src2, src3, src4, src5, src6, src7, src8;
969 src0 = __lasx_xvld(_src, 0);
979 DUP4_ARG2(__lasx_xvpickev_d, src1, src0, src2, src1, src3, src2, src4, src3,
980 src0, src1, src2, src3);
983 DUP4_ARG3(__lasx_xvpermi_q, src2, src0, 0x20, src3, src1, 0x20, src6, src4,
984 0x20, src7, src5, 0x20, src0, src1, src2, src3);
985 src0 = __lasx_xvavg_bu(src0, src1);
987 __lasx_xvstelm_d(src0, dst, 0, 0);
988 __lasx_xvstelm_d(src0, dst + dst_stride, 0, 1);
989 __lasx_xvstelm_d(src0, dst + dst_stride_2x, 0, 2);
990 __lasx_xvstelm_d(src0, dst + dst_stride_3x, 0, 3);
1001 __m256i src0, src1, src2, src3, src4;
1009 src0 = __lasx_xvld(_src, 0);
1012 DUP4_ARG2(__lasx_xvpickev_d, src1, src0, src2, src1, src3, src2, src4, src3,
1013 src0, src1, src2, src3);
1014 DUP2_ARG3(__lasx_xvpermi_q, src2, src0, 0x20, src3, src1, 0x20, src0, src1);
1015 src0 = __lasx_xvavg_bu(src0, src1);
1016 __lasx_xvstelm_d(src0, dst, 0, 0);
1017 __lasx_xvstelm_d(src0, dst + dst_stride, 0, 1);
1018 __lasx_xvstelm_d(src0, dst + dst_stride_2x, 0, 2);
1019 __lasx_xvstelm_d(src0, dst + dst_stride_3x, 0, 3);
1035 __m256i src0, src1, src2, src3, src4, src5, src6, src7;
1046 src0 = __lasx_xvld(_src, 0);
1066 DUP4_ARG2(__lasx_xvilvl_b, src9, src0, src10, src1, src11, src2, src12, src3,
1067 src0, src1, src2, src3);
1071 DUP4_ARG3(__lasx_xvpermi_q, src1, src0, 0x20, src2, src1, 0x20, src3, src2,
1072 0x20, src4, src3, 0x20, src0, src1, src2, src3);
1075 DUP4_ARG2(__lasx_xvhaddw_hu_bu, src0, src0, src1, src1, src2, src2,
1076 src3, src3, src0, src1, src2, src3);
1079 DUP4_ARG2(__lasx_xvadd_h, src0, src1, src2, src3, src4, src5, src6, src7,
1098 __m256i src0, src1, src2, src3, src4, src5, src6, src7;
1107 src0 = __lasx_xvld(_src, 0);
1117 DUP4_ARG2(__lasx_xvilvl_b, src5, src0, src6, src1, src7, src2, src8, src3,
1118 src0, src1, src2, src3);
1120 DUP4_ARG3(__lasx_xvpermi_q, src1, src0, 0x20, src2, src1, 0x20, src3, src2,
1121 0x20, src4, src3, 0x20, src0, src1, src2, src3);
1122 DUP4_ARG2(__lasx_xvhaddw_hu_bu, src0, src0, src1, src1, src2, src2,
1123 src3, src3, src0, src1, src2, src3);
1124 DUP2_ARG2(__lasx_xvadd_h, src0, src1, src2, src3, sum0, sum1);
1148 __m256i src0, src1, src2, src3, src4, src5, src6, src7, src8, src9;
1158 src0 = __lasx_xvld(_src, 0);
1178 DUP4_ARG3(__lasx_xvpermi_q, src0, src4, 0x02, src1, src5, 0x02, src2,
1179 src6, 0x02, src3, src7, 0x02, src0, src1, src2, src3);
1185 DUP4_ARG2(__lasx_xvilvl_h, src5, src0, src6, src1, src7, src2, src8,
1187 DUP4_ARG2(__lasx_xvilvh_h, src5, src0, src6, src1, src7, src2, src8,
1193 sum3, sum3, src0, src1, src2, src3);
1198 DUP4_ARG2(__lasx_xvadd_h, src0, src2, src1, src3, src2, src4, src3,
1241 __m256i src0, src1, src2, src3, src4, src5, src6, src7;
1252 DUP2_ARG2(__lasx_xvld, _src, 0, _src, 1, src0, src5);
1264 DUP4_ARG2(__lasx_xvilvl_b, src5, src0, src6, src1, src7, src2, src8, src3,
1265 src0, src1, src2, src3);
1267 DUP4_ARG3(__lasx_xvpermi_q, src1, src0, 0x20, src2, src1, 0x20, src3, src2,
1268 0x20, src5, src3, 0x20, src0, src1, src2, src3);
1269 DUP4_ARG2(__lasx_xvhaddw_hu_bu, src0, src0, src1, src1, src2, src2,
1270 src3, src3, src0, src1, src2, src3);
1271 DUP2_ARG2(__lasx_xvadd_h, src0, src1, src2, src3, sum0, sum1);
1278 src0 = src4;