Lines Matching refs:src1
26 put_pixels8_l2_8_lsx(uint8_t *dst, const uint8_t *src1, const uint8_t *src2,
39 "vld $vr0, %[src1], 0 \n\t"
40 "vldx $vr1, %[src1], %[srcStride1] \n\t"
41 "vldx $vr2, %[src1], %[stride1_2] \n\t"
42 "vldx $vr3, %[src1], %[stride1_3] \n\t"
43 "add.d %[src1], %[src1], %[stride1_4] \n\t"
67 : [dst]"+&r"(dst), [src2]"+&r"(src2), [src1]"+&r"(src1),
79 put_pixels16_l2_8_lsx(uint8_t *dst, const uint8_t *src1, const uint8_t *src2,
96 "vld $vr0, %[src1], 0 \n\t"
97 "vldx $vr1, %[src1], %[srcStride1] \n\t"
98 "vldx $vr2, %[src1], %[stride1_2] \n\t"
99 "vldx $vr3, %[src1], %[stride1_3] \n\t"
100 "add.d %[src1], %[src1], %[stride1_4] \n\t"
121 : [dst]"+&r"(dst), [src2]"+&r"(src2), [src1]"+&r"(src1),
284 __m256i src0, src1, src2, src3, src4, src5, src6, src7;
291 DUP2_ARG2(__lasx_xvldx, _src, src_stride, _src, src_stride_2x, src1, src2);
298 DUP4_ARG3(__lasx_xvpermi_q, src1, src0, 0x20, src3, src2, 0x20, src5,
299 src4, 0x20, src7, src6, 0x20, src0, src1, src2, src3);
301 src1 = __lasx_xvavg_bu(src1, src3);
308 __lasx_xvstelm_d(src1, dst, 0, 0);
309 __lasx_xvstelm_d(src1, dst, 8, 1);
311 __lasx_xvstelm_d(src1, dst, 0, 2);
312 __lasx_xvstelm_d(src1, dst, 8, 3);
316 DUP2_ARG2(__lasx_xvldx, _src, src_stride, _src, src_stride_2x, src1, src2);
323 DUP4_ARG3(__lasx_xvpermi_q, src1, src0, 0x20, src3, src2, 0x20, src5, src4,
324 0x20, src7, src6, 0x20, src0, src1, src2, src3);
326 src1 = __lasx_xvavg_bu(src1, src3);
333 __lasx_xvstelm_d(src1, dst, 0, 0);
334 __lasx_xvstelm_d(src1, dst, 8, 1);
336 __lasx_xvstelm_d(src1, dst, 0, 2);
337 __lasx_xvstelm_d(src1, dst, 8, 3);
341 DUP2_ARG2(__lasx_xvldx, _src, src_stride, _src, src_stride_2x, src1, src2);
348 DUP4_ARG3(__lasx_xvpermi_q, src1, src0, 0x20, src3, src2, 0x20, src5, src4,
349 0x20, src7, src6, 0x20, src0, src1, src2, src3);
351 src1 = __lasx_xvavg_bu(src1, src3);
358 __lasx_xvstelm_d(src1, dst, 0, 0);
359 __lasx_xvstelm_d(src1, dst, 8, 1);
361 __lasx_xvstelm_d(src1, dst, 0, 2);
362 __lasx_xvstelm_d(src1, dst, 8, 3);
366 DUP2_ARG2(__lasx_xvldx, _src, src_stride, _src, src_stride_2x, src1, src2);
372 DUP4_ARG3(__lasx_xvpermi_q, src1, src0, 0x20, src3, src2, 0x20, src5, src4,
373 0x20, src7, src6, 0x20, src0, src1, src2, src3);
375 src1 = __lasx_xvavg_bu(src1, src3);
382 __lasx_xvstelm_d(src1, dst, 0, 0);
383 __lasx_xvstelm_d(src1, dst, 8, 1);
385 __lasx_xvstelm_d(src1, dst, 0, 2);
386 __lasx_xvstelm_d(src1, dst, 8, 3);
393 __m256i src0, src1, src2, src3, src4, src5, src6, src7;
400 DUP2_ARG2(__lasx_xvldx, _src, src_stride, _src, src_stride_2x, src1, src2);
407 DUP4_ARG3(__lasx_xvpermi_q, src1, src0, 0x20, src3, src2, 0x20, src5, src4,
408 0x20, src7, src6, 0x20, src0, src1, src2, src3);
410 src1 = __lasx_xvavg_bu(src1, src3);
417 __lasx_xvstelm_d(src1, dst, 0, 0);
418 __lasx_xvstelm_d(src1, dst, 8, 1);
420 __lasx_xvstelm_d(src1, dst, 0, 2);
421 __lasx_xvstelm_d(src1, dst, 8, 3);
425 DUP2_ARG2(__lasx_xvldx, _src, src_stride, _src, src_stride_2x, src1, src2);
431 DUP4_ARG3(__lasx_xvpermi_q, src1, src0, 0x20, src3, src2, 0x20, src5, src4,
432 0x20, src7, src6, 0x20, src0, src1, src2, src3);
434 src1 = __lasx_xvavg_bu(src1, src3);
441 __lasx_xvstelm_d(src1, dst, 0, 0);
442 __lasx_xvstelm_d(src1, dst, 8, 1);
444 __lasx_xvstelm_d(src1, dst, 0, 2);
445 __lasx_xvstelm_d(src1, dst, 8, 3);
462 __m256i src0, src1, src2, src3, src4, src5, src6, src7, src8;
470 DUP2_ARG2(__lasx_xvldx, _src, src_stride, _src, src_stride_2x, src1, src2);
488 DUP4_ARG3(__lasx_xvpermi_q, src1, src0, 0x20, src2, src1, 0x20, src3, src2,
489 0x20, src4, src3, 0x20, src0, src1, src2, src3);
496 DUP4_ARG2(__lasx_xvavg_bu, src0, src1, src2, src3, src4, src5, src6, src7,
554 __m256i src0, src1, src2, src3, src4, src5, src6, src7, src8;
561 DUP2_ARG2(__lasx_xvldx, _src, src_stride, _src, src_stride_2x, src1, src2);
570 DUP4_ARG3(__lasx_xvpermi_q, src1, src0, 0x20, src2, src1, 0x20, src3, src2,
571 0x20, src4, src3, 0x20, src0, src1, src2, src3);
574 DUP4_ARG2(__lasx_xvavg_bu, src0, src1, src2, src3, src4, src5, src6, src7,
616 __m256i src0, src1, src2, src3, src4, src5, src6, src7, src8, src9;
625 DUP2_ARG2(__lasx_xvldx, _src, src_stride, _src, src_stride_2x, src1, src2);
644 DUP4_ARG3(__lasx_xvpermi_q, src0, src4, 0x02, src1, src5, 0x02, src2,
645 src6, 0x02, src3, src7, 0x02, src0, src1, src2, src3);
650 DUP4_ARG2(__lasx_xvilvl_h, src5, src0, src6, src1, src7, src2, src8, src3,
652 DUP4_ARG2(__lasx_xvilvh_h, src5, src0, src6, src1, src7, src2, src8, src3,
658 sum3, sum3, src0, src1, src2, src3);
663 DUP4_ARG2(__lasx_xvadd_h, src0, src2, src1, src3, src2, src4, src3, src5,
699 DUP2_ARG2(__lasx_xvldx, _src, src_stride, _src, src_stride_2x, src1, src2);
718 DUP4_ARG3(__lasx_xvpermi_q, src0, src4, 0x02, src1, src5, 0x02, src2, src6, 0x02,
719 src3, src7, 0x02, src0, src1, src2, src3);
724 DUP4_ARG2(__lasx_xvilvl_h, src5, src0, src6, src1, src7, src2, src8, src3,
726 DUP4_ARG2(__lasx_xvilvh_h, src5, src0, src6, src1, src7, src2, src8, src3,
732 sum3, sum3, src0, src1, src2, src3);
737 DUP4_ARG2(__lasx_xvadd_h, src0, src2, src1, src3, src2, src4, src3, src5,
776 __m256i src0, src1, src2, src3, src4, src5, src6, src7, src8, src9;
785 DUP2_ARG2(__lasx_xvldx, _src, src_stride, _src, src_stride_2x, src1, src2);
804 DUP4_ARG3(__lasx_xvpermi_q, src0, src4, 0x02, src1, src5, 0x02, src2,
805 src6, 0x02, src3, src7, 0x02, src0, src1, src2, src3);
810 DUP4_ARG2(__lasx_xvilvl_h, src5, src0, src6, src1, src7, src2, src8, src3,
812 DUP4_ARG2(__lasx_xvilvh_h, src5, src0, src6, src1, src7, src2, src8, src3,
818 sum3, sum3, src0, src1, src2, src3);
823 DUP4_ARG2(__lasx_xvadd_h, src0, src2, src1, src3, src2, src4, src3, src5,
873 __m256i src0, src1, src2, src3, src4, src5, src6, src7;
884 DUP2_ARG2(__lasx_xvldx, _src, src_stride, _src, src_stride_2x, src1, src2);
900 DUP4_ARG2(__lasx_xvpickev_d, src1, src0, src3, src2, src5, src4, src7,
901 src6, src0, src1, src2, src3);
904 DUP4_ARG3(__lasx_xvpermi_q, src1, src0, 0x20, src3, src2, 0x20, src5, src4,
905 0x20, src7, src6, 0x20, src0, src1, src2, src3);
907 src1 = __lasx_xvavg_bu(src1, src3);
913 __lasx_xvstelm_d(src1, dst, 0, 0);
914 __lasx_xvstelm_d(src1, dst + dst_stride, 0, 1);
915 __lasx_xvstelm_d(src1, dst + dst_stride_2x, 0, 2);
916 __lasx_xvstelm_d(src1, dst + dst_stride_3x, 0, 3);
923 __m256i src0, src1, src2, src3, src4, src5, src6, src7;
931 DUP2_ARG2(__lasx_xvldx, _src, src_stride, _src, src_stride_2x, src1, src2);
937 DUP4_ARG2(__lasx_xvpickev_d, src1, src0, src3, src2, src5, src4, src7, src6,
938 src0, src1, src2, src3);
939 DUP2_ARG3(__lasx_xvpermi_q, src1, src0, 0x20, src3, src2, 0x20, src0, src1);
940 src0 = __lasx_xvavg_bu(src0, src1);
960 __m256i src0, src1, src2, src3, src4, src5, src6, src7, src8;
970 DUP2_ARG2(__lasx_xvldx, _src, src_stride, _src, src_stride_2x, src1, src2);
979 DUP4_ARG2(__lasx_xvpickev_d, src1, src0, src2, src1, src3, src2, src4, src3,
980 src0, src1, src2, src3);
983 DUP4_ARG3(__lasx_xvpermi_q, src2, src0, 0x20, src3, src1, 0x20, src6, src4,
984 0x20, src7, src5, 0x20, src0, src1, src2, src3);
985 src0 = __lasx_xvavg_bu(src0, src1);
986 src1 = __lasx_xvavg_bu(src2, src3);
992 __lasx_xvstelm_d(src1, dst, 0, 0);
993 __lasx_xvstelm_d(src1, dst + dst_stride, 0, 1);
994 __lasx_xvstelm_d(src1, dst + dst_stride_2x, 0, 2);
995 __lasx_xvstelm_d(src1, dst + dst_stride_3x, 0, 3);
1001 __m256i src0, src1, src2, src3, src4;
1011 src_stride_3x, _src, src_stride_4x, src1, src2, src3, src4);
1012 DUP4_ARG2(__lasx_xvpickev_d, src1, src0, src2, src1, src3, src2, src4, src3,
1013 src0, src1, src2, src3);
1014 DUP2_ARG3(__lasx_xvpermi_q, src2, src0, 0x20, src3, src1, 0x20, src0, src1);
1015 src0 = __lasx_xvavg_bu(src0, src1);
1035 __m256i src0, src1, src2, src3, src4, src5, src6, src7;
1047 DUP2_ARG2(__lasx_xvldx, _src, src_stride, _src, src_stride_2x, src1, src2);
1066 DUP4_ARG2(__lasx_xvilvl_b, src9, src0, src10, src1, src11, src2, src12, src3,
1067 src0, src1, src2, src3);
1071 DUP4_ARG3(__lasx_xvpermi_q, src1, src0, 0x20, src2, src1, 0x20, src3, src2,
1072 0x20, src4, src3, 0x20, src0, src1, src2, src3);
1075 DUP4_ARG2(__lasx_xvhaddw_hu_bu, src0, src0, src1, src1, src2, src2,
1076 src3, src3, src0, src1, src2, src3);
1079 DUP4_ARG2(__lasx_xvadd_h, src0, src1, src2, src3, src4, src5, src6, src7,
1098 __m256i src0, src1, src2, src3, src4, src5, src6, src7;
1108 DUP2_ARG2(__lasx_xvldx, _src, src_stride, _src, src_stride_2x, src1, src2);
1117 DUP4_ARG2(__lasx_xvilvl_b, src5, src0, src6, src1, src7, src2, src8, src3,
1118 src0, src1, src2, src3);
1120 DUP4_ARG3(__lasx_xvpermi_q, src1, src0, 0x20, src2, src1, 0x20, src3, src2,
1121 0x20, src4, src3, 0x20, src0, src1, src2, src3);
1122 DUP4_ARG2(__lasx_xvhaddw_hu_bu, src0, src0, src1, src1, src2, src2,
1123 src3, src3, src0, src1, src2, src3);
1124 DUP2_ARG2(__lasx_xvadd_h, src0, src1, src2, src3, sum0, sum1);
1148 __m256i src0, src1, src2, src3, src4, src5, src6, src7, src8, src9;
1159 DUP2_ARG2(__lasx_xvldx, _src, src_stride, _src, src_stride_2x, src1, src2);
1178 DUP4_ARG3(__lasx_xvpermi_q, src0, src4, 0x02, src1, src5, 0x02, src2,
1179 src6, 0x02, src3, src7, 0x02, src0, src1, src2, src3);
1185 DUP4_ARG2(__lasx_xvilvl_h, src5, src0, src6, src1, src7, src2, src8,
1187 DUP4_ARG2(__lasx_xvilvh_h, src5, src0, src6, src1, src7, src2, src8,
1193 sum3, sum3, src0, src1, src2, src3);
1198 DUP4_ARG2(__lasx_xvadd_h, src0, src2, src1, src3, src2, src4, src3,
1241 __m256i src0, src1, src2, src3, src4, src5, src6, src7;
1256 src1 = __lasx_xvld(_src, 0);
1264 DUP4_ARG2(__lasx_xvilvl_b, src5, src0, src6, src1, src7, src2, src8, src3,
1265 src0, src1, src2, src3);
1267 DUP4_ARG3(__lasx_xvpermi_q, src1, src0, 0x20, src2, src1, 0x20, src3, src2,
1268 0x20, src5, src3, 0x20, src0, src1, src2, src3);
1269 DUP4_ARG2(__lasx_xvhaddw_hu_bu, src0, src0, src1, src1, src2, src2,
1270 src3, src3, src0, src1, src2, src3);
1271 DUP2_ARG2(__lasx_xvadd_h, src0, src1, src2, src3, sum0, sum1);