Lines Matching refs:dst1
285 int16_t* dst1 = dst + 8;
310 __lsx_vst(in0_l, dst1, 0);
311 __lsx_vstx(in1_l, dst1, dst_stride_x);
312 __lsx_vstx(in2_l, dst1, dst_stride_2x);
313 __lsx_vstx(in3_l, dst1, dst_stride_3x);
315 dst1 += dst_stride_2x;
327 __lsx_vst(in0_l, dst1, 0);
328 __lsx_vstx(in1_l, dst1, dst_stride_x);
329 __lsx_vstx(in2_l, dst1, dst_stride_2x);
330 __lsx_vstx(in3_l, dst1, dst_stride_3x);
332 dst1 += dst_stride_2x;
369 int16_t *dst1 = dst;
395 dst1 = dst + 8;
396 __lsx_vst(in0_l, dst1, 0);
397 __lsx_vstx(in1_l, dst1, dst_stride_x);
398 __lsx_vstx(in2_l, dst1, dst_stride_2x);
399 __lsx_vstx(in3_l, dst1, dst_stride_3x);
402 dst1 = dst1 + 8;
403 __lsx_vst(in0_r, dst1, 0);
404 __lsx_vstx(in1_r, dst1, dst_stride_x);
405 __lsx_vstx(in2_r, dst1, dst_stride_2x);
406 __lsx_vstx(in3_r, dst1, dst_stride_3x);
614 __m128i dst0, dst1, dst2, dst3;
641 dst1 = __lsx_vdp2_h_bu_b(vec0, filt0);
642 DUP2_ARG3(__lsx_vdp2add_h_bu_b, dst1, vec1, filt1, dst1, vec2, filt2,
643 dst1, dst1);
644 dst1 = __lsx_vdp2add_h_bu_b(dst1, vec3, filt3);
660 __lsx_vstelm_d(dst1, dst + dst_stride_2x, 0, 0);
661 __lsx_vstelm_d(dst1, dst + dst_stride_3x, 0, 1);
700 __m128i dst0, dst1, dst2, dst3;
724 dst1 = __lsx_vdp2_h_bu_b(vec0, filt0);
725 DUP2_ARG3(__lsx_vdp2add_h_bu_b, dst1, vec1, filt1, dst1, vec2, filt2,
726 dst1, dst1);
727 dst1 = __lsx_vdp2add_h_bu_b(dst1, vec3, filt3);
742 __lsx_vstx(dst1, dst, dst_stride_x);
761 __m128i filt0, filt1, filt2, filt3, dst0, dst1, dst2, dst3, dst4, dst5;
793 vec3, filt0, dst0, dst1, dst2, dst3);
801 DUP4_ARG3(__lsx_vdp2add_h_bu_b, dst0, vec0, filt1, dst1, vec1, filt1,
802 dst2, vec2, filt1, dst3, vec3, filt1, dst0, dst1, dst2, dst3);
811 DUP4_ARG3(__lsx_vdp2add_h_bu_b, dst0, vec0, filt2, dst1, vec1, filt2,
812 dst2, vec2, filt2, dst3, vec3, filt2, dst0, dst1, dst2, dst3);
821 DUP4_ARG3(__lsx_vdp2add_h_bu_b, dst0, vec0, filt3, dst1, vec1, filt3,
822 dst2, vec2, filt3, dst3, vec3, filt3, dst0, dst1, dst2, dst3);
829 __lsx_vst(dst1, dst, 0);
850 __m128i dst0, dst1, dst2, dst3;
872 vec3, filt0, dst0, dst1, dst2, dst3);
877 DUP4_ARG3(__lsx_vdp2add_h_bu_b, dst0, vec0, filt1, dst1, vec1, filt1,
878 dst2, vec2, filt1, dst3, vec3, filt1, dst0, dst1, dst2, dst3);
883 DUP4_ARG3(__lsx_vdp2add_h_bu_b, dst0, vec0, filt2, dst1, vec1, filt2,
884 dst2, vec2, filt2, dst3, vec3, filt2, dst0, dst1, dst2, dst3);
889 DUP4_ARG3(__lsx_vdp2add_h_bu_b, dst0, vec0, filt3, dst1, vec1, filt3,
890 dst2, vec2, filt3, dst3, vec3, filt3, dst0, dst1, dst2, dst3);
893 __lsx_vst(dst1, dst, 16);
910 __m128i dst0, dst1, dst2, dst3, dst4, dst5;
933 vec3, filt0, dst0, dst1, dst2, dst3);
939 DUP4_ARG3(__lsx_vdp2add_h_bu_b, dst0, vec0, filt1, dst1, vec1, filt1,
940 dst2, vec2, filt1, dst3, vec3, filt1, dst0, dst1, dst2, dst3);
947 DUP4_ARG3(__lsx_vdp2add_h_bu_b, dst0, vec0, filt2, dst1, vec1, filt2,
948 dst2, vec2, filt2, dst3, vec3, filt2, dst0, dst1, dst2, dst3);
955 DUP4_ARG3(__lsx_vdp2add_h_bu_b, dst0, vec0, filt3, dst1, vec1, filt3,
956 dst2, vec2, filt3, dst3, vec3, filt3, dst0, dst1, dst2, dst3);
961 __lsx_vst(dst1, dst, 16);
980 __m128i dst0, dst1, dst2, dst3;
1006 dst1 = __lsx_vdp2_h_bu_b(vec0, filt0);
1007 DUP2_ARG3(__lsx_vdp2add_h_bu_b, dst1, vec1, filt1, dst1, vec2, filt2,
1008 dst1, dst1);
1009 dst1 = __lsx_vdp2add_h_bu_b(dst1, vec3, filt3);
1024 __lsx_vst(dst1, dst, 16);
1040 __m128i dst0, dst1, dst2, dst3, dst4, dst5;
1061 vec3, filt0, dst0, dst1, dst2, dst3);
1064 DUP4_ARG3(__lsx_vdp2add_h_bu_b, dst0, vec0, filt1, dst1, vec1, filt1,
1065 dst2, vec2, filt1, dst3, vec3, filt1, dst0, dst1, dst2, dst3);
1068 DUP4_ARG3(__lsx_vdp2add_h_bu_b, dst0, vec0, filt2, dst1, vec1, filt2,
1069 dst2, vec2, filt2, dst3, vec3, filt2, dst0, dst1, dst2, dst3);
1072 DUP4_ARG3(__lsx_vdp2add_h_bu_b, dst0, vec0, filt3, dst1, vec1, filt3,
1073 dst2, vec2, filt3, dst3, vec3, filt3, dst0, dst1, dst2, dst3);
1075 __lsx_vst(dst1, dst, 16);
1109 __m128i dst0, dst1, dst2, dst3, dst4, dst5, dst6, dst7;
1137 dst1 = __lsx_vdp2_h_bu_b(vec0, filt0);
1138 DUP2_ARG3(__lsx_vdp2add_h_bu_b, dst1, vec1, filt1, dst1, vec2, filt2,
1139 dst1, dst1);
1140 dst1 = __lsx_vdp2add_h_bu_b(dst1, vec3, filt3);
1141 __lsx_vst(dst1, dst, 16);
1810 __m128i dst0, dst1, dst2, dst3, dst4, dst5, dst6, dst7;
1855 dst1 = __lsx_vdp2_h_bu_b(vec4, filt0);
1856 DUP2_ARG3(__lsx_vdp2add_h_bu_b, dst1, vec5, filt1, dst1, vec6, filt2,
1857 dst1, dst1);
1858 dst1 = __lsx_vdp2add_h_bu_b(dst1, vec7, filt3);
1899 DUP4_ARG2(__lsx_vilvl_h, dst1, dst0, dst3, dst2, dst5, dst4, dst7,
1901 DUP4_ARG2(__lsx_vilvh_h, dst1, dst0, dst3, dst2, dst5, dst4, dst7,
1918 dst0 = dst1;
1919 dst1 = dst2;
1957 __m128i dst0, dst1, dst2, dst3, dst4, dst5, dst6, dst7;
2003 dst1 = __lsx_vdp2_h_bu_b(vec4, filt0);
2004 DUP2_ARG3(__lsx_vdp2add_h_bu_b, dst1, vec5, filt1, dst1, vec6, filt2,
2005 dst1, dst1);
2006 dst1 = __lsx_vdp2add_h_bu_b(dst1, vec7, filt3);
2046 DUP4_ARG2(__lsx_vilvl_h, dst1, dst0, dst3, dst2, dst5, dst4, dst7, dst6,
2048 DUP4_ARG2(__lsx_vilvh_h, dst1, dst0, dst3, dst2, dst5, dst4, dst7, dst6,
2064 dst0 = dst1;
2065 dst1 = dst2;
2234 __m128i dst0, dst1, dst2, dst3;
2253 vec3, filt0, dst0, dst1, dst2, dst3);
2258 DUP4_ARG3(__lsx_vdp2add_h_bu_b, dst0, vec0, filt1, dst1, vec1, filt1,
2259 dst2, vec2, filt1, dst3, vec3, filt1, dst0, dst1, dst2, dst3);
2261 __lsx_vst(dst1, dst, 16);
2548 __m128i dst0, dst1, dst2, dst3, dst4;
2574 vec6, filt0, dst0, dst1, dst2, dst3);
2575 DUP4_ARG3(__lsx_vdp2add_h_bu_b, dst0, vec1, filt1, dst1, vec3, filt1,
2576 dst2, vec5, filt1, dst3, vec7, filt1, dst0, dst1, dst2, dst3);
2580 DUP2_ARG2(__lsx_vilvl_h, dst1, dst0, dst2, dst1, dst10_r, dst21_r);
2581 DUP2_ARG2(__lsx_vilvh_h, dst1, dst0, dst2, dst1, dst10_l, dst21_l);
2613 __m128i dst0, dst1, dst2, dst3, dst4, dst5, dst6;
2643 DUP2_ARG2(__lsx_vdp2_h_bu_b, vec0, filt0, vec2, filt0, dst0, dst1);
2644 DUP2_ARG3(__lsx_vdp2add_h_bu_b, dst0, vec1, filt1, dst1, vec3, filt1,
2645 dst0, dst1);
2649 DUP2_ARG2(__lsx_vilvl_h, dst1, dst0, dst2, dst1, dst10_r, dst21_r);
2650 DUP2_ARG2(__lsx_vilvh_h, dst1, dst0, dst2, dst1, dst10_l, dst21_l);
2715 __m128i dst0, dst1, dst2, dst3, dst4, dst5, dst6, dst7, dst8;
2751 filt0, dst0, dst1, dst2, dst3);
2752 DUP4_ARG3(__lsx_vdp2add_h_bu_b, dst0, vec1, filt1, dst1, vec3, filt1,
2753 dst2, vec5, filt1, dst3, vec7, filt1, dst0, dst1, dst2, dst3);
2761 DUP4_ARG2(__lsx_vilvl_h, dst1, dst0, dst2, dst1, dst3, dst2, dst4, dst3,
2763 DUP4_ARG2(__lsx_vilvh_h, dst1, dst0, dst2, dst1, dst3, dst2, dst4, dst3,
2831 __m128i dst0, dst1, dst2, dst3, dst4, dst5, dst6;
2861 DUP2_ARG2(__lsx_vdp2_h_bu_b, vec0, filt0, vec2, filt0, dst0, dst1);
2862 DUP2_ARG3(__lsx_vdp2add_h_bu_b, dst0, vec1, filt1, dst1, vec3, filt1,
2863 dst0, dst1);
2867 DUP2_ARG2(__lsx_vilvl_h, dst1, dst0, dst2, dst1, dst10_r, dst21_r);
2868 DUP2_ARG2(__lsx_vilvh_h, dst1, dst0, dst2, dst1, dst10_l, dst21_l);
2979 __m128i dst1, dst2, dst3, dst4, dst5, dst6, dst10, dst21, dst22, dst73;
3008 DUP2_ARG2(__lsx_vdp2_h_bu_b, vec0, filt0, vec2, filt0, dst0, dst1);
3010 DUP2_ARG3(__lsx_vdp2add_h_bu_b, dst0, vec1, filt1, dst1, vec3, filt1,
3011 dst0, dst1);
3014 DUP2_ARG2(__lsx_vilvl_h, dst1, dst0, dst2, dst1, dst10_r, dst21_r);
3015 DUP2_ARG2(__lsx_vilvh_h, dst1, dst0, dst2, dst1, dst10_l, dst21_l);