Lines Matching refs:vec2
52 #define FILT_8TAP_DPADD_S_H(vec0, vec1, vec2, vec3, \
59 tmp1 = __msa_dotp_s_h((v16i8) vec2, (v16i8) filt2); \
1030 v8i16 filt, vec0, vec1, vec2, vec3;
1055 mask3, filt0, filt1, filt2, filt3, vec2, vec3);
1056 SRARI_H4_SH(vec0, vec1, vec2, vec3, 7);
1057 SAT_SH4_SH(vec0, vec1, vec2, vec3, 7);
1058 PCKEV_B4_UB(vec0, vec0, vec1, vec1, vec2, vec2, vec3, vec3,
1132 v8i16 vec0, vec1, vec2, vec3, vec4, vec5, vec6, vec7;
1156 VSHF_B4_SH(src2, src2, mask0, mask1, mask2, mask3, vec2, vec6, vec10,
1160 DOTP_SB4_SH(vec0, vec1, vec2, vec3, filt0, filt0, filt0, filt0, vec0,
1161 vec1, vec2, vec3);
1165 vec1, vec2, vec3);
1168 ADDS_SH4_SH(vec0, vec8, vec1, vec9, vec2, vec10, vec3, vec11, out0,
1190 v8i16 vec0, vec1, vec2, vec3, vec4, vec5, vec6, vec7;
1216 VSHF_B4_SH(src2, src2, mask0, mask1, mask2, mask3, vec2, vec6, vec10,
1220 DOTP_SB4_SH(vec0, vec1, vec2, vec3, filt0, filt0, filt0, filt0, vec0,
1221 vec1, vec2, vec3);
1225 vec1, vec2, vec3);
1228 ADDS_SH4_SH(vec0, vec8, vec1, vec9, vec2, vec10, vec3, vec11, out0,
1249 v8i16 vec0, vec1, vec2, vec3, vec4, vec5, vec6, vec7;
1275 VSHF_B4_SH(src2, src2, mask0, mask1, mask2, mask3, vec2, vec6,
1279 DOTP_SB4_SH(vec0, vec1, vec2, vec3, filt0, filt0, filt0, filt0,
1280 vec0, vec1, vec2, vec3);
1284 vec0, vec1, vec2, vec3);
1287 ADDS_SH4_SH(vec0, vec8, vec1, vec9, vec2, vec10, vec3, vec11, out0,
1562 v8i16 hz_out7, hz_out8, hz_out9, res0, res1, vec0, vec1, vec2, vec3, vec4;
1594 vec2 = (v8i16) __msa_ilvev_b((v16i8) hz_out5, (v16i8) hz_out4);
1607 res0 = FILT_8TAP_DPADD_S_H(vec0, vec1, vec2, vec3, filt_vt0, filt_vt1,
1614 res1 = FILT_8TAP_DPADD_S_H(vec1, vec2, vec3, vec4, filt_vt0, filt_vt1,
1625 vec0 = vec2;
1627 vec2 = vec4;
1801 v8u16 vec2, vec3, filt;
1811 DOTP_UB2_UH(vec0, vec1, filt0, filt0, vec2, vec3);
1812 SRARI_H2_UH(vec2, vec3, 7);
1813 PCKEV_B2_UB(vec2, vec2, vec3, vec3, res0, res1);
1822 v16u8 vec0, vec1, vec2, vec3, filt0;
1835 VSHF_B2_UB(src4, src5, src6, src7, mask, mask, vec2, vec3);
1836 DOTP_UB4_UH(vec0, vec1, vec2, vec3, filt0, filt0, filt0, filt0,
1866 v8u16 vec0, vec1, vec2, vec3, filt;
1876 VSHF_B2_UH(src2, src2, src3, src3, mask, mask, vec2, vec3);
1877 DOTP_UB4_UH(vec0, vec1, vec2, vec3, filt0, filt0, filt0, filt0,
1878 vec0, vec1, vec2, vec3);
1879 SRARI_H4_UH(vec0, vec1, vec2, vec3, 7);
1880 PCKEV_B2_SB(vec1, vec0, vec3, vec2, src0, src1);
1890 v8u16 vec0, vec1, vec2, vec3, filt;
1902 VSHF_B2_UH(src2, src2, src3, src3, mask, mask, vec2, vec3);
1903 DOTP_UB4_UH(vec0, vec1, vec2, vec3, filt0, filt0, filt0, filt0,
1904 vec0, vec1, vec2, vec3);
1905 SRARI_H4_UH(vec0, vec1, vec2, vec3, 7);
1909 PCKEV_B2_SB(vec1, vec0, vec3, vec2, out0, out1);
1913 VSHF_B2_UH(src2, src2, src3, src3, mask, mask, vec2, vec3);
1914 DOTP_UB4_UH(vec0, vec1, vec2, vec3, filt0, filt0, filt0, filt0,
1915 vec0, vec1, vec2, vec3);
1916 SRARI_H4_UH(vec0, vec1, vec2, vec3, 7);
1917 PCKEV_B2_SB(vec1, vec0, vec3, vec2, out0, out1);
1926 VSHF_B2_UH(src2, src2, src3, src3, mask, mask, vec2, vec3);
1927 DOTP_UB4_UH(vec0, vec1, vec2, vec3, filt0, filt0, filt0, filt0,
1928 vec0, vec1, vec2, vec3);
1929 SRARI_H4_UH(vec0, vec1, vec2, vec3, 7);
1933 PCKEV_B2_SB(vec1, vec0, vec3, vec2, out0, out1);
1937 VSHF_B2_UH(src2, src2, src3, src3, mask, mask, vec2, vec3);
1938 DOTP_UB4_UH(vec0, vec1, vec2, vec3, filt0, filt0, filt0, filt0,
1939 vec0, vec1, vec2, vec3);
1940 SRARI_H4_UH(vec0, vec1, vec2, vec3, 7);
1941 PCKEV_B2_SB(vec1, vec0, vec3, vec2, out0, out1);
1967 v16u8 filt0, vec0, vec1, vec2, vec3, vec4, vec5, vec6, vec7;
1983 VSHF_B2_UB(src2, src2, src3, src3, mask, mask, vec2, vec3);
1986 DOTP_UB4_UH(vec0, vec1, vec2, vec3, filt0, filt0, filt0, filt0,
2007 VSHF_B2_UB(src2, src2, src3, src3, mask, mask, vec2, vec3);
2010 DOTP_UB4_UH(vec0, vec1, vec2, vec3, filt0, filt0, filt0, filt0,
2034 v16u8 filt0, vec0, vec1, vec2, vec3, vec4, vec5, vec6, vec7;
2056 VSHF_B2_UB(src2, src2, src3, src3, mask, mask, vec2, vec3);
2059 DOTP_UB4_UH(vec0, vec1, vec2, vec3, filt0, filt0, filt0, filt0,
2081 v16u8 filt0, vec0, vec1, vec2, vec3, vec4, vec5, vec6, vec7;
2100 VSHF_B2_UB(src2, src2, src3, src3, mask, mask, vec2, vec3);
2103 DOTP_UB4_UH(vec0, vec1, vec2, vec3, filt0, filt0, filt0, filt0,
2194 v16u8 src0, src1, src2, src3, src4, vec0, vec1, vec2, vec3, filt0;
2205 ILVR_B2_UB(src3, src2, src4, src3, vec2, vec3);
2206 DOTP_UB4_UH(vec0, vec1, vec2, vec3, filt0, filt0, filt0, filt0,
2220 v16u8 vec0, vec1, vec2, vec3, vec4, vec5, vec6, vec7, filt0;
2237 vec0, vec1, vec2, vec3);
2240 DOTP_UB4_UH(vec0, vec1, vec2, vec3, filt0, filt0, filt0, filt0,
2280 v16u8 vec0, vec1, vec2, vec3, vec4, vec5, vec6, vec7, filt0;
2295 ILVR_B2_UB(src1, src0, src2, src1, vec0, vec2);
2305 DOTP_UB2_UH(vec2, vec3, filt0, filt0, tmp2, tmp3);
2334 v16u8 vec0, vec1, vec2, vec3, vec4, vec5, vec6, vec7, filt0;
2348 ILVR_B2_UB(src1, src0, src2, src1, vec0, vec2);
2358 DOTP_UB2_UH(vec2, vec3, filt0, filt0, tmp2, tmp3);
2375 ILVR_B2_UB(src6, src5, src7, src6, vec0, vec2);
2382 DOTP_UB2_UH(vec2, vec3, filt0, filt0, tmp2, tmp3);
2412 v16u8 src11, vec0, vec1, vec2, vec3, vec4, vec5, vec6, vec7, filt0;
2430 ILVR_B2_UB(src1, src0, src2, src1, vec0, vec2);
2437 DOTP_UB2_UH(vec2, vec3, filt0, filt0, tmp2, tmp3);
2454 ILVR_B2_UB(src7, src6, src8, src7, vec0, vec2);
2461 DOTP_UB2_UH(vec2, vec3, filt0, filt0, tmp2, tmp3);
2525 v16u8 filt_hz, filt_vt, vec0, vec1, vec2, vec3;
2552 ILVEV_B2_UB(hz_out4, hz_out5, hz_out6, hz_out7, vec2, vec3);
2553 DOTP_UB4_UH(vec0, vec1, vec2, vec3, filt_vt, filt_vt, filt_vt, filt_vt,
2586 v16u8 filt_hz, filt_vt, vec0, vec1, vec2, vec3;
2611 vec2 = (v16u8) __msa_ilvev_b((v16i8) hz_out1, (v16i8) hz_out0);
2612 tmp2 = __msa_dotp_u_h(vec2, filt_vt);
2826 v8u16 vec2, vec3, filt;
2838 DOTP_UB2_UH(vec0, vec1, filt0, filt0, vec2, vec3);
2839 SRARI_H2_UH(vec2, vec3, 7);
2841 res = (v16u8) __msa_pckev_b((v16i8) vec3, (v16i8) vec2);
2854 v16u8 filt0, vec0, vec1, vec2, vec3, res0, res1, res2, res3;
2870 VSHF_B2_UB(src4, src5, src6, src7, mask, mask, vec2, vec3);
2871 DOTP_UB4_UH(vec0, vec1, vec2, vec3, filt0, filt0, filt0, filt0, vec4, vec5,
2904 v8u16 vec0, vec1, vec2, vec3, filt;
2914 VSHF_B2_UH(src2, src2, src3, src3, mask, mask, vec2, vec3);
2915 DOTP_UB4_UH(vec0, vec1, vec2, vec3, filt0, filt0, filt0, filt0,
2916 vec0, vec1, vec2, vec3);
2917 SRARI_H4_UH(vec0, vec1, vec2, vec3, 7);
2921 PCKEV_AVG_ST8x4_UB(vec0, vec1, vec2, vec3, dst0, dst1, dst, dst_stride);
2934 v8u16 vec0, vec1, vec2, vec3, filt;
2945 VSHF_B2_UH(src2, src2, src3, src3, mask, mask, vec2, vec3);
2946 DOTP_UB4_UH(vec0, vec1, vec2, vec3, filt0, filt0, filt0, filt0, vec0, vec1,
2947 vec2, vec3);
2948 SRARI_H4_UH(vec0, vec1, vec2, vec3, 7);
2954 PCKEV_AVG_ST8x4_UB(vec0, vec1, vec2, vec3, dst0, dst1, dst, dst_stride);
2958 VSHF_B2_UH(src2, src2, src3, src3, mask, mask, vec2, vec3);
2959 DOTP_UB4_UH(vec0, vec1, vec2, vec3, filt0, filt0, filt0, filt0, vec0, vec1,
2960 vec2, vec3);
2961 SRARI_H4_UH(vec0, vec1, vec2, vec3, 7);
2965 PCKEV_AVG_ST8x4_UB(vec0, vec1, vec2, vec3, dst0, dst1, dst, dst_stride);
2973 VSHF_B2_UH(src2, src2, src3, src3, mask, mask, vec2, vec3);
2974 DOTP_UB4_UH(vec0, vec1, vec2, vec3, filt0, filt0, filt0, filt0, vec0,
2975 vec1, vec2, vec3);
2976 SRARI_H4_UH(vec0, vec1, vec2, vec3, 7);
2981 PCKEV_AVG_ST8x4_UB(vec0, vec1, vec2, vec3, dst0, dst1, dst, dst_stride);
2985 VSHF_B2_UH(src2, src2, src3, src3, mask, mask, vec2, vec3);
2986 DOTP_UB4_UH(vec0, vec1, vec2, vec3, filt0, filt0, filt0, filt0, vec0,
2987 vec1, vec2, vec3);
2988 SRARI_H4_UH(vec0, vec1, vec2, vec3, 7);
2992 PCKEV_AVG_ST8x4_UB(vec0, vec1, vec2, vec3, dst0, dst1, dst, dst_stride);
3019 v16u8 vec0, vec1, vec2, vec3, vec4, vec5, vec6, vec7;
3033 VSHF_B2_UB(src2, src2, src3, src3, mask, mask, vec2, vec3);
3036 DOTP_UB4_UH(vec0, vec1, vec2, vec3, filt0, filt0, filt0, filt0, res0, res1,
3058 VSHF_B2_UB(src2, src2, src3, src3, mask, mask, vec2, vec3);
3061 DOTP_UB4_UH(vec0, vec1, vec2, vec3, filt0, filt0, filt0, filt0, res0,
3087 v16u8 vec0, vec1, vec2, vec3, vec4, vec5, vec6, vec7;
3109 VSHF_B2_UB(src2, src2, src3, src3, mask, mask, vec2, vec3);
3112 DOTP_UB4_UH(vec0, vec1, vec2, vec3, filt0, filt0, filt0, filt0,
3137 v16u8 vec0, vec1, vec2, vec3, vec4, vec5, vec6, vec7;
3153 VSHF_B2_UB(src2, src2, src3, src3, mask, mask, vec2, vec3);
3156 DOTP_UB4_UH(vec0, vec1, vec2, vec3, filt0, filt0, filt0, filt0,
3269 v16u8 dst0, dst1, vec0, vec1, vec2, vec3, filt0;
3282 ILVR_B2_UB(src3, src2, src4, src3, vec2, vec3);
3283 DOTP_UB4_UH(vec0, vec1, vec2, vec3, filt0, filt0, filt0, filt0,
3301 v16u8 vec0, vec1, vec2, vec3, vec4, vec5, vec6, vec7, filt0;
3324 vec0, vec1, vec2, vec3);
3327 DOTP_UB4_UH(vec0, vec1, vec2, vec3, filt0, filt0, filt0, filt0,
3367 v16u8 vec0, vec1, vec2, vec3, vec4, vec5, vec6, vec7;
3382 ILVR_B2_UB(src1, src0, src2, src1, vec0, vec2);
3392 DOTP_UB2_UH(vec2, vec3, filt0, filt0, tmp2, tmp3);
3422 v16u8 vec0, vec1, vec2, vec3, vec4, vec5, vec6, vec7, filt0;
3435 ILVR_B2_UB(src1, src0, src2, src1, vec0, vec2);
3447 DOTP_UB2_UH(vec2, vec3, filt0, filt0, tmp2, tmp3);
3464 ILVR_B2_UB(src6, src5, src7, src6, vec0, vec2);
3471 DOTP_UB2_UH(vec2, vec3, filt0, filt0, tmp2, tmp3);
3503 v16u8 vec0, vec1, vec2, vec3, vec4, vec5, vec6, vec7;
3525 ILVR_B2_UB(src1, src0, src2, src1, vec0, vec2);
3532 DOTP_UB2_UH(vec2, vec3, filt0, filt0, tmp2, tmp3);
3549 ILVR_B2_UB(src7, src6, src8, src7, vec0, vec2);
3556 DOTP_UB2_UH(vec2, vec3, filt0, filt0, tmp2, tmp3);
3634 v16u8 filt_hz, filt_vt, vec0, vec1, vec2, vec3, res0, res1;
3667 ILVEV_B2_UB(hz_out4, hz_out5, hz_out6, hz_out7, vec2, vec3);
3668 DOTP_UB4_UH(vec0, vec1, vec2, vec3, filt_vt, filt_vt, filt_vt, filt_vt,
3702 v16u8 filt_hz, filt_vt, dst0, dst1, vec0, vec1, vec2, vec3;
3731 vec2 = (v16u8) __msa_ilvev_b((v16i8) hz_out1, (v16i8) hz_out0);
3732 tmp2 = __msa_dotp_u_h(vec2, filt_vt);