Lines Matching refs:src0

66 #define HORIZ_8TAP_FILT(src0, src1, mask0, mask1, mask2, mask3,          \
72 VSHF_B4_SB(src0, src1, mask0, mask1, mask2, mask3, \
83 #define HORIZ_8TAP_4WID_4VECS_FILT(src0, src1, src2, src3, \
91 VSHF_B2_SB(src0, src1, src2, src3, mask0, mask0, vec0_m, vec1_m); \
93 VSHF_B2_SB(src0, src1, src2, src3, mask1, mask1, vec2_m, vec3_m); \
95 VSHF_B2_SB(src0, src1, src2, src3, mask2, mask2, vec4_m, vec5_m); \
97 VSHF_B2_SB(src0, src1, src2, src3, mask3, mask3, vec6_m, vec7_m); \
102 #define HORIZ_8TAP_8WID_4VECS_FILT(src0, src1, src2, src3, \
110 VSHF_B2_SB(src0, src0, src1, src1, mask0, mask0, vec0_m, vec1_m); \
114 VSHF_B2_SB(src0, src0, src1, src1, mask2, mask2, vec0_m, vec1_m); \
118 VSHF_B2_SB(src0, src0, src1, src1, mask1, mask1, vec4_m, vec5_m); \
122 VSHF_B2_SB(src0, src0, src1, src1, mask3, mask3, vec4_m, vec5_m); \
164 v16i8 src0, src1, src2, src3, filt0, filt1, filt2, filt3;
178 LD_SB4(src, src_stride, src0, src1, src2, src3);
179 XORI_B4_128_SB(src0, src1, src2, src3);
180 HORIZ_8TAP_4WID_4VECS_FILT(src0, src1, src2, src3, mask0, mask1, mask2,
193 v16i8 src0, src1, src2, src3;
208 LD_SB4(src, src_stride, src0, src1, src2, src3);
209 XORI_B4_128_SB(src0, src1, src2, src3);
211 HORIZ_8TAP_4WID_4VECS_FILT(src0, src1, src2, src3, mask0, mask1, mask2,
213 LD_SB4(src, src_stride, src0, src1, src2, src3);
214 XORI_B4_128_SB(src0, src1, src2, src3);
215 HORIZ_8TAP_4WID_4VECS_FILT(src0, src1, src2, src3, mask0, mask1, mask2,
240 v16i8 src0, src1, src2, src3, filt0, filt1, filt2, filt3;
255 LD_SB4(src, src_stride, src0, src1, src2, src3);
256 XORI_B4_128_SB(src0, src1, src2, src3);
257 HORIZ_8TAP_8WID_4VECS_FILT(src0, src1, src2, src3, mask0, mask1, mask2,
272 v16i8 src0, src1, src2, src3, filt0, filt1, filt2, filt3;
288 LD_SB4(src, src_stride, src0, src1, src2, src3);
289 XORI_B4_128_SB(src0, src1, src2, src3);
291 HORIZ_8TAP_8WID_4VECS_FILT(src0, src1, src2, src3, mask0, mask1, mask2,
320 v16i8 src0, src1, src2, src3, filt0, filt1, filt2, filt3;
336 LD_SB2(src, src_stride, src0, src2);
338 XORI_B4_128_SB(src0, src1, src2, src3);
340 HORIZ_8TAP_8WID_4VECS_FILT(src0, src1, src2, src3, mask0, mask1, mask2,
359 v16i8 src0, src1, src2, src3, filt0, filt1, filt2, filt3;
375 src0 = LD_SB(src);
378 src1 = __msa_sldi_b(src2, src0, 8);
380 XORI_B4_128_SB(src0, src1, src2, src3);
381 HORIZ_8TAP_8WID_4VECS_FILT(src0, src1, src2, src3, mask0, mask1, mask2,
387 src0 = LD_SB(src);
390 src1 = __msa_sldi_b(src2, src0, 8);
399 XORI_B4_128_SB(src0, src1, src2, src3);
400 HORIZ_8TAP_8WID_4VECS_FILT(src0, src1, src2, src3, mask0, mask1, mask2,
418 v16i8 src0, src1, src2, src3, filt0, filt1, filt2, filt3;
434 src0 = LD_SB(src);
437 src1 = __msa_sldi_b(src2, src0, 8);
439 XORI_B4_128_SB(src0, src1, src2, src3);
440 HORIZ_8TAP_8WID_4VECS_FILT(src0, src1, src2, src3, mask0, mask1,
450 src0 = LD_SB(src + 32);
453 src1 = __msa_sldi_b(src2, src0, 8);
456 XORI_B4_128_SB(src0, src1, src2, src3);
457 HORIZ_8TAP_8WID_4VECS_FILT(src0, src1, src2, src3, mask0, mask1,
475 v16i8 src0, src1, src2, src3, src4, src5, src6, src7, src8, src9, src10;
487 LD_SB7(src, src_stride, src0, src1, src2, src3, src4, src5, src6);
490 ILVR_B4_SB(src1, src0, src3, src2, src5, src4, src2, src1, src10_r, src32_r,
527 v16i8 src0, src1, src2, src3, src4, src5, src6, src7, src8, src9, src10;
538 LD_SB7(src, src_stride, src0, src1, src2, src3, src4, src5, src6);
539 XORI_B7_128_SB(src0, src1, src2, src3, src4, src5, src6);
541 ILVR_B4_SB(src1, src0, src3, src2, src5, src4, src2, src1, src10_r, src32_r,
582 v16i8 src0, src1, src2, src3, src4, src5, src6, src7, src8, src9, src10;
595 LD_SB7(src, src_stride, src0, src1, src2, src3, src4, src5, src6);
596 XORI_B7_128_SB(src0, src1, src2, src3, src4, src5, src6);
598 ILVR_B4_SB(src1, src0, src3, src2, src5, src4, src2, src1, src10_r, src32_r,
601 ILVL_B4_SB(src1, src0, src3, src2, src5, src4, src2, src1, src10_l, src32_l,
664 v16i8 src0, src1, src2, src3, src4, src5, src6, src7, src8, src9, src10;
681 LD_SB7(src_tmp, src_stride, src0, src1, src2, src3, src4, src5, src6);
682 XORI_B7_128_SB(src0, src1, src2, src3, src4, src5, src6);
684 ILVR_B4_SB(src1, src0, src3, src2, src5, src4, src2, src1, src10_r,
687 ILVL_B4_SB(src1, src0, src3, src2, src5, src4, src2, src1, src10_l,
768 v16i8 src0, src1, src2, src3, src4, src5, src6, src7, src8, src9, src10;
786 LD_SB7(src, src_stride, src0, src1, src2, src3, src4, src5, src6);
787 XORI_B7_128_SB(src0, src1, src2, src3, src4, src5, src6);
790 hz_out0 = HORIZ_8TAP_FILT(src0, src1, mask0, mask1, mask2, mask3, filt_hz0,
844 v16i8 src0, src1, src2, src3, src4, src5, src6, src7, src8, src9, src10;
863 LD_SB7(src, src_stride, src0, src1, src2, src3, src4, src5, src6);
866 XORI_B7_128_SB(src0, src1, src2, src3, src4, src5, src6);
867 hz_out0 = HORIZ_8TAP_FILT(src0, src0, mask0, mask1, mask2, mask3, filt_hz0,
992 v16i8 src0, src1, src2, src3, filt0, filt1, filt2, filt3;
1008 LD_SB4(src, src_stride, src0, src1, src2, src3);
1009 XORI_B4_128_SB(src0, src1, src2, src3);
1010 HORIZ_8TAP_4WID_4VECS_FILT(src0, src1, src2, src3, mask0, mask1, mask2,
1027 v16i8 src0, src1, src2, src3, filt0, filt1, filt2, filt3;
1043 LD_SB4(src, src_stride, src0, src1, src2, src3);
1044 XORI_B4_128_SB(src0, src1, src2, src3);
1050 HORIZ_8TAP_4WID_4VECS_FILT(src0, src1, src2, src3, mask0, mask1, mask2,
1052 LD_SB4(src, src_stride, src0, src1, src2, src3);
1053 XORI_B4_128_SB(src0, src1, src2, src3);
1054 HORIZ_8TAP_4WID_4VECS_FILT(src0, src1, src2, src3, mask0, mask1, mask2,
1089 v16i8 src0, src1, src2, src3, filt0, filt1, filt2, filt3;
1105 LD_SB4(src, src_stride, src0, src1, src2, src3);
1106 XORI_B4_128_SB(src0, src1, src2, src3);
1108 HORIZ_8TAP_8WID_4VECS_FILT(src0, src1, src2, src3, mask0, mask1, mask2,
1129 v16i8 src0, src1, src2, src3, filt0, filt1, filt2, filt3;
1147 LD_SB2(src, src_stride, src0, src2);
1151 XORI_B4_128_SB(src0, src1, src2, src3);
1152 VSHF_B4_SH(src0, src0, mask0, mask1, mask2, mask3, vec0, vec4, vec8,
1187 v16i8 src0, src1, src2, src3, filt0, filt1, filt2, filt3;
1205 src0 = LD_SB(src);
1208 src1 = __msa_sldi_b(src2, src0, 8);
1211 XORI_B4_128_SB(src0, src1, src2, src3);
1212 VSHF_B4_SH(src0, src0, mask0, mask1, mask2, mask3, vec0, vec4, vec8,
1246 v16i8 src0, src1, src2, src3, filt0, filt1, filt2, filt3;
1265 src0 = LD_SB(&src[cnt << 5]);
1268 src1 = __msa_sldi_b(src2, src0, 8);
1270 XORI_B4_128_SB(src0, src1, src2, src3);
1271 VSHF_B4_SH(src0, src0, mask0, mask1, mask2, mask3, vec0, vec4, vec8,
1309 v16i8 src0, src1, src2, src3, src4, src5, src6, src7, src8, src9, src10;
1321 LD_SB7(src, src_stride, src0, src1, src2, src3, src4, src5, src6);
1324 ILVR_B4_SB(src1, src0, src3, src2, src5, src4, src2, src1, src10_r, src32_r,
1368 v16i8 src0, src1, src2, src3, src4, src5, src6, src7, src8, src9, src10;
1379 LD_SB7(src, src_stride, src0, src1, src2, src3, src4, src5, src6);
1382 XORI_B7_128_SB(src0, src1, src2, src3, src4, src5, src6);
1383 ILVR_B4_SB(src1, src0, src3, src2, src5, src4, src2, src1, src10_r, src32_r,
1432 v16i8 src0, src1, src2, src3, src4, src5, src6, src7, src8, src9, src10;
1449 LD_SB7(src_tmp, src_stride, src0, src1, src2, src3, src4, src5, src6);
1450 XORI_B7_128_SB(src0, src1, src2, src3, src4, src5, src6);
1453 ILVR_B4_SB(src1, src0, src3, src2, src5, src4, src2, src1, src10_r,
1456 ILVL_B4_SB(src1, src0, src3, src2, src5, src4, src2, src1, src10_l,
1558 v16i8 src0, src1, src2, src3, src4, src5, src6, src7, src8, src9, src10;
1576 LD_SB7(src, src_stride, src0, src1, src2, src3, src4, src5, src6);
1577 XORI_B7_128_SB(src0, src1, src2, src3, src4, src5, src6);
1580 hz_out0 = HORIZ_8TAP_FILT(src0, src1, mask0, mask1, mask2, mask3, filt_hz0,
1641 v16i8 src0, src1, src2, src3, src4, src5, src6, src7, src8, src9, src10;
1660 LD_SB7(src, src_stride, src0, src1, src2, src3, src4, src5, src6);
1663 XORI_B7_128_SB(src0, src1, src2, src3, src4, src5, src6);
1664 hz_out0 = HORIZ_8TAP_FILT(src0, src0, mask0, mask1, mask2, mask3, filt_hz0,
1799 v16i8 src0, src1, src2, src3, mask;
1809 LD_SB4(src, src_stride, src0, src1, src2, src3);
1810 VSHF_B2_UB(src0, src1, src2, src3, mask, mask, vec0, vec1);
1823 v16i8 src0, src1, src2, src3, src4, src5, src6, src7, mask;
1833 LD_SB8(src, src_stride, src0, src1, src2, src3, src4, src5, src6, src7);
1834 VSHF_B2_UB(src0, src1, src2, src3, mask, mask, vec0, vec1);
1865 v16i8 src0, src1, src2, src3, mask;
1874 LD_SB4(src, src_stride, src0, src1, src2, src3);
1875 VSHF_B2_UH(src0, src0, src1, src1, mask, mask, vec0, vec1);
1880 PCKEV_B2_SB(vec1, vec0, vec3, vec2, src0, src1);
1881 ST_D4(src0, src1, 0, 1, 0, 1, dst, dst_stride);
1889 v16i8 src0, src1, src2, src3, mask, out0, out1;
1898 LD_SB4(src, src_stride, src0, src1, src2, src3);
1901 VSHF_B2_UH(src0, src0, src1, src1, mask, mask, vec0, vec1);
1906 LD_SB4(src, src_stride, src0, src1, src2, src3);
1912 VSHF_B2_UH(src0, src0, src1, src1, mask, mask, vec0, vec1);
1922 LD_SB4(src, src_stride, src0, src1, src2, src3);
1925 VSHF_B2_UH(src0, src0, src1, src1, mask, mask, vec0, vec1);
1930 LD_SB4(src, src_stride, src0, src1, src2, src3);
1936 VSHF_B2_UH(src0, src0, src1, src1, mask, mask, vec0, vec1);
1966 v16i8 src0, src1, src2, src3, src4, src5, src6, src7, mask;
1978 LD_SB4(src, src_stride, src0, src2, src4, src6);
1982 VSHF_B2_UB(src0, src0, src1, src1, mask, mask, vec0, vec1);
2002 LD_SB4(src, src_stride, src0, src2, src4, src6);
2006 VSHF_B2_UB(src0, src0, src1, src1, mask, mask, vec0, vec1);
2033 v16i8 src0, src1, src2, src3, src4, src5, src6, src7, mask;
2044 src0 = LD_SB(src);
2047 src1 = __msa_sldi_b(src2, src0, 8);
2055 VSHF_B2_UB(src0, src0, src1, src1, mask, mask, vec0, vec1);
2080 v16i8 src0, src1, src2, src3, src4, src5, src6, src7, mask;
2091 src0 = LD_SB(src);
2096 SLDI_B3_SB(src2, src0, src4, src2, src6, src4, 8, src1, src3, src5);
2099 VSHF_B2_UB(src0, src0, src1, src1, mask, mask, vec0, vec1);
2121 v16i8 src0, src1, src2, src3, src4;
2130 LD_SB5(src, src_stride, src0, src1, src2, src3, src4);
2133 ILVR_B4_SB(src1, src0, src2, src1, src3, src2, src4, src3,
2147 v16i8 src0, src1, src2, src3, src4, src5, src6, src7, src8;
2157 LD_SB8(src, src_stride, src0, src1, src2, src3, src4, src5, src6, src7);
2163 ILVR_B4_SB(src1, src0, src2, src1, src3, src2, src4, src3, src10_r, src21_r,
2194 v16u8 src0, src1, src2, src3, src4, vec0, vec1, vec2, vec3, filt0;
2203 LD_UB5(src, src_stride, src0, src1, src2, src3, src4);
2204 ILVR_B2_UB(src1, src0, src2, src1, vec0, vec1);
2219 v16u8 src0, src1, src2, src3, src4, src5, src6, src7, src8;
2229 src0 = LD_UB(src);
2236 ILVR_B4_UB(src1, src0, src2, src1, src3, src2, src4, src3,
2255 src0 = src8;
2279 v16u8 src0, src1, src2, src3, src4;
2288 src0 = LD_UB(src);
2295 ILVR_B2_UB(src1, src0, src2, src1, vec0, vec2);
2296 ILVL_B2_UB(src1, src0, src2, src1, vec1, vec3);
2323 src0 = src4;
2333 v16u8 src0, src1, src2, src3, src4, src5, src6, src7, src8, src9;
2342 src0 = LD_UB(src);
2348 ILVR_B2_UB(src1, src0, src2, src1, vec0, vec2);
2349 ILVL_B2_UB(src1, src0, src2, src1, vec1, vec3);
2400 src0 = src4;
2411 v16u8 src0, src1, src2, src3, src4, src5, src6, src7, src8, src9, src10;
2420 LD_UB4(src, 16, src0, src3, src6, src9);
2430 ILVR_B2_UB(src1, src0, src2, src1, vec0, vec2);
2431 ILVL_B2_UB(src1, src0, src2, src1, vec1, vec3);
2479 src0 = src2;
2490 v16i8 src0, src1, src2, src3, src4, mask;
2503 LD_SB5(src, src_stride, src0, src1, src2, src3, src4);
2504 hz_out0 = HORIZ_2TAP_FILT_UH(src0, src1, mask, filt_hz, 7);
2523 v16i8 src0, src1, src2, src3, src4, src5, src6, src7, src8, mask;
2538 LD_SB8(src, src_stride, src0, src1, src2, src3, src4, src5, src6, src7);
2542 hz_out0 = HORIZ_2TAP_FILT_UH(src0, src1, mask, filt_hz, 7);
2585 v16i8 src0, src1, src2, src3, src4, mask, out0, out1;
2599 LD_SB5(src, src_stride, src0, src1, src2, src3, src4);
2601 hz_out0 = HORIZ_2TAP_FILT_UH(src0, src0, mask, filt_hz, 7);
2630 v16i8 src0, src1, src2, src3, src4, mask, out0, out1;
2644 src0 = LD_SB(src);
2647 hz_out0 = HORIZ_2TAP_FILT_UH(src0, src0, mask, filt_hz, 7);
2726 v16i8 src0, src1, src2, src3, src4, src5, src6, src7, mask;
2740 LD_SB2(src, 8, src0, src1);
2743 hz_out0 = HORIZ_2TAP_FILT_UH(src0, src0, mask, filt_hz, 7);
2748 LD_SB4(src, src_stride, src0, src2, src4, src6);
2752 hz_out1 = HORIZ_2TAP_FILT_UH(src0, src0, mask, filt_hz, 7);
2824 v16i8 src0, src1, src2, src3, mask;
2834 LD_SB4(src, src_stride, src0, src1, src2, src3);
2837 VSHF_B2_UB(src0, src1, src2, src3, mask, mask, vec0, vec1);
2853 v16i8 src0, src1, src2, src3, src4, src5, src6, src7, mask;
2864 LD_SB8(src, src_stride, src0, src1, src2, src3, src4, src5, src6, src7);
2869 VSHF_B2_UB(src0, src1, src2, src3, mask, mask, vec0, vec1);
2902 v16i8 src0, src1, src2, src3, mask;
2912 LD_SB4(src, src_stride, src0, src1, src2, src3);
2913 VSHF_B2_UH(src0, src0, src1, src1, mask, mask, vec0, vec1);
2932 v16i8 src0, src1, src2, src3, mask;
2942 LD_SB4(src, src_stride, src0, src1, src2, src3);
2944 VSHF_B2_UH(src0, src0, src1, src1, mask, mask, vec0, vec1);
2952 LD_SB4(src, src_stride, src0, src1, src2, src3);
2957 VSHF_B2_UH(src0, src0, src1, src1, mask, mask, vec0, vec1);
2969 LD_SB4(src, src_stride, src0, src1, src2, src3);
2972 VSHF_B2_UH(src0, src0, src1, src1, mask, mask, vec0, vec1);
2980 LD_SB4(src, src_stride, src0, src1, src2, src3);
2984 VSHF_B2_UH(src0, src0, src1, src1, mask, mask, vec0, vec1);
3017 v16i8 src0, src1, src2, src3, src4, src5, src6, src7, mask;
3028 LD_SB4(src, src_stride, src0, src2, src4, src6);
3032 VSHF_B2_UB(src0, src0, src1, src1, mask, mask, vec0, vec1);
3053 LD_SB4(src, src_stride, src0, src2, src4, src6);
3057 VSHF_B2_UB(src0, src0, src1, src1, mask, mask, vec0, vec1);
3085 v16i8 src0, src1, src2, src3, src4, src5, src6, src7, mask;
3097 src0 = LD_SB(src);
3100 src1 = __msa_sldi_b(src2, src0, 8);
3108 VSHF_B2_UB(src0, src0, src1, src1, mask, mask, vec0, vec1);
3135 v16i8 src0, src1, src2, src3, src4, src5, src6, src7, mask;
3147 LD_SB4(src, 16, src0, src2, src4, src6);
3149 SLDI_B3_SB(src2, src0, src4, src2, src6, src4, 8, src1, src3, src5);
3152 VSHF_B2_UB(src0, src0, src1, src1, mask, mask, vec0, vec1);
3177 v16i8 src0, src1, src2, src3, src4;
3186 LD_SB4(src, src_stride, src0, src1, src2, src3);
3194 ILVR_B4_SB(src1, src0, src2, src1, src3, src2, src4, src3,
3214 v16i8 src0, src1, src2, src3, src4, src5, src6, src7, src8, src87_r;
3223 LD_SB8(src, src_stride, src0, src1, src2, src3, src4, src5, src6, src7);
3231 ILVR_B4_SB(src1, src0, src2, src1, src3, src2, src4, src3, src10_r, src21_r,
3268 v16u8 src0, src1, src2, src3, src4;
3277 LD_UB5(src, src_stride, src0, src1, src2, src3, src4);
3281 ILVR_B2_UB(src1, src0, src2, src1, vec0, vec1);
3299 v16u8 src0, src1, src2, src3, src4, src5, src6, src7, src8;
3309 src0 = LD_UB(src);
3323 ILVR_B4_UB(src1, src0, src2, src1, src3, src2, src4, src3,
3341 src0 = src8;
3366 v16u8 src0, src1, src2, src3, src4, dst0, dst1, dst2, dst3, filt0;
3374 src0 = LD_UB(src);
3382 ILVR_B2_UB(src1, src0, src2, src1, vec0, vec2);
3383 ILVL_B2_UB(src1, src0, src2, src1, vec1, vec3);
3410 src0 = src4;
3420 v16u8 src0, src1, src2, src3, src4, src5, src6, src7, src8, src9;
3429 LD_UB2(src, 16, src0, src5);
3435 ILVR_B2_UB(src1, src0, src2, src1, vec0, vec2);
3436 ILVL_B2_UB(src1, src0, src2, src1, vec1, vec3);
3489 src0 = src4;
3500 v16u8 src0, src1, src2, src3, src4, src5;
3511 LD_UB4(src, 16, src0, src3, src6, src9);
3525 ILVR_B2_UB(src1, src0, src2, src1, vec0, vec2);
3526 ILVL_B2_UB(src1, src0, src2, src1, vec1, vec3);
3574 src0 = src2;
3589 v16i8 src0, src1, src2, src3, src4, mask;
3603 LD_SB5(src, src_stride, src0, src1, src2, src3, src4);
3605 hz_out0 = HORIZ_2TAP_FILT_UH(src0, src1, mask, filt_hz, 7);
3633 v16i8 src0, src1, src2, src3, src4, src5, src6, src7, src8, mask;
3649 LD_SB8(src, src_stride, src0, src1, src2, src3, src4, src5, src6, src7);
3653 hz_out0 = HORIZ_2TAP_FILT_UH(src0, src1, mask, filt_hz, 7);
3701 v16i8 src0, src1, src2, src3, src4, mask;
3715 LD_SB5(src, src_stride, src0, src1, src2, src3, src4);
3721 hz_out0 = HORIZ_2TAP_FILT_UH(src0, src0, mask, filt_hz, 7);
3753 v16i8 src0, src1, src2, src3, src4, mask;
3767 src0 = LD_SB(src);
3770 hz_out0 = HORIZ_2TAP_FILT_UH(src0, src0, mask, filt_hz, 7);
3830 v16i8 src0, src1, src2, src3, src4, src5, src6, src7, mask;
3844 LD_SB2(src, 8, src0, src1);
3847 hz_out0 = HORIZ_2TAP_FILT_UH(src0, src0, mask, filt_hz, 7);
3851 LD_SB4(src, src_stride, src0, src2, src4, src6);
3856 hz_out1 = HORIZ_2TAP_FILT_UH(src0, src0, mask, filt_hz, 7);
3957 v16u8 src0, src1, src2, src3, src4, src5, src6, src7;
3960 LD_UB8(src, src_stride, src0, src1, src2, src3, src4, src5, src6, src7);
3961 ST_UB8(src0, src1, src2, src3, src4, src5, src6, src7, dst, dst_stride);
3963 LD_UB8(src, src_stride, src0, src1, src2, src3, src4, src5, src6, src7);
3965 ST_UB8(src0, src1, src2, src3, src4, src5, src6, src7, dst, dst_stride);
3967 LD_UB8(src, src_stride, src0, src1, src2, src3, src4, src5, src6, src7);
3969 ST_UB8(src0, src1, src2, src3, src4, src5, src6, src7, dst, dst_stride);
3972 LD_UB8(src, src_stride, src0, src1, src2, src3, src4, src5, src6, src7);
3974 ST_UB8(src0, src1, src2, src3, src4, src5, src6, src7, dst, dst_stride);
3976 LD_UB8(src, src_stride, src0, src1, src2, src3, src4, src5, src6, src7);
3978 ST_UB8(src0, src1, src2, src3, src4, src5, src6, src7, dst, dst_stride);
3980 LD_UB8(src, src_stride, src0, src1, src2, src3, src4, src5, src6, src7);
3982 ST_UB8(src0, src1, src2, src3, src4, src5, src6, src7, dst, dst_stride);
3984 LD_UB8(src, src_stride, src0, src1, src2, src3, src4, src5, src6, src7);
3985 ST_UB8(src0, src1, src2, src3, src4, src5, src6, src7, dst, dst_stride);
3988 LD_UB4(src, src_stride, src0, src1, src2, src3);
3990 ST_UB4(src0, src1, src2, src3, dst, dst_stride);
4001 v16u8 src0, src1, src2, src3, src4, src5, src6, src7;
4005 LD_UB8(src, src_stride, src0, src1, src2, src3, src4, src5, src6, src7);
4006 ST_UB8(src0, src1, src2, src3, src4, src5, src6, src7, dst, dst_stride);
4007 LD_UB8(src + 16, src_stride, src0, src1, src2, src3, src4, src5, src6,
4010 ST_UB8(src0, src1, src2, src3, src4, src5, src6, src7, dst + 16,
4016 LD_UB4(src, src_stride, src0, src1, src2, src3);
4019 ST_UB4(src0, src1, src2, src3, dst, dst_stride);
4031 v16u8 src0, src1, src2, src3, src4, src5, src6, src7;
4035 LD_UB4(src, 16, src0, src1, src2, src3);
4044 ST_UB4(src0, src1, src2, src3, dst, 16);
4060 v16u8 src0 = { 0 }, src1 = { 0 }, dst0 = { 0 }, dst1 = { 0 };
4065 INSERT_W4_UB(tp0, tp1, tp2, tp3, src0);
4072 AVER_UB2_UB(src0, dst0, src1, dst1, dst0, dst1);
4076 INSERT_W4_UB(tp0, tp1, tp2, tp3, src0);
4079 dst0 = __msa_aver_u_b(src0, dst0);
4090 v16u8 src0, src1, src2, src3;
4099 INSERT_D2_UB(tp0, tp1, src0);
4109 AVER_UB4_UB(src0, dst0, src1, dst1, src2, dst2, src3, dst3, dst0,
4116 INSERT_D2_UB(tp0, tp1, src0);
4121 AVER_UB2_UB(src0, dst0, src1, dst1, dst0, dst1);
4131 v16u8 src0, src1, src2, src3, src4, src5, src6, src7;
4136 LD_UB8(src, src_stride, src0, src1, src2, src3, src4, src5, src6, src7);
4140 AVER_UB4_UB(src0, dst0, src1, dst1, src2, dst2, src3, dst3,
4149 LD_UB4(src, src_stride, src0, src1, src2, src3);
4153 AVER_UB4_UB(src0, dst0, src1, dst1, src2, dst2, src3, dst3,
4167 v16u8 src0, src1, src2, src3, src4, src5, src6, src7;
4174 LD_UB4(src, src_stride, src0, src2, src4, src6);
4187 AVER_UB4_UB(src0, dst0, src1, dst1, src2, dst2, src3, dst3,
4205 LD_UB4(src, src_stride, src0, src2, src4, src6);
4212 AVER_UB4_UB(src0, dst0, src1, dst1, src2, dst2, src3, dst3,
4230 v16u8 src0, src1, src2, src3, src4, src5, src6, src7;
4236 LD_UB4(src, 16, src0, src1, src2, src3);
4254 AVER_UB4_UB(src0, dst0, src1, dst1, src2, dst2, src3, dst3,