Lines Matching defs:dst

229 #define VP9_ADDBLK_ST8x4_UB(dst, dst_stride, in0, in1, in2, in3)  \
231 uint8_t *dst_m = (uint8_t *) (dst); \
346 static void vp9_idct4x4_1_add_msa(int16_t *input, uint8_t *dst,
358 ADDBLK_ST4x4_UB(vec, vec, vec, vec, dst, dst_stride);
361 static void vp9_idct4x4_colcol_addblk_msa(int16_t *input, uint8_t *dst,
380 ADDBLK_ST4x4_UB(in0, in1, in2, in3, dst, dst_stride);
383 static void vp9_iadst4x4_colcol_addblk_msa(int16_t *input, uint8_t *dst,
402 ADDBLK_ST4x4_UB(in0, in1, in2, in3, dst, dst_stride);
405 static void vp9_iadst_idct_4x4_add_msa(int16_t *input, uint8_t *dst,
424 ADDBLK_ST4x4_UB(in0, in1, in2, in3, dst, dst_stride);
427 static void vp9_idct_iadst_4x4_add_msa(int16_t *input, uint8_t *dst,
446 ADDBLK_ST4x4_UB(in0, in1, in2, in3, dst, dst_stride);
599 static void vp9_idct8x8_1_add_msa(int16_t *input, uint8_t *dst,
612 VP9_ADDBLK_ST8x4_UB(dst, dst_stride, vec, vec, vec, vec);
613 dst += (4 * dst_stride);
614 VP9_ADDBLK_ST8x4_UB(dst, dst_stride, vec, vec, vec, vec);
617 static void vp9_idct8x8_12_colcol_addblk_msa(int16_t *input, uint8_t *dst,
676 VP9_ADDBLK_ST8x4_UB(dst, dst_stride, in0, in1, in2, in3);
677 dst += (4 * dst_stride);
678 VP9_ADDBLK_ST8x4_UB(dst, dst_stride, in4, in5, in6, in7);
681 static void vp9_idct8x8_colcol_addblk_msa(int16_t *input, uint8_t *dst,
703 VP9_ADDBLK_ST8x4_UB(dst, dst_stride, in0, in1, in2, in3);
704 dst += (4 * dst_stride);
705 VP9_ADDBLK_ST8x4_UB(dst, dst_stride, in4, in5, in6, in7);
708 static void vp9_iadst8x8_colcol_addblk_msa(int16_t *input, uint8_t *dst,
762 dst0 = LD_UB(dst + 0 * dst_stride);
763 dst7 = LD_UB(dst + 7 * dst_stride);
769 ST_D1(res0, 0, dst);
775 ST_D1(res7, 0, dst + 7 * dst_stride);
792 dst1 = LD_UB(dst + 1 * dst_stride);
793 dst6 = LD_UB(dst + 6 * dst_stride);
798 ST_D1(res1, 0, dst + dst_stride);
799 ST_D1(res6, 0, dst + 6 * dst_stride);
811 dst3 = LD_UB(dst + 3 * dst_stride);
812 dst4 = LD_UB(dst + 4 * dst_stride);
817 ST_D1(res3, 0, dst + 3 * dst_stride);
818 ST_D1(res4, 0, dst + 4 * dst_stride);
824 dst2 = LD_UB(dst + 2 * dst_stride);
825 dst5 = LD_UB(dst + 5 * dst_stride);
830 ST_D1(res2, 0, dst + 2 * dst_stride);
831 ST_D1(res5, 0, dst + 5 * dst_stride);
834 static void vp9_iadst_idct_8x8_add_msa(int16_t *input, uint8_t *dst,
856 VP9_ADDBLK_ST8x4_UB(dst, dst_stride, in0, in1, in2, in3);
857 dst += (4 * dst_stride);
858 VP9_ADDBLK_ST8x4_UB(dst, dst_stride, in4, in5, in6, in7);
861 static void vp9_idct_iadst_8x8_add_msa(int16_t *input, uint8_t *dst,
884 VP9_ADDBLK_ST8x4_UB(dst, dst_stride, in0, in1, in2, in3);
885 dst += (4 * dst_stride);
886 VP9_ADDBLK_ST8x4_UB(dst, dst_stride, in4, in5, in6, in7);
963 static void vp9_idct16_1d_columns_addblk_msa(int16_t *input, uint8_t *dst,
1055 VP9_ADDBLK_ST8x4_UB(dst, dst_stride, reg0, reg2, reg4, reg6);
1056 dst += (4 * dst_stride);
1058 VP9_ADDBLK_ST8x4_UB(dst, dst_stride, reg8, reg10, reg12, reg14);
1059 dst += (4 * dst_stride);
1061 VP9_ADDBLK_ST8x4_UB(dst, dst_stride, reg3, reg13, reg11, reg5);
1062 dst += (4 * dst_stride);
1064 VP9_ADDBLK_ST8x4_UB(dst, dst_stride, reg7, reg9, reg1, reg15);
1171 static void vp9_idct16x16_1_add_msa(int16_t *input, uint8_t *dst,
1187 LD_UB4(dst, dst_stride, dst0, dst1, dst2, dst3);
1199 ST_UB4(tmp0, tmp1, tmp2, tmp3, dst, dst_stride);
1200 dst += (4 * dst_stride);
1204 static void vp9_idct16x16_10_colcol_addblk_msa(int16_t *input, uint8_t *dst,
1239 vp9_idct16_1d_columns_addblk_msa((out + (i << 3)), (dst + (i << 3)),
1244 static void vp9_idct16x16_colcol_addblk_msa(int16_t *input, uint8_t *dst,
1260 vp9_idct16_1d_columns_addblk_msa((out + (i << 3)), (dst + (i << 3)),
1299 static void vp9_iadst16_1d_columns_addblk_msa(int16_t *input, uint8_t *dst,
1363 dst0 = LD_UB(dst + 0 * dst_stride);
1364 dst1 = LD_UB(dst + 15 * dst_stride);
1369 ST_D1(res0, 0, dst);
1370 ST_D1(res1, 0, dst + 15 * dst_stride);
1380 dst8 = LD_UB(dst + 1 * dst_stride);
1381 dst9 = LD_UB(dst + 14 * dst_stride);
1386 ST_D1(res8, 0, dst + dst_stride);
1387 ST_D1(res9, 0, dst + 14 * dst_stride);
1395 dst4 = LD_UB(dst + 3 * dst_stride);
1396 dst5 = LD_UB(dst + 12 * dst_stride);
1401 ST_D1(res4, 0, dst + 3 * dst_stride);
1402 ST_D1(res5, 0, dst + 12 * dst_stride);
1407 dst12 = LD_UB(dst + 2 * dst_stride);
1408 dst13 = LD_UB(dst + 13 * dst_stride);
1413 ST_D1(res12, 0, dst + 2 * dst_stride);
1414 ST_D1(res13, 0, dst + 13 * dst_stride);
1420 dst6 = LD_UB(dst + 4 * dst_stride);
1421 dst7 = LD_UB(dst + 11 * dst_stride);
1426 ST_D1(res6, 0, dst + 4 * dst_stride);
1427 ST_D1(res7, 0, dst + 11 * dst_stride);
1431 dst10 = LD_UB(dst + 6 * dst_stride);
1432 dst11 = LD_UB(dst + 9 * dst_stride);
1437 ST_D1(res10, 0, dst + 6 * dst_stride);
1438 ST_D1(res11, 0, dst + 9 * dst_stride);
1444 dst2 = LD_UB(dst + 7 * dst_stride);
1445 dst3 = LD_UB(dst + 8 * dst_stride);
1450 ST_D1(res2, 0, dst + 7 * dst_stride);
1451 ST_D1(res3, 0, dst + 8 * dst_stride);
1455 dst14 = LD_UB(dst + 5 * dst_stride);
1456 dst15 = LD_UB(dst + 10 * dst_stride);
1461 ST_D1(res14, 0, dst + 5 * dst_stride);
1462 ST_D1(res15, 0, dst + 10 * dst_stride);
1465 static void vp9_iadst16x16_colcol_addblk_msa(int16_t *input, uint8_t *dst,
1481 vp9_iadst16_1d_columns_addblk_msa((out + (i << 3)), (dst + (i << 3)),
1486 static void vp9_iadst_idct_16x16_add_msa(int16_t *input, uint8_t *dst,
1503 (dst + (i << 3)), dst_stride);
1507 static void vp9_idct_iadst_16x16_add_msa(int16_t *input, uint8_t *dst,
1524 (dst + (i << 3)), dst_stride);
1531 int16_t *dst)
1608 ST_SH4(m0, n0, m1, n1, (dst + 0), 32);
1609 ST_SH4(m2, n2, m3, n3, (dst + 4 * 32), 32);
1613 ST_SH4(m4, n4, m5, n5, (dst + 8), 32);
1614 ST_SH4(m6, n6, m7, n7, (dst + 8 + 4 * 32), 32);
1621 ST_SH4(m0, n0, m1, n1, (dst + 16), 32);
1622 ST_SH4(m2, n2, m3, n3, (dst + 16 + 4 * 32), 32);
1626 ST_SH4(m4, n4, m5, n5, (dst + 24), 32);
1627 ST_SH4(m6, n6, m7, n7, (dst + 24 + 4 * 32), 32);
1847 uint8_t *dst,
1865 VP9_ADDBLK_ST8x4_UB(dst, (4 * dst_stride), m0, m2, m4, m6);
1869 VP9_ADDBLK_ST8x4_UB((dst + 19 * dst_stride), (4 * dst_stride),
1884 VP9_ADDBLK_ST8x4_UB((dst + 2 * dst_stride), (4 * dst_stride),
1889 VP9_ADDBLK_ST8x4_UB((dst + 17 * dst_stride), (4 * dst_stride),
1904 VP9_ADDBLK_ST8x4_UB((dst + 1 * dst_stride), (4 * dst_stride),
1909 VP9_ADDBLK_ST8x4_UB((dst + 18 * dst_stride), (4 * dst_stride),
1924 VP9_ADDBLK_ST8x4_UB((dst + 3 * dst_stride), (4 * dst_stride),
1929 VP9_ADDBLK_ST8x4_UB((dst + 16 * dst_stride), (4 * dst_stride),
1933 static void vp9_idct8x32_1d_columns_addblk_msa(int16_t *input, uint8_t *dst,
1942 dst, dst_stride);
1957 static void vp9_idct32x32_1_add_msa(int16_t *input, uint8_t *dst,
1973 LD_UB2(dst, 16, dst0, dst1);
1974 LD_UB2(dst + dst_stride, 16, dst2, dst3);
1988 ST_UB2(tmp0, tmp1, dst, 16);
1989 dst += dst_stride;
1990 ST_UB2(tmp2, tmp3, dst, 16);
1991 dst += dst_stride;
1995 static void vp9_idct32x32_34_colcol_addblk_msa(int16_t *input, uint8_t *dst,
2038 (dst + (i << 3)), dst_stride);
2042 static void vp9_idct32x32_colcol_addblk_msa(int16_t *input, uint8_t *dst,
2061 (dst + (i << 3)), dst_stride);
2065 void ff_idct_idct_4x4_add_msa(uint8_t *dst, ptrdiff_t stride,
2069 vp9_idct4x4_colcol_addblk_msa(block, dst, stride);
2072 vp9_idct4x4_1_add_msa(block, dst, stride);
2076 void ff_idct_idct_8x8_add_msa(uint8_t *dst, ptrdiff_t stride,
2080 vp9_idct8x8_1_add_msa(block, dst, stride);
2083 vp9_idct8x8_12_colcol_addblk_msa(block, dst, stride);
2086 vp9_idct8x8_colcol_addblk_msa(block, dst, stride);
2090 void ff_idct_idct_16x16_add_msa(uint8_t *dst, ptrdiff_t stride,
2095 vp9_idct16x16_1_add_msa(block, dst, stride);
2098 vp9_idct16x16_10_colcol_addblk_msa(block, dst, stride);
2101 vp9_idct16x16_colcol_addblk_msa(block, dst, stride);
2105 void ff_idct_idct_32x32_add_msa(uint8_t *dst, ptrdiff_t stride,
2109 vp9_idct32x32_1_add_msa(block, dst, stride);
2112 vp9_idct32x32_34_colcol_addblk_msa(block, dst, stride);
2115 vp9_idct32x32_colcol_addblk_msa(block, dst, stride);
2119 void ff_iadst_iadst_4x4_add_msa(uint8_t *dst, ptrdiff_t stride,
2122 vp9_iadst4x4_colcol_addblk_msa(block, dst, stride);
2125 void ff_iadst_iadst_8x8_add_msa(uint8_t *dst, ptrdiff_t stride,
2128 vp9_iadst8x8_colcol_addblk_msa(block, dst, stride);
2131 void ff_iadst_iadst_16x16_add_msa(uint8_t *dst, ptrdiff_t stride,
2134 vp9_iadst16x16_colcol_addblk_msa(block, dst, stride);
2137 void ff_idct_iadst_4x4_add_msa(uint8_t *dst, ptrdiff_t stride,
2140 vp9_idct_iadst_4x4_add_msa(block, dst, stride, eob);
2143 void ff_idct_iadst_8x8_add_msa(uint8_t *dst, ptrdiff_t stride,
2146 vp9_idct_iadst_8x8_add_msa(block, dst, stride, eob);
2149 void ff_idct_iadst_16x16_add_msa(uint8_t *dst, ptrdiff_t stride,
2152 vp9_idct_iadst_16x16_add_msa(block, dst, stride, eob);
2155 void ff_iadst_idct_4x4_add_msa(uint8_t *dst, ptrdiff_t stride,
2158 vp9_iadst_idct_4x4_add_msa(block, dst, stride, eob);
2161 void ff_iadst_idct_8x8_add_msa(uint8_t *dst, ptrdiff_t stride,
2164 vp9_iadst_idct_8x8_add_msa(block, dst, stride, eob);
2167 void ff_iadst_idct_16x16_add_msa(uint8_t *dst, ptrdiff_t stride,
2170 vp9_iadst_idct_16x16_add_msa(block, dst, stride, eob);