~ubuntu-branches/ubuntu/jaunty/xvidcap/jaunty-proposed

« back to all changes in this revision

Viewing changes to ffmpeg/libavcodec/i386/dsputil_h264_template_mmx.c

  • Committer: Bazaar Package Importer
  • Author(s): Lionel Le Folgoc
  • Date: 2008-12-26 00:10:06 UTC
  • mto: This revision was merged to the branch mainline in revision 8.
  • Revision ID: james.westby@ubuntu.com-20081226001006-wd8cuqn8d81smkdp
Tags: upstream-1.1.7
ImportĀ upstreamĀ versionĀ 1.1.7

Show diffs side-by-side

added added

removed removed

Lines of Context:
25
25
 * H264_CHROMA_OP must be defined to empty for put and pavgb/pavgusb for avg
26
26
 * H264_CHROMA_MC8_MV0 must be defined to a (put|avg)_pixels8 function
27
27
 */
28
 
static void H264_CHROMA_MC8_TMPL(uint8_t *dst/*align 8*/, uint8_t *src/*align 1*/, int stride, int h, int x, int y)
 
28
static void H264_CHROMA_MC8_TMPL(uint8_t *dst/*align 8*/, uint8_t *src/*align 1*/, int stride, int h, int x, int y, int rnd)
29
29
{
 
30
    const uint64_t *rnd_reg;
30
31
    DECLARE_ALIGNED_8(uint64_t, AA);
31
32
    DECLARE_ALIGNED_8(uint64_t, DD);
32
33
    int i;
44
45
        /* 1 dimensional filter only */
45
46
        const int dxy = x ? 1 : stride;
46
47
 
 
48
        rnd_reg = rnd ? &ff_pw_4 : &ff_pw_3;
 
49
 
47
50
        asm volatile(
48
51
            "movd %0, %%mm5\n\t"
49
52
            "movq %1, %%mm4\n\t"
 
53
            "movq %2, %%mm6\n\t"         /* mm6 = rnd */
50
54
            "punpcklwd %%mm5, %%mm5\n\t"
51
55
            "punpckldq %%mm5, %%mm5\n\t" /* mm5 = B = x */
52
 
            "movq %%mm4, %%mm6\n\t"
53
56
            "pxor %%mm7, %%mm7\n\t"
54
57
            "psubw %%mm5, %%mm4\n\t"     /* mm4 = A = 8-x */
55
 
            "psrlw $1, %%mm6\n\t"        /* mm6 = 4 */
56
 
            :: "rm"(x+y), "m"(ff_pw_8));
 
58
            :: "rm"(x+y), "m"(ff_pw_8), "m"(*rnd_reg));
57
59
 
58
60
        for(i=0; i<h; i++) {
59
61
            asm volatile(
95
97
    }
96
98
 
97
99
    /* general case, bilinear */
 
100
    rnd_reg = rnd ? &ff_pw_32.a : &ff_pw_28.a;
98
101
    asm volatile("movd %2, %%mm4\n\t"
99
102
                 "movd %3, %%mm6\n\t"
100
103
                 "punpcklwd %%mm4, %%mm4\n\t"
177
180
            "packuswb %%mm3, %%mm2\n\t"
178
181
            H264_CHROMA_OP(%0, %%mm2)
179
182
            "movq %%mm2, %0\n\t"
180
 
            : "=m" (dst[0]) : "m" (ff_pw_32));
 
183
            : "=m" (dst[0]) : "m" (*rnd_reg));
181
184
        dst+= stride;
182
185
    }
183
186
}
251
254
}
252
255
 
253
256
#ifdef H264_CHROMA_MC2_TMPL
254
 
static void H264_CHROMA_MC2_TMPL(uint8_t *dst/*align 2*/, uint8_t *src/*align 1*/, long stride, int h, int x, int y)
 
257
static void H264_CHROMA_MC2_TMPL(uint8_t *dst/*align 2*/, uint8_t *src/*align 1*/, int stride, int h, int x, int y)
255
258
{
256
259
    int tmp = ((1<<16)-1)*x + 8;
257
260
    int CD= tmp*y;
297
300
        "sub $1, %2\n\t"
298
301
        "jnz 1b\n\t"
299
302
        : "+r" (dst), "+r"(src), "+r"(h)
300
 
        : "m" (ff_pw_32), "r"(stride)
 
303
        : "m" (ff_pw_32), "r"((long)stride)
301
304
        : "%esi");
302
305
 
303
306
}