~ubuntu-branches/ubuntu/maverick/x264/maverick-updates

« back to all changes in this revision

Viewing changes to common/x86/mc-a2.asm

  • Committer: Bazaar Package Importer
  • Author(s): Reinhard Tartler
  • Date: 2010-02-18 07:39:51 UTC
  • mto: This revision was merged to the branch mainline in revision 19.
  • Revision ID: james.westby@ubuntu.com-20100218073951-9jgsvskb976rfbvq
Tags: upstream-0.85.1442.1+git781d30
ImportĀ upstreamĀ versionĀ 0.85.1442.1+git781d30

Show diffs side-by-side

added added

removed removed

Lines of Context:
125
125
%ifnidn %1, ssse3
126
126
    pxor m0, m0
127
127
%else
128
 
    mova m0, [filt_mul51 GLOBAL]
 
128
    mova m0, [filt_mul51]
129
129
%endif
130
130
.loop:
131
131
%ifidn %1, ssse3
142
142
    pmaddubsw m4, m0
143
143
    pmaddubsw m2, m0
144
144
    pmaddubsw m5, m0
145
 
    pmaddubsw m3, [filt_mul20 GLOBAL]
146
 
    pmaddubsw m6, [filt_mul20 GLOBAL]
 
145
    pmaddubsw m3, [filt_mul20]
 
146
    pmaddubsw m6, [filt_mul20]
147
147
    paddw  m1, m2
148
148
    paddw  m4, m5
149
149
    paddw  m1, m3
155
155
    LOAD_ADD   m6,     [r1+r3*2+mmsize/2], [r5+mmsize/2], m7 ; c1
156
156
    FILT_V2
157
157
%endif
158
 
    mova      m7, [pw_16 GLOBAL]
 
158
    mova      m7, [pw_16]
159
159
    mova      [r2+r4*2], m1
160
160
    mova      [r2+r4*2+mmsize], m4
161
161
    paddw     m1, m7
180
180
    lea r1, [r1+r2*2]
181
181
    neg r2
182
182
    %define src r1+r2*2
183
 
    movq m7, [pw_32 GLOBAL]
 
183
    movq m7, [pw_32]
184
184
.loop:
185
185
    movq   m1, [src-4]
186
186
    movq   m2, [src-2]
237
237
    punpcklbw  m7, m0
238
238
    punpcklbw  m6, m0
239
239
    paddw      m6, m7 ; a1
240
 
    movq       m7, [pw_1 GLOBAL]
 
240
    movq       m7, [pw_1]
241
241
    FILT_H2 m1, m2, m3, m4, m5, m6
242
242
    FILT_PACK m1, m4, 1
243
243
    movntq     [r0+r2], m1
257
257
    neg r2
258
258
    %define src r1+r2*2
259
259
%ifidn %1, ssse3
260
 
    mova    m7, [pw_32 GLOBAL]
 
260
    mova    m7, [pw_32]
261
261
    %define tpw_32 m7
262
262
%elifdef ARCH_X86_64
263
 
    mova    m8, [pw_32 GLOBAL]
 
263
    mova    m8, [pw_32]
264
264
    %define tpw_32 m8
265
265
%else
266
 
    %define tpw_32 [pw_32 GLOBAL]
 
266
    %define tpw_32 [pw_32]
267
267
%endif
268
268
.loop:
269
269
%ifidn %1,sse2_misalign
340
340
    punpcklbw  m6, m0
341
341
    punpcklbw  m7, m0
342
342
    paddw      m6, m7 ; c1
343
 
    mova       m7, [pw_1 GLOBAL] ; FIXME xmm8
 
343
    mova       m7, [pw_1] ; FIXME xmm8
344
344
    FILT_H2 m1, m2, m3, m4, m5, m6
345
345
    FILT_PACK m1, m4, 1
346
346
    movntdq    [r0+r2], m1
362
362
    punpcklbw m1, m0         ; 00 -1 00 -2 00 -3 00 -4 00 -5 00 -6 00 -7 00 -8
363
363
    movh m2, [src]
364
364
    punpcklbw m2, m0
365
 
    mova       m7, [pw_1 GLOBAL]
 
365
    mova       m7, [pw_1]
366
366
.loop:
367
367
    movh       m3, [src+8]
368
368
    punpcklbw  m3, m0
436
436
    mova m3, [r1]
437
437
    mova %4, [r1+r2]
438
438
    mova m0, [r1+r2*2]
439
 
    mova %2, [filt_mul51 GLOBAL]
 
439
    mova %2, [filt_mul51]
440
440
    mova m4, m1
441
441
    punpcklbw m1, m2
442
442
    punpckhbw m4, m2
452
452
    pmaddubsw m4, %2
453
453
    pmaddubsw m0, %2
454
454
    pmaddubsw m2, %2
455
 
    pmaddubsw m3, [filt_mul20 GLOBAL]
456
 
    pmaddubsw %1, [filt_mul20 GLOBAL]
 
455
    pmaddubsw m3, [filt_mul20]
 
456
    pmaddubsw %1, [filt_mul20]
457
457
    psrlw     %3, 8
458
458
    psrlw     %4, 8
459
459
    paddw m1, m0
1096
1096
    add r4, r5
1097
1097
    neg r5
1098
1098
    pxor      xmm5, xmm5
1099
 
    movdqa    xmm4, [pd_128 GLOBAL]
 
1099
    movdqa    xmm4, [pd_128]
1100
1100
.loop:
1101
1101
    movq      xmm2, [r2+r5] ; intra
1102
1102
    movq      xmm0, [r4+r5] ; invq