~ubuntu-branches/ubuntu/jaunty/xvidcap/jaunty-proposed

« back to all changes in this revision

Viewing changes to ffmpeg/libavcodec/i386/motion_est_mmx.c

Committer: Bazaar Package Importer
Author(s): Christian Marillat
Date: 2004-08-29 10:53:42 UTC
Revision ID: james.westby@ubuntu.com-20040829105342-qgmnry37eadfkoxx

Tags: upstream-1.1.3

Import upstream version 1.1.3

files added:

AUTHORS

COPYING

ChangeLog

INSTALL

Makefile.am

Makefile.in

NEWS

README

TODO

Xw/Base.c

Xw/Base.h

Xw/BaseP.h

Xw/Box.c

Xw/Box.h

Xw/BoxP.h

Xw/Button.c

Xw/Button.h

Xw/ButtonP.h

Xw/Field.c

Xw/Field.h

Xw/FieldP.h

Xw/Label.c

Xw/Label.h

Xw/LabelP.h

Xw/Makefile.am

Xw/Makefile.in

Xw/README

Xw/RootIcon.c

Xw/RootIcon.h

Xw/RootIconP.h

Xw/Toggle.c

Xw/Toggle.h

Xw/ToggleP.h

Xw/simple.c

Xw/testxw.c

Xw/testxw.xbm

aclocal.m4

compile

config.h.in

configure

configure.ac

depcomp

ffmpeg

ffmpeg/.nbattrs

ffmpeg/COPYING

ffmpeg/CREDITS

ffmpeg/Changelog

ffmpeg/INSTALL

ffmpeg/Makefile

ffmpeg/README

ffmpeg/berrno.h

ffmpeg/cmdutils.c

ffmpeg/cmdutils.h

ffmpeg/configure

ffmpeg/cygwin_inttypes.h

ffmpeg/doc

ffmpeg/doc/.nbattrs

ffmpeg/doc/Makefile

ffmpeg/doc/TODO

ffmpeg/doc/faq.html

ffmpeg/doc/faq.texi

ffmpeg/doc/ffmpeg-doc.html

ffmpeg/doc/ffmpeg-doc.texi

ffmpeg/doc/ffmpeg.1

ffmpeg/doc/ffmpeg_powerpc_performance_evaluation_howto.txt

ffmpeg/doc/ffplay-doc.html

ffmpeg/doc/ffplay-doc.texi

ffmpeg/doc/ffplay.1

ffmpeg/doc/ffserver-doc.html

ffmpeg/doc/ffserver-doc.texi

ffmpeg/doc/ffserver.1

ffmpeg/doc/ffserver.conf

ffmpeg/doc/hooks.html

ffmpeg/doc/hooks.texi

ffmpeg/doc/optimization.txt

ffmpeg/doc/texi2pod.pl

ffmpeg/ffinstall.nsi

ffmpeg/ffmpeg.c

ffmpeg/ffplay.c

ffmpeg/ffserver.c

ffmpeg/ffserver.h

ffmpeg/libavcodec

ffmpeg/libavcodec/.nbattrs

ffmpeg/libavcodec/4xm.c

ffmpeg/libavcodec/Doxyfile

ffmpeg/libavcodec/Makefile

ffmpeg/libavcodec/a52dec.c

ffmpeg/libavcodec/ac3.h

ffmpeg/libavcodec/ac3dec.c

ffmpeg/libavcodec/ac3enc.c

ffmpeg/libavcodec/ac3tab.h

ffmpeg/libavcodec/adpcm.c

ffmpeg/libavcodec/allcodecs.c

ffmpeg/libavcodec/alpha

ffmpeg/libavcodec/alpha/asm.h

ffmpeg/libavcodec/alpha/dsputil_alpha.c

ffmpeg/libavcodec/alpha/dsputil_alpha_asm.S

ffmpeg/libavcodec/alpha/motion_est_alpha.c

ffmpeg/libavcodec/alpha/motion_est_mvi_asm.S

ffmpeg/libavcodec/alpha/mpegvideo_alpha.c

ffmpeg/libavcodec/alpha/regdef.h

ffmpeg/libavcodec/alpha/simple_idct_alpha.c

ffmpeg/libavcodec/amr.c

ffmpeg/libavcodec/apiexample.c

ffmpeg/libavcodec/armv4l

ffmpeg/libavcodec/armv4l/dsputil_arm.c

ffmpeg/libavcodec/armv4l/jrevdct_arm.S

ffmpeg/libavcodec/armv4l/mpegvideo_arm.c

ffmpeg/libavcodec/armv4l/simple_idct_arm.S

ffmpeg/libavcodec/asv1.c

ffmpeg/libavcodec/avcodec.c

ffmpeg/libavcodec/avcodec.h

ffmpeg/libavcodec/bswap.h

ffmpeg/libavcodec/cabac.c

ffmpeg/libavcodec/cabac.h

ffmpeg/libavcodec/cljr.c

ffmpeg/libavcodec/common.c

ffmpeg/libavcodec/common.h

ffmpeg/libavcodec/cyuv.c

ffmpeg/libavcodec/dct-test.c

ffmpeg/libavcodec/dpcm.c

ffmpeg/libavcodec/dsputil.c

ffmpeg/libavcodec/dsputil.h

ffmpeg/libavcodec/dv.c

ffmpeg/libavcodec/dvdata.h

ffmpeg/libavcodec/error_resilience.c

ffmpeg/libavcodec/eval.c

ffmpeg/libavcodec/faad.c

ffmpeg/libavcodec/fastmemcpy.h

ffmpeg/libavcodec/fdctref.c

ffmpeg/libavcodec/fft-test.c

ffmpeg/libavcodec/fft.c

ffmpeg/libavcodec/ffv1.c

ffmpeg/libavcodec/golomb.c

ffmpeg/libavcodec/golomb.h

ffmpeg/libavcodec/h263.c

ffmpeg/libavcodec/h263data.h

ffmpeg/libavcodec/h263dec.c

ffmpeg/libavcodec/h264.c

ffmpeg/libavcodec/h264data.h

ffmpeg/libavcodec/huffyuv.c

ffmpeg/libavcodec/i386

ffmpeg/libavcodec/i386/cputest.c

ffmpeg/libavcodec/i386/dsputil_mmx.c

ffmpeg/libavcodec/i386/dsputil_mmx_avg.h

ffmpeg/libavcodec/i386/dsputil_mmx_rnd.h

ffmpeg/libavcodec/i386/fdct_mmx.c

ffmpeg/libavcodec/i386/fft_sse.c

ffmpeg/libavcodec/i386/idct_mmx.c

ffmpeg/libavcodec/i386/mmx.h

ffmpeg/libavcodec/i386/motion_est_mmx.c

ffmpeg/libavcodec/i386/mpegvideo_mmx.c

ffmpeg/libavcodec/i386/mpegvideo_mmx_template.c

ffmpeg/libavcodec/i386/simple_idct_mmx.c

ffmpeg/libavcodec/imgconvert.c

ffmpeg/libavcodec/imgconvert_template.h

ffmpeg/libavcodec/imgresample.c

ffmpeg/libavcodec/indeo3.c

ffmpeg/libavcodec/indeo3data.h

ffmpeg/libavcodec/interplayvideo.c

ffmpeg/libavcodec/jfdctfst.c

ffmpeg/libavcodec/jfdctint.c

ffmpeg/libavcodec/jrevdct.c

ffmpeg/libavcodec/liba52

ffmpeg/libavcodec/liba52/a52.h

ffmpeg/libavcodec/liba52/a52_internal.h

ffmpeg/libavcodec/liba52/a52_util.h

ffmpeg/libavcodec/liba52/bit_allocate.c

ffmpeg/libavcodec/liba52/bitstream.c

ffmpeg/libavcodec/liba52/bitstream.h

ffmpeg/libavcodec/liba52/crc.c

ffmpeg/libavcodec/liba52/downmix.c

ffmpeg/libavcodec/liba52/imdct.c

ffmpeg/libavcodec/liba52/mm_accel.h

ffmpeg/libavcodec/liba52/parse.c

ffmpeg/libavcodec/liba52/resample.c

ffmpeg/libavcodec/liba52/resample_c.c

ffmpeg/libavcodec/liba52/resample_mmx.c

ffmpeg/libavcodec/liba52/tables.h

ffmpeg/libavcodec/libpostproc

ffmpeg/libavcodec/libpostproc/.nbattrs

ffmpeg/libavcodec/libpostproc/Makefile

ffmpeg/libavcodec/libpostproc/mangle.h

ffmpeg/libavcodec/libpostproc/postprocess.c

ffmpeg/libavcodec/libpostproc/postprocess.h

ffmpeg/libavcodec/libpostproc/postprocess_internal.h

ffmpeg/libavcodec/libpostproc/postprocess_template.c

ffmpeg/libavcodec/mace.c

ffmpeg/libavcodec/mdct.c

ffmpeg/libavcodec/mdec.c

ffmpeg/libavcodec/mem.c

ffmpeg/libavcodec/mjpeg.c

ffmpeg/libavcodec/mlib

ffmpeg/libavcodec/mlib/dsputil_mlib.c

ffmpeg/libavcodec/motion_est.c

ffmpeg/libavcodec/motion_est_template.c

ffmpeg/libavcodec/motion_test.c

ffmpeg/libavcodec/mp3lameaudio.c

ffmpeg/libavcodec/mpeg12.c

ffmpeg/libavcodec/mpeg12data.h

ffmpeg/libavcodec/mpeg4data.h

ffmpeg/libavcodec/mpegaudio.c

ffmpeg/libavcodec/mpegaudio.h

ffmpeg/libavcodec/mpegaudiodec.c

ffmpeg/libavcodec/mpegaudiodectab.h

ffmpeg/libavcodec/mpegaudiotab.h

ffmpeg/libavcodec/mpegvideo.c

ffmpeg/libavcodec/mpegvideo.h

ffmpeg/libavcodec/msmpeg4.c

ffmpeg/libavcodec/msmpeg4data.h

ffmpeg/libavcodec/oggvorbis.c

ffmpeg/libavcodec/oggvorbis.h

ffmpeg/libavcodec/opts.c

ffmpeg/libavcodec/pcm.c

ffmpeg/libavcodec/ppc

ffmpeg/libavcodec/ppc/dsputil_altivec.c

ffmpeg/libavcodec/ppc/dsputil_altivec.h

ffmpeg/libavcodec/ppc/dsputil_ppc.c

ffmpeg/libavcodec/ppc/dsputil_ppc.h

ffmpeg/libavcodec/ppc/fft_altivec.c

ffmpeg/libavcodec/ppc/gcc_fixes.h

ffmpeg/libavcodec/ppc/gmc_altivec.c

ffmpeg/libavcodec/ppc/idct_altivec.c

ffmpeg/libavcodec/ppc/mpegvideo_altivec.c

ffmpeg/libavcodec/ppc/mpegvideo_ppc.c

ffmpeg/libavcodec/ps2

ffmpeg/libavcodec/ps2/dsputil_mmi.c

ffmpeg/libavcodec/ps2/idct_mmi.c

ffmpeg/libavcodec/ps2/mmi.h

ffmpeg/libavcodec/ps2/mpegvideo_mmi.c

ffmpeg/libavcodec/ra144.c

ffmpeg/libavcodec/ra144.h

ffmpeg/libavcodec/ra288.c

ffmpeg/libavcodec/ra288.h

ffmpeg/libavcodec/ratecontrol.c

ffmpeg/libavcodec/raw.c

ffmpeg/libavcodec/resample.c

ffmpeg/libavcodec/roqvideo.c

ffmpeg/libavcodec/rv10.c

ffmpeg/libavcodec/sh4

ffmpeg/libavcodec/sh4/dsputil_align.c

ffmpeg/libavcodec/sh4/dsputil_sh4.c

ffmpeg/libavcodec/sh4/idct_sh4.c

ffmpeg/libavcodec/sh4/qpel.c

ffmpeg/libavcodec/simple_idct.c

ffmpeg/libavcodec/simple_idct.h

ffmpeg/libavcodec/svq1.c

ffmpeg/libavcodec/svq1_cb.h

ffmpeg/libavcodec/svq1_vlc.h

ffmpeg/libavcodec/svq3.c

ffmpeg/libavcodec/utils.c

ffmpeg/libavcodec/vcr1.c

ffmpeg/libavcodec/vp3.c

ffmpeg/libavcodec/vp3data.h

ffmpeg/libavcodec/wmadata.h

ffmpeg/libavcodec/wmadec.c

ffmpeg/libavcodec/wmv2.c

ffmpeg/libavcodec/xan.c

ffmpeg/libavcodec/xvmcvideo.c

ffmpeg/libavformat

ffmpeg/libavformat/.nbattrs

ffmpeg/libavformat/4xm.c

ffmpeg/libavformat/Makefile

ffmpeg/libavformat/allformats.c

ffmpeg/libavformat/amr.c

ffmpeg/libavformat/asf.c

ffmpeg/libavformat/au.c

ffmpeg/libavformat/audio.c

ffmpeg/libavformat/avformat.h

ffmpeg/libavformat/avi.h

ffmpeg/libavformat/avidec.c

ffmpeg/libavformat/avienc.c

ffmpeg/libavformat/avio.c

ffmpeg/libavformat/avio.h

ffmpeg/libavformat/aviobuf.c

ffmpeg/libavformat/barpainet.c

ffmpeg/libavformat/barpainet.h

ffmpeg/libavformat/beosaudio.cpp

ffmpeg/libavformat/crc.c

ffmpeg/libavformat/cutils.c

ffmpeg/libavformat/dv.c

ffmpeg/libavformat/dv1394.c

ffmpeg/libavformat/dv1394.h

ffmpeg/libavformat/dvcore.c

ffmpeg/libavformat/dvcore.h

ffmpeg/libavformat/ffm.c

ffmpeg/libavformat/file.c

ffmpeg/libavformat/flvdec.c

ffmpeg/libavformat/flvenc.c

ffmpeg/libavformat/framehook.c

ffmpeg/libavformat/framehook.h

ffmpeg/libavformat/gif.c

ffmpeg/libavformat/gifdec.c

ffmpeg/libavformat/grab.c

ffmpeg/libavformat/http.c

ffmpeg/libavformat/idroq.c

ffmpeg/libavformat/img.c

ffmpeg/libavformat/ipmovie.c

ffmpeg/libavformat/jpeg.c

ffmpeg/libavformat/mov.c

ffmpeg/libavformat/movenc.c

ffmpeg/libavformat/mp3.c

ffmpeg/libavformat/mpeg.c

ffmpeg/libavformat/mpegts.c

ffmpeg/libavformat/mpegts.h

ffmpeg/libavformat/mpegtsenc.c

ffmpeg/libavformat/mpjpeg.c

ffmpeg/libavformat/nut.c

ffmpeg/libavformat/ogg.c

ffmpeg/libavformat/os_support.c

ffmpeg/libavformat/os_support.h

ffmpeg/libavformat/png.c

ffmpeg/libavformat/pnm.c

ffmpeg/libavformat/psxstr.c

ffmpeg/libavformat/raw.c

ffmpeg/libavformat/rm.c

ffmpeg/libavformat/rtp.c

ffmpeg/libavformat/rtp.h

ffmpeg/libavformat/rtpproto.c

ffmpeg/libavformat/rtsp.c

ffmpeg/libavformat/rtsp.h

ffmpeg/libavformat/rtspcodes.h

ffmpeg/libavformat/swf.c

ffmpeg/libavformat/tcp.c

ffmpeg/libavformat/udp.c

ffmpeg/libavformat/utils.c

ffmpeg/libavformat/wav.c

ffmpeg/libavformat/wc3movie.c

ffmpeg/libavformat/yuv.c

ffmpeg/libavformat/yuv4mpeg.c

ffmpeg/output_example.c

ffmpeg/tests

ffmpeg/tests/.nbattrs

ffmpeg/tests/Makefile

ffmpeg/tests/audiogen.c

ffmpeg/tests/dsptest.c

ffmpeg/tests/ffmpeg.regression.ref

ffmpeg/tests/ffserver.regression.ref

ffmpeg/tests/lena.pnm

ffmpeg/tests/libav.regression.ref

ffmpeg/tests/regression.sh

ffmpeg/tests/rotozoom.c

ffmpeg/tests/rotozoom.regression.ref

ffmpeg/tests/server-regression.sh

ffmpeg/tests/test.conf

ffmpeg/tests/tiny_psnr.c

ffmpeg/tests/videogen.c

ffmpeg/vhook

ffmpeg/vhook/.nbattrs

ffmpeg/vhook/Makefile

ffmpeg/vhook/drawtext.c

ffmpeg/vhook/fish.c

ffmpeg/vhook/imlib2.c

ffmpeg/vhook/null.c

ffmpeg/vhook/ppm.c

ffmpeg/xvmc_render.h

getopt

getopt/README

getopt/getopt.c

getopt/getopt.h

getopt/getopt1.c

gt/COPYING.LIB

gt/Makefile.am

gt/Makefile.in

gt/README

gt/gnuavi.c

gt/gnuavi.h

gt/gnuplay.c

gt/gt.c

gt/gt.h

gt/gtapi.c

gt/gtapi.h

gt/gtatoms.h

gt/gttypes.h

gt/gtvr.c

gt/gtvr.h

gt/parse_gt.c

gt/ppm2qt.c

gt/ppm2qtvr.c

gt/sound.c

gt/sound.h

gt/video.c

gt/video.h

gt/xt.c

gt/xt.h

install-sh

man/gvidcap.man

man/index.bt

man/xvidcap.man

missing

mkinstalldirs

src/Makefile.am

src/Makefile.in

src/app_data.h

src/capture.c

src/capture.h

src/codecs.h

src/colors.c

src/colors.h

src/control.h

src/fallback.h

src/frame.c

src/frame.h

src/gtk2_control.c

src/gtk2_control.h

src/gtk2_frame.c

src/gtk2_frame.h

src/gtk2_options.c

src/gtk2_options.h

src/gtk2_support.c

src/gtk2_support.h

src/job.c

src/job.h

src/led_meter.c

src/led_meter.h

src/main.c

src/main.h

src/malloc.c

src/mkresfile.sh

src/mngutil.c

src/mngutil.h

src/options.c

src/realloc.c

src/util.c

src/util.h

src/video.c

src/video.h

src/xt_control.c

src/xt_control.h

src/xt_frame.c

src/xt_frame.h

src/xt_options.c

src/xt_options.h

src/xtoffmpeg.c

src/xtoffmpeg.h

src/xtojpg.c

src/xtojpg.h

src/xtomng.c

src/xtomng.h

src/xtopng.c

src/xtopng.h

src/xtopnm.c

src/xtopnm.h

src/xtoqtf.c

src/xtoqtf.h

src/xtoxwd.c

src/xtoxwd.h

src/xutil.c

src/xutil.h

xbm/animate.png

xbm/animate.xbm

xbm/edit.png

xbm/edit.xbm

xbm/help.xbm

xbm/mkvideo.xbm

xbm/move.png

xbm/move.xbm

xbm/next.png

xbm/next.xbm

xbm/pause.png

xbm/pause.xbm

xbm/prev.png

xbm/prev.xbm

xbm/record.png

xbm/record.xbm

xbm/record_off.png

xbm/record_on.png

xbm/select.png

xbm/select.xbm

xbm/step.png

xbm/step.xbm

xbm/stop.png

xbm/stop.xbm

Show diffs side-by-side

added added

removed removed

ffmpeg/libavcodec/i386/motion_est_mmx.c

* MMX optimized motion estimation

* This library is free software; you can redistribute it and/or

* modify it under the terms of the GNU Lesser General Public

* License as published by the Free Software Foundation; either

* version 2 of the License, or (at your option) any later version.

* This library is distributed in the hope that it will be useful,

* but WITHOUT ANY WARRANTY; without even the implied warranty of

* MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE. See the GNU

* Lesser General Public License for more details.

* You should have received a copy of the GNU Lesser General Public

* License along with this library; if not, write to the Free Software

* Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA 02111-1307 USA

* mostly by Michael Niedermayer <michaelni@gmx.at>

#include "../dsputil.h"

static const __attribute__ ((aligned(8))) uint64_t round_tab[3]={

0x0000000000000000,

0x0001000100010001,

0x0002000200020002,

};

static __attribute__ ((aligned(8), unused)) uint64_t bone= 0x0101010101010101LL;

static inline void sad8_mmx(uint8_t *blk1, uint8_t *blk2, int stride, int h)

{

int len= -(stride<<h);

asm volatile(

".balign 16 \n\t"

"1: \n\t"

"movq (%1, %%eax), %%mm0 \n\t"

"movq (%2, %%eax), %%mm2 \n\t"

"movq (%2, %%eax), %%mm4 \n\t"

"addl %3, %%eax \n\t"

"psubusb %%mm0, %%mm2 \n\t"

"psubusb %%mm4, %%mm0 \n\t"

"movq (%1, %%eax), %%mm1 \n\t"

"movq (%2, %%eax), %%mm3 \n\t"

"movq (%2, %%eax), %%mm5 \n\t"

"psubusb %%mm1, %%mm3 \n\t"

"psubusb %%mm5, %%mm1 \n\t"

"por %%mm2, %%mm0 \n\t"

"por %%mm1, %%mm3 \n\t"

"movq %%mm0, %%mm1 \n\t"

"movq %%mm3, %%mm2 \n\t"

"punpcklbw %%mm7, %%mm0 \n\t"

"punpckhbw %%mm7, %%mm1 \n\t"

"punpcklbw %%mm7, %%mm3 \n\t"

"punpckhbw %%mm7, %%mm2 \n\t"

"paddw %%mm1, %%mm0 \n\t"

"paddw %%mm3, %%mm2 \n\t"

"paddw %%mm2, %%mm0 \n\t"

"paddw %%mm0, %%mm6 \n\t"

"addl %3, %%eax \n\t"

" js 1b \n\t"

: "+a" (len)

: "r" (blk1 - len), "r" (blk2 - len), "r" (stride)

);

}

static inline void sad8_mmx2(uint8_t *blk1, uint8_t *blk2, int stride, int h)

{

int len= -(stride<<h);

asm volatile(

".balign 16 \n\t"

"1: \n\t"

"movq (%1, %%eax), %%mm0 \n\t"

"movq (%2, %%eax), %%mm2 \n\t"

"psadbw %%mm2, %%mm0 \n\t"

"addl %3, %%eax \n\t"

"movq (%1, %%eax), %%mm1 \n\t"

"movq (%2, %%eax), %%mm3 \n\t"

"psadbw %%mm1, %%mm3 \n\t"

"paddw %%mm3, %%mm0 \n\t"

"paddw %%mm0, %%mm6 \n\t"

"addl %3, %%eax \n\t"

" js 1b \n\t"

: "+a" (len)

: "r" (blk1 - len), "r" (blk2 - len), "r" (stride)

);

}

static inline void sad8_2_mmx2(uint8_t *blk1a, uint8_t *blk1b, uint8_t *blk2, int stride, int h)

{

int len= -(stride<<h);

asm volatile(

".balign 16 \n\t"

"1: \n\t"

"movq (%1, %%eax), %%mm0 \n\t"

"movq (%2, %%eax), %%mm2 \n\t"

"pavgb %%mm2, %%mm0 \n\t"

"movq (%3, %%eax), %%mm2 \n\t"

"psadbw %%mm2, %%mm0 \n\t"

100

"addl %4, %%eax \n\t"

101

"movq (%1, %%eax), %%mm1 \n\t"

102

"movq (%2, %%eax), %%mm3 \n\t"

103

"pavgb %%mm1, %%mm3 \n\t"

104

"movq (%3, %%eax), %%mm1 \n\t"

105

"psadbw %%mm1, %%mm3 \n\t"

106

"paddw %%mm3, %%mm0 \n\t"

107

"paddw %%mm0, %%mm6 \n\t"

108

"addl %4, %%eax \n\t"

109

" js 1b \n\t"

110

: "+a" (len)

111

: "r" (blk1a - len), "r" (blk1b -len), "r" (blk2 - len), "r" (stride)

112

);

113

}

114

115

static inline void sad8_4_mmx2(uint8_t *blk1, uint8_t *blk2, int stride, int h)

116

{ //FIXME reuse src

117

int len= -(stride<<h);

118

asm volatile(

119

".balign 16 \n\t"

120

"movq "MANGLE(bone)", %%mm5 \n\t"

121

"1: \n\t"

122

"movq (%1, %%eax), %%mm0 \n\t"

123

"movq (%2, %%eax), %%mm2 \n\t"

124

"movq 1(%1, %%eax), %%mm1 \n\t"

125

"movq 1(%2, %%eax), %%mm3 \n\t"

126

"pavgb %%mm2, %%mm0 \n\t"

127

"pavgb %%mm1, %%mm3 \n\t"

128

"psubusb %%mm5, %%mm3 \n\t"

129

"pavgb %%mm3, %%mm0 \n\t"

130

"movq (%3, %%eax), %%mm2 \n\t"

131

"psadbw %%mm2, %%mm0 \n\t"

132

"addl %4, %%eax \n\t"

133

"movq (%1, %%eax), %%mm1 \n\t"

134

"movq (%2, %%eax), %%mm3 \n\t"

135

"movq 1(%1, %%eax), %%mm2 \n\t"

136

"movq 1(%2, %%eax), %%mm4 \n\t"

137

"pavgb %%mm3, %%mm1 \n\t"

138

"pavgb %%mm4, %%mm2 \n\t"

139

"psubusb %%mm5, %%mm2 \n\t"

140

"pavgb %%mm1, %%mm2 \n\t"

141

"movq (%3, %%eax), %%mm1 \n\t"

142

"psadbw %%mm1, %%mm2 \n\t"

143

"paddw %%mm2, %%mm0 \n\t"

144

"paddw %%mm0, %%mm6 \n\t"

145

"addl %4, %%eax \n\t"

146

" js 1b \n\t"

147

: "+a" (len)

148

: "r" (blk1 - len), "r" (blk1 - len + stride), "r" (blk2 - len), "r" (stride)

149

);

150

}

151

152

static inline void sad8_2_mmx(uint8_t *blk1a, uint8_t *blk1b, uint8_t *blk2, int stride, int h)

153

{

154

int len= -(stride<<h);

155

asm volatile(

156

".balign 16 \n\t"

157

"1: \n\t"

158

"movq (%1, %%eax), %%mm0 \n\t"

159

"movq (%2, %%eax), %%mm1 \n\t"

160

"movq (%1, %%eax), %%mm2 \n\t"

161

"movq (%2, %%eax), %%mm3 \n\t"

162

"punpcklbw %%mm7, %%mm0 \n\t"

163

"punpcklbw %%mm7, %%mm1 \n\t"

164

"punpckhbw %%mm7, %%mm2 \n\t"

165

"punpckhbw %%mm7, %%mm3 \n\t"

166

"paddw %%mm0, %%mm1 \n\t"

167

"paddw %%mm2, %%mm3 \n\t"

168

"movq (%3, %%eax), %%mm4 \n\t"

169

"movq (%3, %%eax), %%mm2 \n\t"

170

"paddw %%mm5, %%mm1 \n\t"

171

"paddw %%mm5, %%mm3 \n\t"

172

"psrlw $1, %%mm1 \n\t"

173

"psrlw $1, %%mm3 \n\t"

174

"packuswb %%mm3, %%mm1 \n\t"

175

"psubusb %%mm1, %%mm4 \n\t"

176

"psubusb %%mm2, %%mm1 \n\t"

177

"por %%mm4, %%mm1 \n\t"

178

"movq %%mm1, %%mm0 \n\t"

179

"punpcklbw %%mm7, %%mm0 \n\t"

180

"punpckhbw %%mm7, %%mm1 \n\t"

181

"paddw %%mm1, %%mm0 \n\t"

182

"paddw %%mm0, %%mm6 \n\t"

183

"addl %4, %%eax \n\t"

184

" js 1b \n\t"

185

: "+a" (len)

186

: "r" (blk1a - len), "r" (blk1b -len), "r" (blk2 - len), "r" (stride)

187

);

188

}

189

190

static inline void sad8_4_mmx(uint8_t *blk1, uint8_t *blk2, int stride, int h)

191

{

192

int len= -(stride<<h);

193

asm volatile(

194

".balign 16 \n\t"

195

"1: \n\t"

196

"movq (%1, %%eax), %%mm0 \n\t"

197

"movq (%2, %%eax), %%mm1 \n\t"

198

"movq %%mm0, %%mm4 \n\t"

199

"movq %%mm1, %%mm2 \n\t"

200

"punpcklbw %%mm7, %%mm0 \n\t"

201

"punpcklbw %%mm7, %%mm1 \n\t"

202

"punpckhbw %%mm7, %%mm4 \n\t"

203

"punpckhbw %%mm7, %%mm2 \n\t"

204

"paddw %%mm1, %%mm0 \n\t"

205

"paddw %%mm2, %%mm4 \n\t"

206

"movq 1(%1, %%eax), %%mm2 \n\t"

207

"movq 1(%2, %%eax), %%mm3 \n\t"

208

"movq %%mm2, %%mm1 \n\t"

209

"punpcklbw %%mm7, %%mm2 \n\t"

210

"punpckhbw %%mm7, %%mm1 \n\t"

211

"paddw %%mm0, %%mm2 \n\t"

212

"paddw %%mm4, %%mm1 \n\t"

213

"movq %%mm3, %%mm4 \n\t"

214

"punpcklbw %%mm7, %%mm3 \n\t"

215

"punpckhbw %%mm7, %%mm4 \n\t"

216

"paddw %%mm3, %%mm2 \n\t"

217

"paddw %%mm4, %%mm1 \n\t"

218

"movq (%3, %%eax), %%mm3 \n\t"

219

"movq (%3, %%eax), %%mm4 \n\t"

220

"paddw %%mm5, %%mm2 \n\t"

221

"paddw %%mm5, %%mm1 \n\t"

222

"psrlw $2, %%mm2 \n\t"

223

"psrlw $2, %%mm1 \n\t"

224

"packuswb %%mm1, %%mm2 \n\t"

225

"psubusb %%mm2, %%mm3 \n\t"

226

"psubusb %%mm4, %%mm2 \n\t"

227

"por %%mm3, %%mm2 \n\t"

228

"movq %%mm2, %%mm0 \n\t"

229

"punpcklbw %%mm7, %%mm0 \n\t"

230

"punpckhbw %%mm7, %%mm2 \n\t"

231

"paddw %%mm2, %%mm0 \n\t"

232

"paddw %%mm0, %%mm6 \n\t"

233

"addl %4, %%eax \n\t"

234

" js 1b \n\t"

235

: "+a" (len)

236

: "r" (blk1 - len), "r" (blk1 -len + stride), "r" (blk2 - len), "r" (stride)

237

);

238

}

239

240

static inline int sum_mmx(void)

241

{

242

int ret;

243

asm volatile(

244

"movq %%mm6, %%mm0 \n\t"

245

"psrlq $32, %%mm6 \n\t"

246

"paddw %%mm0, %%mm6 \n\t"

247

"movq %%mm6, %%mm0 \n\t"

248

"psrlq $16, %%mm6 \n\t"

249

"paddw %%mm0, %%mm6 \n\t"

250

"movd %%mm6, %0 \n\t"

251

: "=r" (ret)

252

);

253

return ret&0xFFFF;

254

}

255

256

static inline int sum_mmx2(void)

257

{

258

int ret;

259

asm volatile(

260

"movd %%mm6, %0 \n\t"

261

: "=r" (ret)

262

);

263

return ret;

264

}

265

266

267

#define PIX_SAD(suf)\

268

static int pix_abs8x8_ ## suf(uint8_t *blk2, uint8_t *blk1, int stride)\

269

270

asm volatile("pxor %%mm7, %%mm7 \n\t"\

271

"pxor %%mm6, %%mm6 \n\t":);\

272

273

sad8_ ## suf(blk1, blk2, stride, 3);\

274

275

return sum_ ## suf();\

276

277

static int sad8x8_ ## suf(void *s, uint8_t *blk2, uint8_t *blk1, int stride)\

278

279

asm volatile("pxor %%mm7, %%mm7 \n\t"\

280

"pxor %%mm6, %%mm6 \n\t":);\

281

282

sad8_ ## suf(blk1, blk2, stride, 3);\

283

284

return sum_ ## suf();\

285

286

287

static int pix_abs8x8_x2_ ## suf(uint8_t *blk2, uint8_t *blk1, int stride)\

288

289

asm volatile("pxor %%mm7, %%mm7 \n\t"\

290

"pxor %%mm6, %%mm6 \n\t"\

291

"movq %0, %%mm5 \n\t"\

292

:: "m"(round_tab[1]) \

293

);\

294

295

sad8_2_ ## suf(blk1, blk1+1, blk2, stride, 3);\

296

297

return sum_ ## suf();\

298

299

300

static int pix_abs8x8_y2_ ## suf(uint8_t *blk2, uint8_t *blk1, int stride)\

301

302

asm volatile("pxor %%mm7, %%mm7 \n\t"\

303

"pxor %%mm6, %%mm6 \n\t"\

304

"movq %0, %%mm5 \n\t"\

305

:: "m"(round_tab[1]) \

306

);\

307

308

sad8_2_ ## suf(blk1, blk1+stride, blk2, stride, 3);\

309

310

return sum_ ## suf();\

311

312

313

static int pix_abs8x8_xy2_ ## suf(uint8_t *blk2, uint8_t *blk1, int stride)\

314

315

asm volatile("pxor %%mm7, %%mm7 \n\t"\

316

"pxor %%mm6, %%mm6 \n\t"\

317

"movq %0, %%mm5 \n\t"\

318

:: "m"(round_tab[2]) \

319

);\

320

321

sad8_4_ ## suf(blk1, blk2, stride, 3);\

322

323

return sum_ ## suf();\

324

325

326

static int pix_abs16x16_ ## suf(uint8_t *blk2, uint8_t *blk1, int stride)\

327

328

asm volatile("pxor %%mm7, %%mm7 \n\t"\

329

"pxor %%mm6, %%mm6 \n\t":);\

330

331

sad8_ ## suf(blk1 , blk2 , stride, 4);\

332

sad8_ ## suf(blk1+8, blk2+8, stride, 4);\

333

334

return sum_ ## suf();\

335

336

static int sad16x16_ ## suf(void *s, uint8_t *blk2, uint8_t *blk1, int stride)\

337

338

asm volatile("pxor %%mm7, %%mm7 \n\t"\

339

"pxor %%mm6, %%mm6 \n\t":);\

340

341

sad8_ ## suf(blk1 , blk2 , stride, 4);\

342

sad8_ ## suf(blk1+8, blk2+8, stride, 4);\

343

344

return sum_ ## suf();\

345

346

static int pix_abs16x16_x2_ ## suf(uint8_t *blk2, uint8_t *blk1, int stride)\

347

348

asm volatile("pxor %%mm7, %%mm7 \n\t"\

349

"pxor %%mm6, %%mm6 \n\t"\

350

"movq %0, %%mm5 \n\t"\

351

:: "m"(round_tab[1]) \

352

);\

353

354

sad8_2_ ## suf(blk1 , blk1+1, blk2 , stride, 4);\

355

sad8_2_ ## suf(blk1+8, blk1+9, blk2+8, stride, 4);\

356

357

return sum_ ## suf();\

358

359

static int pix_abs16x16_y2_ ## suf(uint8_t *blk2, uint8_t *blk1, int stride)\

360

361

asm volatile("pxor %%mm7, %%mm7 \n\t"\

362

"pxor %%mm6, %%mm6 \n\t"\

363

"movq %0, %%mm5 \n\t"\

364

:: "m"(round_tab[1]) \

365

);\

366

367

sad8_2_ ## suf(blk1 , blk1+stride, blk2 , stride, 4);\

368

sad8_2_ ## suf(blk1+8, blk1+stride+8,blk2+8, stride, 4);\

369

370

return sum_ ## suf();\

371

372

static int pix_abs16x16_xy2_ ## suf(uint8_t *blk2, uint8_t *blk1, int stride)\

373

374

asm volatile("pxor %%mm7, %%mm7 \n\t"\

375

"pxor %%mm6, %%mm6 \n\t"\

376

"movq %0, %%mm5 \n\t"\

377

:: "m"(round_tab[2]) \

378

);\

379

380

sad8_4_ ## suf(blk1 , blk2 , stride, 4);\

381

sad8_4_ ## suf(blk1+8, blk2+8, stride, 4);\

382

383

return sum_ ## suf();\

384

385

386

PIX_SAD(mmx)

387

PIX_SAD(mmx2)

388

389

void dsputil_init_pix_mmx(DSPContext* c, AVCodecContext *avctx)

390

{

391

if (mm_flags & MM_MMX) {

392

c->pix_abs16x16 = pix_abs16x16_mmx;

393

c->pix_abs16x16_x2 = pix_abs16x16_x2_mmx;

394

c->pix_abs16x16_y2 = pix_abs16x16_y2_mmx;

395

c->pix_abs16x16_xy2 = pix_abs16x16_xy2_mmx;

396

c->pix_abs8x8 = pix_abs8x8_mmx;

397

c->pix_abs8x8_x2 = pix_abs8x8_x2_mmx;

398

c->pix_abs8x8_y2 = pix_abs8x8_y2_mmx;

399

c->pix_abs8x8_xy2 = pix_abs8x8_xy2_mmx;

400

401

c->sad[0]= sad16x16_mmx;

402

c->sad[1]= sad8x8_mmx;

403

}

404

if (mm_flags & MM_MMXEXT) {

405

c->pix_abs16x16 = pix_abs16x16_mmx2;

406

c->pix_abs8x8 = pix_abs8x8_mmx2;

407

408

c->sad[0]= sad16x16_mmx2;

409

c->sad[1]= sad8x8_mmx2;

410

411

if(!(avctx->flags & CODEC_FLAG_BITEXACT)){

412

c->pix_abs16x16_x2 = pix_abs16x16_x2_mmx2;

413

c->pix_abs16x16_y2 = pix_abs16x16_y2_mmx2;

414

c->pix_abs16x16_xy2 = pix_abs16x16_xy2_mmx2;

415

c->pix_abs8x8_x2 = pix_abs8x8_x2_mmx2;

416

c->pix_abs8x8_y2 = pix_abs8x8_y2_mmx2;

417

c->pix_abs8x8_xy2 = pix_abs8x8_xy2_mmx2;

418

}

419

}

420

}

Older »