~ubuntu-branches/ubuntu/utopic/ffmpeg-debian/utopic

« back to all changes in this revision

Viewing changes to libavcodec/i386/cavsdsp_mmx.c

Committer: Bazaar Package Importer
Author(s): Reinhard Tartler
Date: 2009-01-20 09:20:53 UTC
mfrom: (1.1.3 upstream)
Revision ID: james.westby@ubuntu.com-20090120092053-izz63p40hc98qfgp

Tags: 3:0.svn20090119-1ubuntu1

https://launchpad.net/bugs/318501

https://launchpad.net/bugs/253767

* merge from debian. LP: #318501
* new version fixes CVE-2008-3230, LP: #253767

files added:
.svnrevision

debian/README.upstream-upgrade

ffpresets/libx264-baseline.ffpreset

ffpresets/libx264-ipod320.ffpreset

ffpresets/libx264-ipod640.ffpreset

ffpresets/libx264-lossless_fast.ffpreset

ffpresets/libx264-lossless_max.ffpreset

ffpresets/libx264-lossless_medium.ffpreset

ffpresets/libx264-lossless_slow.ffpreset

ffpresets/libx264-lossless_slower.ffpreset

ffpresets/libx264-lossless_ultrafast.ffpreset

ffpresets/libx264-main.ffpreset

ffpresets/libx264-slowfirstpass.ffpreset

libavcodec/aac_parser.h

libavcodec/aandcttab.c

libavcodec/aandcttab.h

libavcodec/arm

libavcodec/arm/asm.S

libavcodec/arm/dsputil_arm.c

libavcodec/arm/dsputil_arm_s.S

libavcodec/arm/dsputil_iwmmxt.c

libavcodec/arm/dsputil_iwmmxt_rnd_template.c

libavcodec/arm/dsputil_neon.c

libavcodec/arm/dsputil_neon_s.S

libavcodec/arm/dsputil_vfp.S

libavcodec/arm/float_arm_vfp.c

libavcodec/arm/h264dsp_neon.S

libavcodec/arm/h264idct_neon.S

libavcodec/arm/jrevdct_arm.S

libavcodec/arm/mathops.h

libavcodec/arm/mpegvideo_arm.c

libavcodec/arm/mpegvideo_armv5te.c

libavcodec/arm/mpegvideo_armv5te_s.S

libavcodec/arm/mpegvideo_iwmmxt.c

libavcodec/arm/simple_idct_arm.S

libavcodec/arm/simple_idct_armv5te.S

libavcodec/arm/simple_idct_armv6.S

libavcodec/arm/simple_idct_neon.S

libavcodec/dnxhdenc.h

libavcodec/faxcompr.c

libavcodec/faxcompr.h

libavcodec/internal.h

libavcodec/options.c

libavcodec/qcelp_lsp.c

libavcodec/rv40dsp.c

libavcodec/sh4/sh4.h

libavcodec/vdpau.h

libavcodec/vdpau_internal.h

libavcodec/vdpauvideo.c

libavcodec/x86

libavcodec/x86/cavsdsp_mmx.c

libavcodec/x86/cpuid.c

libavcodec/x86/dnxhd_mmx.c

libavcodec/x86/dsputil_h264_template_mmx.c

libavcodec/x86/dsputil_h264_template_ssse3.c

libavcodec/x86/dsputil_mmx.c

libavcodec/x86/dsputil_mmx.h

libavcodec/x86/dsputil_mmx_avg_template.c

libavcodec/x86/dsputil_mmx_qns_template.c

libavcodec/x86/dsputil_mmx_rnd_template.c

libavcodec/x86/dsputil_yasm.asm

libavcodec/x86/dsputilenc_mmx.c

libavcodec/x86/fdct_mmx.c

libavcodec/x86/fft_3dn.c

libavcodec/x86/fft_3dn2.c

libavcodec/x86/fft_mmx.asm

libavcodec/x86/fft_sse.c

libavcodec/x86/flacdsp_mmx.c

libavcodec/x86/h264_deblock_sse2.asm

libavcodec/x86/h264_i386.h

libavcodec/x86/h264_idct_sse2.asm

libavcodec/x86/h264dsp_mmx.c

libavcodec/x86/idct_mmx.c

libavcodec/x86/idct_mmx_xvid.c

libavcodec/x86/idct_sse2_xvid.c

libavcodec/x86/idct_xvid.h

libavcodec/x86/mathops.h

libavcodec/x86/mmx.h

libavcodec/x86/motion_est_mmx.c

libavcodec/x86/mpegvideo_mmx.c

libavcodec/x86/mpegvideo_mmx_template.c

libavcodec/x86/rv40dsp_mmx.c

libavcodec/x86/simple_idct_mmx.c

libavcodec/x86/snowdsp_mmx.c

libavcodec/x86/vc1dsp_mmx.c

libavcodec/x86/vp3dsp_mmx.c

libavcodec/x86/vp3dsp_mmx.h

libavcodec/x86/vp3dsp_sse2.c

libavcodec/x86/vp3dsp_sse2.h

libavcodec/x86/x86inc.asm

libavcodec/x86/x86util.asm

libavformat/id3v2.c

libavformat/id3v2.h

libavformat/iss.c

libavformat/metadata.c

libavformat/metadata.h

libavformat/metadata_compat.c

libavformat/options.c

libavutil/timer.h

libswscale/.svnrevision

files removed:
debian/patches/050_fix_pkgconfig_files.patch

libavcodec/armv4l

libavcodec/armv4l/asm.S

libavcodec/armv4l/dsputil_arm.c

libavcodec/armv4l/dsputil_arm_s.S

libavcodec/armv4l/dsputil_iwmmxt.c

libavcodec/armv4l/dsputil_iwmmxt_rnd_template.c

libavcodec/armv4l/dsputil_vfp.S

libavcodec/armv4l/float_arm_vfp.c

libavcodec/armv4l/jrevdct_arm.S

libavcodec/armv4l/mathops.h

libavcodec/armv4l/mpegvideo_arm.c

libavcodec/armv4l/mpegvideo_armv5te.c

libavcodec/armv4l/mpegvideo_iwmmxt.c

libavcodec/armv4l/simple_idct_arm.S

libavcodec/armv4l/simple_idct_armv5te.S

libavcodec/armv4l/simple_idct_armv6.S

libavcodec/i386

libavcodec/i386/cavsdsp_mmx.c

libavcodec/i386/cpuid.c

libavcodec/i386/dsputil_h264_template_mmx.c

libavcodec/i386/dsputil_h264_template_ssse3.c

libavcodec/i386/dsputil_mmx.c

libavcodec/i386/dsputil_mmx.h

libavcodec/i386/dsputil_mmx_avg_template.c

libavcodec/i386/dsputil_mmx_qns_template.c

libavcodec/i386/dsputil_mmx_rnd_template.c

libavcodec/i386/dsputil_yasm.asm

libavcodec/i386/dsputilenc_mmx.c

libavcodec/i386/fdct_mmx.c

libavcodec/i386/fft_3dn.c

libavcodec/i386/fft_3dn2.c

libavcodec/i386/fft_mmx.asm

libavcodec/i386/fft_sse.c

libavcodec/i386/flacdsp_mmx.c

libavcodec/i386/h264_i386.h

libavcodec/i386/h264dsp_mmx.c

libavcodec/i386/idct_mmx.c

libavcodec/i386/idct_mmx_xvid.c

libavcodec/i386/idct_sse2_xvid.c

libavcodec/i386/idct_xvid.h

libavcodec/i386/mathops.h

libavcodec/i386/mmx.h

libavcodec/i386/motion_est_mmx.c

libavcodec/i386/mpegvideo_mmx.c

libavcodec/i386/mpegvideo_mmx_template.c

libavcodec/i386/simple_idct_mmx.c

libavcodec/i386/snowdsp_mmx.c

libavcodec/i386/vc1dsp_mmx.c

libavcodec/i386/vp3dsp_mmx.c

libavcodec/i386/vp3dsp_mmx.h

libavcodec/i386/vp3dsp_sse2.c

libavcodec/i386/vp3dsp_sse2.h

libavcodec/i386/x86inc.asm

files modified:
Changelog

MAINTAINERS

Makefile

README

cmdutils.c

cmdutils.h

common.mak

configure

debian/changelog

debian/confflags

debian/control

debian/control.common

debian/control.ffmpeg-debian

debian/fixup-config.sh

debian/get-orig-source.sh

debian/patches/series

debian/rules

doc/faq.texi

doc/ffmpeg-doc.texi

doc/general.texi

doc/issue_tracker.txt

doc/optimization.txt

ffmpeg.c

ffplay.c

ffpresets/libx264-fastfirstpass.ffpreset

ffpresets/libx264-hq.ffpreset

ffpresets/libx264-max.ffpreset

ffpresets/libx264-normal.ffpreset

ffserver.c

libavcodec/4xm.c

libavcodec/8bps.c

libavcodec/Makefile

libavcodec/aac.c

libavcodec/aac.h

libavcodec/aac_ac3_parser.h

libavcodec/aac_parser.c

libavcodec/aactab.c

libavcodec/aactab.h

libavcodec/aasc.c

libavcodec/ac3.c

libavcodec/ac3.h

libavcodec/ac3_parser.c

libavcodec/ac3_parser.h

libavcodec/ac3dec.c

libavcodec/acelp_pitch_delay.c

libavcodec/acelp_pitch_delay.h

libavcodec/adpcm.c

libavcodec/adxdec.c

libavcodec/adxenc.c

libavcodec/alacenc.c

libavcodec/allcodecs.c

libavcodec/alpha/asm.h

libavcodec/alpha/dsputil_alpha.c

libavcodec/alpha/dsputil_alpha_asm.S

libavcodec/alpha/motion_est_mvi_asm.S

libavcodec/alpha/mpegvideo_alpha.c

libavcodec/alpha/simple_idct_alpha.c

libavcodec/apedec.c

libavcodec/asv1.c

libavcodec/audioconvert.c

libavcodec/avcodec.h

libavcodec/avs.c

libavcodec/bfin/dsputil_bfin.c

libavcodec/bfin/mathops.h

libavcodec/bfin/mpegvideo_bfin.c

libavcodec/bfin/vp3_bfin.c

libavcodec/bitstream.c

libavcodec/bitstream.h

libavcodec/bmp.c

libavcodec/bytestream.h

libavcodec/cabac.h

libavcodec/cavs.c

libavcodec/cavs.h

libavcodec/cavsdata.h

libavcodec/cavsdec.c

libavcodec/celp_math.h

libavcodec/cinepak.c

libavcodec/cljr.c

libavcodec/cook.c

libavcodec/cscd.c

libavcodec/dca.c

libavcodec/dca.h

libavcodec/dca_parser.c

libavcodec/dct-test.c

libavcodec/dirac_parser.c

libavcodec/dnxhddata.c

libavcodec/dnxhddec.c

libavcodec/dnxhdenc.c

libavcodec/dpcm.c

libavcodec/dsputil.c

libavcodec/dsputil.h

libavcodec/dv.c

libavcodec/dvbsub.c

libavcodec/dvbsubdec.c

libavcodec/dvdata.h

libavcodec/dvdsub_parser.c

libavcodec/dvdsubdec.c

libavcodec/dvdsubenc.c

libavcodec/dxa.c

libavcodec/eac3dec.c

libavcodec/eacmv.c

libavcodec/eatgq.c

libavcodec/eatgv.c

libavcodec/error_resilience.c

libavcodec/eval.c

libavcodec/eval.h

libavcodec/fft.c

libavcodec/ffv1.c

libavcodec/flacenc.c

libavcodec/flashsv.c

libavcodec/flicvideo.c

libavcodec/fraps.c

libavcodec/g726.c

libavcodec/gif.c

libavcodec/golomb.c

libavcodec/golomb.h

libavcodec/h263.c

libavcodec/h263.h

libavcodec/h263dec.c

libavcodec/h264.c

libavcodec/h264.h

libavcodec/h264_mp4toannexb_bsf.c

libavcodec/h264_parser.c

libavcodec/h264data.h

libavcodec/h264enc.c

libavcodec/h264idct.c

libavcodec/h264pred.c

libavcodec/h264pred.h

libavcodec/huffman.c

libavcodec/huffman.h

libavcodec/huffyuv.c

libavcodec/idcinvideo.c

libavcodec/imc.c

libavcodec/imgconvert.c

libavcodec/imgconvert.h

libavcodec/imgconvert_template.c

libavcodec/imgresample.c

libavcodec/indeo3.c

libavcodec/intrax8.c

libavcodec/jpeglsdec.c

libavcodec/jpeglsenc.c

libavcodec/lcldec.c

libavcodec/lclenc.c

libavcodec/libamr.c

libavcodec/libdirac.h

libavcodec/libdiracdec.c

libavcodec/libfaad.c

libavcodec/libmp3lame.c

libavcodec/libschroedinger.h

libavcodec/libschroedingerdec.c

libavcodec/libtheoraenc.c

libavcodec/libxvidff.c

libavcodec/loco.c

libavcodec/lsp.c

libavcodec/mathops.h

libavcodec/mdct.c

libavcodec/mimic.c

libavcodec/mjpega_dump_header_bsf.c

libavcodec/mjpegdec.c

libavcodec/mjpegdec.h

libavcodec/mlp.c

libavcodec/mlp.h

libavcodec/mlp_parser.c

libavcodec/mlpdec.c

libavcodec/mmvideo.c

libavcodec/motion_est.c

libavcodec/movsub_bsf.c

libavcodec/mpc.c

libavcodec/mpc.h

libavcodec/mpc7.c

libavcodec/mpc8.c

libavcodec/mpeg12.c

libavcodec/mpegaudio.h

libavcodec/mpegaudio_parser.c

libavcodec/mpegaudiodec.c

libavcodec/mpegaudioenc.c

libavcodec/mpegvideo.c

libavcodec/mpegvideo.h

libavcodec/mpegvideo_common.h

libavcodec/mpegvideo_enc.c

libavcodec/msmpeg4.c

libavcodec/msmpeg4.h

libavcodec/msmpeg4data.c

libavcodec/msrledec.c

libavcodec/msvideo1.c

libavcodec/nellymoserdec.c

libavcodec/nellymoserenc.c

libavcodec/opt.c

libavcodec/opt.h

libavcodec/pcm.c

libavcodec/png.h

libavcodec/pnmenc.c

libavcodec/ppc/dsputil_altivec.c

libavcodec/ppc/dsputil_altivec.h

libavcodec/ppc/dsputil_ppc.c

libavcodec/ppc/dsputil_ppc.h

libavcodec/ppc/fft_altivec.c

libavcodec/ppc/float_altivec.c

libavcodec/ppc/gcc_fixes.h

libavcodec/ppc/h264_altivec.c

libavcodec/ppc/h264_template_altivec.c

libavcodec/ppc/idct_altivec.c

libavcodec/ppc/imgresample_altivec.c

libavcodec/ppc/int_altivec.c

libavcodec/ppc/mathops.h

libavcodec/ppc/mpegvideo_altivec.c

libavcodec/ppc/types_altivec.h

libavcodec/ppc/util_altivec.h

libavcodec/pthread.c

libavcodec/ptx.c

libavcodec/qcelpdata.h

libavcodec/qcelpdec.c

libavcodec/qdm2.c

libavcodec/qdrw.c

libavcodec/qtrle.c

libavcodec/ratecontrol.c

libavcodec/raw.c

libavcodec/rectangle.h

libavcodec/rl2.c

libavcodec/roqaudioenc.c

libavcodec/roqvideoenc.c

libavcodec/rpza.c

libavcodec/rv10.c

libavcodec/rv30.c

libavcodec/rv30data.h

libavcodec/rv30dsp.c

libavcodec/rv34.c

libavcodec/rv34.h

libavcodec/rv34data.h

libavcodec/rv40.c

libavcodec/s3tc.c

libavcodec/sh4/dsputil_align.c

libavcodec/sh4/dsputil_sh4.c

libavcodec/sh4/idct_sh4.c

libavcodec/sh4/qpel.c

libavcodec/shorten.c

libavcodec/simple_idct.c

libavcodec/smacker.c

libavcodec/smc.c

libavcodec/snow.c

libavcodec/snow.h

libavcodec/sonic.c

libavcodec/sparc/dsputil_vis.c

libavcodec/sparc/simple_idct_vis.c

libavcodec/sunrast.c

libavcodec/svq1.c

libavcodec/svq1.h

libavcodec/svq1dec.c

libavcodec/svq1enc.c

libavcodec/svq3.c

libavcodec/targa.c

libavcodec/targaenc.c

libavcodec/tiff.c

libavcodec/tiff.h

libavcodec/tiffenc.c

libavcodec/truespeech.c

libavcodec/tta.c

libavcodec/txd.c

libavcodec/utils.c

libavcodec/vc1.c

libavcodec/vc1.h

libavcodec/vcr1.c

libavcodec/vmdav.c

libavcodec/vmnc.c

libavcodec/vorbis.c

libavcodec/vorbis.h

libavcodec/vorbis_dec.c

libavcodec/vorbis_enc.c

libavcodec/vp3.c

libavcodec/vp5.c

libavcodec/vp56.c

libavcodec/vp56.h

libavcodec/vp56data.c

libavcodec/vp56data.h

libavcodec/vp6.c

libavcodec/vp6data.h

libavcodec/vqavideo.c

libavcodec/wavpack.c

libavcodec/wmv2.c

libavcodec/wmv2dec.c

libavcodec/ws-snd1.c

libavcodec/xan.c

libavcodec/xiph.c

libavcodec/xl.c

libavcodec/xsubdec.c

libavcodec/xvmc_render.h

libavcodec/xvmcvideo.c

libavcodec/zmbv.c

libavcodec/zmbvenc.c

libavdevice/alldevices.c

libavdevice/audio.c

libavdevice/beosaudio.cpp

libavdevice/bktr.c

libavdevice/libdc1394.c

libavdevice/v4l.c

libavdevice/v4l2.c

libavdevice/vfwcap.c

libavdevice/x11grab.c

libavfilter/Makefile

libavfilter/allfilters.c

libavfilter/avfilter.c

libavfilter/avfilter.h

libavfilter/avfiltergraph.h

libavfilter/defaults.c

libavfilter/graphparser.c

libavfilter/graphparser.h

libavformat/4xm.c

libavformat/Makefile

libavformat/aiff.c

libavformat/allformats.c

libavformat/amr.c

libavformat/ape.c

libavformat/asf-enc.c

libavformat/asf.c

libavformat/asf.h

libavformat/au.c

libavformat/avc.c

libavformat/avc.h

libavformat/avformat.h

libavformat/avidec.c

libavformat/avienc.c

libavformat/avio.h

libavformat/aviobuf.c

libavformat/avs.c

libavformat/bethsoftvid.c

libavformat/bfi.c

libavformat/c93.c

libavformat/daud.c

libavformat/dsicin.c

libavformat/dv.c

libavformat/dv.h

libavformat/dvenc.c

libavformat/dxa.c

libavformat/electronicarts.c

libavformat/ffmdec.c

libavformat/ffmenc.c

libavformat/file.c

libavformat/flic.c

libavformat/flvdec.c

libavformat/flvenc.c

libavformat/framehook.c

libavformat/framehook.h

libavformat/gif.c

libavformat/gxf.c

libavformat/gxf.h

libavformat/gxfenc.c

libavformat/idcin.c

libavformat/idroq.c

libavformat/iff.c

libavformat/img2.c

libavformat/internal.h

libavformat/ipmovie.c

libavformat/isom.c

libavformat/isom.h

libavformat/libnut.c

libavformat/lmlm4.c

libavformat/matroska.c

libavformat/matroskadec.c

libavformat/matroskaenc.c

libavformat/mm.c

libavformat/mmf.c

libavformat/mov.c

libavformat/movenc.c

libavformat/mp3.c

libavformat/mpegenc.c

libavformat/mpegts.c

libavformat/mpegtsenc.c

libavformat/mtv.c

libavformat/mxf.h

libavformat/mxfdec.c

libavformat/network.h

libavformat/nut.c

libavformat/nut.h

libavformat/nutdec.c

libavformat/nutenc.c

libavformat/nuv.c

libavformat/oggdec.h

libavformat/oggparseflac.c

libavformat/oggparsevorbis.c

libavformat/os_support.c

libavformat/os_support.h

libavformat/psxstr.c

libavformat/raw.c

libavformat/rdt.c

libavformat/rdt.h

libavformat/riff.c

libavformat/riff.h

libavformat/rl2.c

libavformat/rm.h

libavformat/rmdec.c

libavformat/rmenc.c

libavformat/rtp.h

libavformat/rtp_h264.c

libavformat/rtp_internal.h

libavformat/rtpdec.c

libavformat/rtpproto.c

libavformat/rtsp.c

libavformat/rtsp.h

libavformat/sdp.c

libavformat/segafilm.c

libavformat/sierravmd.c

libavformat/siff.c

libavformat/smacker.c

libavformat/swfdec.c

libavformat/swfenc.c

libavformat/tcp.c

libavformat/thp.c

libavformat/tta.c

libavformat/txd.c

libavformat/udp.c

libavformat/utils.c

libavformat/vc1test.c

libavformat/voc.h

libavformat/vocdec.c

libavformat/vocenc.c

libavformat/wav.c

libavformat/wc3movie.c

libavformat/westwood.c

libavformat/wv.c

libavformat/xa.c

libavformat/yuv4mpeg.c

libavutil/Makefile

libavutil/adler32.c

libavutil/aes.c

libavutil/arm/bswap.h

libavutil/avutil.h

libavutil/bswap.h

libavutil/common.h

libavutil/crc.c

libavutil/des.c

libavutil/fifo.h

libavutil/internal.h

libavutil/intreadwrite.h

libavutil/log.h

libavutil/mathematics.c

libavutil/mathematics.h

libavutil/md5.c

libavutil/mem.c

libavutil/mem.h

libavutil/pca.c

libavutil/random.c

libavutil/random.h

libavutil/rational.c

libavutil/sha1.c

libavutil/tree.c

libavutil/x86/bswap.h

libavutil/x86_cpu.h

libpostproc/postprocess.c

libpostproc/postprocess.h

libpostproc/postprocess_template.c

libswscale/Makefile

libswscale/rgb2rgb.c

libswscale/rgb2rgb.h

libswscale/rgb2rgb_template.c

libswscale/swscale-example.c

libswscale/swscale.c

libswscale/swscale_bfin.c

libswscale/swscale_internal.h

libswscale/swscale_template.c

libswscale/yuv2rgb.c

libswscale/yuv2rgb_altivec.c

libswscale/yuv2rgb_bfin.c

libswscale/yuv2rgb_template.c

subdir.mak

tests/ffmpeg.regression.ref

tests/libav.regression.ref

tests/regression.sh

tests/rotozoom.regression.ref

tests/seek.regression.ref

tests/seek_test.sh

Show diffs side-by-side

added added

removed removed

libavcodec/i386/cavsdsp_mmx.c

* Chinese AVS video (AVS1-P2, JiZhun profile) decoder.

* MMX-optimized DSP functions, based on H.264 optimizations by

* Michael Niedermayer and Loren Merritt

* This file is part of FFmpeg.

* FFmpeg is free software; you can redistribute it and/or

* modify it under the terms of the GNU Lesser General Public

* License as published by the Free Software Foundation; either

* version 2.1 of the License, or (at your option) any later version.

* FFmpeg is distributed in the hope that it will be useful,

* but WITHOUT ANY WARRANTY; without even the implied warranty of

* MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE. See the GNU

* Lesser General Public License for more details.

* You should have received a copy of the GNU Lesser General Public

* License along with FFmpeg; if not, write to the Free Software

* Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA

#include "libavutil/common.h"

#include "libavutil/x86_cpu.h"

#include "libavcodec/dsputil.h"

#include "dsputil_mmx.h"

/*****************************************************************************

* inverse transform

****************************************************************************/

static inline void cavs_idct8_1d(int16_t *block, uint64_t bias)

{

__asm__ volatile(

"movq 112(%0), %%mm4 \n\t" /* mm4 = src7 */

"movq 16(%0), %%mm5 \n\t" /* mm5 = src1 */

"movq 80(%0), %%mm2 \n\t" /* mm2 = src5 */

"movq 48(%0), %%mm7 \n\t" /* mm7 = src3 */

"movq %%mm4, %%mm0 \n\t"

"movq %%mm5, %%mm3 \n\t"

"movq %%mm2, %%mm6 \n\t"

"movq %%mm7, %%mm1 \n\t"

"paddw %%mm4, %%mm4 \n\t" /* mm4 = 2*src7 */

"paddw %%mm3, %%mm3 \n\t" /* mm3 = 2*src1 */

"paddw %%mm6, %%mm6 \n\t" /* mm6 = 2*src5 */

"paddw %%mm1, %%mm1 \n\t" /* mm1 = 2*src3 */

"paddw %%mm4, %%mm0 \n\t" /* mm0 = 3*src7 */

"paddw %%mm3, %%mm5 \n\t" /* mm5 = 3*src1 */

"paddw %%mm6, %%mm2 \n\t" /* mm2 = 3*src5 */

"paddw %%mm1, %%mm7 \n\t" /* mm7 = 3*src3 */

"psubw %%mm4, %%mm5 \n\t" /* mm5 = 3*src1 - 2*src7 = a0 */

"paddw %%mm6, %%mm7 \n\t" /* mm7 = 3*src3 + 2*src5 = a1 */

"psubw %%mm2, %%mm1 \n\t" /* mm1 = 2*src3 - 3*src5 = a2 */

"paddw %%mm0, %%mm3 \n\t" /* mm3 = 2*src1 + 3*src7 = a3 */

"movq %%mm5, %%mm4 \n\t"

"movq %%mm7, %%mm6 \n\t"

"movq %%mm3, %%mm0 \n\t"

"movq %%mm1, %%mm2 \n\t"

SUMSUB_BA( %%mm7, %%mm5 ) /* mm7 = a0 + a1 mm5 = a0 - a1 */

"paddw %%mm3, %%mm7 \n\t" /* mm7 = a0 + a1 + a3 */

"paddw %%mm1, %%mm5 \n\t" /* mm5 = a0 - a1 + a2 */

"paddw %%mm7, %%mm7 \n\t"

"paddw %%mm5, %%mm5 \n\t"

"paddw %%mm6, %%mm7 \n\t" /* mm7 = b4 */

"paddw %%mm4, %%mm5 \n\t" /* mm5 = b5 */

SUMSUB_BA( %%mm1, %%mm3 ) /* mm1 = a3 + a2 mm3 = a3 - a2 */

"psubw %%mm1, %%mm4 \n\t" /* mm4 = a0 - a2 - a3 */

"movq %%mm4, %%mm1 \n\t" /* mm1 = a0 - a2 - a3 */

"psubw %%mm6, %%mm3 \n\t" /* mm3 = a3 - a2 - a1 */

"paddw %%mm1, %%mm1 \n\t"

"paddw %%mm3, %%mm3 \n\t"

"psubw %%mm2, %%mm1 \n\t" /* mm1 = b7 */

"paddw %%mm0, %%mm3 \n\t" /* mm3 = b6 */

"movq 32(%0), %%mm2 \n\t" /* mm2 = src2 */

"movq 96(%0), %%mm6 \n\t" /* mm6 = src6 */

"movq %%mm2, %%mm4 \n\t"

"movq %%mm6, %%mm0 \n\t"

"psllw $2, %%mm4 \n\t" /* mm4 = 4*src2 */

"psllw $2, %%mm6 \n\t" /* mm6 = 4*src6 */

"paddw %%mm4, %%mm2 \n\t" /* mm2 = 5*src2 */

"paddw %%mm6, %%mm0 \n\t" /* mm0 = 5*src6 */

"paddw %%mm2, %%mm2 \n\t"

"paddw %%mm0, %%mm0 \n\t"

"psubw %%mm0, %%mm4 \n\t" /* mm4 = 4*src2 - 10*src6 = a7 */

"paddw %%mm2, %%mm6 \n\t" /* mm6 = 4*src6 + 10*src2 = a6 */

"movq (%0), %%mm2 \n\t" /* mm2 = src0 */

"movq 64(%0), %%mm0 \n\t" /* mm0 = src4 */

SUMSUB_BA( %%mm0, %%mm2 ) /* mm0 = src0+src4 mm2 = src0-src4 */

"psllw $3, %%mm0 \n\t"

"psllw $3, %%mm2 \n\t"

100

"paddw %1, %%mm0 \n\t" /* add rounding bias */

101

"paddw %1, %%mm2 \n\t" /* add rounding bias */

102

103

SUMSUB_BA( %%mm6, %%mm0 ) /* mm6 = a4 + a6 mm0 = a4 - a6 */

104

SUMSUB_BA( %%mm4, %%mm2 ) /* mm4 = a5 + a7 mm2 = a5 - a7 */

105

SUMSUB_BA( %%mm7, %%mm6 ) /* mm7 = dst0 mm6 = dst7 */

106

SUMSUB_BA( %%mm5, %%mm4 ) /* mm5 = dst1 mm4 = dst6 */

107

SUMSUB_BA( %%mm3, %%mm2 ) /* mm3 = dst2 mm2 = dst5 */

108

SUMSUB_BA( %%mm1, %%mm0 ) /* mm1 = dst3 mm0 = dst4 */

109

:: "r"(block), "m"(bias)

110

);

111

}

112

113

static void cavs_idct8_add_mmx(uint8_t *dst, int16_t *block, int stride)

114

{

115

int i;

116

DECLARE_ALIGNED_8(int16_t, b2[64]);

117

118

for(i=0; i<2; i++){

119

DECLARE_ALIGNED_8(uint64_t, tmp);

120

121

cavs_idct8_1d(block+4*i, ff_pw_4);

122

123

__asm__ volatile(

124

"psraw $3, %%mm7 \n\t"

125

"psraw $3, %%mm6 \n\t"

126

"psraw $3, %%mm5 \n\t"

127

"psraw $3, %%mm4 \n\t"

128

"psraw $3, %%mm3 \n\t"

129

"psraw $3, %%mm2 \n\t"

130

"psraw $3, %%mm1 \n\t"

131

"psraw $3, %%mm0 \n\t"

132

"movq %%mm7, %0 \n\t"

133

TRANSPOSE4( %%mm0, %%mm2, %%mm4, %%mm6, %%mm7 )

134

"movq %%mm0, 8(%1) \n\t"

135

"movq %%mm6, 24(%1) \n\t"

136

"movq %%mm7, 40(%1) \n\t"

137

"movq %%mm4, 56(%1) \n\t"

138

"movq %0, %%mm7 \n\t"

139

TRANSPOSE4( %%mm7, %%mm5, %%mm3, %%mm1, %%mm0 )

140

"movq %%mm7, (%1) \n\t"

141

"movq %%mm1, 16(%1) \n\t"

142

"movq %%mm0, 32(%1) \n\t"

143

"movq %%mm3, 48(%1) \n\t"

144

: "=m"(tmp)

145

: "r"(b2+32*i)

146

: "memory"

147

);

148

}

149

150

for(i=0; i<2; i++){

151

cavs_idct8_1d(b2+4*i, ff_pw_64);

152

153

__asm__ volatile(

154

"psraw $7, %%mm7 \n\t"

155

"psraw $7, %%mm6 \n\t"

156

"psraw $7, %%mm5 \n\t"

157

"psraw $7, %%mm4 \n\t"

158

"psraw $7, %%mm3 \n\t"

159

"psraw $7, %%mm2 \n\t"

160

"psraw $7, %%mm1 \n\t"

161

"psraw $7, %%mm0 \n\t"

162

"movq %%mm7, (%0) \n\t"

163

"movq %%mm5, 16(%0) \n\t"

164

"movq %%mm3, 32(%0) \n\t"

165

"movq %%mm1, 48(%0) \n\t"

166

"movq %%mm0, 64(%0) \n\t"

167

"movq %%mm2, 80(%0) \n\t"

168

"movq %%mm4, 96(%0) \n\t"

169

"movq %%mm6, 112(%0) \n\t"

170

:: "r"(b2+4*i)

171

: "memory"

172

);

173

}

174

175

add_pixels_clamped_mmx(b2, dst, stride);

176

177

/* clear block */

178

__asm__ volatile(

179

"pxor %%mm7, %%mm7 \n\t"

180

"movq %%mm7, (%0) \n\t"

181

"movq %%mm7, 8(%0) \n\t"

182

"movq %%mm7, 16(%0) \n\t"

183

"movq %%mm7, 24(%0) \n\t"

184

"movq %%mm7, 32(%0) \n\t"

185

"movq %%mm7, 40(%0) \n\t"

186

"movq %%mm7, 48(%0) \n\t"

187

"movq %%mm7, 56(%0) \n\t"

188

"movq %%mm7, 64(%0) \n\t"

189

"movq %%mm7, 72(%0) \n\t"

190

"movq %%mm7, 80(%0) \n\t"

191

"movq %%mm7, 88(%0) \n\t"

192

"movq %%mm7, 96(%0) \n\t"

193

"movq %%mm7, 104(%0) \n\t"

194

"movq %%mm7, 112(%0) \n\t"

195

"movq %%mm7, 120(%0) \n\t"

196

:: "r" (block)

197

);

198

}

199

200

/*****************************************************************************

201

202

* motion compensation

203

204

****************************************************************************/

205

206

/* vertical filter [-1 -2 96 42 -7 0] */

207

#define QPEL_CAVSV1(A,B,C,D,E,F,OP) \

208

"movd (%0), "#F" \n\t"\

209

"movq "#C", %%mm6 \n\t"\

210

"pmullw %5, %%mm6 \n\t"\

211

"movq "#D", %%mm7 \n\t"\

212

"pmullw %6, %%mm7 \n\t"\

213

"psllw $3, "#E" \n\t"\

214

"psubw "#E", %%mm6 \n\t"\

215

"psraw $3, "#E" \n\t"\

216

"paddw %%mm7, %%mm6 \n\t"\

217

"paddw "#E", %%mm6 \n\t"\

218

"paddw "#B", "#B" \n\t"\

219

"pxor %%mm7, %%mm7 \n\t"\

220

"add %2, %0 \n\t"\

221

"punpcklbw %%mm7, "#F" \n\t"\

222

"psubw "#B", %%mm6 \n\t"\

223

"psraw $1, "#B" \n\t"\

224

"psubw "#A", %%mm6 \n\t"\

225

"paddw %4, %%mm6 \n\t"\

226

"psraw $7, %%mm6 \n\t"\

227

"packuswb %%mm6, %%mm6 \n\t"\

228

OP(%%mm6, (%1), A, d) \

229

"add %3, %1 \n\t"

230

231

/* vertical filter [ 0 -1 5 5 -1 0] */

232

#define QPEL_CAVSV2(A,B,C,D,E,F,OP) \

233

"movd (%0), "#F" \n\t"\

234

"movq "#C", %%mm6 \n\t"\

235

"paddw "#D", %%mm6 \n\t"\

236

"pmullw %5, %%mm6 \n\t"\

237

"add %2, %0 \n\t"\

238

"punpcklbw %%mm7, "#F" \n\t"\

239

"psubw "#B", %%mm6 \n\t"\

240

"psubw "#E", %%mm6 \n\t"\

241

"paddw %4, %%mm6 \n\t"\

242

"psraw $3, %%mm6 \n\t"\

243

"packuswb %%mm6, %%mm6 \n\t"\

244

OP(%%mm6, (%1), A, d) \

245

"add %3, %1 \n\t"

246

247

/* vertical filter [ 0 -7 42 96 -2 -1] */

248

#define QPEL_CAVSV3(A,B,C,D,E,F,OP) \

249

"movd (%0), "#F" \n\t"\

250

"movq "#C", %%mm6 \n\t"\

251

"pmullw %6, %%mm6 \n\t"\

252

"movq "#D", %%mm7 \n\t"\

253

"pmullw %5, %%mm7 \n\t"\

254

"psllw $3, "#B" \n\t"\

255

"psubw "#B", %%mm6 \n\t"\

256

"psraw $3, "#B" \n\t"\

257

"paddw %%mm7, %%mm6 \n\t"\

258

"paddw "#B", %%mm6 \n\t"\

259

"paddw "#E", "#E" \n\t"\

260

"pxor %%mm7, %%mm7 \n\t"\

261

"add %2, %0 \n\t"\

262

"punpcklbw %%mm7, "#F" \n\t"\

263

"psubw "#E", %%mm6 \n\t"\

264

"psraw $1, "#E" \n\t"\

265

"psubw "#F", %%mm6 \n\t"\

266

"paddw %4, %%mm6 \n\t"\

267

"psraw $7, %%mm6 \n\t"\

268

"packuswb %%mm6, %%mm6 \n\t"\

269

OP(%%mm6, (%1), A, d) \

270

"add %3, %1 \n\t"

271

272

273

#define QPEL_CAVSVNUM(VOP,OP,ADD,MUL1,MUL2)\

274

int w= 2;\

275

src -= 2*srcStride;\

276

277

while(w--){\

278

__asm__ volatile(\

279

"pxor %%mm7, %%mm7 \n\t"\

280

"movd (%0), %%mm0 \n\t"\

281

"add %2, %0 \n\t"\

282

"movd (%0), %%mm1 \n\t"\

283

"add %2, %0 \n\t"\

284

"movd (%0), %%mm2 \n\t"\

285

"add %2, %0 \n\t"\

286

"movd (%0), %%mm3 \n\t"\

287

"add %2, %0 \n\t"\

288

"movd (%0), %%mm4 \n\t"\

289

"add %2, %0 \n\t"\

290

"punpcklbw %%mm7, %%mm0 \n\t"\

291

"punpcklbw %%mm7, %%mm1 \n\t"\

292

"punpcklbw %%mm7, %%mm2 \n\t"\

293

"punpcklbw %%mm7, %%mm3 \n\t"\

294

"punpcklbw %%mm7, %%mm4 \n\t"\

295

VOP(%%mm0, %%mm1, %%mm2, %%mm3, %%mm4, %%mm5, OP)\

296

VOP(%%mm1, %%mm2, %%mm3, %%mm4, %%mm5, %%mm0, OP)\

297

VOP(%%mm2, %%mm3, %%mm4, %%mm5, %%mm0, %%mm1, OP)\

298

VOP(%%mm3, %%mm4, %%mm5, %%mm0, %%mm1, %%mm2, OP)\

299

VOP(%%mm4, %%mm5, %%mm0, %%mm1, %%mm2, %%mm3, OP)\

300

VOP(%%mm5, %%mm0, %%mm1, %%mm2, %%mm3, %%mm4, OP)\

301

VOP(%%mm0, %%mm1, %%mm2, %%mm3, %%mm4, %%mm5, OP)\

302

VOP(%%mm1, %%mm2, %%mm3, %%mm4, %%mm5, %%mm0, OP)\

303

304

: "+a"(src), "+c"(dst)\

305

: "S"((x86_reg)srcStride), "D"((x86_reg)dstStride), "m"(ADD), "m"(MUL1), "m"(MUL2)\

306

: "memory"\

307

);\

308

if(h==16){\

309

__asm__ volatile(\

310

VOP(%%mm2, %%mm3, %%mm4, %%mm5, %%mm0, %%mm1, OP)\

311

VOP(%%mm3, %%mm4, %%mm5, %%mm0, %%mm1, %%mm2, OP)\

312

VOP(%%mm4, %%mm5, %%mm0, %%mm1, %%mm2, %%mm3, OP)\

313

VOP(%%mm5, %%mm0, %%mm1, %%mm2, %%mm3, %%mm4, OP)\

314

VOP(%%mm0, %%mm1, %%mm2, %%mm3, %%mm4, %%mm5, OP)\

315

VOP(%%mm1, %%mm2, %%mm3, %%mm4, %%mm5, %%mm0, OP)\

316

VOP(%%mm2, %%mm3, %%mm4, %%mm5, %%mm0, %%mm1, OP)\

317

VOP(%%mm3, %%mm4, %%mm5, %%mm0, %%mm1, %%mm2, OP)\

318

319

: "+a"(src), "+c"(dst)\

320

: "S"((x86_reg)srcStride), "D"((x86_reg)dstStride), "m"(ADD), "m"(MUL1), "m"(MUL2)\

321

: "memory"\

322

);\

323

324

src += 4-(h+5)*srcStride;\

325

dst += 4-h*dstStride;\

326

}

327

328

#define QPEL_CAVS(OPNAME, OP, MMX)\

329

static void OPNAME ## cavs_qpel8_h_ ## MMX(uint8_t *dst, uint8_t *src, int dstStride, int srcStride){\

330

int h=8;\

331

__asm__ volatile(\

332

"pxor %%mm7, %%mm7 \n\t"\

333

"movq %5, %%mm6 \n\t"\

334

"1: \n\t"\

335

"movq (%0), %%mm0 \n\t"\

336

"movq 1(%0), %%mm2 \n\t"\

337

"movq %%mm0, %%mm1 \n\t"\

338

"movq %%mm2, %%mm3 \n\t"\

339

"punpcklbw %%mm7, %%mm0 \n\t"\

340

"punpckhbw %%mm7, %%mm1 \n\t"\

341

"punpcklbw %%mm7, %%mm2 \n\t"\

342

"punpckhbw %%mm7, %%mm3 \n\t"\

343

"paddw %%mm2, %%mm0 \n\t"\

344

"paddw %%mm3, %%mm1 \n\t"\

345

"pmullw %%mm6, %%mm0 \n\t"\

346

"pmullw %%mm6, %%mm1 \n\t"\

347

"movq -1(%0), %%mm2 \n\t"\

348

"movq 2(%0), %%mm4 \n\t"\

349

"movq %%mm2, %%mm3 \n\t"\

350

"movq %%mm4, %%mm5 \n\t"\

351

"punpcklbw %%mm7, %%mm2 \n\t"\

352

"punpckhbw %%mm7, %%mm3 \n\t"\

353

"punpcklbw %%mm7, %%mm4 \n\t"\

354

"punpckhbw %%mm7, %%mm5 \n\t"\

355

"paddw %%mm4, %%mm2 \n\t"\

356

"paddw %%mm3, %%mm5 \n\t"\

357

"psubw %%mm2, %%mm0 \n\t"\

358

"psubw %%mm5, %%mm1 \n\t"\

359

"movq %6, %%mm5 \n\t"\

360

"paddw %%mm5, %%mm0 \n\t"\

361

"paddw %%mm5, %%mm1 \n\t"\

362

"psraw $3, %%mm0 \n\t"\

363

"psraw $3, %%mm1 \n\t"\

364

"packuswb %%mm1, %%mm0 \n\t"\

365

OP(%%mm0, (%1),%%mm5, q) \

366

"add %3, %0 \n\t"\

367

"add %4, %1 \n\t"\

368

"decl %2 \n\t"\

369

" jnz 1b \n\t"\

370

: "+a"(src), "+c"(dst), "+m"(h)\

371

: "d"((x86_reg)srcStride), "S"((x86_reg)dstStride), "m"(ff_pw_5), "m"(ff_pw_4)\

372

: "memory"\

373

);\

374

375

376

static inline void OPNAME ## cavs_qpel8or16_v1_ ## MMX(uint8_t *dst, uint8_t *src, int dstStride, int srcStride, int h){\

377

QPEL_CAVSVNUM(QPEL_CAVSV1,OP,ff_pw_64,ff_pw_96,ff_pw_42) \

378

379

380

static inline void OPNAME ## cavs_qpel8or16_v2_ ## MMX(uint8_t *dst, uint8_t *src, int dstStride, int srcStride, int h){\

381

QPEL_CAVSVNUM(QPEL_CAVSV2,OP,ff_pw_4,ff_pw_5,ff_pw_5) \

382

383

384

static inline void OPNAME ## cavs_qpel8or16_v3_ ## MMX(uint8_t *dst, uint8_t *src, int dstStride, int srcStride, int h){\

385

QPEL_CAVSVNUM(QPEL_CAVSV3,OP,ff_pw_64,ff_pw_96,ff_pw_42) \

386

387

388

static void OPNAME ## cavs_qpel8_v1_ ## MMX(uint8_t *dst, uint8_t *src, int dstStride, int srcStride){\

389

OPNAME ## cavs_qpel8or16_v1_ ## MMX(dst , src , dstStride, srcStride, 8);\

390

391

static void OPNAME ## cavs_qpel16_v1_ ## MMX(uint8_t *dst, uint8_t *src, int dstStride, int srcStride){\

392

OPNAME ## cavs_qpel8or16_v1_ ## MMX(dst , src , dstStride, srcStride, 16);\

393

OPNAME ## cavs_qpel8or16_v1_ ## MMX(dst+8, src+8, dstStride, srcStride, 16);\

394

395

396

static void OPNAME ## cavs_qpel8_v2_ ## MMX(uint8_t *dst, uint8_t *src, int dstStride, int srcStride){\

397

OPNAME ## cavs_qpel8or16_v2_ ## MMX(dst , src , dstStride, srcStride, 8);\

398

399

static void OPNAME ## cavs_qpel16_v2_ ## MMX(uint8_t *dst, uint8_t *src, int dstStride, int srcStride){\

400

OPNAME ## cavs_qpel8or16_v2_ ## MMX(dst , src , dstStride, srcStride, 16);\

401

OPNAME ## cavs_qpel8or16_v2_ ## MMX(dst+8, src+8, dstStride, srcStride, 16);\

402

403

404

static void OPNAME ## cavs_qpel8_v3_ ## MMX(uint8_t *dst, uint8_t *src, int dstStride, int srcStride){\

405

OPNAME ## cavs_qpel8or16_v3_ ## MMX(dst , src , dstStride, srcStride, 8);\

406

407

static void OPNAME ## cavs_qpel16_v3_ ## MMX(uint8_t *dst, uint8_t *src, int dstStride, int srcStride){\

408

OPNAME ## cavs_qpel8or16_v3_ ## MMX(dst , src , dstStride, srcStride, 16);\

409

OPNAME ## cavs_qpel8or16_v3_ ## MMX(dst+8, src+8, dstStride, srcStride, 16);\

410

411

412

static void OPNAME ## cavs_qpel16_h_ ## MMX(uint8_t *dst, uint8_t *src, int dstStride, int srcStride){\

413

OPNAME ## cavs_qpel8_h_ ## MMX(dst , src , dstStride, srcStride);\

414

OPNAME ## cavs_qpel8_h_ ## MMX(dst+8, src+8, dstStride, srcStride);\

415

src += 8*srcStride;\

416

dst += 8*dstStride;\

417

OPNAME ## cavs_qpel8_h_ ## MMX(dst , src , dstStride, srcStride);\

418

OPNAME ## cavs_qpel8_h_ ## MMX(dst+8, src+8, dstStride, srcStride);\

419

420

421

#define CAVS_MC(OPNAME, SIZE, MMX) \

422

static void ff_ ## OPNAME ## cavs_qpel ## SIZE ## _mc20_ ## MMX(uint8_t *dst, uint8_t *src, int stride){\

423

OPNAME ## cavs_qpel ## SIZE ## _h_ ## MMX(dst, src, stride, stride);\

424

425

426

static void ff_ ## OPNAME ## cavs_qpel ## SIZE ## _mc01_ ## MMX(uint8_t *dst, uint8_t *src, int stride){\

427

OPNAME ## cavs_qpel ## SIZE ## _v1_ ## MMX(dst, src, stride, stride);\

428

429

430

static void ff_ ## OPNAME ## cavs_qpel ## SIZE ## _mc02_ ## MMX(uint8_t *dst, uint8_t *src, int stride){\

431

OPNAME ## cavs_qpel ## SIZE ## _v2_ ## MMX(dst, src, stride, stride);\

432

433

434

static void ff_ ## OPNAME ## cavs_qpel ## SIZE ## _mc03_ ## MMX(uint8_t *dst, uint8_t *src, int stride){\

435

OPNAME ## cavs_qpel ## SIZE ## _v3_ ## MMX(dst, src, stride, stride);\

436

437

438

#define PUT_OP(a,b,temp, size) "mov" #size " " #a ", " #b " \n\t"

439

#define AVG_3DNOW_OP(a,b,temp, size) \

440

"mov" #size " " #b ", " #temp " \n\t"\

441

"pavgusb " #temp ", " #a " \n\t"\

442

"mov" #size " " #a ", " #b " \n\t"

443

#define AVG_MMX2_OP(a,b,temp, size) \

444

"mov" #size " " #b ", " #temp " \n\t"\

445

"pavgb " #temp ", " #a " \n\t"\

446

"mov" #size " " #a ", " #b " \n\t"

447

448

QPEL_CAVS(put_, PUT_OP, 3dnow)

449

QPEL_CAVS(avg_, AVG_3DNOW_OP, 3dnow)

450

QPEL_CAVS(put_, PUT_OP, mmx2)

451

QPEL_CAVS(avg_, AVG_MMX2_OP, mmx2)

452

453

CAVS_MC(put_, 8, 3dnow)

454

CAVS_MC(put_, 16,3dnow)

455

CAVS_MC(avg_, 8, 3dnow)

456

CAVS_MC(avg_, 16,3dnow)

457

CAVS_MC(put_, 8, mmx2)

458

CAVS_MC(put_, 16,mmx2)

459

CAVS_MC(avg_, 8, mmx2)

460

CAVS_MC(avg_, 16,mmx2)

461

462

void ff_put_cavs_qpel8_mc00_mmx2(uint8_t *dst, uint8_t *src, int stride);

463

void ff_avg_cavs_qpel8_mc00_mmx2(uint8_t *dst, uint8_t *src, int stride);

464

void ff_put_cavs_qpel16_mc00_mmx2(uint8_t *dst, uint8_t *src, int stride);

465

void ff_avg_cavs_qpel16_mc00_mmx2(uint8_t *dst, uint8_t *src, int stride);

466

467

void ff_cavsdsp_init_mmx2(DSPContext* c, AVCodecContext *avctx) {

468

#define dspfunc(PFX, IDX, NUM) \

469

c->PFX ## _pixels_tab[IDX][ 0] = ff_ ## PFX ## NUM ## _mc00_mmx2; \

470

c->PFX ## _pixels_tab[IDX][ 2] = ff_ ## PFX ## NUM ## _mc20_mmx2; \

471

c->PFX ## _pixels_tab[IDX][ 4] = ff_ ## PFX ## NUM ## _mc01_mmx2; \

472

c->PFX ## _pixels_tab[IDX][ 8] = ff_ ## PFX ## NUM ## _mc02_mmx2; \

473

c->PFX ## _pixels_tab[IDX][12] = ff_ ## PFX ## NUM ## _mc03_mmx2; \

474

475

dspfunc(put_cavs_qpel, 0, 16);

476

dspfunc(put_cavs_qpel, 1, 8);

477

dspfunc(avg_cavs_qpel, 0, 16);

478

dspfunc(avg_cavs_qpel, 1, 8);

479

#undef dspfunc

480

c->cavs_idct8_add = cavs_idct8_add_mmx;

481

}

482

483

void ff_cavsdsp_init_3dnow(DSPContext* c, AVCodecContext *avctx) {

484

#define dspfunc(PFX, IDX, NUM) \

485

c->PFX ## _pixels_tab[IDX][ 0] = ff_ ## PFX ## NUM ## _mc00_mmx2; \

486

c->PFX ## _pixels_tab[IDX][ 2] = ff_ ## PFX ## NUM ## _mc20_3dnow; \

487

c->PFX ## _pixels_tab[IDX][ 4] = ff_ ## PFX ## NUM ## _mc01_3dnow; \

488

c->PFX ## _pixels_tab[IDX][ 8] = ff_ ## PFX ## NUM ## _mc02_3dnow; \

489

c->PFX ## _pixels_tab[IDX][12] = ff_ ## PFX ## NUM ## _mc03_3dnow; \

490

491

dspfunc(put_cavs_qpel, 0, 16);

492

dspfunc(put_cavs_qpel, 1, 8);

493

dspfunc(avg_cavs_qpel, 0, 16);

494

dspfunc(avg_cavs_qpel, 1, 8);

495

#undef dspfunc

496

c->cavs_idct8_add = cavs_idct8_add_mmx;

497

}

Older »