~ubuntu-branches/ubuntu/utopic/ffmpeg-debian/utopic

« back to all changes in this revision

Viewing changes to libpostproc/postprocess_template.c

Committer: Bazaar Package Importer
Author(s): Reinhard Tartler
Date: 2009-01-20 09:20:53 UTC
mfrom: (1.1.3 upstream)
Revision ID: james.westby@ubuntu.com-20090120092053-izz63p40hc98qfgp

Tags: 3:0.svn20090119-1ubuntu1

https://launchpad.net/bugs/318501

https://launchpad.net/bugs/253767

* merge from debian. LP: #318501
* new version fixes CVE-2008-3230, LP: #253767

files added:
.svnrevision

debian/README.upstream-upgrade

ffpresets/libx264-baseline.ffpreset

ffpresets/libx264-ipod320.ffpreset

ffpresets/libx264-ipod640.ffpreset

ffpresets/libx264-lossless_fast.ffpreset

ffpresets/libx264-lossless_max.ffpreset

ffpresets/libx264-lossless_medium.ffpreset

ffpresets/libx264-lossless_slow.ffpreset

ffpresets/libx264-lossless_slower.ffpreset

ffpresets/libx264-lossless_ultrafast.ffpreset

ffpresets/libx264-main.ffpreset

ffpresets/libx264-slowfirstpass.ffpreset

libavcodec/aac_parser.h

libavcodec/aandcttab.c

libavcodec/aandcttab.h

libavcodec/arm

libavcodec/arm/asm.S

libavcodec/arm/dsputil_arm.c

libavcodec/arm/dsputil_arm_s.S

libavcodec/arm/dsputil_iwmmxt.c

libavcodec/arm/dsputil_iwmmxt_rnd_template.c

libavcodec/arm/dsputil_neon.c

libavcodec/arm/dsputil_neon_s.S

libavcodec/arm/dsputil_vfp.S

libavcodec/arm/float_arm_vfp.c

libavcodec/arm/h264dsp_neon.S

libavcodec/arm/h264idct_neon.S

libavcodec/arm/jrevdct_arm.S

libavcodec/arm/mathops.h

libavcodec/arm/mpegvideo_arm.c

libavcodec/arm/mpegvideo_armv5te.c

libavcodec/arm/mpegvideo_armv5te_s.S

libavcodec/arm/mpegvideo_iwmmxt.c

libavcodec/arm/simple_idct_arm.S

libavcodec/arm/simple_idct_armv5te.S

libavcodec/arm/simple_idct_armv6.S

libavcodec/arm/simple_idct_neon.S

libavcodec/dnxhdenc.h

libavcodec/faxcompr.c

libavcodec/faxcompr.h

libavcodec/internal.h

libavcodec/options.c

libavcodec/qcelp_lsp.c

libavcodec/rv40dsp.c

libavcodec/sh4/sh4.h

libavcodec/vdpau.h

libavcodec/vdpau_internal.h

libavcodec/vdpauvideo.c

libavcodec/x86

libavcodec/x86/cavsdsp_mmx.c

libavcodec/x86/cpuid.c

libavcodec/x86/dnxhd_mmx.c

libavcodec/x86/dsputil_h264_template_mmx.c

libavcodec/x86/dsputil_h264_template_ssse3.c

libavcodec/x86/dsputil_mmx.c

libavcodec/x86/dsputil_mmx.h

libavcodec/x86/dsputil_mmx_avg_template.c

libavcodec/x86/dsputil_mmx_qns_template.c

libavcodec/x86/dsputil_mmx_rnd_template.c

libavcodec/x86/dsputil_yasm.asm

libavcodec/x86/dsputilenc_mmx.c

libavcodec/x86/fdct_mmx.c

libavcodec/x86/fft_3dn.c

libavcodec/x86/fft_3dn2.c

libavcodec/x86/fft_mmx.asm

libavcodec/x86/fft_sse.c

libavcodec/x86/flacdsp_mmx.c

libavcodec/x86/h264_deblock_sse2.asm

libavcodec/x86/h264_i386.h

libavcodec/x86/h264_idct_sse2.asm

libavcodec/x86/h264dsp_mmx.c

libavcodec/x86/idct_mmx.c

libavcodec/x86/idct_mmx_xvid.c

libavcodec/x86/idct_sse2_xvid.c

libavcodec/x86/idct_xvid.h

libavcodec/x86/mathops.h

libavcodec/x86/mmx.h

libavcodec/x86/motion_est_mmx.c

libavcodec/x86/mpegvideo_mmx.c

libavcodec/x86/mpegvideo_mmx_template.c

libavcodec/x86/rv40dsp_mmx.c

libavcodec/x86/simple_idct_mmx.c

libavcodec/x86/snowdsp_mmx.c

libavcodec/x86/vc1dsp_mmx.c

libavcodec/x86/vp3dsp_mmx.c

libavcodec/x86/vp3dsp_mmx.h

libavcodec/x86/vp3dsp_sse2.c

libavcodec/x86/vp3dsp_sse2.h

libavcodec/x86/x86inc.asm

libavcodec/x86/x86util.asm

libavformat/id3v2.c

libavformat/id3v2.h

libavformat/iss.c

libavformat/metadata.c

libavformat/metadata.h

libavformat/metadata_compat.c

libavformat/options.c

libavutil/timer.h

libswscale/.svnrevision

files removed:
debian/patches/050_fix_pkgconfig_files.patch

libavcodec/armv4l

libavcodec/armv4l/asm.S

libavcodec/armv4l/dsputil_arm.c

libavcodec/armv4l/dsputil_arm_s.S

libavcodec/armv4l/dsputil_iwmmxt.c

libavcodec/armv4l/dsputil_iwmmxt_rnd_template.c

libavcodec/armv4l/dsputil_vfp.S

libavcodec/armv4l/float_arm_vfp.c

libavcodec/armv4l/jrevdct_arm.S

libavcodec/armv4l/mathops.h

libavcodec/armv4l/mpegvideo_arm.c

libavcodec/armv4l/mpegvideo_armv5te.c

libavcodec/armv4l/mpegvideo_iwmmxt.c

libavcodec/armv4l/simple_idct_arm.S

libavcodec/armv4l/simple_idct_armv5te.S

libavcodec/armv4l/simple_idct_armv6.S

libavcodec/i386

libavcodec/i386/cavsdsp_mmx.c

libavcodec/i386/cpuid.c

libavcodec/i386/dsputil_h264_template_mmx.c

libavcodec/i386/dsputil_h264_template_ssse3.c

libavcodec/i386/dsputil_mmx.c

libavcodec/i386/dsputil_mmx.h

libavcodec/i386/dsputil_mmx_avg_template.c

libavcodec/i386/dsputil_mmx_qns_template.c

libavcodec/i386/dsputil_mmx_rnd_template.c

libavcodec/i386/dsputil_yasm.asm

libavcodec/i386/dsputilenc_mmx.c

libavcodec/i386/fdct_mmx.c

libavcodec/i386/fft_3dn.c

libavcodec/i386/fft_3dn2.c

libavcodec/i386/fft_mmx.asm

libavcodec/i386/fft_sse.c

libavcodec/i386/flacdsp_mmx.c

libavcodec/i386/h264_i386.h

libavcodec/i386/h264dsp_mmx.c

libavcodec/i386/idct_mmx.c

libavcodec/i386/idct_mmx_xvid.c

libavcodec/i386/idct_sse2_xvid.c

libavcodec/i386/idct_xvid.h

libavcodec/i386/mathops.h

libavcodec/i386/mmx.h

libavcodec/i386/motion_est_mmx.c

libavcodec/i386/mpegvideo_mmx.c

libavcodec/i386/mpegvideo_mmx_template.c

libavcodec/i386/simple_idct_mmx.c

libavcodec/i386/snowdsp_mmx.c

libavcodec/i386/vc1dsp_mmx.c

libavcodec/i386/vp3dsp_mmx.c

libavcodec/i386/vp3dsp_mmx.h

libavcodec/i386/vp3dsp_sse2.c

libavcodec/i386/vp3dsp_sse2.h

libavcodec/i386/x86inc.asm

files modified:
Changelog

MAINTAINERS

Makefile

README

cmdutils.c

cmdutils.h

common.mak

configure

debian/changelog

debian/confflags

debian/control

debian/control.common

debian/control.ffmpeg-debian

debian/fixup-config.sh

debian/get-orig-source.sh

debian/patches/series

debian/rules

doc/faq.texi

doc/ffmpeg-doc.texi

doc/general.texi

doc/issue_tracker.txt

doc/optimization.txt

ffmpeg.c

ffplay.c

ffpresets/libx264-fastfirstpass.ffpreset

ffpresets/libx264-hq.ffpreset

ffpresets/libx264-max.ffpreset

ffpresets/libx264-normal.ffpreset

ffserver.c

libavcodec/4xm.c

libavcodec/8bps.c

libavcodec/Makefile

libavcodec/aac.c

libavcodec/aac.h

libavcodec/aac_ac3_parser.h

libavcodec/aac_parser.c

libavcodec/aactab.c

libavcodec/aactab.h

libavcodec/aasc.c

libavcodec/ac3.c

libavcodec/ac3.h

libavcodec/ac3_parser.c

libavcodec/ac3_parser.h

libavcodec/ac3dec.c

libavcodec/acelp_pitch_delay.c

libavcodec/acelp_pitch_delay.h

libavcodec/adpcm.c

libavcodec/adxdec.c

libavcodec/adxenc.c

libavcodec/alacenc.c

libavcodec/allcodecs.c

libavcodec/alpha/asm.h

libavcodec/alpha/dsputil_alpha.c

libavcodec/alpha/dsputil_alpha_asm.S

libavcodec/alpha/motion_est_mvi_asm.S

libavcodec/alpha/mpegvideo_alpha.c

libavcodec/alpha/simple_idct_alpha.c

libavcodec/apedec.c

libavcodec/asv1.c

libavcodec/audioconvert.c

libavcodec/avcodec.h

libavcodec/avs.c

libavcodec/bfin/dsputil_bfin.c

libavcodec/bfin/mathops.h

libavcodec/bfin/mpegvideo_bfin.c

libavcodec/bfin/vp3_bfin.c

libavcodec/bitstream.c

libavcodec/bitstream.h

libavcodec/bmp.c

libavcodec/bytestream.h

libavcodec/cabac.h

libavcodec/cavs.c

libavcodec/cavs.h

libavcodec/cavsdata.h

libavcodec/cavsdec.c

libavcodec/celp_math.h

libavcodec/cinepak.c

libavcodec/cljr.c

libavcodec/cook.c

libavcodec/cscd.c

libavcodec/dca.c

libavcodec/dca.h

libavcodec/dca_parser.c

libavcodec/dct-test.c

libavcodec/dirac_parser.c

libavcodec/dnxhddata.c

libavcodec/dnxhddec.c

libavcodec/dnxhdenc.c

libavcodec/dpcm.c

libavcodec/dsputil.c

libavcodec/dsputil.h

libavcodec/dv.c

libavcodec/dvbsub.c

libavcodec/dvbsubdec.c

libavcodec/dvdata.h

libavcodec/dvdsub_parser.c

libavcodec/dvdsubdec.c

libavcodec/dvdsubenc.c

libavcodec/dxa.c

libavcodec/eac3dec.c

libavcodec/eacmv.c

libavcodec/eatgq.c

libavcodec/eatgv.c

libavcodec/error_resilience.c

libavcodec/eval.c

libavcodec/eval.h

libavcodec/fft.c

libavcodec/ffv1.c

libavcodec/flacenc.c

libavcodec/flashsv.c

libavcodec/flicvideo.c

libavcodec/fraps.c

libavcodec/g726.c

libavcodec/gif.c

libavcodec/golomb.c

libavcodec/golomb.h

libavcodec/h263.c

libavcodec/h263.h

libavcodec/h263dec.c

libavcodec/h264.c

libavcodec/h264.h

libavcodec/h264_mp4toannexb_bsf.c

libavcodec/h264_parser.c

libavcodec/h264data.h

libavcodec/h264enc.c

libavcodec/h264idct.c

libavcodec/h264pred.c

libavcodec/h264pred.h

libavcodec/huffman.c

libavcodec/huffman.h

libavcodec/huffyuv.c

libavcodec/idcinvideo.c

libavcodec/imc.c

libavcodec/imgconvert.c

libavcodec/imgconvert.h

libavcodec/imgconvert_template.c

libavcodec/imgresample.c

libavcodec/indeo3.c

libavcodec/intrax8.c

libavcodec/jpeglsdec.c

libavcodec/jpeglsenc.c

libavcodec/lcldec.c

libavcodec/lclenc.c

libavcodec/libamr.c

libavcodec/libdirac.h

libavcodec/libdiracdec.c

libavcodec/libfaad.c

libavcodec/libmp3lame.c

libavcodec/libschroedinger.h

libavcodec/libschroedingerdec.c

libavcodec/libtheoraenc.c

libavcodec/libxvidff.c

libavcodec/loco.c

libavcodec/lsp.c

libavcodec/mathops.h

libavcodec/mdct.c

libavcodec/mimic.c

libavcodec/mjpega_dump_header_bsf.c

libavcodec/mjpegdec.c

libavcodec/mjpegdec.h

libavcodec/mlp.c

libavcodec/mlp.h

libavcodec/mlp_parser.c

libavcodec/mlpdec.c

libavcodec/mmvideo.c

libavcodec/motion_est.c

libavcodec/movsub_bsf.c

libavcodec/mpc.c

libavcodec/mpc.h

libavcodec/mpc7.c

libavcodec/mpc8.c

libavcodec/mpeg12.c

libavcodec/mpegaudio.h

libavcodec/mpegaudio_parser.c

libavcodec/mpegaudiodec.c

libavcodec/mpegaudioenc.c

libavcodec/mpegvideo.c

libavcodec/mpegvideo.h

libavcodec/mpegvideo_common.h

libavcodec/mpegvideo_enc.c

libavcodec/msmpeg4.c

libavcodec/msmpeg4.h

libavcodec/msmpeg4data.c

libavcodec/msrledec.c

libavcodec/msvideo1.c

libavcodec/nellymoserdec.c

libavcodec/nellymoserenc.c

libavcodec/opt.c

libavcodec/opt.h

libavcodec/pcm.c

libavcodec/png.h

libavcodec/pnmenc.c

libavcodec/ppc/dsputil_altivec.c

libavcodec/ppc/dsputil_altivec.h

libavcodec/ppc/dsputil_ppc.c

libavcodec/ppc/dsputil_ppc.h

libavcodec/ppc/fft_altivec.c

libavcodec/ppc/float_altivec.c

libavcodec/ppc/gcc_fixes.h

libavcodec/ppc/h264_altivec.c

libavcodec/ppc/h264_template_altivec.c

libavcodec/ppc/idct_altivec.c

libavcodec/ppc/imgresample_altivec.c

libavcodec/ppc/int_altivec.c

libavcodec/ppc/mathops.h

libavcodec/ppc/mpegvideo_altivec.c

libavcodec/ppc/types_altivec.h

libavcodec/ppc/util_altivec.h

libavcodec/pthread.c

libavcodec/ptx.c

libavcodec/qcelpdata.h

libavcodec/qcelpdec.c

libavcodec/qdm2.c

libavcodec/qdrw.c

libavcodec/qtrle.c

libavcodec/ratecontrol.c

libavcodec/raw.c

libavcodec/rectangle.h

libavcodec/rl2.c

libavcodec/roqaudioenc.c

libavcodec/roqvideoenc.c

libavcodec/rpza.c

libavcodec/rv10.c

libavcodec/rv30.c

libavcodec/rv30data.h

libavcodec/rv30dsp.c

libavcodec/rv34.c

libavcodec/rv34.h

libavcodec/rv34data.h

libavcodec/rv40.c

libavcodec/s3tc.c

libavcodec/sh4/dsputil_align.c

libavcodec/sh4/dsputil_sh4.c

libavcodec/sh4/idct_sh4.c

libavcodec/sh4/qpel.c

libavcodec/shorten.c

libavcodec/simple_idct.c

libavcodec/smacker.c

libavcodec/smc.c

libavcodec/snow.c

libavcodec/snow.h

libavcodec/sonic.c

libavcodec/sparc/dsputil_vis.c

libavcodec/sparc/simple_idct_vis.c

libavcodec/sunrast.c

libavcodec/svq1.c

libavcodec/svq1.h

libavcodec/svq1dec.c

libavcodec/svq1enc.c

libavcodec/svq3.c

libavcodec/targa.c

libavcodec/targaenc.c

libavcodec/tiff.c

libavcodec/tiff.h

libavcodec/tiffenc.c

libavcodec/truespeech.c

libavcodec/tta.c

libavcodec/txd.c

libavcodec/utils.c

libavcodec/vc1.c

libavcodec/vc1.h

libavcodec/vcr1.c

libavcodec/vmdav.c

libavcodec/vmnc.c

libavcodec/vorbis.c

libavcodec/vorbis.h

libavcodec/vorbis_dec.c

libavcodec/vorbis_enc.c

libavcodec/vp3.c

libavcodec/vp5.c

libavcodec/vp56.c

libavcodec/vp56.h

libavcodec/vp56data.c

libavcodec/vp56data.h

libavcodec/vp6.c

libavcodec/vp6data.h

libavcodec/vqavideo.c

libavcodec/wavpack.c

libavcodec/wmv2.c

libavcodec/wmv2dec.c

libavcodec/ws-snd1.c

libavcodec/xan.c

libavcodec/xiph.c

libavcodec/xl.c

libavcodec/xsubdec.c

libavcodec/xvmc_render.h

libavcodec/xvmcvideo.c

libavcodec/zmbv.c

libavcodec/zmbvenc.c

libavdevice/alldevices.c

libavdevice/audio.c

libavdevice/beosaudio.cpp

libavdevice/bktr.c

libavdevice/libdc1394.c

libavdevice/v4l.c

libavdevice/v4l2.c

libavdevice/vfwcap.c

libavdevice/x11grab.c

libavfilter/Makefile

libavfilter/allfilters.c

libavfilter/avfilter.c

libavfilter/avfilter.h

libavfilter/avfiltergraph.h

libavfilter/defaults.c

libavfilter/graphparser.c

libavfilter/graphparser.h

libavformat/4xm.c

libavformat/Makefile

libavformat/aiff.c

libavformat/allformats.c

libavformat/amr.c

libavformat/ape.c

libavformat/asf-enc.c

libavformat/asf.c

libavformat/asf.h

libavformat/au.c

libavformat/avc.c

libavformat/avc.h

libavformat/avformat.h

libavformat/avidec.c

libavformat/avienc.c

libavformat/avio.h

libavformat/aviobuf.c

libavformat/avs.c

libavformat/bethsoftvid.c

libavformat/bfi.c

libavformat/c93.c

libavformat/daud.c

libavformat/dsicin.c

libavformat/dv.c

libavformat/dv.h

libavformat/dvenc.c

libavformat/dxa.c

libavformat/electronicarts.c

libavformat/ffmdec.c

libavformat/ffmenc.c

libavformat/file.c

libavformat/flic.c

libavformat/flvdec.c

libavformat/flvenc.c

libavformat/framehook.c

libavformat/framehook.h

libavformat/gif.c

libavformat/gxf.c

libavformat/gxf.h

libavformat/gxfenc.c

libavformat/idcin.c

libavformat/idroq.c

libavformat/iff.c

libavformat/img2.c

libavformat/internal.h

libavformat/ipmovie.c

libavformat/isom.c

libavformat/isom.h

libavformat/libnut.c

libavformat/lmlm4.c

libavformat/matroska.c

libavformat/matroskadec.c

libavformat/matroskaenc.c

libavformat/mm.c

libavformat/mmf.c

libavformat/mov.c

libavformat/movenc.c

libavformat/mp3.c

libavformat/mpegenc.c

libavformat/mpegts.c

libavformat/mpegtsenc.c

libavformat/mtv.c

libavformat/mxf.h

libavformat/mxfdec.c

libavformat/network.h

libavformat/nut.c

libavformat/nut.h

libavformat/nutdec.c

libavformat/nutenc.c

libavformat/nuv.c

libavformat/oggdec.h

libavformat/oggparseflac.c

libavformat/oggparsevorbis.c

libavformat/os_support.c

libavformat/os_support.h

libavformat/psxstr.c

libavformat/raw.c

libavformat/rdt.c

libavformat/rdt.h

libavformat/riff.c

libavformat/riff.h

libavformat/rl2.c

libavformat/rm.h

libavformat/rmdec.c

libavformat/rmenc.c

libavformat/rtp.h

libavformat/rtp_h264.c

libavformat/rtp_internal.h

libavformat/rtpdec.c

libavformat/rtpproto.c

libavformat/rtsp.c

libavformat/rtsp.h

libavformat/sdp.c

libavformat/segafilm.c

libavformat/sierravmd.c

libavformat/siff.c

libavformat/smacker.c

libavformat/swfdec.c

libavformat/swfenc.c

libavformat/tcp.c

libavformat/thp.c

libavformat/tta.c

libavformat/txd.c

libavformat/udp.c

libavformat/utils.c

libavformat/vc1test.c

libavformat/voc.h

libavformat/vocdec.c

libavformat/vocenc.c

libavformat/wav.c

libavformat/wc3movie.c

libavformat/westwood.c

libavformat/wv.c

libavformat/xa.c

libavformat/yuv4mpeg.c

libavutil/Makefile

libavutil/adler32.c

libavutil/aes.c

libavutil/arm/bswap.h

libavutil/avutil.h

libavutil/bswap.h

libavutil/common.h

libavutil/crc.c

libavutil/des.c

libavutil/fifo.h

libavutil/internal.h

libavutil/intreadwrite.h

libavutil/log.h

libavutil/mathematics.c

libavutil/mathematics.h

libavutil/md5.c

libavutil/mem.c

libavutil/mem.h

libavutil/pca.c

libavutil/random.c

libavutil/random.h

libavutil/rational.c

libavutil/sha1.c

libavutil/tree.c

libavutil/x86/bswap.h

libavutil/x86_cpu.h

libpostproc/postprocess.c

libpostproc/postprocess.h

libpostproc/postprocess_template.c

libswscale/Makefile

libswscale/rgb2rgb.c

libswscale/rgb2rgb.h

libswscale/rgb2rgb_template.c

libswscale/swscale-example.c

libswscale/swscale.c

libswscale/swscale_bfin.c

libswscale/swscale_internal.h

libswscale/swscale_template.c

libswscale/yuv2rgb.c

libswscale/yuv2rgb_altivec.c

libswscale/yuv2rgb_bfin.c

libswscale/yuv2rgb_template.c

subdir.mak

tests/ffmpeg.regression.ref

tests/libav.regression.ref

tests/regression.sh

tests/rotozoom.regression.ref

tests/seek.regression.ref

tests/seek_test.sh

Show diffs side-by-side

added added

removed removed

libpostproc/postprocess_template.c

#undef PMINUB

#undef PMAXUB

#ifdef HAVE_MMX2

#if HAVE_MMX2

#define REAL_PAVGB(a,b) "pavgb " #a ", " #b " \n\t"

#elif defined (HAVE_3DNOW)

#elif HAVE_3DNOW

#define REAL_PAVGB(a,b) "pavgusb " #a ", " #b " \n\t"

#endif

#define PAVGB(a,b) REAL_PAVGB(a,b)

#ifdef HAVE_MMX2

#if HAVE_MMX2

#define PMINUB(a,b,t) "pminub " #a ", " #b " \n\t"

#elif defined (HAVE_MMX)

#elif HAVE_MMX

#define PMINUB(b,a,t) \

"movq " #a ", " #t " \n\t"\

"psubusb " #b ", " #t " \n\t"\

"psubb " #t ", " #a " \n\t"

#endif

#ifdef HAVE_MMX2

#if HAVE_MMX2

#define PMAXUB(a,b) "pmaxub " #a ", " #b " \n\t"

#elif defined (HAVE_MMX)

#elif HAVE_MMX

#define PMAXUB(a,b) \

"psubusb " #a ", " #b " \n\t"\

"paddb " #a ", " #b " \n\t"

#endif

//FIXME? |255-0| = 1 (should not be a problem ...)

#ifdef HAVE_MMX

#if HAVE_MMX

/**

* Check if the middle 8x8 Block in the given 8x16 block is flat

136

"psubusb %%mm3, %%mm4 \n\t"

137

138

" \n\t"

139

#ifdef HAVE_MMX2

139

#if HAVE_MMX2

140

"pxor %%mm7, %%mm7 \n\t"

141

"psadbw %%mm7, %%mm0 \n\t"

142

#else

176

* Do a vertical low pass filter on the 8x16 block (only write to the 8x8 block in the middle)

177

* using the 9-Tap Filter (1,1,2,2,4,2,2,1,1)/16

178

179

#ifndef HAVE_ALTIVEC

179

#if !HAVE_ALTIVEC

180

static inline void RENAME(doVertLowPass)(uint8_t *src, int stride, PPContext *c)

181

{

182

#if defined (HAVE_MMX2) || defined (HAVE_3DNOW)

182

#if HAVE_MMX2 || HAVE_3DNOW

183

src+= stride*3;

184

__asm__ volatile( //"movv %0 %1 %2\n\t"

185

"movq %2, %%mm0 \n\t" // QP,..., QP

306

: "r" (src), "r" ((x86_reg)stride), "m" (c->pQPb)

307

: "%"REG_a, "%"REG_c

308

);

309

#else //defined (HAVE_MMX2) || defined (HAVE_3DNOW)

309

#else //HAVE_MMX2 || HAVE_3DNOW

310

const int l1= stride;

311

const int l2= stride + l1;

312

const int l3= stride + l2;

345

346

src++;

347

}

348

#endif //defined (HAVE_MMX2) || defined (HAVE_3DNOW)

348

#endif //HAVE_MMX2 || HAVE_3DNOW

349

}

350

#endif //HAVE_ALTIVEC

351

364

365

static inline void RENAME(vertRK1Filter)(uint8_t *src, int stride, int QP)

366

{

367

#if defined (HAVE_MMX2) || defined (HAVE_3DNOW)

367

#if HAVE_MMX2 || HAVE_3DNOW

368

src+= stride*3;

369

// FIXME rounding

370

__asm__ volatile(

426

: "r" (src), "r" ((x86_reg)stride)

427

: "%"REG_a, "%"REG_c

428

);

429

#else //defined (HAVE_MMX2) || defined (HAVE_3DNOW)

429

#else //HAVE_MMX2 || HAVE_3DNOW

430

const int l1= stride;

431

const int l2= stride + l1;

432

const int l3= stride + l2;

449

}

450

}

451

452

#endif //defined (HAVE_MMX2) || defined (HAVE_3DNOW)

452

#endif //HAVE_MMX2 || HAVE_3DNOW

453

}

454

#endif //0

455

462

463

static inline void RENAME(vertX1Filter)(uint8_t *src, int stride, PPContext *co)

464

{

465

#if defined (HAVE_MMX2) || defined (HAVE_3DNOW)

465

#if HAVE_MMX2 || HAVE_3DNOW

466

src+= stride*3;

467

468

__asm__ volatile(

548

: "r" (src), "r" ((x86_reg)stride), "m" (co->pQPb)

549

: "%"REG_a, "%"REG_c

550

);

551

#else //defined (HAVE_MMX2) || defined (HAVE_3DNOW)

551

#else //HAVE_MMX2 || HAVE_3DNOW

552

553

const int l1= stride;

554

const int l2= stride + l1;

582

}

583

src++;

584

}

585

#endif //defined (HAVE_MMX2) || defined (HAVE_3DNOW)

585

#endif //HAVE_MMX2 || HAVE_3DNOW

586

}

587

588

#ifndef HAVE_ALTIVEC

588

#if !HAVE_ALTIVEC

589

static inline void RENAME(doVertDefFilter)(uint8_t src[], int stride, PPContext *c)

590

{

591

#if defined (HAVE_MMX2) || defined (HAVE_3DNOW)

591

#if HAVE_MMX2 || HAVE_3DNOW

592

593

uint8_t tmp[16];

594

const int l1= stride;

869

}

870

}

871

872

#elif defined (HAVE_MMX)

872

#elif HAVE_MMX

873

src+= stride*4;

874

__asm__ volatile(

875

"pxor %%mm7, %%mm7 \n\t"

978

"movq (%%"REG_c"), %%mm2 \n\t" // 2L0 - 5L1 + 5L2 - 2L3

979

"movq 8(%%"REG_c"), %%mm3 \n\t" // 2H0 - 5H1 + 5H2 - 2H3

980

981

#ifdef HAVE_MMX2

981

#if HAVE_MMX2

982

"movq %%mm7, %%mm6 \n\t" // 0

983

"psubw %%mm0, %%mm6 \n\t"

984

"pmaxsw %%mm6, %%mm0 \n\t" // |2L4 - 5L5 + 5L6 - 2L7|

1010

"psubw %%mm6, %%mm3 \n\t" // |2H0 - 5H1 + 5H2 - 2H3|

1011

#endif

1012

1013

#ifdef HAVE_MMX2

1013

#if HAVE_MMX2

1014

"pminsw %%mm2, %%mm0 \n\t"

1015

"pminsw %%mm3, %%mm1 \n\t"

1016

#else

1074

"pand %%mm2, %%mm4 \n\t"

1075

"pand %%mm3, %%mm5 \n\t"

1076

1077

#ifdef HAVE_MMX2

1077

#if HAVE_MMX2

1078

"pminsw %%mm0, %%mm4 \n\t"

1079

"pminsw %%mm1, %%mm5 \n\t"

1080

#else

1101

: "r" ((x86_reg)stride), "m" (c->pQPb)

1102

: "%"REG_a, "%"REG_c

1103

);

1104

#else //defined (HAVE_MMX2) || defined (HAVE_3DNOW)

1104

#else //HAVE_MMX2 || HAVE_3DNOW

1105

const int l1= stride;

1106

const int l2= stride + l1;

1107

const int l3= stride + l2;

1139

}

1140

src++;

1141

}

1142

#endif //defined (HAVE_MMX2) || defined (HAVE_3DNOW)

1142

#endif //HAVE_MMX2 || HAVE_3DNOW

1143

}

1144

#endif //HAVE_ALTIVEC

1145

1146

#ifndef HAVE_ALTIVEC

1146

#if !HAVE_ALTIVEC

1147

static inline void RENAME(dering)(uint8_t src[], int stride, PPContext *c)

1148

{

1149

#if defined (HAVE_MMX2) || defined (HAVE_3DNOW)

1149

#if HAVE_MMX2 || HAVE_3DNOW

1150

__asm__ volatile(

1151

"pxor %%mm6, %%mm6 \n\t"

1152

"pcmpeqb %%mm7, %%mm7 \n\t"

1164

// %0 eax eax+%1 eax+2%1 %0+4%1 edx edx+%1 edx+2%1 %0+8%1 edx+4%1

1165

1166

#undef FIND_MIN_MAX

1167

#ifdef HAVE_MMX2

1167

#if HAVE_MMX2

1168

#define REAL_FIND_MIN_MAX(addr)\

1169

"movq " #addr ", %%mm0 \n\t"\

1170

"pminub %%mm0, %%mm7 \n\t"\

1191

1192

"movq %%mm7, %%mm4 \n\t"

1193

"psrlq $8, %%mm7 \n\t"

1194

#ifdef HAVE_MMX2

1194

#if HAVE_MMX2

1195

"pminub %%mm4, %%mm7 \n\t" // min of pixels

1196

"pshufw $0xF9, %%mm7, %%mm4 \n\t"

1197

"pminub %%mm4, %%mm7 \n\t" // min of pixels

1216

1217

"movq %%mm6, %%mm4 \n\t"

1218

"psrlq $8, %%mm6 \n\t"

1219

#ifdef HAVE_MMX2

1219

#if HAVE_MMX2

1220

"pmaxub %%mm4, %%mm6 \n\t" // max of pixels

1221

"pshufw $0xF9, %%mm6, %%mm4 \n\t"

1222

"pmaxub %%mm4, %%mm6 \n\t"

1370

: : "r" (src), "r" ((x86_reg)stride), "m" (c->pQPb), "m"(c->pQPb2)

1371

: "%"REG_a, "%"REG_d, "%"REG_c

1372

);

1373

#else //defined (HAVE_MMX2) || defined (HAVE_3DNOW)

1373

#else //HAVE_MMX2 || HAVE_3DNOW

1374

int y;

1375

int min=255;

1376

int max=0;

1487

// src[0] = src[7]=src[stride*7]=src[stride*7 + 7]=255;

1488

}

1489

#endif

1490

#endif //defined (HAVE_MMX2) || defined (HAVE_3DNOW)

1490

#endif //HAVE_MMX2 || HAVE_3DNOW

1491

}

1492

#endif //HAVE_ALTIVEC

1493

1499

1500

static inline void RENAME(deInterlaceInterpolateLinear)(uint8_t src[], int stride)

1501

{

1502

#if defined (HAVE_MMX2) || defined (HAVE_3DNOW)

1502

#if HAVE_MMX2 || HAVE_3DNOW

1503

src+= 4*stride;

1504

__asm__ volatile(

1505

"lea (%0, %1), %%"REG_a" \n\t"

1552

1553

static inline void RENAME(deInterlaceInterpolateCubic)(uint8_t src[], int stride)

1554

{

1555

#if defined (HAVE_MMX2) || defined (HAVE_3DNOW)

1555

#if HAVE_MMX2 || HAVE_3DNOW

1556

src+= stride*3;

1557

__asm__ volatile(

1558

"lea (%0, %1), %%"REG_a" \n\t"

1594

: : "r" (src), "r" ((x86_reg)stride)

1595

: "%"REG_a, "%"REG_d, "%"REG_c

1596

);

1597

#else //defined (HAVE_MMX2) || defined (HAVE_3DNOW)

1597

#else //HAVE_MMX2 || HAVE_3DNOW

1598

int x;

1599

src+= stride*3;

1600

for(x=0; x<8; x++){

1604

src[stride*9] = CLIP((-src[stride*6] + 9*src[stride*8] + 9*src[stride*10] - src[stride*12])>>4);

1605

src++;

1606

}

1607

#endif //defined (HAVE_MMX2) || defined (HAVE_3DNOW)

1607

#endif //HAVE_MMX2 || HAVE_3DNOW

1608

}

1609

1610

/**

1616

1617

static inline void RENAME(deInterlaceFF)(uint8_t src[], int stride, uint8_t *tmp)

1618

{

1619

#if defined (HAVE_MMX2) || defined (HAVE_3DNOW)

1619

#if HAVE_MMX2 || HAVE_3DNOW

1620

src+= stride*4;

1621

__asm__ volatile(

1622

"lea (%0, %1), %%"REG_a" \n\t"

1665

: : "r" (src), "r" ((x86_reg)stride), "r"(tmp)

1666

: "%"REG_a, "%"REG_d

1667

);

1668

#else //defined (HAVE_MMX2) || defined (HAVE_3DNOW)

1668

#else //HAVE_MMX2 || HAVE_3DNOW

1669

int x;

1670

src+= stride*4;

1671

for(x=0; x<8; x++){

1683

1684

src++;

1685

}

1686

#endif //defined (HAVE_MMX2) || defined (HAVE_3DNOW)

1686

#endif //HAVE_MMX2 || HAVE_3DNOW

1687

}

1688

1689

/**

1695

1696

static inline void RENAME(deInterlaceL5)(uint8_t src[], int stride, uint8_t *tmp, uint8_t *tmp2)

1697

{

1698

#if defined (HAVE_MMX2) || defined (HAVE_3DNOW)

1698

#if HAVE_MMX2 || HAVE_3DNOW

1699

src+= stride*4;

1700

__asm__ volatile(

1701

"lea (%0, %1), %%"REG_a" \n\t"

1755

: : "r" (src), "r" ((x86_reg)stride), "r"(tmp), "r"(tmp2)

1756

: "%"REG_a, "%"REG_d

1757

);

1758

#else //defined (HAVE_MMX2) || defined (HAVE_3DNOW)

1758

#else //HAVE_MMX2 || HAVE_3DNOW

1759

int x;

1760

src+= stride*4;

1761

for(x=0; x<8; x++){

1784

1785

src++;

1786

}

1787

#endif //defined (HAVE_MMX2) || defined (HAVE_3DNOW)

1787

#endif //HAVE_MMX2 || HAVE_3DNOW

1788

}

1789

1790

/**

1796

1797

static inline void RENAME(deInterlaceBlendLinear)(uint8_t src[], int stride, uint8_t *tmp)

1798

{

1799

#if defined (HAVE_MMX2) || defined (HAVE_3DNOW)

1799

#if HAVE_MMX2 || HAVE_3DNOW

1800

src+= 4*stride;

1801

__asm__ volatile(

1802

"lea (%0, %1), %%"REG_a" \n\t"

1843

: : "r" (src), "r" ((x86_reg)stride), "r" (tmp)

1844

: "%"REG_a, "%"REG_d

1845

);

1846

#else //defined (HAVE_MMX2) || defined (HAVE_3DNOW)

1846

#else //HAVE_MMX2 || HAVE_3DNOW

1847

int a, b, c, x;

1848

src+= 4*stride;

1849

1886

src += 4;

1887

tmp += 4;

1888

}

1889

#endif //defined (HAVE_MMX2) || defined (HAVE_3DNOW)

1889

#endif //HAVE_MMX2 || HAVE_3DNOW

1890

}

1891

1892

/**

1897

1898

static inline void RENAME(deInterlaceMedian)(uint8_t src[], int stride)

1899

{

1900

#ifdef HAVE_MMX

1900

#if HAVE_MMX

1901

src+= 4*stride;

1902

#ifdef HAVE_MMX2

1902

#if HAVE_MMX2

1903

__asm__ volatile(

1904

"lea (%0, %1), %%"REG_a" \n\t"

1905

"lea (%%"REG_a", %1, 4), %%"REG_d" \n\t"

2012

#endif //HAVE_MMX

2013

}

2014

2015

#ifdef HAVE_MMX

2015

#if HAVE_MMX

2016

/**

2017

* transposes and shift the given 8x8 Block into dst1 and dst2

2018

2180

#endif //HAVE_MMX

2181

//static long test=0;

2182

2183

#ifndef HAVE_ALTIVEC

2183

#if !HAVE_ALTIVEC

2184

static inline void RENAME(tempNoiseReducer)(uint8_t *src, int stride,

2185

uint8_t *tempBlurred, uint32_t *tempBlurredPast, int *maxNoise)

2186

{

2191

2192

#define FAST_L2_DIFF

2193

//#define L1_DIFF //u should change the thresholds too if u try that one

2194

#if defined (HAVE_MMX2) || defined (HAVE_3DNOW)

2194

#if HAVE_MMX2 || HAVE_3DNOW

2195

__asm__ volatile(

2196

"lea (%2, %2, 2), %%"REG_a" \n\t" // 3*stride

2197

"lea (%2, %2, 4), %%"REG_d" \n\t" // 5*stride

2479

:: "r" (src), "r" (tempBlurred), "r"((x86_reg)stride), "m" (tempBlurredPast)

2480

: "%"REG_a, "%"REG_d, "%"REG_c, "memory"

2481

);

2482

#else //defined (HAVE_MMX2) || defined (HAVE_3DNOW)

2482

#else //HAVE_MMX2 || HAVE_3DNOW

2483

{

2484

int y;

2485

int d=0;

2562

}

2563

}

2564

}

2565

#endif //defined (HAVE_MMX2) || defined (HAVE_3DNOW)

2565

#endif //HAVE_MMX2 || HAVE_3DNOW

2566

}

2567

#endif //HAVE_ALTIVEC

2568

2569

#ifdef HAVE_MMX

2569

#if HAVE_MMX

2570

/**

2571

* accurate deblock filter

2572

2970

"movq (%%"REG_c"), %%mm2 \n\t" // 2L0 - 5L1 + 5L2 - 2L3

2971

"movq 8(%%"REG_c"), %%mm3 \n\t" // 2H0 - 5H1 + 5H2 - 2H3

2972

2973

#ifdef HAVE_MMX2

2973

#if HAVE_MMX2

2974

"movq %%mm7, %%mm6 \n\t" // 0

2975

"psubw %%mm0, %%mm6 \n\t"

2976

"pmaxsw %%mm6, %%mm0 \n\t" // |2L4 - 5L5 + 5L6 - 2L7|

3002

"psubw %%mm6, %%mm3 \n\t" // |2H0 - 5H1 + 5H2 - 2H3|

3003

#endif

3004

3005

#ifdef HAVE_MMX2

3005

#if HAVE_MMX2

3006

"pminsw %%mm2, %%mm0 \n\t"

3007

"pminsw %%mm3, %%mm1 \n\t"

3008

#else

3066

"pand %%mm2, %%mm4 \n\t"

3067

"pand %%mm3, %%mm5 \n\t"

3068

3069

#ifdef HAVE_MMX2

3069

#if HAVE_MMX2

3070

"pminsw %%mm0, %%mm4 \n\t"

3071

"pminsw %%mm1, %%mm5 \n\t"

3072

#else

3116

static inline void RENAME(blockCopy)(uint8_t dst[], int dstStride, const uint8_t src[], int srcStride,

3117

int levelFix, int64_t *packedOffsetAndScale)

3118

{

3119

#ifndef HAVE_MMX

3119

#if !HAVE_MMX

3120

int i;

3121

#endif

3122

if(levelFix){

3123

#ifdef HAVE_MMX

3123

#if HAVE_MMX

3124

__asm__ volatile(

3125

"movq (%%"REG_a"), %%mm2 \n\t" // packedYOffset

3126

"movq 8(%%"REG_a"), %%mm3 \n\t" // packedYScale

3127

"lea (%2,%4), %%"REG_a" \n\t"

3128

"lea (%3,%5), %%"REG_d" \n\t"

3129

"pxor %%mm4, %%mm4 \n\t"

3130

#ifdef HAVE_MMX2

3130

#if HAVE_MMX2

3131

#define REAL_SCALED_CPY(src1, src2, dst1, dst2) \

3132

"movq " #src1 ", %%mm0 \n\t"\

3133

"movq " #src1 ", %%mm5 \n\t"\

3203

&(src[srcStride*i]), BLOCK_SIZE);

3204

#endif //HAVE_MMX

3205

}else{

3206

#ifdef HAVE_MMX

3206

#if HAVE_MMX

3207

__asm__ volatile(

3208

"lea (%0,%2), %%"REG_a" \n\t"

3209

"lea (%1,%3), %%"REG_d" \n\t"

3243

3244

static inline void RENAME(duplicate)(uint8_t src[], int stride)

3245

{

3246

#ifdef HAVE_MMX

3246

#if HAVE_MMX

3247

__asm__ volatile(

3248

"movq (%0), %%mm0 \n\t"

3249

"add %1, %0 \n\t"

3280

int QPCorrecture= 256*256;

3281

3282

int copyAhead;

3283

#ifdef HAVE_MMX

3283

#if HAVE_MMX

3284

int i;

3285

#endif

3286

3293

uint8_t * const tempDst= dstStride > 0 ? c.tempDst : c.tempDst - 23*dstStride;

3294

//const int mbWidth= isColor ? (width+7)>>3 : (width+15)>>4;

3295

3296

#ifdef HAVE_MMX

3296

#if HAVE_MMX

3297

for(i=0; i<57; i++){

3298

int offset= ((i*c.ppMode.baseDcDiff)>>8) + 1;

3299

int threshold= offset*2 + 1;

3351

3352

scale= (double)(c.ppMode.maxAllowedY - c.ppMode.minAllowedY) / (double)(white-black);

3353

3354

#ifdef HAVE_MMX2

3354

#if HAVE_MMX2

3355

c.packedYScale= (uint16_t)(scale*256.0 + 0.5);

3356

c.packedYOffset= (((black*c.packedYScale)>>8) - c.ppMode.minAllowedY) & 0xFFFF;

3357

#else

3384

// with the L1 Cache of the P4 ... or only a few blocks at a time or soemthing

3385

for(x=0; x<width; x+=BLOCK_SIZE){

3386

3387

#ifdef HAVE_MMX2

3387

#if HAVE_MMX2

3388

3389

prefetchnta(srcBlock + (((x>>2)&6) + 5)*srcStride + 32);

3390

prefetchnta(srcBlock + (((x>>2)&6) + 6)*srcStride + 32);

3411

: "%"REG_a, "%"REG_d

3412

);

3413

3414

#elif defined(HAVE_3DNOW)

3414

#elif HAVE_3DNOW

3415

//FIXME check if this is faster on an 3dnow chip or if it is faster without the prefetch or ...

3416

/* prefetch(srcBlock + (((x>>3)&3) + 5)*srcStride + 32);

3417

prefetch(srcBlock + (((x>>3)&3) + 9)*srcStride + 32);

3457

//1% speedup if these are here instead of the inner loop

3458

const uint8_t *srcBlock= &(src[y*srcStride]);

3459

uint8_t *dstBlock= &(dst[y*dstStride]);

3460

#ifdef HAVE_MMX

3460

#if HAVE_MMX

3461

uint8_t *tempBlock1= c.tempBlocks;

3462

uint8_t *tempBlock2= c.tempBlocks + 8;

3463

#endif

3493

// with the L1 Cache of the P4 ... or only a few blocks at a time or soemthing

3494

for(x=0; x<width; x+=BLOCK_SIZE){

3495

const int stride= dstStride;

3496

#ifdef HAVE_MMX

3496

#if HAVE_MMX

3497

uint8_t *tmpXchg;

3498

#endif

3499

if(isColor){

3507

yHistogram[ srcBlock[srcStride*12 + 4] ]++;

3508

}

3509

c.QP= QP;

3510

#ifdef HAVE_MMX

3510

#if HAVE_MMX

3511

__asm__ volatile(

3512

"movd %1, %%mm7 \n\t"

3513

"packuswb %%mm7, %%mm7 \n\t" // 0, 0, 0, QP, 0, 0, 0, QP

3520

#endif

3521

3522

3523

#ifdef HAVE_MMX2

3523

#if HAVE_MMX2

3524

3525

prefetchnta(srcBlock + (((x>>2)&6) + 5)*srcStride + 32);

3526

prefetchnta(srcBlock + (((x>>2)&6) + 6)*srcStride + 32);

3547

: "%"REG_a, "%"REG_d

3548

);

3549

3550

#elif defined(HAVE_3DNOW)

3550

#elif HAVE_3DNOW

3551

//FIXME check if this is faster on an 3dnow chip or if it is faster without the prefetch or ...

3552

/* prefetch(srcBlock + (((x>>3)&3) + 5)*srcStride + 32);

3553

prefetch(srcBlock + (((x>>3)&3) + 9)*srcStride + 32);

3591

}

3592

}

3593

3594

#ifdef HAVE_MMX

3594

#if HAVE_MMX

3595

RENAME(transpose1)(tempBlock1, tempBlock2, dstBlock, dstStride);

3596

#endif

3597

/* check if we have a previous block to deblock it with dstBlock */

3598

if(x - 8 >= 0){

3599

#ifdef HAVE_MMX

3599

#if HAVE_MMX

3600

if(mode & H_X1_FILTER)

3601

RENAME(vertX1Filter)(tempBlock1, 16, &c);

3602

else if(mode & H_DEBLOCK){

3617

if(mode & H_X1_FILTER)

3618

horizX1Filter(dstBlock-4, stride, QP);

3619

else if(mode & H_DEBLOCK){

3620

#ifdef HAVE_ALTIVEC

3620

#if HAVE_ALTIVEC

3621

DECLARE_ALIGNED(16, unsigned char, tempBlock[272]);

3622

transpose_16x8_char_toPackedAlign_altivec(tempBlock, dstBlock - (4 + 1), stride);

3623

3659

dstBlock+=8;

3660

srcBlock+=8;

3661

3662

#ifdef HAVE_MMX

3662

#if HAVE_MMX

3663

tmpXchg= tempBlock1;

3664

tempBlock1= tempBlock2;

3665

tempBlock2 = tmpXchg;

3699

+ dstBlock[x +14*dstStride] + dstBlock[x +15*dstStride];

3700

}*/

3701

}

3702

#ifdef HAVE_3DNOW

3702

#if HAVE_3DNOW

3703

__asm__ volatile("femms");

3704

#elif defined (HAVE_MMX)

3704

#elif HAVE_MMX

3705

__asm__ volatile("emms");

3706

#endif

3707

Older »