~ubuntu-branches/ubuntu/trusty/libav/trusty

Viewing changes to libswscale/x86/swscale_template.c

Committer: Bazaar Package Importer
Author(s): Reinhard Tartler
Date: 2011-04-19 15:04:55 UTC
mfrom: (1.2.1 upstream)
mto: (1.3.4 sid)
mto: This revision was merged to the branch mainline in revision 3.
Revision ID: james.westby@ubuntu.com-20110419150455-c1nac6gjm3t2aa4n

Tags: 4:0.7~b1-1

* New upstream version
* bump SONAME and SHLIBS
* configure flags --disable-stripping was removed upstream
* the MAINTAINERS file was removed upstream
* remove patch disable-configuration-warning.patch
* drop avfilter confflags, it is enable by default in 0.7
* libfaad wrapper has been removed upstream
* also update the *contents* of the lintian overrides

files added:
debian/libavcodec53.install

debian/libavcodec53.lintian-overrides

debian/libavdevice53.install

debian/libavdevice53.lintian-overrides

debian/libavfilter2.install

debian/libavfilter2.lintian-overrides

debian/libavformat53.install

debian/libavformat53.lintian-overrides

debian/libavutil51.install

debian/libavutil51.lintian-overrides

debian/libpostproc52.install

debian/libpostproc52.lintian-overrides

debian/libswscale1.install

debian/libswscale1.lintian-overrides

doc/bitstream_filters.texi

doc/build_system.txt

doc/demuxers.texi

doc/encoders.texi

doc/eval.texi

doc/fate.txt

doc/ffmpeg.texi

doc/ffplay.texi

doc/ffprobe.texi

doc/ffserver.texi

doc/filters.texi

doc/git-howto.txt

doc/indevs.texi

doc/metadata.texi

doc/multithreading.txt

doc/muxers.texi

doc/outdevs.texi

doc/protocols.texi

doc/t2h.init

libavcodec/a64colors.h

libavcodec/a64enc.h

libavcodec/a64multienc.c

libavcodec/a64tables.h

libavcodec/aacadtsdec.c

libavcodec/aacadtsdec.h

libavcodec/ac3dsp.c

libavcodec/ac3dsp.h

libavcodec/ac3enc_fixed.c

libavcodec/ac3enc_float.c

libavcodec/amr.h

libavcodec/amrwbdata.h

libavcodec/amrwbdec.c

libavcodec/ansi.c

libavcodec/arm/ac3dsp_arm.S

libavcodec/arm/ac3dsp_armv6.S

libavcodec/arm/ac3dsp_init_arm.c

libavcodec/arm/ac3dsp_neon.S

libavcodec/arm/asm-offsets.h

libavcodec/arm/fft_fixed_init_arm.c

libavcodec/arm/fft_fixed_neon.S

libavcodec/arm/fmtconvert_init_arm.c

libavcodec/arm/fmtconvert_neon.S

libavcodec/arm/fmtconvert_vfp.S

libavcodec/arm/mdct_fixed_neon.S

libavcodec/arm/mpegvideo_neon.S

libavcodec/arm/vp56_arith.h

libavcodec/arm/vp8.h

libavcodec/arm/vp8_armv6.S

libavcodec/arm/vp8dsp_init_arm.c

libavcodec/arm/vp8dsp_neon.S

libavcodec/ass.c

libavcodec/ass.h

libavcodec/assdec.c

libavcodec/assenc.c

libavcodec/cavsdsp.h

libavcodec/chomp_bsf.c

libavcodec/dct.h

libavcodec/dct32.c

libavcodec/dfa.c

libavcodec/dxva2_mpeg2.c

libavcodec/fft-fixed-test.c

libavcodec/fft-internal.h

libavcodec/fft_fixed.c

libavcodec/fft_float.c

libavcodec/flac_parser.c

libavcodec/fmtconvert.c

libavcodec/fmtconvert.h

libavcodec/g722.c

libavcodec/gsmdec.c

libavcodec/gsmdec_data.c

libavcodec/gsmdec_data.h

libavcodec/gsmdec_template.c

libavcodec/inverse.c

libavcodec/jvdec.c

libavcodec/kbdwin.c

libavcodec/kbdwin.h

libavcodec/lagarith.c

libavcodec/lagarithrac.c

libavcodec/lagarithrac.h

libavcodec/latm_parser.c

libavcodec/libvo-aacenc.c

libavcodec/libvo-amrwbenc.c

libavcodec/libxavs.c

libavcodec/mdct_fixed.c

libavcodec/mdct_float.c

libavcodec/mjpeg2jpeg_bsf.c

libavcodec/mpegaudiodec_float.c

libavcodec/msgsmdec.c

libavcodec/msgsmdec.h

libavcodec/mxpegdec.c

libavcodec/pictordec.c

libavcodec/ppc/asm.S

libavcodec/ppc/fft_altivec_s.S

libavcodec/ppc/fmtconvert_altivec.c

libavcodec/ppc/mpegaudiodec_altivec.c

libavcodec/ppc/regs.h

libavcodec/ppc/vp8dsp_altivec.c

libavcodec/ra144dec.c

libavcodec/ra144enc.c

libavcodec/rdft.h

libavcodec/sinewin.c

libavcodec/sinewin.h

libavcodec/sinewin_tablegen.c

libavcodec/sinewin_tablegen.h

libavcodec/srtdec.c

libavcodec/targa.h

libavcodec/thread.h

libavcodec/vc1dsp.h

libavcodec/version.h

libavcodec/vp56rac.c

libavcodec/vp8.c

libavcodec/vp8.h

libavcodec/vp8_parser.c

libavcodec/vp8data.h

libavcodec/vp8dsp.c

libavcodec/vp8dsp.h

libavcodec/x86/ac3dsp.asm

libavcodec/x86/ac3dsp_mmx.c

libavcodec/x86/dct32_sse.c

libavcodec/x86/deinterlace.asm

libavcodec/x86/dsputilenc_yasm.asm

libavcodec/x86/fmtconvert.asm

libavcodec/x86/fmtconvert_mmx.c

libavcodec/x86/h264_chromamc.asm

libavcodec/x86/h264_deblock.asm

libavcodec/x86/h264_idct.asm

libavcodec/x86/h264_intrapred.asm

libavcodec/x86/h264_intrapred_init.c

libavcodec/x86/h264_qpel_mmx.c

libavcodec/x86/h264_weight.asm

libavcodec/x86/mpegaudiodec_mmx.c

libavcodec/x86/vc1dsp_yasm.asm

libavcodec/x86/vp3dsp.asm

libavcodec/x86/vp56_arith.h

libavcodec/x86/vp56dsp.asm

libavcodec/x86/vp56dsp_init.c

libavcodec/x86/vp8dsp-init.c

libavcodec/x86/vp8dsp.asm

libavcodec/xxan.c

libavdevice/fbdev.c

libavdevice/sndio_common.c

libavdevice/sndio_common.h

libavdevice/sndio_dec.c

libavdevice/sndio_enc.c

libavfilter/af_anull.c

libavfilter/asink_anullsink.c

libavfilter/asrc_anullsrc.c

libavfilter/drawutils.c

libavfilter/drawutils.h

libavfilter/gradfun.h

libavfilter/internal.h

libavfilter/vf_blackframe.c

libavfilter/vf_copy.c

libavfilter/vf_cropdetect.c

libavfilter/vf_drawbox.c

libavfilter/vf_fade.c

libavfilter/vf_fifo.c

libavfilter/vf_frei0r.c

libavfilter/vf_gradfun.c

libavfilter/vf_hflip.c

libavfilter/vf_hqdn3d.c

libavfilter/vf_libopencv.c

libavfilter/vf_overlay.c

libavfilter/vf_pad.c

libavfilter/vf_pixdesctest.c

libavfilter/vf_setpts.c

libavfilter/vf_settb.c

libavfilter/vf_transpose.c

libavfilter/vf_yadif.c

libavfilter/vsrc_buffer.c

libavfilter/vsrc_buffer.h

libavfilter/vsrc_color.c

libavfilter/vsrc_movie.c

libavfilter/x86

libavfilter/x86/Makefile

libavfilter/x86/gradfun.c

libavfilter/x86/yadif.c

libavfilter/x86/yadif_template.c

libavfilter/yadif.h

libavformat/a64.c

libavformat/aacdec.c

libavformat/ac3dec.c

libavformat/applehttp.c

libavformat/applehttpproto.c

libavformat/avio_internal.h

libavformat/cavsvideodec.c

libavformat/dfa.c

libavformat/diracdec.c

libavformat/dnxhddec.c

libavformat/dtsdec.c

libavformat/ffmeta.h

libavformat/ffmetadec.c

libavformat/ffmetaenc.c

libavformat/h261dec.c

libavformat/h263dec.c

libavformat/h264dec.c

libavformat/http.h

libavformat/idroqdec.c

libavformat/idroqenc.c

libavformat/ingenientdec.c

libavformat/ivfdec.c

libavformat/ivfenc.c

libavformat/jvdec.c

libavformat/lxfdec.c

libavformat/m4vdec.c

libavformat/md5enc.c

libavformat/md5proto.c

libavformat/mms.c

libavformat/mms.h

libavformat/mmsh.c

libavformat/mmst.c

libavformat/mp3dec.c

libavformat/mp3enc.c

libavformat/mpegvideodec.c

libavformat/mxg.c

libavformat/nullenc.c

libavformat/pcm.c

libavformat/pcm.h

libavformat/pcmdec.c

libavformat/pcmenc.c

libavformat/rawdec.c

libavformat/rawdec.h

libavformat/rawenc.c

libavformat/rawenc.h

libavformat/rawvideodec.c

libavformat/rso.c

libavformat/rso.h

libavformat/rsodec.c

libavformat/rsoenc.c

libavformat/rtpdec_formats.h

libavformat/rtpdec_latm.c

libavformat/rtpdec_mpeg4.c

libavformat/rtpdec_qcelp.c

libavformat/rtpdec_qdm2.c

libavformat/rtpdec_qt.c

libavformat/rtpdec_svq3.c

libavformat/rtpdec_vp8.c

libavformat/rtpenc_chain.c

libavformat/rtpenc_chain.h

libavformat/rtpenc_vp8.c

libavformat/rtpenc_xiph.c

libavformat/rtspdec.c

libavformat/sapdec.c

libavformat/sapenc.c

libavformat/sauce.c

libavformat/sauce.h

libavformat/spdif.h

libavformat/spdifdec.c

libavformat/spdifenc.c

libavformat/srtdec.c

libavformat/tty.c

libavformat/url.h

libavformat/version.h

libavformat/wtv.c

libavformat/xwma.c

libavutil/arm/cpu.c

libavutil/audioconvert.c

libavutil/audioconvert.h

libavutil/avassert.h

libavutil/colorspace.h

libavutil/cpu.c

libavutil/cpu.h

libavutil/eval.c

libavutil/eval.h

libavutil/file.c

libavutil/file.h

libavutil/imgutils.c

libavutil/imgutils.h

libavutil/inverse.c

libavutil/opt.c

libavutil/opt.h

libavutil/parseutils.c

libavutil/parseutils.h

libavutil/ppc/cpu.c

libavutil/samplefmt.c

libavutil/samplefmt.h

libavutil/x86/cpu.c

libswscale/ppc/swscale_template.c

libswscale/x86/rgb2rgb.c

libswscale/x86/rgb2rgb_template.c

libswscale/x86/swscale_template.c

libswscale/x86/swscale_template.h

tests/base64.c

tests/fate

tests/fate.sh

tests/fate/aac.mak

tests/fate/als.mak

tests/fate/fft.mak

tests/fate/h264.mak

tests/fate/mp3.mak

tests/fate/vorbis.mak

tests/fate/vp8.mak

tests/fate2.mak

tests/ref/acodec/ac3_fixed

tests/ref/fate/4xm-1

tests/ref/fate/4xm-2

tests/ref/fate/ansi

tests/ref/fate/dxa-scummvm

tests/ref/fate/fax-g3

tests/ref/fate/fax-g3s

tests/ref/fate/g722dec-1

tests/ref/fate/gsm

tests/ref/fate/gsm-ms

tests/ref/fate/h264-extreme-plane-pred

tests/ref/fate/h264-interlace-crop

tests/ref/fate/h264-lossless

tests/ref/fate/mjpegb

tests/ref/fate/mpeg2-field-enc

tests/ref/fate/msmpeg4v1

tests/ref/fate/pictor

tests/ref/fate/psx-str-v3-adpcm_xa

tests/ref/fate/psx-str-v3-mdec

tests/ref/fate/rv30

tests/ref/fate/sha

tests/ref/fate/sub-srt

tests/ref/fate/truemotion1-15

tests/ref/fate/truemotion1-24

tests/ref/fate/txd-16bpp

tests/ref/fate/txd-pal8

tests/ref/fate/vp3

tests/ref/fate/vp8-sign-bias

tests/ref/fate/vp8-test-vector-001

tests/ref/fate/vp8-test-vector-002

tests/ref/fate/vp8-test-vector-003

tests/ref/fate/vp8-test-vector-004

tests/ref/fate/vp8-test-vector-005

tests/ref/fate/vp8-test-vector-006

tests/ref/fate/vp8-test-vector-007

tests/ref/fate/vp8-test-vector-008

tests/ref/fate/vp8-test-vector-009

tests/ref/fate/vp8-test-vector-010

tests/ref/fate/vp8-test-vector-011

tests/ref/fate/vp8-test-vector-012

tests/ref/fate/vp8-test-vector-013

tests/ref/fate/vp8-test-vector-014

tests/ref/fate/vp8-test-vector-015

tests/ref/fate/vp8-test-vector-016

tests/ref/fate/vp8-test-vector-017

tests/ref/fate/wmv8-drm

tests/ref/fate/wmv8-drm-nodec

tests/ref/fate/ws_snd

tests/ref/fate/yop

tests/ref/lavf/png

tests/ref/lavf/voc_s16

tests/ref/lavfi/pixdesc_be

tests/ref/lavfi/pixdesc_le

tests/ref/lavfi/pixfmts_copy_le

tests/ref/lavfi/pixfmts_crop_le

tests/ref/lavfi/pixfmts_hflip_le

tests/ref/lavfi/pixfmts_null_le

tests/ref/lavfi/pixfmts_pad_le

tests/ref/lavfi/pixfmts_scale_le

tests/ref/lavfi/pixfmts_vflip_le

tests/ref/seek/ac3_rm

tests/ref/seek/adpcm_ima_wav

tests/ref/seek/adpcm_ms_wav

tests/ref/seek/adpcm_qt_aiff

tests/ref/seek/adpcm_swf_flv

tests/ref/seek/adpcm_yam_wav

tests/ref/seek/alac_m4a

tests/ref/seek/asv1_avi

tests/ref/seek/asv2_avi

tests/ref/seek/dnxhd_1080i_mov

tests/ref/seek/dnxhd_720p_dnxhd

tests/ref/seek/dnxhd_720p_rd_dnxhd

tests/ref/seek/dv411_dv

tests/ref/seek/dv50_dv

tests/ref/seek/dv_dv

tests/ref/seek/error_mpeg4_adv_avi

tests/ref/seek/ffv1_avi

tests/ref/seek/flac_flac

tests/ref/seek/flashsv_flv

tests/ref/seek/flv_flv

tests/ref/seek/g726_wav

tests/ref/seek/h261_avi

tests/ref/seek/h263_avi

tests/ref/seek/h263p_avi

tests/ref/seek/huffyuv_avi

tests/ref/seek/image_bmp

tests/ref/seek/image_jpg

tests/ref/seek/image_pcx

tests/ref/seek/image_pgm

tests/ref/seek/image_ppm

tests/ref/seek/image_sgi

tests/ref/seek/image_tga

tests/ref/seek/image_tiff

tests/ref/seek/jpegls_avi

tests/ref/seek/lavf_aif

tests/ref/seek/lavf_al

tests/ref/seek/lavf_asf

tests/ref/seek/lavf_au

tests/ref/seek/lavf_avi

tests/ref/seek/lavf_dv

tests/ref/seek/lavf_ffm

tests/ref/seek/lavf_flv

tests/ref/seek/lavf_gif

tests/ref/seek/lavf_gxf

tests/ref/seek/lavf_mkv

tests/ref/seek/lavf_mmf

tests/ref/seek/lavf_mov

tests/ref/seek/lavf_mpg

tests/ref/seek/lavf_mxf

tests/ref/seek/lavf_mxf_d10

tests/ref/seek/lavf_nut

tests/ref/seek/lavf_ogg

tests/ref/seek/lavf_rm

tests/ref/seek/lavf_swf

tests/ref/seek/lavf_ts

tests/ref/seek/lavf_ul

tests/ref/seek/lavf_voc

tests/ref/seek/lavf_wav

tests/ref/seek/lavf_y4m

tests/ref/seek/ljpeg_avi

tests/ref/seek/mjpeg_avi

tests/ref/seek/mp2_mp2

tests/ref/seek/mpeg1_mpg

tests/ref/seek/mpeg1b_mpg

tests/ref/seek/mpeg2_422_mpg

tests/ref/seek/mpeg2_mpg

tests/ref/seek/mpeg2i_mpg

tests/ref/seek/mpeg2ivlc_qprd_mpg

tests/ref/seek/mpeg2reuse_mpg

tests/ref/seek/mpeg2thread_mpg

tests/ref/seek/mpeg2threadivlc_mpg

tests/ref/seek/mpeg4_Q_avi

tests/ref/seek/mpeg4_adap_avi

tests/ref/seek/mpeg4_adv_avi

tests/ref/seek/mpeg4_nr_avi

tests/ref/seek/mpeg4_qprd_avi

tests/ref/seek/mpeg4_rc_avi

tests/ref/seek/mpeg4_thread_avi

tests/ref/seek/msmpeg4_avi

tests/ref/seek/msmpeg4v2_avi

tests/ref/seek/odivx_mp4

tests/ref/seek/pbmpipe_pbm

tests/ref/seek/pcm_alaw_wav

tests/ref/seek/pcm_f32be_au

tests/ref/seek/pcm_f32le_wav

tests/ref/seek/pcm_f64be_au

tests/ref/seek/pcm_f64le_wav

tests/ref/seek/pcm_mulaw_wav

tests/ref/seek/pcm_s16be_mkv

tests/ref/seek/pcm_s16be_mov

tests/ref/seek/pcm_s16le_mkv

tests/ref/seek/pcm_s16le_wav

tests/ref/seek/pcm_s24be_mov

tests/ref/seek/pcm_s24daud_302

tests/ref/seek/pcm_s24le_wav

tests/ref/seek/pcm_s32be_mov

tests/ref/seek/pcm_s32le_wav

tests/ref/seek/pcm_s8_mov

tests/ref/seek/pcm_u8_wav

tests/ref/seek/pcm_zork_wav

tests/ref/seek/pgmpipe_pgm

tests/ref/seek/ppmpipe_ppm

tests/ref/seek/rgb_avi

tests/ref/seek/roqav_roq

tests/ref/seek/rv10_rm

tests/ref/seek/rv20_rm

tests/ref/seek/snow53_avi

tests/ref/seek/snow_avi

tests/ref/seek/svq1_mov

tests/ref/seek/wmav1_asf

tests/ref/seek/wmav2_asf

tests/ref/seek/wmv1_avi

tests/ref/seek/wmv2_avi

tests/ref/seek/yuv_avi

tests/ref/vsynth1/qtrle

tests/ref/vsynth1/rgb

tests/ref/vsynth1/yuv

tests/ref/vsynth2/qtrle

tests/ref/vsynth2/rgb

tests/ref/vsynth2/yuv

tools/jauche_sortierer.sh

tools/lavfi-showfiltfmts.c

files removed:
MAINTAINERS

RELEASE

debian/libavcodec52.install

debian/libavcodec52.lintian-overrides

debian/libavdevice52.install

debian/libavdevice52.lintian-overrides

debian/libavfilter1.install

debian/libavfilter1.lintian-overrides

debian/libavformat52.install

debian/libavformat52.lintian-overrides

debian/libavutil50.install

debian/libavutil50.lintian-overrides

debian/libpostproc51.install

debian/libpostproc51.lintian-overrides

debian/libswscale0.install

debian/libswscale0.lintian-overrides

doc/ffmpeg-doc.texi

doc/ffmpeg_powerpc_performance_evaluation_howto.txt

doc/ffplay-doc.texi

doc/ffprobe-doc.texi

doc/ffserver-doc.texi

ffpresets/libx264-default.ffpreset

ffpresets/libx264-fastfirstpass.ffpreset

ffpresets/libx264-hq.ffpreset

ffpresets/libx264-max.ffpreset

ffpresets/libx264-normal.ffpreset

ffpresets/libx264-slowfirstpass.ffpreset

libavcodec/aac_parser.h

libavcodec/beosthread.c

libavcodec/colorspace.h

libavcodec/eval.c

libavcodec/eval.h

libavcodec/h264_parser.h

libavcodec/h264dspenc.c

libavcodec/h264enc.c

libavcodec/iff.h

libavcodec/libfaad.c

libavcodec/mdct_tablegen.c

libavcodec/mdct_tablegen.h

libavcodec/os2thread.c

libavcodec/ppc/check_altivec.c

libavcodec/ppc/dsputil_ppc.h

libavcodec/sonic.c

libavcodec/x86/cpuid.c

libavcodec/x86/dsputil_h264_template_mmx.c

libavcodec/x86/dsputil_h264_template_ssse3.c

libavcodec/x86/h264_deblock_sse2.asm

libavcodec/x86/h264_idct_sse2.asm

libavcodec/x86/mmx.h

libavcodec/x86/rv40dsp_mmx.c

libavcodec/x86/vp3dsp_mmx.c

libavcodec/x86/vp3dsp_mmx.h

libavcodec/x86/vp3dsp_sse2.c

libavcodec/x86/vp3dsp_sse2.h

libavcodec/x86/vp6dsp_mmx.c

libavcodec/x86/vp6dsp_mmx.h

libavcodec/x86/vp6dsp_sse2.c

libavcodec/x86/vp6dsp_sse2.h

libavdevice/beosaudio.cpp

libavfilter/graphparser.h

libavfilter/parseutils.c

libavfilter/parseutils.h

libavformat/idroq.c

libavformat/mp3.c

libavformat/raw.c

libavformat/raw.h

libavformat/rtpdec_amr.h

libavformat/rtpdec_asf.h

libavformat/rtpdec_h263.h

libavformat/rtpdec_h264.h

libavformat/rtpdec_xiph.h

libswscale/x86/yuv2rgb_template2.c

tests/fate-update.sh

tests/ref/acodec/ac3

tests/ref/fate/4xm

tests/ref/seek/%02d.bmp.ref

tests/ref/seek/%02d.jpg.ref

tests/ref/seek/%02d.pcx.ref

tests/ref/seek/%02d.pgm.ref

tests/ref/seek/%02d.ppm.ref

tests/ref/seek/%02d.sgi.ref

tests/ref/seek/%02d.tga.ref

tests/ref/seek/%02d.tiff.ref

tests/ref/seek/ac3.rm.ref

tests/ref/seek/adpcm_ima.wav.ref

tests/ref/seek/adpcm_ms.wav.ref

tests/ref/seek/adpcm_qt.aiff.ref

tests/ref/seek/adpcm_swf.flv.ref

tests/ref/seek/adpcm_yam.wav.ref

tests/ref/seek/alac.m4a.ref

tests/ref/seek/asv1.avi.ref

tests/ref/seek/asv2.avi.ref

tests/ref/seek/dnxhd-1080i.mov.ref

tests/ref/seek/dnxhd-720p-rd.dnxhd.ref

tests/ref/seek/dnxhd-720p.dnxhd.ref

tests/ref/seek/dv.dv.ref

tests/ref/seek/dv411.dv.ref

tests/ref/seek/dv50.dv.ref

tests/ref/seek/error-mpeg4-adv.avi.ref

tests/ref/seek/ffv1.avi.ref

tests/ref/seek/flac.flac.ref

tests/ref/seek/flashsv.flv.ref

tests/ref/seek/flv.flv.ref

tests/ref/seek/g726.wav.ref

tests/ref/seek/h261.avi.ref

tests/ref/seek/h263.avi.ref

tests/ref/seek/h263p.avi.ref

tests/ref/seek/huffyuv.avi.ref

tests/ref/seek/jpegls.avi.ref

tests/ref/seek/lavf.aif.ref

tests/ref/seek/lavf.al.ref

tests/ref/seek/lavf.asf.ref

tests/ref/seek/lavf.au.ref

tests/ref/seek/lavf.avi.ref

tests/ref/seek/lavf.dv.ref

tests/ref/seek/lavf.ffm.ref

tests/ref/seek/lavf.flv.ref

tests/ref/seek/lavf.gif.ref

tests/ref/seek/lavf.gxf.ref

tests/ref/seek/lavf.mkv.ref

tests/ref/seek/lavf.mmf.ref

tests/ref/seek/lavf.mov.ref

tests/ref/seek/lavf.mpg.ref

tests/ref/seek/lavf.mxf.ref

tests/ref/seek/lavf.mxf_d10.ref

tests/ref/seek/lavf.nut.ref

tests/ref/seek/lavf.ogg.ref

tests/ref/seek/lavf.rm.ref

tests/ref/seek/lavf.swf.ref

tests/ref/seek/lavf.ts.ref

tests/ref/seek/lavf.ul.ref

tests/ref/seek/lavf.voc.ref

tests/ref/seek/lavf.wav.ref

tests/ref/seek/lavf.y4m.ref

tests/ref/seek/ljpeg.avi.ref

tests/ref/seek/mjpeg.avi.ref

tests/ref/seek/mp2.mp2.ref

tests/ref/seek/mpeg1.mpg.ref

tests/ref/seek/mpeg1b.mpg.ref

tests/ref/seek/mpeg2.mpg.ref

tests/ref/seek/mpeg2_422.mpg.ref

tests/ref/seek/mpeg2i.mpg.ref

tests/ref/seek/mpeg2ivlc-qprd.mpg.ref

tests/ref/seek/mpeg2reuse.mpg.ref

tests/ref/seek/mpeg2thread.mpg.ref

tests/ref/seek/mpeg2threadivlc.mpg.ref

tests/ref/seek/mpeg4-Q.avi.ref

tests/ref/seek/mpeg4-adap.avi.ref

tests/ref/seek/mpeg4-adv.avi.ref

tests/ref/seek/mpeg4-nr.avi.ref

tests/ref/seek/mpeg4-qprd.avi.ref

tests/ref/seek/mpeg4-rc.avi.ref

tests/ref/seek/mpeg4-thread.avi.ref

tests/ref/seek/msmpeg4.avi.ref

tests/ref/seek/msmpeg4v2.avi.ref

tests/ref/seek/odivx.mp4.ref

tests/ref/seek/pbmpipe.pbm.ref

tests/ref/seek/pcm_alaw.wav.ref

tests/ref/seek/pcm_f32be.au.ref

tests/ref/seek/pcm_f32le.wav.ref

tests/ref/seek/pcm_f64be.au.ref

tests/ref/seek/pcm_f64le.wav.ref

tests/ref/seek/pcm_mulaw.wav.ref

tests/ref/seek/pcm_s16be.mkv.ref

tests/ref/seek/pcm_s16be.mov.ref

tests/ref/seek/pcm_s16le.mkv.ref

tests/ref/seek/pcm_s16le.wav.ref

tests/ref/seek/pcm_s24be.mov.ref

tests/ref/seek/pcm_s24daud.302.ref

tests/ref/seek/pcm_s24le.wav.ref

tests/ref/seek/pcm_s32be.mov.ref

tests/ref/seek/pcm_s32le.wav.ref

tests/ref/seek/pcm_s8.mov.ref

tests/ref/seek/pcm_u8.wav.ref

tests/ref/seek/pcm_zork.wav.ref

tests/ref/seek/pgmpipe.pgm.ref

tests/ref/seek/ppmpipe.ppm.ref

tests/ref/seek/roqav.roq.ref

tests/ref/seek/rv10.rm.ref

tests/ref/seek/rv20.rm.ref

tests/ref/seek/snow.avi.ref

tests/ref/seek/snow53.avi.ref

tests/ref/seek/svq1.mov.ref

tests/ref/seek/wmav1.asf.ref

tests/ref/seek/wmav2.asf.ref

tests/ref/seek/wmv1.avi.ref

tests/ref/seek/wmv2.avi.ref

tests/seek-regression.sh

files modified:
Changelog

Doxyfile

INSTALL

LICENSE

Makefile

README

VERSION

cmdutils.c

cmdutils.h

common.mak

configure

debian/changelog

debian/confflags

debian/control

debian/copyright

debian/rules

debian/source.lintian-overrides

debian/watch

doc/APIchanges

doc/TODO

doc/developer.texi

doc/faq.texi

doc/ffserver.conf

doc/fftools-common-opts.texi

doc/general.texi

doc/issue_tracker.txt

doc/libavfilter.texi

doc/optimization.txt

doc/soc.txt

doc/tablegen.txt

doc/texi2pod.pl

ffmpeg.c

ffplay.c

ffpresets/libx264-fast.ffpreset

ffpresets/libx264-fast_firstpass.ffpreset

ffpresets/libx264-faster.ffpreset

ffpresets/libx264-faster_firstpass.ffpreset

ffpresets/libx264-lossless_fast.ffpreset

ffpresets/libx264-lossless_max.ffpreset

ffpresets/libx264-lossless_medium.ffpreset

ffpresets/libx264-lossless_slow.ffpreset

ffpresets/libx264-lossless_slower.ffpreset

ffpresets/libx264-lossless_ultrafast.ffpreset

ffpresets/libx264-medium.ffpreset

ffpresets/libx264-medium_firstpass.ffpreset

ffpresets/libx264-placebo.ffpreset

ffpresets/libx264-placebo_firstpass.ffpreset

ffpresets/libx264-slow.ffpreset

ffpresets/libx264-slow_firstpass.ffpreset

ffpresets/libx264-slower.ffpreset

ffpresets/libx264-slower_firstpass.ffpreset

ffpresets/libx264-superfast.ffpreset

ffpresets/libx264-superfast_firstpass.ffpreset

ffpresets/libx264-ultrafast.ffpreset

ffpresets/libx264-ultrafast_firstpass.ffpreset

ffpresets/libx264-veryfast.ffpreset

ffpresets/libx264-veryfast_firstpass.ffpreset

ffpresets/libx264-veryslow.ffpreset

ffpresets/libx264-veryslow_firstpass.ffpreset

ffprobe.c

ffserver.c

ffserver.h

libavcodec/4xm.c

libavcodec/8bps.c

libavcodec/8svx.c

libavcodec/Makefile

libavcodec/aac.h

libavcodec/aac_ac3_parser.c

libavcodec/aac_ac3_parser.h

libavcodec/aac_adtstoasc_bsf.c

libavcodec/aac_parser.c

libavcodec/aac_tablegen.c

libavcodec/aac_tablegen.h

libavcodec/aac_tablegen_decl.h

libavcodec/aaccoder.c

libavcodec/aacdec.c

libavcodec/aacdectab.h

libavcodec/aacenc.c

libavcodec/aacenc.h

libavcodec/aacps.c

libavcodec/aacps.h

libavcodec/aacps_tablegen.c

libavcodec/aacps_tablegen.h

libavcodec/aacpsdata.c

libavcodec/aacpsy.c

libavcodec/aacpsy.h

libavcodec/aacsbr.c

libavcodec/aacsbr.h

libavcodec/aacsbrdata.h

libavcodec/aactab.c

libavcodec/aactab.h

libavcodec/aandcttab.c

libavcodec/aandcttab.h

libavcodec/aasc.c

libavcodec/ac3.c

libavcodec/ac3.h

libavcodec/ac3_parser.c

libavcodec/ac3_parser.h

libavcodec/ac3dec.c

libavcodec/ac3dec.h

libavcodec/ac3dec_data.c

libavcodec/ac3dec_data.h

libavcodec/ac3enc.c

libavcodec/ac3tab.c

libavcodec/ac3tab.h

libavcodec/acelp_filters.c

libavcodec/acelp_filters.h

libavcodec/acelp_pitch_delay.c

libavcodec/acelp_pitch_delay.h

libavcodec/acelp_vectors.c

libavcodec/acelp_vectors.h

libavcodec/adpcm.c

libavcodec/adx.h

libavcodec/adxdec.c

libavcodec/adxenc.c

libavcodec/alac.c

libavcodec/alacenc.c

libavcodec/allcodecs.c

libavcodec/alpha/asm.h

libavcodec/alpha/dsputil_alpha.c

libavcodec/alpha/dsputil_alpha.h

libavcodec/alpha/dsputil_alpha_asm.S

libavcodec/alpha/motion_est_alpha.c

libavcodec/alpha/motion_est_mvi_asm.S

libavcodec/alpha/mpegvideo_alpha.c

libavcodec/alpha/regdef.h

libavcodec/alpha/simple_idct_alpha.c

libavcodec/alsdec.c

libavcodec/amrnbdata.h

libavcodec/amrnbdec.c

libavcodec/anm.c

libavcodec/apedec.c

libavcodec/api-example.c

libavcodec/arm/Makefile

libavcodec/arm/aac.h

libavcodec/arm/asm.S

libavcodec/arm/dcadsp_init_arm.c

libavcodec/arm/dcadsp_neon.S

libavcodec/arm/dsputil_arm.S

libavcodec/arm/dsputil_arm.h

libavcodec/arm/dsputil_armv6.S

libavcodec/arm/dsputil_init_arm.c

libavcodec/arm/dsputil_init_armv5te.c

libavcodec/arm/dsputil_init_armv6.c

libavcodec/arm/dsputil_init_neon.c

libavcodec/arm/dsputil_init_vfp.c

libavcodec/arm/dsputil_iwmmxt.c

libavcodec/arm/dsputil_iwmmxt_rnd_template.c

libavcodec/arm/dsputil_neon.S

libavcodec/arm/dsputil_vfp.S

libavcodec/arm/fft_init_arm.c

libavcodec/arm/fft_neon.S

libavcodec/arm/h264dsp_init_arm.c

libavcodec/arm/h264dsp_neon.S

libavcodec/arm/h264idct_neon.S

libavcodec/arm/h264pred_init_arm.c

libavcodec/arm/h264pred_neon.S

libavcodec/arm/int_neon.S

libavcodec/arm/mathops.h

libavcodec/arm/mdct_neon.S

libavcodec/arm/mpegvideo_arm.c

libavcodec/arm/mpegvideo_arm.h

libavcodec/arm/mpegvideo_armv5te.c

libavcodec/arm/mpegvideo_armv5te_s.S

libavcodec/arm/mpegvideo_iwmmxt.c

libavcodec/arm/rdft_neon.S

libavcodec/arm/simple_idct_arm.S

libavcodec/arm/simple_idct_armv5te.S

libavcodec/arm/simple_idct_armv6.S

libavcodec/arm/simple_idct_neon.S

libavcodec/arm/synth_filter_neon.S

libavcodec/arm/vp3dsp_neon.S

libavcodec/arm/vp56dsp_init_arm.c

libavcodec/arm/vp56dsp_neon.S

libavcodec/asv1.c

libavcodec/atrac.c

libavcodec/atrac.h

libavcodec/atrac1.c

libavcodec/atrac1data.h

libavcodec/atrac3.c

libavcodec/atrac3data.h

libavcodec/audioconvert.c

libavcodec/audioconvert.h

libavcodec/aura.c

libavcodec/avcodec.h

libavcodec/avfft.c

libavcodec/avfft.h

libavcodec/avpacket.c

libavcodec/avr32/mathops.h

libavcodec/avs.c

libavcodec/bethsoftvideo.c

libavcodec/bethsoftvideo.h

libavcodec/bfi.c

libavcodec/bfin/config_bfin.h

libavcodec/bfin/dsputil_bfin.c

libavcodec/bfin/dsputil_bfin.h

libavcodec/bfin/fdct_bfin.S

libavcodec/bfin/idct_bfin.S

libavcodec/bfin/mathops.h

libavcodec/bfin/mpegvideo_bfin.c

libavcodec/bfin/pixels_bfin.S

libavcodec/bfin/vp3_bfin.c

libavcodec/bfin/vp3_idct_bfin.S

libavcodec/bgmc.c

libavcodec/bgmc.h

libavcodec/bink.c

libavcodec/binkaudio.c

libavcodec/binkdata.h

libavcodec/binkidct.c

libavcodec/bitstream.c

libavcodec/bitstream_filter.c

libavcodec/bmp.c

libavcodec/bmp.h

libavcodec/bmpenc.c

libavcodec/bytestream.h

libavcodec/c93.c

libavcodec/cabac.c

libavcodec/cabac.h

libavcodec/cavs.c

libavcodec/cavs.h

libavcodec/cavs_parser.c

libavcodec/cavsdata.h

libavcodec/cavsdec.c

libavcodec/cavsdsp.c

libavcodec/cbrt_tablegen.c

libavcodec/cbrt_tablegen.h

libavcodec/cdgraphics.c

libavcodec/celp_filters.c

libavcodec/celp_filters.h

libavcodec/celp_math.c

libavcodec/celp_math.h

libavcodec/cga_data.c

libavcodec/cga_data.h

libavcodec/cinepak.c

libavcodec/cljr.c

libavcodec/cook.c

libavcodec/cookdata.h

libavcodec/costablegen.c

libavcodec/cscd.c

libavcodec/cyuv.c

libavcodec/dca.c

libavcodec/dca.h

libavcodec/dca_parser.c

libavcodec/dcadata.h

libavcodec/dcadsp.c

libavcodec/dcadsp.h

libavcodec/dcahuff.h

libavcodec/dct-test.c

libavcodec/dct.c

libavcodec/dctref.c

libavcodec/dctref.h

libavcodec/dirac.c

libavcodec/dirac.h

libavcodec/dirac_parser.c

libavcodec/dnxhd_parser.c

libavcodec/dnxhddata.c

libavcodec/dnxhddata.h

libavcodec/dnxhddec.c

libavcodec/dnxhdenc.c

libavcodec/dnxhdenc.h

libavcodec/dpcm.c

libavcodec/dpx.c

libavcodec/dsicinav.c

libavcodec/dsputil.c

libavcodec/dsputil.h

libavcodec/dump_extradata_bsf.c

libavcodec/dv.c

libavcodec/dv_tablegen.c

libavcodec/dv_tablegen.h

libavcodec/dv_vlc_data.h

libavcodec/dvbsub.c

libavcodec/dvbsub_parser.c

libavcodec/dvbsubdec.c

libavcodec/dvdata.c

libavcodec/dvdata.h

libavcodec/dvdsub_parser.c

libavcodec/dvdsubdec.c

libavcodec/dvdsubenc.c

libavcodec/dwt.c

libavcodec/dwt.h

libavcodec/dxa.c

libavcodec/dxva2.c

libavcodec/dxva2.h

libavcodec/dxva2_h264.c

libavcodec/dxva2_internal.h

libavcodec/dxva2_vc1.c

libavcodec/eac3dec.c

libavcodec/eac3dec_data.c

libavcodec/eac3dec_data.h

libavcodec/eacmv.c

libavcodec/eaidct.c

libavcodec/eamad.c

libavcodec/eatgq.c

libavcodec/eatgv.c

libavcodec/eatqi.c

libavcodec/elbg.c

libavcodec/elbg.h

libavcodec/error_resilience.c

libavcodec/escape124.c

libavcodec/faandct.h

libavcodec/faanidct.c

libavcodec/faanidct.h

libavcodec/faxcompr.c

libavcodec/faxcompr.h

libavcodec/fft-test.c

libavcodec/fft.c

libavcodec/fft.h

libavcodec/ffv1.c

libavcodec/flac.c

libavcodec/flac.h

libavcodec/flacdata.c

libavcodec/flacdata.h

libavcodec/flacdec.c

libavcodec/flacenc.c

libavcodec/flashsv.c

libavcodec/flashsvenc.c

libavcodec/flicvideo.c

libavcodec/flv.h

libavcodec/flvdec.c

libavcodec/flvenc.c

libavcodec/fraps.c

libavcodec/frwu.c

libavcodec/g726.c

libavcodec/g729.h

libavcodec/g729data.h

libavcodec/g729dec.c

libavcodec/get_bits.h

libavcodec/gif.c

libavcodec/gifdec.c

libavcodec/golomb.c

libavcodec/golomb.h

libavcodec/h261.c

libavcodec/h261.h

libavcodec/h261_parser.c

libavcodec/h261data.h

libavcodec/h261dec.c

libavcodec/h261enc.c

libavcodec/h263.c

libavcodec/h263.h

libavcodec/h263_parser.c

libavcodec/h263_parser.h

libavcodec/h263data.h

libavcodec/h263dec.c

libavcodec/h264.c

libavcodec/h264.h

libavcodec/h264_cabac.c

libavcodec/h264_cavlc.c

libavcodec/h264_direct.c

libavcodec/h264_loopfilter.c

libavcodec/h264_mp4toannexb_bsf.c

libavcodec/h264_mvpred.h

libavcodec/h264_parser.c

libavcodec/h264_ps.c

libavcodec/h264_refs.c

libavcodec/h264_sei.c

libavcodec/h264data.h

libavcodec/h264dsp.c

libavcodec/h264dsp.h

libavcodec/h264idct.c

libavcodec/h264pred.c

libavcodec/h264pred.h

libavcodec/huffman.c

libavcodec/huffman.h

libavcodec/huffyuv.c

libavcodec/idcinvideo.c

libavcodec/iff.c

libavcodec/iirfilter.c

libavcodec/iirfilter.h

libavcodec/imc.c

libavcodec/imcdata.h

libavcodec/imgconvert.c

libavcodec/imgconvert.h

libavcodec/imx_dump_header_bsf.c

libavcodec/indeo2.c

libavcodec/indeo2data.h

libavcodec/indeo3.c

libavcodec/indeo3data.h

libavcodec/indeo5.c

libavcodec/indeo5data.h

libavcodec/intelh263dec.c

libavcodec/internal.h

libavcodec/interplayvideo.c

libavcodec/intrax8.c

libavcodec/intrax8.h

libavcodec/intrax8dsp.c

libavcodec/intrax8huf.h

libavcodec/ituh263dec.c

libavcodec/ituh263enc.c

libavcodec/ivi_common.c

libavcodec/ivi_common.h

libavcodec/ivi_dsp.c

libavcodec/ivi_dsp.h

libavcodec/jpegls.c

libavcodec/jpegls.h

libavcodec/jpeglsdec.c

libavcodec/jpeglsdec.h

libavcodec/jpeglsenc.c

libavcodec/kgv1dec.c

libavcodec/kmvc.c

libavcodec/lcl.h

libavcodec/lcldec.c

libavcodec/lclenc.c

libavcodec/libavcodec.v

libavcodec/libdirac.h

libavcodec/libdirac_libschro.c

libavcodec/libdirac_libschro.h

libavcodec/libdiracdec.c

libavcodec/libdiracenc.c

libavcodec/libfaac.c

libavcodec/libgsm.c

libavcodec/libmp3lame.c

libavcodec/libopencore-amr.c

libavcodec/libopenjpeg.c

libavcodec/libschroedinger.c

libavcodec/libschroedinger.h

libavcodec/libschroedingerdec.c

libavcodec/libschroedingerenc.c

libavcodec/libspeexdec.c

libavcodec/libtheoraenc.c

libavcodec/libvorbis.c

libavcodec/libvpxdec.c

libavcodec/libvpxenc.c

libavcodec/libx264.c

libavcodec/libxvid_internal.h

libavcodec/libxvid_rc.c

libavcodec/libxvidff.c

libavcodec/ljpegenc.c

libavcodec/loco.c

libavcodec/lpc.c

libavcodec/lpc.h

libavcodec/lsp.c

libavcodec/lsp.h

libavcodec/lzw.c

libavcodec/lzw.h

libavcodec/lzwenc.c

libavcodec/mace.c

libavcodec/mathops.h

libavcodec/mdct.c

libavcodec/mdec.c

libavcodec/mimic.c

libavcodec/mips/mathops.h

libavcodec/mjpeg.c

libavcodec/mjpeg.h

libavcodec/mjpeg_parser.c

libavcodec/mjpega_dump_header_bsf.c

libavcodec/mjpegbdec.c

libavcodec/mjpegdec.c

libavcodec/mjpegdec.h

libavcodec/mjpegenc.c

libavcodec/mjpegenc.h

libavcodec/mlib/dsputil_mlib.c

libavcodec/mlp.c

libavcodec/mlp.h

libavcodec/mlp_parser.c

libavcodec/mlp_parser.h

libavcodec/mlpdec.c

libavcodec/mlpdsp.c

libavcodec/mmvideo.c

libavcodec/motion-test.c

libavcodec/motion_est.c

libavcodec/motion_est_template.c

libavcodec/motionpixels.c

libavcodec/motionpixels_tablegen.c

libavcodec/motionpixels_tablegen.h

libavcodec/movsub_bsf.c

libavcodec/mp3_header_compress_bsf.c

libavcodec/mp3_header_decompress_bsf.c

libavcodec/mpc.c

libavcodec/mpc.h

libavcodec/mpc7.c

libavcodec/mpc7data.h

libavcodec/mpc8.c

libavcodec/mpc8data.h

libavcodec/mpc8huff.h

libavcodec/mpcdata.h

libavcodec/mpeg12.c

libavcodec/mpeg12.h

libavcodec/mpeg12data.c

libavcodec/mpeg12data.h

libavcodec/mpeg12decdata.h

libavcodec/mpeg12enc.c

libavcodec/mpeg4audio.c

libavcodec/mpeg4audio.h

libavcodec/mpeg4data.h

libavcodec/mpeg4video.c

libavcodec/mpeg4video.h

libavcodec/mpeg4video_parser.c

libavcodec/mpeg4video_parser.h

libavcodec/mpeg4videodec.c

libavcodec/mpeg4videoenc.c

libavcodec/mpegaudio.c

libavcodec/mpegaudio.h

libavcodec/mpegaudio3.h

libavcodec/mpegaudio_parser.c

libavcodec/mpegaudio_tablegen.c

libavcodec/mpegaudio_tablegen.h

libavcodec/mpegaudiodata.c

libavcodec/mpegaudiodata.h

libavcodec/mpegaudiodec.c

libavcodec/mpegaudiodecheader.c

libavcodec/mpegaudiodecheader.h

libavcodec/mpegaudiodectab.h

libavcodec/mpegaudioenc.c

libavcodec/mpegaudiotab.h

libavcodec/mpegvideo.c

libavcodec/mpegvideo.h

libavcodec/mpegvideo_common.h

libavcodec/mpegvideo_enc.c

libavcodec/mpegvideo_parser.c

libavcodec/mpegvideo_xvmc.c

libavcodec/msmpeg4.c

libavcodec/msmpeg4.h

libavcodec/msmpeg4data.c

libavcodec/msmpeg4data.h

libavcodec/msrle.c

libavcodec/msrledec.c

libavcodec/msrledec.h

libavcodec/msvideo1.c

libavcodec/nellymoserdec.c

libavcodec/nellymoserenc.c

libavcodec/noise_bsf.c

libavcodec/nuv.c

libavcodec/opt.c

libavcodec/opt.h

libavcodec/options.c

libavcodec/pamenc.c

libavcodec/parser.c

libavcodec/parser.h

libavcodec/pcm-mpeg.c

libavcodec/pcm.c

libavcodec/pcm_tablegen.c

libavcodec/pcm_tablegen.h

libavcodec/pcx.c

libavcodec/pcxenc.c

libavcodec/pgssubdec.c

libavcodec/png.c

libavcodec/png.h

libavcodec/pngdec.c

libavcodec/pngenc.c

libavcodec/pnm.c

libavcodec/pnm.h

libavcodec/pnm_parser.c

libavcodec/pnmdec.c

libavcodec/pnmenc.c

libavcodec/ppc/Makefile

libavcodec/ppc/dsputil_altivec.c

libavcodec/ppc/dsputil_altivec.h

libavcodec/ppc/dsputil_ppc.c

libavcodec/ppc/fdct_altivec.c

libavcodec/ppc/fft_altivec.c

libavcodec/ppc/float_altivec.c

libavcodec/ppc/gmc_altivec.c

libavcodec/ppc/h264_altivec.c

libavcodec/ppc/h264_template_altivec.c

libavcodec/ppc/idct_altivec.c

libavcodec/ppc/int_altivec.c

libavcodec/ppc/mathops.h

libavcodec/ppc/mpegvideo_altivec.c

libavcodec/ppc/types_altivec.h

libavcodec/ppc/util_altivec.h

libavcodec/ppc/vc1dsp_altivec.c

libavcodec/ppc/vp3dsp_altivec.c

libavcodec/ps2/dsputil_mmi.c

libavcodec/ps2/idct_mmi.c

libavcodec/ps2/mmi.h

libavcodec/ps2/mpegvideo_mmi.c

libavcodec/psymodel.c

libavcodec/psymodel.h

libavcodec/pthread.c

libavcodec/ptx.c

libavcodec/put_bits.h

libavcodec/qcelpdata.h

libavcodec/qcelpdec.c

libavcodec/qdm2.c

libavcodec/qdm2_tablegen.c

libavcodec/qdm2_tablegen.h

libavcodec/qdm2data.h

libavcodec/qdrw.c

libavcodec/qpeg.c

libavcodec/qtrle.c

libavcodec/qtrleenc.c

libavcodec/r210dec.c

libavcodec/ra144.c

libavcodec/ra144.h

libavcodec/ra288.c

libavcodec/ra288.h

libavcodec/rangecoder.c

libavcodec/rangecoder.h

libavcodec/ratecontrol.c

libavcodec/ratecontrol.h

libavcodec/raw.c

libavcodec/raw.h

libavcodec/rawdec.c

libavcodec/rawenc.c

libavcodec/rdft.c

libavcodec/rectangle.h

libavcodec/remove_extradata_bsf.c

libavcodec/resample.c

libavcodec/resample2.c

libavcodec/rl.h

libavcodec/rl2.c

libavcodec/rle.c

libavcodec/rle.h

libavcodec/roqaudioenc.c

libavcodec/roqvideo.c

libavcodec/roqvideo.h

libavcodec/roqvideodec.c

libavcodec/roqvideoenc.c

libavcodec/rpza.c

libavcodec/rtjpeg.c

libavcodec/rtjpeg.h

libavcodec/rv10.c

libavcodec/rv10enc.c

libavcodec/rv20enc.c

libavcodec/rv30.c

libavcodec/rv30data.h

libavcodec/rv30dsp.c

libavcodec/rv34.c

libavcodec/rv34.h

libavcodec/rv34data.h

libavcodec/rv34vlc.h

libavcodec/rv40.c

libavcodec/rv40data.h

libavcodec/rv40dsp.c

libavcodec/rv40vlc2.h

libavcodec/s3tc.c

libavcodec/s3tc.h

libavcodec/sbr.h

libavcodec/sgi.h

libavcodec/sgidec.c

libavcodec/sgienc.c

libavcodec/sh4/dsputil_align.c

libavcodec/sh4/dsputil_sh4.c

libavcodec/sh4/dsputil_sh4.h

libavcodec/sh4/idct_sh4.c

libavcodec/sh4/qpel.c

libavcodec/sh4/sh4.h

libavcodec/shorten.c

libavcodec/simple_idct.c

libavcodec/simple_idct.h

libavcodec/sipr.c

libavcodec/sipr.h

libavcodec/sipr16k.c

libavcodec/sipr16kdata.h

libavcodec/siprdata.h

libavcodec/smacker.c

libavcodec/smc.c

libavcodec/snow.c

libavcodec/snow.h

libavcodec/sp5x.h

libavcodec/sp5xdec.c

libavcodec/sparc/dsputil_vis.c

libavcodec/sparc/dsputil_vis.h

libavcodec/sparc/simple_idct_vis.c

libavcodec/sparc/vis.h

libavcodec/sunrast.c

libavcodec/svq1.c

libavcodec/svq1.h

libavcodec/svq1_cb.h

libavcodec/svq1_vlc.h

libavcodec/svq1dec.c

libavcodec/svq1enc.c

libavcodec/svq1enc_cb.h

libavcodec/svq3.c

libavcodec/synth_filter.c

libavcodec/synth_filter.h

libavcodec/tableprint.c

libavcodec/tableprint.h

libavcodec/targa.c

libavcodec/targaenc.c

libavcodec/tiertexseqv.c

libavcodec/tiff.c

libavcodec/tiff.h

libavcodec/tiffenc.c

libavcodec/tmv.c

libavcodec/truemotion1.c

libavcodec/truemotion1data.h

libavcodec/truemotion2.c

libavcodec/truespeech.c

libavcodec/truespeech_data.h

libavcodec/tscc.c

libavcodec/tta.c

libavcodec/twinvq.c

libavcodec/twinvq_data.h

libavcodec/txd.c

libavcodec/ulti.c

libavcodec/ulti_cb.h

libavcodec/unary.h

libavcodec/utils.c

libavcodec/v210dec.c

libavcodec/v210enc.c

libavcodec/v210x.c

libavcodec/vaapi.c

libavcodec/vaapi.h

libavcodec/vaapi_h264.c

libavcodec/vaapi_internal.h

libavcodec/vaapi_mpeg2.c

libavcodec/vaapi_mpeg4.c

libavcodec/vaapi_vc1.c

libavcodec/vb.c

libavcodec/vc1.c

libavcodec/vc1.h

libavcodec/vc1_parser.c

libavcodec/vc1acdata.h

libavcodec/vc1data.c

libavcodec/vc1data.h

libavcodec/vc1dec.c

libavcodec/vc1dsp.c

libavcodec/vcr1.c

libavcodec/vdpau.c

libavcodec/vdpau.h

libavcodec/vdpau_internal.h

libavcodec/vmdav.c

libavcodec/vmnc.c

libavcodec/vorbis.c

libavcodec/vorbis.h

libavcodec/vorbis_data.c

libavcodec/vorbis_dec.c

libavcodec/vorbis_enc.c

libavcodec/vorbis_enc_data.h

libavcodec/vp3.c

libavcodec/vp3_parser.c

libavcodec/vp3data.h

libavcodec/vp3dsp.c

libavcodec/vp5.c

libavcodec/vp56.c

libavcodec/vp56.h

libavcodec/vp56data.c

libavcodec/vp56data.h

libavcodec/vp56dsp.c

libavcodec/vp56dsp.h

libavcodec/vp5data.h

libavcodec/vp6.c

libavcodec/vp6data.h

libavcodec/vp6dsp.c

libavcodec/vqavideo.c

libavcodec/w32thread.c

libavcodec/wavpack.c

libavcodec/wma.c

libavcodec/wma.h

libavcodec/wmadata.h

libavcodec/wmadec.c

libavcodec/wmaenc.c

libavcodec/wmaprodata.h

libavcodec/wmaprodec.c

libavcodec/wmavoice.c

libavcodec/wmavoice_data.h

libavcodec/wmv2.c

libavcodec/wmv2.h

libavcodec/wmv2dec.c

libavcodec/wmv2enc.c

libavcodec/wnv1.c

libavcodec/ws-snd1.c

libavcodec/x86/Makefile

libavcodec/x86/cavsdsp_mmx.c

libavcodec/x86/dnxhd_mmx.c

libavcodec/x86/dsputil_mmx.c

libavcodec/x86/dsputil_mmx.h

libavcodec/x86/dsputil_mmx_avg_template.c

libavcodec/x86/dsputil_mmx_qns_template.c

libavcodec/x86/dsputil_mmx_rnd_template.c

libavcodec/x86/dsputil_yasm.asm

libavcodec/x86/dsputilenc_mmx.c

libavcodec/x86/fdct_mmx.c

libavcodec/x86/fft.c

libavcodec/x86/fft.h

libavcodec/x86/fft_3dn.c

libavcodec/x86/fft_3dn2.c

libavcodec/x86/fft_mmx.asm

libavcodec/x86/fft_sse.c

libavcodec/x86/h264_i386.h

libavcodec/x86/h264dsp_mmx.c

libavcodec/x86/idct_mmx.c

libavcodec/x86/idct_mmx_xvid.c

libavcodec/x86/idct_sse2_xvid.c

libavcodec/x86/idct_xvid.h

libavcodec/x86/lpc_mmx.c

libavcodec/x86/mathops.h

libavcodec/x86/mlpdsp.c

libavcodec/x86/motion_est_mmx.c

libavcodec/x86/mpegvideo_mmx.c

libavcodec/x86/mpegvideo_mmx_template.c

libavcodec/x86/simple_idct_mmx.c

libavcodec/x86/snowdsp_mmx.c

libavcodec/x86/vc1dsp_mmx.c

libavcodec/x86/x86inc.asm

libavcodec/x86/x86util.asm

libavcodec/xan.c

libavcodec/xiph.c

libavcodec/xiph.h

libavcodec/xl.c

libavcodec/xsubdec.c

libavcodec/xsubenc.c

libavcodec/xvmc.h

libavcodec/xvmc_internal.h

libavcodec/yop.c

libavcodec/zmbv.c

libavcodec/zmbvenc.c

libavdevice/Makefile

libavdevice/alldevices.c

libavdevice/alsa-audio-common.c

libavdevice/alsa-audio-dec.c

libavdevice/alsa-audio-enc.c

libavdevice/alsa-audio.h

libavdevice/avdevice.c

libavdevice/avdevice.h

libavdevice/bktr.c

libavdevice/dv1394.c

libavdevice/dv1394.h

libavdevice/jack_audio.c

libavdevice/libdc1394.c

libavdevice/oss_audio.c

libavdevice/v4l.c

libavdevice/v4l2.c

libavdevice/vfwcap.c

libavdevice/x11grab.c

libavfilter/Makefile

libavfilter/allfilters.c

libavfilter/avfilter.c

libavfilter/avfilter.h

libavfilter/avfiltergraph.c

libavfilter/avfiltergraph.h

libavfilter/defaults.c

libavfilter/formats.c

libavfilter/graphparser.c

libavfilter/vf_aspect.c

libavfilter/vf_crop.c

libavfilter/vf_format.c

libavfilter/vf_null.c

libavfilter/vf_scale.c

libavfilter/vf_slicify.c

libavfilter/vf_unsharp.c

libavfilter/vf_vflip.c

libavfilter/vsink_nullsink.c

libavfilter/vsrc_nullsrc.c

libavformat/4xm.c

libavformat/Makefile

libavformat/adts.h

libavformat/adtsenc.c

libavformat/aea.c

libavformat/aiff.h

libavformat/aiffdec.c

libavformat/aiffenc.c

libavformat/allformats.c

libavformat/amr.c

libavformat/anm.c

libavformat/apc.c

libavformat/ape.c

libavformat/apetag.c

libavformat/apetag.h

libavformat/asf.c

libavformat/asf.h

libavformat/asfcrypt.c

libavformat/asfcrypt.h

libavformat/asfdec.c

libavformat/asfenc.c

libavformat/assdec.c

libavformat/assenc.c

libavformat/au.c

libavformat/audiointerleave.c

libavformat/audiointerleave.h

libavformat/avc.c

libavformat/avc.h

libavformat/avformat.h

libavformat/avi.c

libavformat/avi.h

libavformat/avidec.c

libavformat/avienc.c

libavformat/avio.c

libavformat/avio.h

libavformat/aviobuf.c

libavformat/avisynth.c

libavformat/avlanguage.c

libavformat/avlanguage.h

libavformat/avs.c

libavformat/bethsoftvid.c

libavformat/bfi.c

libavformat/bink.c

libavformat/c93.c

libavformat/caf.c

libavformat/caf.h

libavformat/cafdec.c

libavformat/cdg.c

libavformat/concat.c

libavformat/crcenc.c

libavformat/cutils.c

libavformat/daud.c

libavformat/dsicin.c

libavformat/dv.c

libavformat/dv.h

libavformat/dvenc.c

libavformat/dxa.c

libavformat/eacdata.c

libavformat/electronicarts.c

libavformat/ffm.h

libavformat/ffmdec.c

libavformat/ffmenc.c

libavformat/file.c

libavformat/filmstripdec.c

libavformat/filmstripenc.c

libavformat/flacdec.c

libavformat/flacenc.c

libavformat/flacenc.h

libavformat/flacenc_header.c

libavformat/flic.c

libavformat/flv.h

libavformat/flvdec.c

libavformat/flvenc.c

libavformat/framecrcenc.c

libavformat/gif.c

libavformat/gopher.c

libavformat/gxf.c

libavformat/gxf.h

libavformat/gxfenc.c

libavformat/http.c

libavformat/httpauth.c

libavformat/httpauth.h

libavformat/id3v1.c

libavformat/id3v1.h

libavformat/id3v2.c

libavformat/id3v2.h

libavformat/idcin.c

libavformat/iff.c

libavformat/img2.c

libavformat/internal.h

libavformat/ipmovie.c

libavformat/isom.c

libavformat/isom.h

libavformat/iss.c

libavformat/iv8.c

libavformat/libavformat.v

libavformat/libnut.c

libavformat/librtmp.c

libavformat/lmlm4.c

libavformat/matroska.c

libavformat/matroska.h

libavformat/matroskadec.c

libavformat/matroskaenc.c

libavformat/metadata.c

libavformat/metadata.h

libavformat/metadata_compat.c

libavformat/mm.c

libavformat/mmf.c

libavformat/mov.c

libavformat/movenc.c

libavformat/movenc.h

libavformat/movenchint.c

libavformat/mpc.c

libavformat/mpc8.c

libavformat/mpeg.c

libavformat/mpeg.h

libavformat/mpegenc.c

libavformat/mpegts.c

libavformat/mpegts.h

libavformat/mpegtsenc.c

libavformat/mpjpeg.c

libavformat/msnwc_tcp.c

libavformat/mtv.c

libavformat/mvi.c

libavformat/mxf.c

libavformat/mxf.h

libavformat/mxfdec.c

libavformat/mxfenc.c

libavformat/ncdec.c

libavformat/network.h

libavformat/nsvdec.c

libavformat/nut.c

libavformat/nut.h

libavformat/nutdec.c

libavformat/nutenc.c

libavformat/nuv.c

libavformat/oggdec.c

libavformat/oggenc.c

libavformat/oggparsedirac.c

libavformat/oggparseflac.c

libavformat/oggparseogm.c

libavformat/oggparseskeleton.c

libavformat/oggparsespeex.c

libavformat/oggparsetheora.c

libavformat/oggparsevorbis.c

libavformat/oma.c

libavformat/options.c

libavformat/os_support.c

libavformat/os_support.h

libavformat/output-example.c

libavformat/psxstr.c

libavformat/pva.c

libavformat/qcp.c

libavformat/qtpalette.h

libavformat/r3d.c

libavformat/rdt.c

libavformat/rdt.h

libavformat/riff.c

libavformat/riff.h

libavformat/rl2.c

libavformat/rm.c

libavformat/rm.h

libavformat/rmdec.c

libavformat/rmenc.c

libavformat/rpl.c

libavformat/rtmp.h

libavformat/rtmppkt.c

libavformat/rtmppkt.h

libavformat/rtmpproto.c

libavformat/rtp.c

libavformat/rtp.h

libavformat/rtpdec.c

libavformat/rtpdec.h

libavformat/rtpdec_amr.c

libavformat/rtpdec_asf.c

libavformat/rtpdec_h263.c

libavformat/rtpdec_h264.c

libavformat/rtpdec_xiph.c

libavformat/rtpenc.c

libavformat/rtpenc.h

libavformat/rtpenc_aac.c

libavformat/rtpenc_amr.c

libavformat/rtpenc_h263.c

libavformat/rtpenc_h264.c

libavformat/rtpenc_mpv.c

libavformat/rtpproto.c

libavformat/rtsp.c

libavformat/rtsp.h

libavformat/rtspcodes.h

libavformat/rtspenc.c

libavformat/sdp.c

libavformat/seek.c

libavformat/seek.h

libavformat/segafilm.c

libavformat/sierravmd.c

libavformat/siff.c

libavformat/smacker.c

libavformat/sol.c

libavformat/sox.h

libavformat/soxdec.c

libavformat/soxenc.c

libavformat/spdif.c

libavformat/swf.h

libavformat/swfdec.c

libavformat/swfenc.c

libavformat/tcp.c

libavformat/thp.c

libavformat/tiertexseq.c

libavformat/timefilter.c

libavformat/timefilter.h

libavformat/tmv.c

libavformat/tta.c

libavformat/txd.c

libavformat/udp.c

libavformat/utils.c

libavformat/vc1test.c

libavformat/vc1testenc.c

libavformat/voc.c

libavformat/voc.h

libavformat/vocdec.c

libavformat/vocenc.c

libavformat/vorbiscomment.c

libavformat/vorbiscomment.h

libavformat/vqf.c

libavformat/wav.c

libavformat/wc3movie.c

libavformat/westwood.c

libavformat/wv.c

libavformat/xa.c

libavformat/yop.c

libavformat/yuv4mpeg.c

libavutil/Makefile

libavutil/adler32.h

libavutil/aes.c

libavutil/aes.h

libavutil/arm/bswap.h

libavutil/arm/intmath.h

libavutil/arm/intreadwrite.h

libavutil/arm/timer.h

libavutil/attributes.h

libavutil/avr32/bswap.h

libavutil/avr32/intreadwrite.h

libavutil/avstring.c

libavutil/avstring.h

libavutil/avutil.h

libavutil/base64.c

libavutil/base64.h

libavutil/bfin/bswap.h

libavutil/bfin/timer.h

libavutil/bswap.h

libavutil/common.h

libavutil/crc.c

libavutil/crc.h

libavutil/crc_data.h

libavutil/des.c

libavutil/des.h

libavutil/error.c

libavutil/error.h

libavutil/fifo.c

libavutil/fifo.h

libavutil/integer.c

libavutil/integer.h

libavutil/internal.h

libavutil/intfloat_readwrite.c

libavutil/intfloat_readwrite.h

libavutil/intmath.h

libavutil/intreadwrite.h

libavutil/lfg.c

libavutil/lfg.h

libavutil/libm.h

libavutil/lls.c

libavutil/lls.h

libavutil/log.c

libavutil/log.h

libavutil/lzo.c

libavutil/lzo.h

libavutil/mathematics.c

libavutil/mathematics.h

libavutil/md5.c

libavutil/md5.h

libavutil/mem.c

libavutil/mem.h

libavutil/mips/intreadwrite.h

libavutil/pca.c

libavutil/pca.h

libavutil/pixdesc.c

libavutil/pixdesc.h

libavutil/pixfmt.h

libavutil/ppc/intreadwrite.h

libavutil/ppc/timer.h

libavutil/random_seed.c

libavutil/random_seed.h

libavutil/rational.c

libavutil/rational.h

libavutil/rc4.c

libavutil/rc4.h

libavutil/sh4/bswap.h

libavutil/sha.c

libavutil/sha.h

libavutil/sha1.h

libavutil/softfloat.c

libavutil/softfloat.h

libavutil/timer.h

libavutil/tomi/intreadwrite.h

libavutil/tree.c

libavutil/tree.h

libavutil/utils.c

libavutil/x86/bswap.h

libavutil/x86/intmath.h

libavutil/x86/intreadwrite.h

libavutil/x86/timer.h

libavutil/x86_cpu.h

libpostproc/postprocess.c

libpostproc/postprocess.h

libpostproc/postprocess_altivec_template.c

libpostproc/postprocess_internal.h

libpostproc/postprocess_template.c

libswscale/Makefile

libswscale/bfin/internal_bfin.S

libswscale/bfin/swscale_bfin.c

libswscale/bfin/yuv2rgb_bfin.c

libswscale/colorspace-test.c

libswscale/mlib/yuv2rgb_mlib.c

libswscale/options.c

libswscale/ppc/swscale_altivec_template.c

libswscale/ppc/yuv2rgb_altivec.c

libswscale/rgb2rgb.c

libswscale/rgb2rgb.h

libswscale/rgb2rgb_template.c

libswscale/sparc/yuv2rgb_vis.c

libswscale/swscale-test.c

libswscale/swscale.c

libswscale/swscale.h

libswscale/swscale_internal.h

libswscale/swscale_template.c

libswscale/utils.c

libswscale/x86/yuv2rgb_mmx.c

libswscale/x86/yuv2rgb_template.c

libswscale/yuv2rgb.c

subdir.mak

tests/audiogen.c

tests/codec-regression.sh

tests/copycooker.sh

tests/fate-run.sh

tests/fate.mak

tests/lavf-regression.sh

tests/lavfi-regression.sh

tests/md5.sh

tests/ref/acodec/adpcm_ima_qt

tests/ref/acodec/adpcm_ima_wav

tests/ref/acodec/adpcm_ms

tests/ref/acodec/adpcm_swf

tests/ref/acodec/adpcm_yam

tests/ref/acodec/alac

tests/ref/acodec/flac

tests/ref/acodec/g726

tests/ref/acodec/mp2

tests/ref/acodec/pcm

tests/ref/acodec/wmav1

tests/ref/acodec/wmav2

tests/ref/fate/8bps

tests/ref/fate/bethsoft-vid

tests/ref/fate/bfi

tests/ref/fate/bink-demux-video

tests/ref/fate/corepng

tests/ref/fate/creatureshock-avs

tests/ref/fate/feeble-dxa

tests/ref/fate/film-cvid-pcm-stereo-8bit

tests/ref/fate/idroq-video-dpcm

tests/ref/fate/interplay-mve-16bit

tests/ref/fate/interplay-mve-8bit

tests/ref/fate/lmlm4-demux

tests/ref/fate/mtv

tests/ref/fate/nuv

tests/ref/fate/psx-str

tests/ref/fate/sierra-vmd

tests/ref/fate/siff

tests/ref/fate/smc

tests/ref/fate/tiertex-seq

tests/ref/fate/tscc-15bit

tests/ref/fate/vc1

tests/ref/fate/vqa-cc

tests/ref/lavf/avi

tests/ref/lavf/gif

tests/ref/lavf/gxf

tests/ref/lavf/mkv

tests/ref/lavf/mpg

tests/ref/lavf/mxf

tests/ref/lavf/nut

tests/ref/lavf/rm

tests/ref/lavf/ts

tests/ref/lavfi/crop

tests/ref/lavfi/crop_scale

tests/ref/lavfi/crop_scale_vflip

tests/ref/lavfi/crop_vflip

tests/ref/lavfi/null

tests/ref/lavfi/scale200

tests/ref/lavfi/scale500

tests/ref/lavfi/vflip

tests/ref/lavfi/vflip_crop

tests/ref/lavfi/vflip_vflip

tests/ref/vsynth1/asv1

tests/ref/vsynth1/asv2

tests/ref/vsynth1/dnxhd_1080i

tests/ref/vsynth1/dnxhd_720p

tests/ref/vsynth1/dnxhd_720p_rd

tests/ref/vsynth1/dv

tests/ref/vsynth1/dv50

tests/ref/vsynth1/error

tests/ref/vsynth1/ffv1

tests/ref/vsynth1/flashsv

tests/ref/vsynth1/flv

tests/ref/vsynth1/h261

tests/ref/vsynth1/h263

tests/ref/vsynth1/h263p

tests/ref/vsynth1/huffyuv

tests/ref/vsynth1/jpegls

tests/ref/vsynth1/ljpeg

tests/ref/vsynth1/mjpeg

tests/ref/vsynth1/mpeg

tests/ref/vsynth1/mpeg1b

tests/ref/vsynth1/mpeg2

tests/ref/vsynth1/mpeg2thread

tests/ref/vsynth1/mpeg4

tests/ref/vsynth1/mpeg4adv

tests/ref/vsynth1/mpeg4nr

tests/ref/vsynth1/mpeg4thread

tests/ref/vsynth1/msmpeg4

tests/ref/vsynth1/msmpeg4v2

tests/ref/vsynth1/rc

tests/ref/vsynth1/roq

tests/ref/vsynth1/rv10

tests/ref/vsynth1/rv20

tests/ref/vsynth1/snow

tests/ref/vsynth1/snowll

tests/ref/vsynth1/svq1

tests/ref/vsynth1/wmv1

tests/ref/vsynth1/wmv2

tests/ref/vsynth2/asv1

tests/ref/vsynth2/asv2

tests/ref/vsynth2/dnxhd_1080i

tests/ref/vsynth2/dnxhd_720p

tests/ref/vsynth2/dnxhd_720p_rd

tests/ref/vsynth2/dv

tests/ref/vsynth2/dv50

tests/ref/vsynth2/error

tests/ref/vsynth2/ffv1

tests/ref/vsynth2/flashsv

tests/ref/vsynth2/flv

tests/ref/vsynth2/h261

tests/ref/vsynth2/h263

tests/ref/vsynth2/h263p

tests/ref/vsynth2/huffyuv

tests/ref/vsynth2/jpegls

tests/ref/vsynth2/ljpeg

tests/ref/vsynth2/mjpeg

tests/ref/vsynth2/mpeg

tests/ref/vsynth2/mpeg1b

tests/ref/vsynth2/mpeg2

tests/ref/vsynth2/mpeg2thread

tests/ref/vsynth2/mpeg4

tests/ref/vsynth2/mpeg4adv

tests/ref/vsynth2/mpeg4nr

tests/ref/vsynth2/mpeg4thread

tests/ref/vsynth2/msmpeg4

tests/ref/vsynth2/msmpeg4v2

tests/ref/vsynth2/rc

tests/ref/vsynth2/roq

tests/ref/vsynth2/rv10

tests/ref/vsynth2/rv20

tests/ref/vsynth2/snow

tests/ref/vsynth2/snowll

tests/ref/vsynth2/svq1

tests/ref/vsynth2/wmv1

tests/ref/vsynth2/wmv2

tests/regression-funcs.sh

tests/rotozoom.c

tests/seek_test.c

tests/tiny_psnr.c

tests/videogen.c

tools/graph2dot.c

tools/patcheck

tools/pktdumper.c

tools/probetest.c

tools/qt-faststart.c

tools/trasher.c

version.sh

Show diffs side-by-side

added added

removed removed

libswscale/x86/swscale_template.c

* This file is part of Libav.

* Libav is free software; you can redistribute it and/or

* modify it under the terms of the GNU Lesser General Public

* License as published by the Free Software Foundation; either

* version 2.1 of the License, or (at your option) any later version.

* Libav is distributed in the hope that it will be useful,

* but WITHOUT ANY WARRANTY; without even the implied warranty of

* MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE. See the GNU

* Lesser General Public License for more details.

* You should have received a copy of the GNU Lesser General Public

* License along with Libav; if not, write to the Free Software

* Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA

#include "swscale_template.h"

#undef REAL_MOVNTQ

#undef MOVNTQ

#undef PAVGB

#undef PREFETCH

#if COMPILE_TEMPLATE_AMD3DNOW

#define PREFETCH "prefetch"

#elif COMPILE_TEMPLATE_MMX2

#define PREFETCH "prefetchnta"

#else

#define PREFETCH " # nop"

#endif

#if COMPILE_TEMPLATE_MMX2

#define PAVGB(a,b) "pavgb " #a ", " #b " \n\t"

#elif COMPILE_TEMPLATE_AMD3DNOW

#define PAVGB(a,b) "pavgusb " #a ", " #b " \n\t"

#endif

#if COMPILE_TEMPLATE_MMX2

#define REAL_MOVNTQ(a,b) "movntq " #a ", " #b " \n\t"

#else

#define REAL_MOVNTQ(a,b) "movq " #a ", " #b " \n\t"

#endif

#define MOVNTQ(a,b) REAL_MOVNTQ(a,b)

#define YSCALEYUV2YV12X(x, offset, dest, width) \

__asm__ volatile(\

"xor %%"REG_a", %%"REG_a" \n\t"\

"movq "VROUNDER_OFFSET"(%0), %%mm3 \n\t"\

"movq %%mm3, %%mm4 \n\t"\

"lea " offset "(%0), %%"REG_d" \n\t"\

"mov (%%"REG_d"), %%"REG_S" \n\t"\

".p2align 4 \n\t" /* FIXME Unroll? */\

"1: \n\t"\

"movq 8(%%"REG_d"), %%mm0 \n\t" /* filterCoeff */\

"movq " x "(%%"REG_S", %%"REG_a", 2), %%mm2 \n\t" /* srcData */\

"movq 8+" x "(%%"REG_S", %%"REG_a", 2), %%mm5 \n\t" /* srcData */\

"add $16, %%"REG_d" \n\t"\

"mov (%%"REG_d"), %%"REG_S" \n\t"\

"test %%"REG_S", %%"REG_S" \n\t"\

"pmulhw %%mm0, %%mm2 \n\t"\

"pmulhw %%mm0, %%mm5 \n\t"\

"paddw %%mm2, %%mm3 \n\t"\

"paddw %%mm5, %%mm4 \n\t"\

" jnz 1b \n\t"\

"psraw $3, %%mm3 \n\t"\

"psraw $3, %%mm4 \n\t"\

"packuswb %%mm4, %%mm3 \n\t"\

MOVNTQ(%%mm3, (%1, %%REGa))\

"add $8, %%"REG_a" \n\t"\

"cmp %2, %%"REG_a" \n\t"\

"movq "VROUNDER_OFFSET"(%0), %%mm3 \n\t"\

"movq %%mm3, %%mm4 \n\t"\

"lea " offset "(%0), %%"REG_d" \n\t"\

"mov (%%"REG_d"), %%"REG_S" \n\t"\

"jb 1b \n\t"\

:: "r" (&c->redDither),\

"r" (dest), "g" ((x86_reg)width)\

: "%"REG_a, "%"REG_d, "%"REG_S\

);

#define YSCALEYUV2YV12X_ACCURATE(x, offset, dest, width) \

__asm__ volatile(\

"lea " offset "(%0), %%"REG_d" \n\t"\

"xor %%"REG_a", %%"REG_a" \n\t"\

"pxor %%mm4, %%mm4 \n\t"\

"pxor %%mm5, %%mm5 \n\t"\

"pxor %%mm6, %%mm6 \n\t"\

"pxor %%mm7, %%mm7 \n\t"\

"mov (%%"REG_d"), %%"REG_S" \n\t"\

".p2align 4 \n\t"\

"1: \n\t"\

"movq " x "(%%"REG_S", %%"REG_a", 2), %%mm0 \n\t" /* srcData */\

"movq 8+" x "(%%"REG_S", %%"REG_a", 2), %%mm2 \n\t" /* srcData */\

"mov "STR(APCK_PTR2)"(%%"REG_d"), %%"REG_S" \n\t"\

"movq " x "(%%"REG_S", %%"REG_a", 2), %%mm1 \n\t" /* srcData */\

100

"movq %%mm0, %%mm3 \n\t"\

101

"punpcklwd %%mm1, %%mm0 \n\t"\

102

"punpckhwd %%mm1, %%mm3 \n\t"\

103

"movq "STR(APCK_COEF)"(%%"REG_d"), %%mm1 \n\t" /* filterCoeff */\

104

"pmaddwd %%mm1, %%mm0 \n\t"\

105

"pmaddwd %%mm1, %%mm3 \n\t"\

106

"paddd %%mm0, %%mm4 \n\t"\

107

"paddd %%mm3, %%mm5 \n\t"\

108

"movq 8+" x "(%%"REG_S", %%"REG_a", 2), %%mm3 \n\t" /* srcData */\

109

"mov "STR(APCK_SIZE)"(%%"REG_d"), %%"REG_S" \n\t"\

110

"add $"STR(APCK_SIZE)", %%"REG_d" \n\t"\

111

"test %%"REG_S", %%"REG_S" \n\t"\

112

"movq %%mm2, %%mm0 \n\t"\

113

"punpcklwd %%mm3, %%mm2 \n\t"\

114

"punpckhwd %%mm3, %%mm0 \n\t"\

115

"pmaddwd %%mm1, %%mm2 \n\t"\

116

"pmaddwd %%mm1, %%mm0 \n\t"\

117

"paddd %%mm2, %%mm6 \n\t"\

118

"paddd %%mm0, %%mm7 \n\t"\

119

" jnz 1b \n\t"\

120

"psrad $16, %%mm4 \n\t"\

121

"psrad $16, %%mm5 \n\t"\

122

"psrad $16, %%mm6 \n\t"\

123

"psrad $16, %%mm7 \n\t"\

124

"movq "VROUNDER_OFFSET"(%0), %%mm0 \n\t"\

125

"packssdw %%mm5, %%mm4 \n\t"\

126

"packssdw %%mm7, %%mm6 \n\t"\

127

"paddw %%mm0, %%mm4 \n\t"\

128

"paddw %%mm0, %%mm6 \n\t"\

129

"psraw $3, %%mm4 \n\t"\

130

"psraw $3, %%mm6 \n\t"\

131

"packuswb %%mm6, %%mm4 \n\t"\

132

MOVNTQ(%%mm4, (%1, %%REGa))\

133

"add $8, %%"REG_a" \n\t"\

134

"cmp %2, %%"REG_a" \n\t"\

135

"lea " offset "(%0), %%"REG_d" \n\t"\

136

"pxor %%mm4, %%mm4 \n\t"\

137

"pxor %%mm5, %%mm5 \n\t"\

138

"pxor %%mm6, %%mm6 \n\t"\

139

"pxor %%mm7, %%mm7 \n\t"\

140

"mov (%%"REG_d"), %%"REG_S" \n\t"\

141

"jb 1b \n\t"\

142

:: "r" (&c->redDither),\

143

"r" (dest), "g" ((x86_reg)width)\

144

: "%"REG_a, "%"REG_d, "%"REG_S\

145

);

146

147

#define YSCALEYUV2YV121 \

148

"mov %2, %%"REG_a" \n\t"\

149

".p2align 4 \n\t" /* FIXME Unroll? */\

150

"1: \n\t"\

151

"movq (%0, %%"REG_a", 2), %%mm0 \n\t"\

152

"movq 8(%0, %%"REG_a", 2), %%mm1 \n\t"\

153

"psraw $7, %%mm0 \n\t"\

154

"psraw $7, %%mm1 \n\t"\

155

"packuswb %%mm1, %%mm0 \n\t"\

156

MOVNTQ(%%mm0, (%1, %%REGa))\

157

"add $8, %%"REG_a" \n\t"\

158

"jnc 1b \n\t"

159

160

#define YSCALEYUV2YV121_ACCURATE \

161

"mov %2, %%"REG_a" \n\t"\

162

"pcmpeqw %%mm7, %%mm7 \n\t"\

163

"psrlw $15, %%mm7 \n\t"\

164

"psllw $6, %%mm7 \n\t"\

165

".p2align 4 \n\t" /* FIXME Unroll? */\

166

"1: \n\t"\

167

"movq (%0, %%"REG_a", 2), %%mm0 \n\t"\

168

"movq 8(%0, %%"REG_a", 2), %%mm1 \n\t"\

169

"paddsw %%mm7, %%mm0 \n\t"\

170

"paddsw %%mm7, %%mm1 \n\t"\

171

"psraw $7, %%mm0 \n\t"\

172

"psraw $7, %%mm1 \n\t"\

173

"packuswb %%mm1, %%mm0 \n\t"\

174

MOVNTQ(%%mm0, (%1, %%REGa))\

175

"add $8, %%"REG_a" \n\t"\

176

"jnc 1b \n\t"

177

178

179

:: "m" (-lumFilterSize), "m" (-chrFilterSize),

180

"m" (lumMmxFilter+lumFilterSize*4), "m" (chrMmxFilter+chrFilterSize*4),

181

"r" (dest), "m" (dstW_reg),

182

"m" (lumSrc+lumFilterSize), "m" (chrSrc+chrFilterSize)

183

: "%eax", "%ebx", "%ecx", "%edx", "%esi"

184

185

#define YSCALEYUV2PACKEDX_UV \

186

__asm__ volatile(\

187

"xor %%"REG_a", %%"REG_a" \n\t"\

188

".p2align 4 \n\t"\

189

"nop \n\t"\

190

"1: \n\t"\

191

"lea "CHR_MMX_FILTER_OFFSET"(%0), %%"REG_d" \n\t"\

192

"mov (%%"REG_d"), %%"REG_S" \n\t"\

193

"movq "VROUNDER_OFFSET"(%0), %%mm3 \n\t"\

194

"movq %%mm3, %%mm4 \n\t"\

195

".p2align 4 \n\t"\

196

"2: \n\t"\

197

"movq 8(%%"REG_d"), %%mm0 \n\t" /* filterCoeff */\

198

"movq (%%"REG_S", %%"REG_a"), %%mm2 \n\t" /* UsrcData */\

199

"movq "AV_STRINGIFY(VOF)"(%%"REG_S", %%"REG_a"), %%mm5 \n\t" /* VsrcData */\

200

"add $16, %%"REG_d" \n\t"\

201

"mov (%%"REG_d"), %%"REG_S" \n\t"\

202

"pmulhw %%mm0, %%mm2 \n\t"\

203

"pmulhw %%mm0, %%mm5 \n\t"\

204

"paddw %%mm2, %%mm3 \n\t"\

205

"paddw %%mm5, %%mm4 \n\t"\

206

"test %%"REG_S", %%"REG_S" \n\t"\

207

" jnz 2b \n\t"\

208

209

#define YSCALEYUV2PACKEDX_YA(offset,coeff,src1,src2,dst1,dst2) \

210

"lea "offset"(%0), %%"REG_d" \n\t"\

211

"mov (%%"REG_d"), %%"REG_S" \n\t"\

212

"movq "VROUNDER_OFFSET"(%0), "#dst1" \n\t"\

213

"movq "#dst1", "#dst2" \n\t"\

214

".p2align 4 \n\t"\

215

"2: \n\t"\

216

"movq 8(%%"REG_d"), "#coeff" \n\t" /* filterCoeff */\

217

"movq (%%"REG_S", %%"REG_a", 2), "#src1" \n\t" /* Y1srcData */\

218

"movq 8(%%"REG_S", %%"REG_a", 2), "#src2" \n\t" /* Y2srcData */\

219

"add $16, %%"REG_d" \n\t"\

220

"mov (%%"REG_d"), %%"REG_S" \n\t"\

221

"pmulhw "#coeff", "#src1" \n\t"\

222

"pmulhw "#coeff", "#src2" \n\t"\

223

"paddw "#src1", "#dst1" \n\t"\

224

"paddw "#src2", "#dst2" \n\t"\

225

"test %%"REG_S", %%"REG_S" \n\t"\

226

" jnz 2b \n\t"\

227

228

#define YSCALEYUV2PACKEDX \

229

YSCALEYUV2PACKEDX_UV \

230

YSCALEYUV2PACKEDX_YA(LUM_MMX_FILTER_OFFSET,%%mm0,%%mm2,%%mm5,%%mm1,%%mm7) \

231

232

#define YSCALEYUV2PACKEDX_END \

233

:: "r" (&c->redDither), \

234

"m" (dummy), "m" (dummy), "m" (dummy),\

235

"r" (dest), "m" (dstW_reg) \

236

: "%"REG_a, "%"REG_d, "%"REG_S \

237

);

238

239

#define YSCALEYUV2PACKEDX_ACCURATE_UV \

240

__asm__ volatile(\

241

"xor %%"REG_a", %%"REG_a" \n\t"\

242

".p2align 4 \n\t"\

243

"nop \n\t"\

244

"1: \n\t"\

245

"lea "CHR_MMX_FILTER_OFFSET"(%0), %%"REG_d" \n\t"\

246

"mov (%%"REG_d"), %%"REG_S" \n\t"\

247

"pxor %%mm4, %%mm4 \n\t"\

248

"pxor %%mm5, %%mm5 \n\t"\

249

"pxor %%mm6, %%mm6 \n\t"\

250

"pxor %%mm7, %%mm7 \n\t"\

251

".p2align 4 \n\t"\

252

"2: \n\t"\

253

"movq (%%"REG_S", %%"REG_a"), %%mm0 \n\t" /* UsrcData */\

254

"movq "AV_STRINGIFY(VOF)"(%%"REG_S", %%"REG_a"), %%mm2 \n\t" /* VsrcData */\

255

"mov "STR(APCK_PTR2)"(%%"REG_d"), %%"REG_S" \n\t"\

256

"movq (%%"REG_S", %%"REG_a"), %%mm1 \n\t" /* UsrcData */\

257

"movq %%mm0, %%mm3 \n\t"\

258

"punpcklwd %%mm1, %%mm0 \n\t"\

259

"punpckhwd %%mm1, %%mm3 \n\t"\

260

"movq "STR(APCK_COEF)"(%%"REG_d"),%%mm1 \n\t" /* filterCoeff */\

261

"pmaddwd %%mm1, %%mm0 \n\t"\

262

"pmaddwd %%mm1, %%mm3 \n\t"\

263

"paddd %%mm0, %%mm4 \n\t"\

264

"paddd %%mm3, %%mm5 \n\t"\

265

"movq "AV_STRINGIFY(VOF)"(%%"REG_S", %%"REG_a"), %%mm3 \n\t" /* VsrcData */\

266

"mov "STR(APCK_SIZE)"(%%"REG_d"), %%"REG_S" \n\t"\

267

"add $"STR(APCK_SIZE)", %%"REG_d" \n\t"\

268

"test %%"REG_S", %%"REG_S" \n\t"\

269

"movq %%mm2, %%mm0 \n\t"\

270

"punpcklwd %%mm3, %%mm2 \n\t"\

271

"punpckhwd %%mm3, %%mm0 \n\t"\

272

"pmaddwd %%mm1, %%mm2 \n\t"\

273

"pmaddwd %%mm1, %%mm0 \n\t"\

274

"paddd %%mm2, %%mm6 \n\t"\

275

"paddd %%mm0, %%mm7 \n\t"\

276

" jnz 2b \n\t"\

277

"psrad $16, %%mm4 \n\t"\

278

"psrad $16, %%mm5 \n\t"\

279

"psrad $16, %%mm6 \n\t"\

280

"psrad $16, %%mm7 \n\t"\

281

"movq "VROUNDER_OFFSET"(%0), %%mm0 \n\t"\

282

"packssdw %%mm5, %%mm4 \n\t"\

283

"packssdw %%mm7, %%mm6 \n\t"\

284

"paddw %%mm0, %%mm4 \n\t"\

285

"paddw %%mm0, %%mm6 \n\t"\

286

"movq %%mm4, "U_TEMP"(%0) \n\t"\

287

"movq %%mm6, "V_TEMP"(%0) \n\t"\

288

289

#define YSCALEYUV2PACKEDX_ACCURATE_YA(offset) \

290

"lea "offset"(%0), %%"REG_d" \n\t"\

291

"mov (%%"REG_d"), %%"REG_S" \n\t"\

292

"pxor %%mm1, %%mm1 \n\t"\

293

"pxor %%mm5, %%mm5 \n\t"\

294

"pxor %%mm7, %%mm7 \n\t"\

295

"pxor %%mm6, %%mm6 \n\t"\

296

".p2align 4 \n\t"\

297

"2: \n\t"\

298

"movq (%%"REG_S", %%"REG_a", 2), %%mm0 \n\t" /* Y1srcData */\

299

"movq 8(%%"REG_S", %%"REG_a", 2), %%mm2 \n\t" /* Y2srcData */\

300

"mov "STR(APCK_PTR2)"(%%"REG_d"), %%"REG_S" \n\t"\

301

"movq (%%"REG_S", %%"REG_a", 2), %%mm4 \n\t" /* Y1srcData */\

302

"movq %%mm0, %%mm3 \n\t"\

303

"punpcklwd %%mm4, %%mm0 \n\t"\

304

"punpckhwd %%mm4, %%mm3 \n\t"\

305

"movq "STR(APCK_COEF)"(%%"REG_d"), %%mm4 \n\t" /* filterCoeff */\

306

"pmaddwd %%mm4, %%mm0 \n\t"\

307

"pmaddwd %%mm4, %%mm3 \n\t"\

308

"paddd %%mm0, %%mm1 \n\t"\

309

"paddd %%mm3, %%mm5 \n\t"\

310

"movq 8(%%"REG_S", %%"REG_a", 2), %%mm3 \n\t" /* Y2srcData */\

311

"mov "STR(APCK_SIZE)"(%%"REG_d"), %%"REG_S" \n\t"\

312

"add $"STR(APCK_SIZE)", %%"REG_d" \n\t"\

313

"test %%"REG_S", %%"REG_S" \n\t"\

314

"movq %%mm2, %%mm0 \n\t"\

315

"punpcklwd %%mm3, %%mm2 \n\t"\

316

"punpckhwd %%mm3, %%mm0 \n\t"\

317

"pmaddwd %%mm4, %%mm2 \n\t"\

318

"pmaddwd %%mm4, %%mm0 \n\t"\

319

"paddd %%mm2, %%mm7 \n\t"\

320

"paddd %%mm0, %%mm6 \n\t"\

321

" jnz 2b \n\t"\

322

"psrad $16, %%mm1 \n\t"\

323

"psrad $16, %%mm5 \n\t"\

324

"psrad $16, %%mm7 \n\t"\

325

"psrad $16, %%mm6 \n\t"\

326

"movq "VROUNDER_OFFSET"(%0), %%mm0 \n\t"\

327

"packssdw %%mm5, %%mm1 \n\t"\

328

"packssdw %%mm6, %%mm7 \n\t"\

329

"paddw %%mm0, %%mm1 \n\t"\

330

"paddw %%mm0, %%mm7 \n\t"\

331

"movq "U_TEMP"(%0), %%mm3 \n\t"\

332

"movq "V_TEMP"(%0), %%mm4 \n\t"\

333

334

#define YSCALEYUV2PACKEDX_ACCURATE \

335

YSCALEYUV2PACKEDX_ACCURATE_UV \

336

YSCALEYUV2PACKEDX_ACCURATE_YA(LUM_MMX_FILTER_OFFSET)

337

338

#define YSCALEYUV2RGBX \

339

"psubw "U_OFFSET"(%0), %%mm3 \n\t" /* (U-128)8*/\

340

"psubw "V_OFFSET"(%0), %%mm4 \n\t" /* (V-128)8*/\

341

"movq %%mm3, %%mm2 \n\t" /* (U-128)8*/\

342

"movq %%mm4, %%mm5 \n\t" /* (V-128)8*/\

343

"pmulhw "UG_COEFF"(%0), %%mm3 \n\t"\

344

"pmulhw "VG_COEFF"(%0), %%mm4 \n\t"\

345

/* mm2=(U-128)8, mm3=ug, mm4=vg mm5=(V-128)8 */\

346

"pmulhw "UB_COEFF"(%0), %%mm2 \n\t"\

347

"pmulhw "VR_COEFF"(%0), %%mm5 \n\t"\

348

"psubw "Y_OFFSET"(%0), %%mm1 \n\t" /* 8(Y-16)*/\

349

"psubw "Y_OFFSET"(%0), %%mm7 \n\t" /* 8(Y-16)*/\

350

"pmulhw "Y_COEFF"(%0), %%mm1 \n\t"\

351

"pmulhw "Y_COEFF"(%0), %%mm7 \n\t"\

352

/* mm1= Y1, mm2=ub, mm3=ug, mm4=vg mm5=vr, mm7=Y2 */\

353

"paddw %%mm3, %%mm4 \n\t"\

354

"movq %%mm2, %%mm0 \n\t"\

355

"movq %%mm5, %%mm6 \n\t"\

356

"movq %%mm4, %%mm3 \n\t"\

357

"punpcklwd %%mm2, %%mm2 \n\t"\

358

"punpcklwd %%mm5, %%mm5 \n\t"\

359

"punpcklwd %%mm4, %%mm4 \n\t"\

360

"paddw %%mm1, %%mm2 \n\t"\

361

"paddw %%mm1, %%mm5 \n\t"\

362

"paddw %%mm1, %%mm4 \n\t"\

363

"punpckhwd %%mm0, %%mm0 \n\t"\

364

"punpckhwd %%mm6, %%mm6 \n\t"\

365

"punpckhwd %%mm3, %%mm3 \n\t"\

366

"paddw %%mm7, %%mm0 \n\t"\

367

"paddw %%mm7, %%mm6 \n\t"\

368

"paddw %%mm7, %%mm3 \n\t"\

369

/* mm0=B1, mm2=B2, mm3=G2, mm4=G1, mm5=R1, mm6=R2 */\

370

"packuswb %%mm0, %%mm2 \n\t"\

371

"packuswb %%mm6, %%mm5 \n\t"\

372

"packuswb %%mm3, %%mm4 \n\t"\

373

374

#define REAL_YSCALEYUV2PACKED(index, c) \

375

"movq "CHR_MMX_FILTER_OFFSET"+8("#c"), %%mm0 \n\t"\

376

"movq "LUM_MMX_FILTER_OFFSET"+8("#c"), %%mm1 \n\t"\

377

"psraw $3, %%mm0 \n\t"\

378

"psraw $3, %%mm1 \n\t"\

379

"movq %%mm0, "CHR_MMX_FILTER_OFFSET"+8("#c") \n\t"\

380

"movq %%mm1, "LUM_MMX_FILTER_OFFSET"+8("#c") \n\t"\

381

"xor "#index", "#index" \n\t"\

382

".p2align 4 \n\t"\

383

"1: \n\t"\

384

"movq (%2, "#index"), %%mm2 \n\t" /* uvbuf0[eax]*/\

385

"movq (%3, "#index"), %%mm3 \n\t" /* uvbuf1[eax]*/\

386

"movq "AV_STRINGIFY(VOF)"(%2, "#index"), %%mm5 \n\t" /* uvbuf0[eax+2048]*/\

387

"movq "AV_STRINGIFY(VOF)"(%3, "#index"), %%mm4 \n\t" /* uvbuf1[eax+2048]*/\

388

"psubw %%mm3, %%mm2 \n\t" /* uvbuf0[eax] - uvbuf1[eax]*/\

389

"psubw %%mm4, %%mm5 \n\t" /* uvbuf0[eax+2048] - uvbuf1[eax+2048]*/\

390

"movq "CHR_MMX_FILTER_OFFSET"+8("#c"), %%mm0 \n\t"\

391

"pmulhw %%mm0, %%mm2 \n\t" /* (uvbuf0[eax] - uvbuf1[eax])uvalpha1>>16*/\

392

"pmulhw %%mm0, %%mm5 \n\t" /* (uvbuf0[eax+2048] - uvbuf1[eax+2048])uvalpha1>>16*/\

393

"psraw $7, %%mm3 \n\t" /* uvbuf0[eax] - uvbuf1[eax] >>4*/\

394

"psraw $7, %%mm4 \n\t" /* uvbuf0[eax+2048] - uvbuf1[eax+2048] >>4*/\

395

"paddw %%mm2, %%mm3 \n\t" /* uvbuf0[eax]uvalpha1 - uvbuf1[eax](1-uvalpha1)*/\

396

"paddw %%mm5, %%mm4 \n\t" /* uvbuf0[eax+2048]uvalpha1 - uvbuf1[eax+2048](1-uvalpha1)*/\

397

"movq (%0, "#index", 2), %%mm0 \n\t" /*buf0[eax]*/\

398

"movq (%1, "#index", 2), %%mm1 \n\t" /*buf1[eax]*/\

399

"movq 8(%0, "#index", 2), %%mm6 \n\t" /*buf0[eax]*/\

400

"movq 8(%1, "#index", 2), %%mm7 \n\t" /*buf1[eax]*/\

401

"psubw %%mm1, %%mm0 \n\t" /* buf0[eax] - buf1[eax]*/\

402

"psubw %%mm7, %%mm6 \n\t" /* buf0[eax] - buf1[eax]*/\

403

"pmulhw "LUM_MMX_FILTER_OFFSET"+8("#c"), %%mm0 \n\t" /* (buf0[eax] - buf1[eax])yalpha1>>16*/\

404

"pmulhw "LUM_MMX_FILTER_OFFSET"+8("#c"), %%mm6 \n\t" /* (buf0[eax] - buf1[eax])yalpha1>>16*/\

405

"psraw $7, %%mm1 \n\t" /* buf0[eax] - buf1[eax] >>4*/\

406

"psraw $7, %%mm7 \n\t" /* buf0[eax] - buf1[eax] >>4*/\

407

"paddw %%mm0, %%mm1 \n\t" /* buf0[eax]yalpha1 + buf1[eax](1-yalpha1) >>16*/\

408

"paddw %%mm6, %%mm7 \n\t" /* buf0[eax]yalpha1 + buf1[eax](1-yalpha1) >>16*/\

409

410

#define YSCALEYUV2PACKED(index, c) REAL_YSCALEYUV2PACKED(index, c)

411

412

#define REAL_YSCALEYUV2RGB_UV(index, c) \

413

"xor "#index", "#index" \n\t"\

414

".p2align 4 \n\t"\

415

"1: \n\t"\

416

"movq (%2, "#index"), %%mm2 \n\t" /* uvbuf0[eax]*/\

417

"movq (%3, "#index"), %%mm3 \n\t" /* uvbuf1[eax]*/\

418

"movq "AV_STRINGIFY(VOF)"(%2, "#index"), %%mm5 \n\t" /* uvbuf0[eax+2048]*/\

419

"movq "AV_STRINGIFY(VOF)"(%3, "#index"), %%mm4 \n\t" /* uvbuf1[eax+2048]*/\

420

"psubw %%mm3, %%mm2 \n\t" /* uvbuf0[eax] - uvbuf1[eax]*/\

421

"psubw %%mm4, %%mm5 \n\t" /* uvbuf0[eax+2048] - uvbuf1[eax+2048]*/\

422

"movq "CHR_MMX_FILTER_OFFSET"+8("#c"), %%mm0 \n\t"\

423

"pmulhw %%mm0, %%mm2 \n\t" /* (uvbuf0[eax] - uvbuf1[eax])uvalpha1>>16*/\

424

"pmulhw %%mm0, %%mm5 \n\t" /* (uvbuf0[eax+2048] - uvbuf1[eax+2048])uvalpha1>>16*/\

425

"psraw $4, %%mm3 \n\t" /* uvbuf0[eax] - uvbuf1[eax] >>4*/\

426

"psraw $4, %%mm4 \n\t" /* uvbuf0[eax+2048] - uvbuf1[eax+2048] >>4*/\

427

"paddw %%mm2, %%mm3 \n\t" /* uvbuf0[eax]uvalpha1 - uvbuf1[eax](1-uvalpha1)*/\

428

"paddw %%mm5, %%mm4 \n\t" /* uvbuf0[eax+2048]uvalpha1 - uvbuf1[eax+2048](1-uvalpha1)*/\

429

"psubw "U_OFFSET"("#c"), %%mm3 \n\t" /* (U-128)8*/\

430

"psubw "V_OFFSET"("#c"), %%mm4 \n\t" /* (V-128)8*/\

431

"movq %%mm3, %%mm2 \n\t" /* (U-128)8*/\

432

"movq %%mm4, %%mm5 \n\t" /* (V-128)8*/\

433

"pmulhw "UG_COEFF"("#c"), %%mm3 \n\t"\

434

"pmulhw "VG_COEFF"("#c"), %%mm4 \n\t"\

435

/* mm2=(U-128)8, mm3=ug, mm4=vg mm5=(V-128)8 */\

436

437

#define REAL_YSCALEYUV2RGB_YA(index, c, b1, b2) \

438

"movq ("#b1", "#index", 2), %%mm0 \n\t" /*buf0[eax]*/\

439

"movq ("#b2", "#index", 2), %%mm1 \n\t" /*buf1[eax]*/\

440

"movq 8("#b1", "#index", 2), %%mm6 \n\t" /*buf0[eax]*/\

441

"movq 8("#b2", "#index", 2), %%mm7 \n\t" /*buf1[eax]*/\

442

"psubw %%mm1, %%mm0 \n\t" /* buf0[eax] - buf1[eax]*/\

443

"psubw %%mm7, %%mm6 \n\t" /* buf0[eax] - buf1[eax]*/\

444

"pmulhw "LUM_MMX_FILTER_OFFSET"+8("#c"), %%mm0 \n\t" /* (buf0[eax] - buf1[eax])yalpha1>>16*/\

445

"pmulhw "LUM_MMX_FILTER_OFFSET"+8("#c"), %%mm6 \n\t" /* (buf0[eax] - buf1[eax])yalpha1>>16*/\

446

"psraw $4, %%mm1 \n\t" /* buf0[eax] - buf1[eax] >>4*/\

447

"psraw $4, %%mm7 \n\t" /* buf0[eax] - buf1[eax] >>4*/\

448

"paddw %%mm0, %%mm1 \n\t" /* buf0[eax]yalpha1 + buf1[eax](1-yalpha1) >>16*/\

449

"paddw %%mm6, %%mm7 \n\t" /* buf0[eax]yalpha1 + buf1[eax](1-yalpha1) >>16*/\

450

451

#define REAL_YSCALEYUV2RGB_COEFF(c) \

452

"pmulhw "UB_COEFF"("#c"), %%mm2 \n\t"\

453

"pmulhw "VR_COEFF"("#c"), %%mm5 \n\t"\

454

"psubw "Y_OFFSET"("#c"), %%mm1 \n\t" /* 8(Y-16)*/\

455

"psubw "Y_OFFSET"("#c"), %%mm7 \n\t" /* 8(Y-16)*/\

456

"pmulhw "Y_COEFF"("#c"), %%mm1 \n\t"\

457

"pmulhw "Y_COEFF"("#c"), %%mm7 \n\t"\

458

/* mm1= Y1, mm2=ub, mm3=ug, mm4=vg mm5=vr, mm7=Y2 */\

459

"paddw %%mm3, %%mm4 \n\t"\

460

"movq %%mm2, %%mm0 \n\t"\

461

"movq %%mm5, %%mm6 \n\t"\

462

"movq %%mm4, %%mm3 \n\t"\

463

"punpcklwd %%mm2, %%mm2 \n\t"\

464

"punpcklwd %%mm5, %%mm5 \n\t"\

465

"punpcklwd %%mm4, %%mm4 \n\t"\

466

"paddw %%mm1, %%mm2 \n\t"\

467

"paddw %%mm1, %%mm5 \n\t"\

468

"paddw %%mm1, %%mm4 \n\t"\

469

"punpckhwd %%mm0, %%mm0 \n\t"\

470

"punpckhwd %%mm6, %%mm6 \n\t"\

471

"punpckhwd %%mm3, %%mm3 \n\t"\

472

"paddw %%mm7, %%mm0 \n\t"\

473

"paddw %%mm7, %%mm6 \n\t"\

474

"paddw %%mm7, %%mm3 \n\t"\

475

/* mm0=B1, mm2=B2, mm3=G2, mm4=G1, mm5=R1, mm6=R2 */\

476

"packuswb %%mm0, %%mm2 \n\t"\

477

"packuswb %%mm6, %%mm5 \n\t"\

478

"packuswb %%mm3, %%mm4 \n\t"\

479

480

#define YSCALEYUV2RGB_YA(index, c, b1, b2) REAL_YSCALEYUV2RGB_YA(index, c, b1, b2)

481

482

#define YSCALEYUV2RGB(index, c) \

483

REAL_YSCALEYUV2RGB_UV(index, c) \

484

REAL_YSCALEYUV2RGB_YA(index, c, %0, %1) \

485

REAL_YSCALEYUV2RGB_COEFF(c)

486

487

#define REAL_YSCALEYUV2PACKED1(index, c) \

488

"xor "#index", "#index" \n\t"\

489

".p2align 4 \n\t"\

490

"1: \n\t"\

491

"movq (%2, "#index"), %%mm3 \n\t" /* uvbuf0[eax]*/\

492

"movq "AV_STRINGIFY(VOF)"(%2, "#index"), %%mm4 \n\t" /* uvbuf0[eax+2048]*/\

493

"psraw $7, %%mm3 \n\t" \

494

"psraw $7, %%mm4 \n\t" \

495

"movq (%0, "#index", 2), %%mm1 \n\t" /*buf0[eax]*/\

496

"movq 8(%0, "#index", 2), %%mm7 \n\t" /*buf0[eax]*/\

497

"psraw $7, %%mm1 \n\t" \

498

"psraw $7, %%mm7 \n\t" \

499

500

#define YSCALEYUV2PACKED1(index, c) REAL_YSCALEYUV2PACKED1(index, c)

501

502

#define REAL_YSCALEYUV2RGB1(index, c) \

503

"xor "#index", "#index" \n\t"\

504

".p2align 4 \n\t"\

505

"1: \n\t"\

506

"movq (%2, "#index"), %%mm3 \n\t" /* uvbuf0[eax]*/\

507

"movq "AV_STRINGIFY(VOF)"(%2, "#index"), %%mm4 \n\t" /* uvbuf0[eax+2048]*/\

508

"psraw $4, %%mm3 \n\t" /* uvbuf0[eax] - uvbuf1[eax] >>4*/\

509

"psraw $4, %%mm4 \n\t" /* uvbuf0[eax+2048] - uvbuf1[eax+2048] >>4*/\

510

"psubw "U_OFFSET"("#c"), %%mm3 \n\t" /* (U-128)8*/\

511

"psubw "V_OFFSET"("#c"), %%mm4 \n\t" /* (V-128)8*/\

512

"movq %%mm3, %%mm2 \n\t" /* (U-128)8*/\

513

"movq %%mm4, %%mm5 \n\t" /* (V-128)8*/\

514

"pmulhw "UG_COEFF"("#c"), %%mm3 \n\t"\

515

"pmulhw "VG_COEFF"("#c"), %%mm4 \n\t"\

516

/* mm2=(U-128)8, mm3=ug, mm4=vg mm5=(V-128)8 */\

517

"movq (%0, "#index", 2), %%mm1 \n\t" /*buf0[eax]*/\

518

"movq 8(%0, "#index", 2), %%mm7 \n\t" /*buf0[eax]*/\

519

"psraw $4, %%mm1 \n\t" /* buf0[eax] - buf1[eax] >>4*/\

520

"psraw $4, %%mm7 \n\t" /* buf0[eax] - buf1[eax] >>4*/\

521

"pmulhw "UB_COEFF"("#c"), %%mm2 \n\t"\

522

"pmulhw "VR_COEFF"("#c"), %%mm5 \n\t"\

523

"psubw "Y_OFFSET"("#c"), %%mm1 \n\t" /* 8(Y-16)*/\

524

"psubw "Y_OFFSET"("#c"), %%mm7 \n\t" /* 8(Y-16)*/\

525

"pmulhw "Y_COEFF"("#c"), %%mm1 \n\t"\

526

"pmulhw "Y_COEFF"("#c"), %%mm7 \n\t"\

527

/* mm1= Y1, mm2=ub, mm3=ug, mm4=vg mm5=vr, mm7=Y2 */\

528

"paddw %%mm3, %%mm4 \n\t"\

529

"movq %%mm2, %%mm0 \n\t"\

530

"movq %%mm5, %%mm6 \n\t"\

531

"movq %%mm4, %%mm3 \n\t"\

532

"punpcklwd %%mm2, %%mm2 \n\t"\

533

"punpcklwd %%mm5, %%mm5 \n\t"\

534

"punpcklwd %%mm4, %%mm4 \n\t"\

535

"paddw %%mm1, %%mm2 \n\t"\

536

"paddw %%mm1, %%mm5 \n\t"\

537

"paddw %%mm1, %%mm4 \n\t"\

538

"punpckhwd %%mm0, %%mm0 \n\t"\

539

"punpckhwd %%mm6, %%mm6 \n\t"\

540

"punpckhwd %%mm3, %%mm3 \n\t"\

541

"paddw %%mm7, %%mm0 \n\t"\

542

"paddw %%mm7, %%mm6 \n\t"\

543

"paddw %%mm7, %%mm3 \n\t"\

544

/* mm0=B1, mm2=B2, mm3=G2, mm4=G1, mm5=R1, mm6=R2 */\

545

"packuswb %%mm0, %%mm2 \n\t"\

546

"packuswb %%mm6, %%mm5 \n\t"\

547

"packuswb %%mm3, %%mm4 \n\t"\

548

549

#define YSCALEYUV2RGB1(index, c) REAL_YSCALEYUV2RGB1(index, c)

550

551

#define REAL_YSCALEYUV2PACKED1b(index, c) \

552

"xor "#index", "#index" \n\t"\

553

".p2align 4 \n\t"\

554

"1: \n\t"\

555

"movq (%2, "#index"), %%mm2 \n\t" /* uvbuf0[eax]*/\

556

"movq (%3, "#index"), %%mm3 \n\t" /* uvbuf1[eax]*/\

557

"movq "AV_STRINGIFY(VOF)"(%2, "#index"), %%mm5 \n\t" /* uvbuf0[eax+2048]*/\

558

"movq "AV_STRINGIFY(VOF)"(%3, "#index"), %%mm4 \n\t" /* uvbuf1[eax+2048]*/\

559

"paddw %%mm2, %%mm3 \n\t" /* uvbuf0[eax] + uvbuf1[eax]*/\

560

"paddw %%mm5, %%mm4 \n\t" /* uvbuf0[eax+2048] + uvbuf1[eax+2048]*/\

561

"psrlw $8, %%mm3 \n\t" \

562

"psrlw $8, %%mm4 \n\t" \

563

"movq (%0, "#index", 2), %%mm1 \n\t" /*buf0[eax]*/\

564

"movq 8(%0, "#index", 2), %%mm7 \n\t" /*buf0[eax]*/\

565

"psraw $7, %%mm1 \n\t" \

566

"psraw $7, %%mm7 \n\t"

567

#define YSCALEYUV2PACKED1b(index, c) REAL_YSCALEYUV2PACKED1b(index, c)

568

569

// do vertical chrominance interpolation

570

#define REAL_YSCALEYUV2RGB1b(index, c) \

571

"xor "#index", "#index" \n\t"\

572

".p2align 4 \n\t"\

573

"1: \n\t"\

574

"movq (%2, "#index"), %%mm2 \n\t" /* uvbuf0[eax]*/\

575

"movq (%3, "#index"), %%mm3 \n\t" /* uvbuf1[eax]*/\

576

"movq "AV_STRINGIFY(VOF)"(%2, "#index"), %%mm5 \n\t" /* uvbuf0[eax+2048]*/\

577

"movq "AV_STRINGIFY(VOF)"(%3, "#index"), %%mm4 \n\t" /* uvbuf1[eax+2048]*/\

578

"paddw %%mm2, %%mm3 \n\t" /* uvbuf0[eax] + uvbuf1[eax]*/\

579

"paddw %%mm5, %%mm4 \n\t" /* uvbuf0[eax+2048] + uvbuf1[eax+2048]*/\

580

"psrlw $5, %%mm3 \n\t" /*FIXME might overflow*/\

581

"psrlw $5, %%mm4 \n\t" /*FIXME might overflow*/\

582

"psubw "U_OFFSET"("#c"), %%mm3 \n\t" /* (U-128)8*/\

583

"psubw "V_OFFSET"("#c"), %%mm4 \n\t" /* (V-128)8*/\

584

"movq %%mm3, %%mm2 \n\t" /* (U-128)8*/\

585

"movq %%mm4, %%mm5 \n\t" /* (V-128)8*/\

586

"pmulhw "UG_COEFF"("#c"), %%mm3 \n\t"\

587

"pmulhw "VG_COEFF"("#c"), %%mm4 \n\t"\

588

/* mm2=(U-128)8, mm3=ug, mm4=vg mm5=(V-128)8 */\

589

"movq (%0, "#index", 2), %%mm1 \n\t" /*buf0[eax]*/\

590

"movq 8(%0, "#index", 2), %%mm7 \n\t" /*buf0[eax]*/\

591

"psraw $4, %%mm1 \n\t" /* buf0[eax] - buf1[eax] >>4*/\

592

"psraw $4, %%mm7 \n\t" /* buf0[eax] - buf1[eax] >>4*/\

593

"pmulhw "UB_COEFF"("#c"), %%mm2 \n\t"\

594

"pmulhw "VR_COEFF"("#c"), %%mm5 \n\t"\

595

"psubw "Y_OFFSET"("#c"), %%mm1 \n\t" /* 8(Y-16)*/\

596

"psubw "Y_OFFSET"("#c"), %%mm7 \n\t" /* 8(Y-16)*/\

597

"pmulhw "Y_COEFF"("#c"), %%mm1 \n\t"\

598

"pmulhw "Y_COEFF"("#c"), %%mm7 \n\t"\

599

/* mm1= Y1, mm2=ub, mm3=ug, mm4=vg mm5=vr, mm7=Y2 */\

600

"paddw %%mm3, %%mm4 \n\t"\

601

"movq %%mm2, %%mm0 \n\t"\

602

"movq %%mm5, %%mm6 \n\t"\

603

"movq %%mm4, %%mm3 \n\t"\

604

"punpcklwd %%mm2, %%mm2 \n\t"\

605

"punpcklwd %%mm5, %%mm5 \n\t"\

606

"punpcklwd %%mm4, %%mm4 \n\t"\

607

"paddw %%mm1, %%mm2 \n\t"\

608

"paddw %%mm1, %%mm5 \n\t"\

609

"paddw %%mm1, %%mm4 \n\t"\

610

"punpckhwd %%mm0, %%mm0 \n\t"\

611

"punpckhwd %%mm6, %%mm6 \n\t"\

612

"punpckhwd %%mm3, %%mm3 \n\t"\

613

"paddw %%mm7, %%mm0 \n\t"\

614

"paddw %%mm7, %%mm6 \n\t"\

615

"paddw %%mm7, %%mm3 \n\t"\

616

/* mm0=B1, mm2=B2, mm3=G2, mm4=G1, mm5=R1, mm6=R2 */\

617

"packuswb %%mm0, %%mm2 \n\t"\

618

"packuswb %%mm6, %%mm5 \n\t"\

619

"packuswb %%mm3, %%mm4 \n\t"\

620

621

#define YSCALEYUV2RGB1b(index, c) REAL_YSCALEYUV2RGB1b(index, c)

622

623

#define REAL_YSCALEYUV2RGB1_ALPHA(index) \

624

"movq (%1, "#index", 2), %%mm7 \n\t" /* abuf0[index ] */\

625

"movq 8(%1, "#index", 2), %%mm1 \n\t" /* abuf0[index+4] */\

626

"psraw $7, %%mm7 \n\t" /* abuf0[index ] >>7 */\

627

"psraw $7, %%mm1 \n\t" /* abuf0[index+4] >>7 */\

628

"packuswb %%mm1, %%mm7 \n\t"

629

#define YSCALEYUV2RGB1_ALPHA(index) REAL_YSCALEYUV2RGB1_ALPHA(index)

630

631

#define REAL_WRITEBGR32(dst, dstw, index, b, g, r, a, q0, q2, q3, t) \

632

"movq "#b", "#q2" \n\t" /* B */\

633

"movq "#r", "#t" \n\t" /* R */\

634

"punpcklbw "#g", "#b" \n\t" /* GBGBGBGB 0 */\

635

"punpcklbw "#a", "#r" \n\t" /* ARARARAR 0 */\

636

"punpckhbw "#g", "#q2" \n\t" /* GBGBGBGB 2 */\

637

"punpckhbw "#a", "#t" \n\t" /* ARARARAR 2 */\

638

"movq "#b", "#q0" \n\t" /* GBGBGBGB 0 */\

639

"movq "#q2", "#q3" \n\t" /* GBGBGBGB 2 */\

640

"punpcklwd "#r", "#q0" \n\t" /* ARGBARGB 0 */\

641

"punpckhwd "#r", "#b" \n\t" /* ARGBARGB 1 */\

642

"punpcklwd "#t", "#q2" \n\t" /* ARGBARGB 2 */\

643

"punpckhwd "#t", "#q3" \n\t" /* ARGBARGB 3 */\

644

645

MOVNTQ( q0, (dst, index, 4))\

646

MOVNTQ( b, 8(dst, index, 4))\

647

MOVNTQ( q2, 16(dst, index, 4))\

648

MOVNTQ( q3, 24(dst, index, 4))\

649

650

"add $8, "#index" \n\t"\

651

"cmp "#dstw", "#index" \n\t"\

652

" jb 1b \n\t"

653

#define WRITEBGR32(dst, dstw, index, b, g, r, a, q0, q2, q3, t) REAL_WRITEBGR32(dst, dstw, index, b, g, r, a, q0, q2, q3, t)

654

655

#define REAL_WRITERGB16(dst, dstw, index) \

656

"pand "MANGLE(bF8)", %%mm2 \n\t" /* B */\

657

"pand "MANGLE(bFC)", %%mm4 \n\t" /* G */\

658

"pand "MANGLE(bF8)", %%mm5 \n\t" /* R */\

659

"psrlq $3, %%mm2 \n\t"\

660

661

"movq %%mm2, %%mm1 \n\t"\

662

"movq %%mm4, %%mm3 \n\t"\

663

664

"punpcklbw %%mm7, %%mm3 \n\t"\

665

"punpcklbw %%mm5, %%mm2 \n\t"\

666

"punpckhbw %%mm7, %%mm4 \n\t"\

667

"punpckhbw %%mm5, %%mm1 \n\t"\

668

669

"psllq $3, %%mm3 \n\t"\

670

"psllq $3, %%mm4 \n\t"\

671

672

"por %%mm3, %%mm2 \n\t"\

673

"por %%mm4, %%mm1 \n\t"\

674

675

MOVNTQ(%%mm2, (dst, index, 2))\

676

MOVNTQ(%%mm1, 8(dst, index, 2))\

677

678

"add $8, "#index" \n\t"\

679

"cmp "#dstw", "#index" \n\t"\

680

" jb 1b \n\t"

681

#define WRITERGB16(dst, dstw, index) REAL_WRITERGB16(dst, dstw, index)

682

683

#define REAL_WRITERGB15(dst, dstw, index) \

684

"pand "MANGLE(bF8)", %%mm2 \n\t" /* B */\

685

"pand "MANGLE(bF8)", %%mm4 \n\t" /* G */\

686

"pand "MANGLE(bF8)", %%mm5 \n\t" /* R */\

687

"psrlq $3, %%mm2 \n\t"\

688

"psrlq $1, %%mm5 \n\t"\

689

690

"movq %%mm2, %%mm1 \n\t"\

691

"movq %%mm4, %%mm3 \n\t"\

692

693

"punpcklbw %%mm7, %%mm3 \n\t"\

694

"punpcklbw %%mm5, %%mm2 \n\t"\

695

"punpckhbw %%mm7, %%mm4 \n\t"\

696

"punpckhbw %%mm5, %%mm1 \n\t"\

697

698

"psllq $2, %%mm3 \n\t"\

699

"psllq $2, %%mm4 \n\t"\

700

701

"por %%mm3, %%mm2 \n\t"\

702

"por %%mm4, %%mm1 \n\t"\

703

704

MOVNTQ(%%mm2, (dst, index, 2))\

705

MOVNTQ(%%mm1, 8(dst, index, 2))\

706

707

"add $8, "#index" \n\t"\

708

"cmp "#dstw", "#index" \n\t"\

709

" jb 1b \n\t"

710

#define WRITERGB15(dst, dstw, index) REAL_WRITERGB15(dst, dstw, index)

711

712

#define WRITEBGR24OLD(dst, dstw, index) \

713

/* mm2=B, %%mm4=G, %%mm5=R, %%mm7=0 */\

714

"movq %%mm2, %%mm1 \n\t" /* B */\

715

"movq %%mm5, %%mm6 \n\t" /* R */\

716

"punpcklbw %%mm4, %%mm2 \n\t" /* GBGBGBGB 0 */\

717

"punpcklbw %%mm7, %%mm5 \n\t" /* 0R0R0R0R 0 */\

718

"punpckhbw %%mm4, %%mm1 \n\t" /* GBGBGBGB 2 */\

719

"punpckhbw %%mm7, %%mm6 \n\t" /* 0R0R0R0R 2 */\

720

"movq %%mm2, %%mm0 \n\t" /* GBGBGBGB 0 */\

721

"movq %%mm1, %%mm3 \n\t" /* GBGBGBGB 2 */\

722

"punpcklwd %%mm5, %%mm0 \n\t" /* 0RGB0RGB 0 */\

723

"punpckhwd %%mm5, %%mm2 \n\t" /* 0RGB0RGB 1 */\

724

"punpcklwd %%mm6, %%mm1 \n\t" /* 0RGB0RGB 2 */\

725

"punpckhwd %%mm6, %%mm3 \n\t" /* 0RGB0RGB 3 */\

726

727

"movq %%mm0, %%mm4 \n\t" /* 0RGB0RGB 0 */\

728

"psrlq $8, %%mm0 \n\t" /* 00RGB0RG 0 */\

729

"pand "MANGLE(bm00000111)", %%mm4 \n\t" /* 00000RGB 0 */\

730

"pand "MANGLE(bm11111000)", %%mm0 \n\t" /* 00RGB000 0.5 */\

731

"por %%mm4, %%mm0 \n\t" /* 00RGBRGB 0 */\

732

"movq %%mm2, %%mm4 \n\t" /* 0RGB0RGB 1 */\

733

"psllq $48, %%mm2 \n\t" /* GB000000 1 */\

734

"por %%mm2, %%mm0 \n\t" /* GBRGBRGB 0 */\

735

736

"movq %%mm4, %%mm2 \n\t" /* 0RGB0RGB 1 */\

737

"psrld $16, %%mm4 \n\t" /* 000R000R 1 */\

738

"psrlq $24, %%mm2 \n\t" /* 0000RGB0 1.5 */\

739

"por %%mm4, %%mm2 \n\t" /* 000RRGBR 1 */\

740

"pand "MANGLE(bm00001111)", %%mm2 \n\t" /* 0000RGBR 1 */\

741

"movq %%mm1, %%mm4 \n\t" /* 0RGB0RGB 2 */\

742

"psrlq $8, %%mm1 \n\t" /* 00RGB0RG 2 */\

743

"pand "MANGLE(bm00000111)", %%mm4 \n\t" /* 00000RGB 2 */\

744

"pand "MANGLE(bm11111000)", %%mm1 \n\t" /* 00RGB000 2.5 */\

745

"por %%mm4, %%mm1 \n\t" /* 00RGBRGB 2 */\

746

"movq %%mm1, %%mm4 \n\t" /* 00RGBRGB 2 */\

747

"psllq $32, %%mm1 \n\t" /* BRGB0000 2 */\

748

"por %%mm1, %%mm2 \n\t" /* BRGBRGBR 1 */\

749

750

"psrlq $32, %%mm4 \n\t" /* 000000RG 2.5 */\

751

"movq %%mm3, %%mm5 \n\t" /* 0RGB0RGB 3 */\

752

"psrlq $8, %%mm3 \n\t" /* 00RGB0RG 3 */\

753

"pand "MANGLE(bm00000111)", %%mm5 \n\t" /* 00000RGB 3 */\

754

"pand "MANGLE(bm11111000)", %%mm3 \n\t" /* 00RGB000 3.5 */\

755

"por %%mm5, %%mm3 \n\t" /* 00RGBRGB 3 */\

756

"psllq $16, %%mm3 \n\t" /* RGBRGB00 3 */\

757

"por %%mm4, %%mm3 \n\t" /* RGBRGBRG 2.5 */\

758

759

MOVNTQ(%%mm0, (dst))\

760

MOVNTQ(%%mm2, 8(dst))\

761

MOVNTQ(%%mm3, 16(dst))\

762

"add $24, "#dst" \n\t"\

763

764

"add $8, "#index" \n\t"\

765

"cmp "#dstw", "#index" \n\t"\

766

" jb 1b \n\t"

767

768

#define WRITEBGR24MMX(dst, dstw, index) \

769

/* mm2=B, %%mm4=G, %%mm5=R, %%mm7=0 */\

770

"movq %%mm2, %%mm1 \n\t" /* B */\

771

"movq %%mm5, %%mm6 \n\t" /* R */\

772

"punpcklbw %%mm4, %%mm2 \n\t" /* GBGBGBGB 0 */\

773

"punpcklbw %%mm7, %%mm5 \n\t" /* 0R0R0R0R 0 */\

774

"punpckhbw %%mm4, %%mm1 \n\t" /* GBGBGBGB 2 */\

775

"punpckhbw %%mm7, %%mm6 \n\t" /* 0R0R0R0R 2 */\

776

"movq %%mm2, %%mm0 \n\t" /* GBGBGBGB 0 */\

777

"movq %%mm1, %%mm3 \n\t" /* GBGBGBGB 2 */\

778

"punpcklwd %%mm5, %%mm0 \n\t" /* 0RGB0RGB 0 */\

779

"punpckhwd %%mm5, %%mm2 \n\t" /* 0RGB0RGB 1 */\

780

"punpcklwd %%mm6, %%mm1 \n\t" /* 0RGB0RGB 2 */\

781

"punpckhwd %%mm6, %%mm3 \n\t" /* 0RGB0RGB 3 */\

782

783

"movq %%mm0, %%mm4 \n\t" /* 0RGB0RGB 0 */\

784

"movq %%mm2, %%mm6 \n\t" /* 0RGB0RGB 1 */\

785

"movq %%mm1, %%mm5 \n\t" /* 0RGB0RGB 2 */\

786

"movq %%mm3, %%mm7 \n\t" /* 0RGB0RGB 3 */\

787

788

"psllq $40, %%mm0 \n\t" /* RGB00000 0 */\

789

"psllq $40, %%mm2 \n\t" /* RGB00000 1 */\

790

"psllq $40, %%mm1 \n\t" /* RGB00000 2 */\

791

"psllq $40, %%mm3 \n\t" /* RGB00000 3 */\

792

793

"punpckhdq %%mm4, %%mm0 \n\t" /* 0RGBRGB0 0 */\

794

"punpckhdq %%mm6, %%mm2 \n\t" /* 0RGBRGB0 1 */\

795

"punpckhdq %%mm5, %%mm1 \n\t" /* 0RGBRGB0 2 */\

796

"punpckhdq %%mm7, %%mm3 \n\t" /* 0RGBRGB0 3 */\

797

798

"psrlq $8, %%mm0 \n\t" /* 00RGBRGB 0 */\

799

"movq %%mm2, %%mm6 \n\t" /* 0RGBRGB0 1 */\

800

"psllq $40, %%mm2 \n\t" /* GB000000 1 */\

801

"por %%mm2, %%mm0 \n\t" /* GBRGBRGB 0 */\

802

MOVNTQ(%%mm0, (dst))\

803

804

"psrlq $24, %%mm6 \n\t" /* 0000RGBR 1 */\

805

"movq %%mm1, %%mm5 \n\t" /* 0RGBRGB0 2 */\

806

"psllq $24, %%mm1 \n\t" /* BRGB0000 2 */\

807

"por %%mm1, %%mm6 \n\t" /* BRGBRGBR 1 */\

808

MOVNTQ(%%mm6, 8(dst))\

809

810

"psrlq $40, %%mm5 \n\t" /* 000000RG 2 */\

811

"psllq $8, %%mm3 \n\t" /* RGBRGB00 3 */\

812

"por %%mm3, %%mm5 \n\t" /* RGBRGBRG 2 */\

813

MOVNTQ(%%mm5, 16(dst))\

814

815

"add $24, "#dst" \n\t"\

816

817

"add $8, "#index" \n\t"\

818

"cmp "#dstw", "#index" \n\t"\

819

" jb 1b \n\t"

820

821

#define WRITEBGR24MMX2(dst, dstw, index) \

822

/* mm2=B, %%mm4=G, %%mm5=R, %%mm7=0 */\

823

"movq "MANGLE(ff_M24A)", %%mm0 \n\t"\

824

"movq "MANGLE(ff_M24C)", %%mm7 \n\t"\

825

"pshufw $0x50, %%mm2, %%mm1 \n\t" /* B3 B2 B3 B2 B1 B0 B1 B0 */\

826

"pshufw $0x50, %%mm4, %%mm3 \n\t" /* G3 G2 G3 G2 G1 G0 G1 G0 */\

827

"pshufw $0x00, %%mm5, %%mm6 \n\t" /* R1 R0 R1 R0 R1 R0 R1 R0 */\

828

829

"pand %%mm0, %%mm1 \n\t" /* B2 B1 B0 */\

830

"pand %%mm0, %%mm3 \n\t" /* G2 G1 G0 */\

831

"pand %%mm7, %%mm6 \n\t" /* R1 R0 */\

832

833

"psllq $8, %%mm3 \n\t" /* G2 G1 G0 */\

834

"por %%mm1, %%mm6 \n\t"\

835

"por %%mm3, %%mm6 \n\t"\

836

MOVNTQ(%%mm6, (dst))\

837

838

"psrlq $8, %%mm4 \n\t" /* 00 G7 G6 G5 G4 G3 G2 G1 */\

839

"pshufw $0xA5, %%mm2, %%mm1 \n\t" /* B5 B4 B5 B4 B3 B2 B3 B2 */\

840

"pshufw $0x55, %%mm4, %%mm3 \n\t" /* G4 G3 G4 G3 G4 G3 G4 G3 */\

841

"pshufw $0xA5, %%mm5, %%mm6 \n\t" /* R5 R4 R5 R4 R3 R2 R3 R2 */\

842

843

"pand "MANGLE(ff_M24B)", %%mm1 \n\t" /* B5 B4 B3 */\

844

"pand %%mm7, %%mm3 \n\t" /* G4 G3 */\

845

"pand %%mm0, %%mm6 \n\t" /* R4 R3 R2 */\

846

847

"por %%mm1, %%mm3 \n\t" /* B5 G4 B4 G3 B3 */\

848

"por %%mm3, %%mm6 \n\t"\

849

MOVNTQ(%%mm6, 8(dst))\

850

851

"pshufw $0xFF, %%mm2, %%mm1 \n\t" /* B7 B6 B7 B6 B7 B6 B6 B7 */\

852

"pshufw $0xFA, %%mm4, %%mm3 \n\t" /* 00 G7 00 G7 G6 G5 G6 G5 */\

853

"pshufw $0xFA, %%mm5, %%mm6 \n\t" /* R7 R6 R7 R6 R5 R4 R5 R4 */\

854

855

"pand %%mm7, %%mm1 \n\t" /* B7 B6 */\

856

"pand %%mm0, %%mm3 \n\t" /* G7 G6 G5 */\

857

"pand "MANGLE(ff_M24B)", %%mm6 \n\t" /* R7 R6 R5 */\

858

859

"por %%mm1, %%mm3 \n\t"\

860

"por %%mm3, %%mm6 \n\t"\

861

MOVNTQ(%%mm6, 16(dst))\

862

863

"add $24, "#dst" \n\t"\

864

865

"add $8, "#index" \n\t"\

866

"cmp "#dstw", "#index" \n\t"\

867

" jb 1b \n\t"

868

869

#if COMPILE_TEMPLATE_MMX2

870

#undef WRITEBGR24

871

#define WRITEBGR24(dst, dstw, index) WRITEBGR24MMX2(dst, dstw, index)

872

#else

873

#undef WRITEBGR24

874

#define WRITEBGR24(dst, dstw, index) WRITEBGR24MMX(dst, dstw, index)

875

#endif

876

877

#define REAL_WRITEYUY2(dst, dstw, index) \

878

"packuswb %%mm3, %%mm3 \n\t"\

879

"packuswb %%mm4, %%mm4 \n\t"\

880

"packuswb %%mm7, %%mm1 \n\t"\

881

"punpcklbw %%mm4, %%mm3 \n\t"\

882

"movq %%mm1, %%mm7 \n\t"\

883

"punpcklbw %%mm3, %%mm1 \n\t"\

884

"punpckhbw %%mm3, %%mm7 \n\t"\

885

886

MOVNTQ(%%mm1, (dst, index, 2))\

887

MOVNTQ(%%mm7, 8(dst, index, 2))\

888

889

"add $8, "#index" \n\t"\

890

"cmp "#dstw", "#index" \n\t"\

891

" jb 1b \n\t"

892

#define WRITEYUY2(dst, dstw, index) REAL_WRITEYUY2(dst, dstw, index)

893

894

895

static inline void RENAME(yuv2yuvX)(SwsContext *c, const int16_t *lumFilter, const int16_t **lumSrc, int lumFilterSize,

896

const int16_t *chrFilter, const int16_t **chrSrc, int chrFilterSize, const int16_t **alpSrc,

897

uint8_t *dest, uint8_t *uDest, uint8_t *vDest, uint8_t *aDest, long dstW, long chrDstW)

898

{

899

if(!(c->flags & SWS_BITEXACT)) {

900

if (c->flags & SWS_ACCURATE_RND) {

901

if (uDest) {

902

YSCALEYUV2YV12X_ACCURATE( "0", CHR_MMX_FILTER_OFFSET, uDest, chrDstW)

903

YSCALEYUV2YV12X_ACCURATE(AV_STRINGIFY(VOF), CHR_MMX_FILTER_OFFSET, vDest, chrDstW)

904

}

905

if (CONFIG_SWSCALE_ALPHA && aDest) {

906

YSCALEYUV2YV12X_ACCURATE( "0", ALP_MMX_FILTER_OFFSET, aDest, dstW)

907

}

908

909

YSCALEYUV2YV12X_ACCURATE("0", LUM_MMX_FILTER_OFFSET, dest, dstW)

910

} else {

911

if (uDest) {

912

YSCALEYUV2YV12X( "0", CHR_MMX_FILTER_OFFSET, uDest, chrDstW)

913

YSCALEYUV2YV12X(AV_STRINGIFY(VOF), CHR_MMX_FILTER_OFFSET, vDest, chrDstW)

914

}

915

if (CONFIG_SWSCALE_ALPHA && aDest) {

916

YSCALEYUV2YV12X( "0", ALP_MMX_FILTER_OFFSET, aDest, dstW)

917

}

918

919

YSCALEYUV2YV12X("0", LUM_MMX_FILTER_OFFSET, dest, dstW)

920

}

921

return;

922

}

923

yuv2yuvXinC(lumFilter, lumSrc, lumFilterSize,

924

chrFilter, chrSrc, chrFilterSize,

925

alpSrc, dest, uDest, vDest, aDest, dstW, chrDstW);

926

}

927

928

static inline void RENAME(yuv2nv12X)(SwsContext *c, const int16_t *lumFilter, const int16_t **lumSrc, int lumFilterSize,

929

const int16_t *chrFilter, const int16_t **chrSrc, int chrFilterSize,

930

uint8_t *dest, uint8_t *uDest, int dstW, int chrDstW, enum PixelFormat dstFormat)

931

{

932

yuv2nv12XinC(lumFilter, lumSrc, lumFilterSize,

933

chrFilter, chrSrc, chrFilterSize,

934

dest, uDest, dstW, chrDstW, dstFormat);

935

}

936

937

static inline void RENAME(yuv2yuv1)(SwsContext *c, const int16_t *lumSrc, const int16_t *chrSrc, const int16_t *alpSrc,

938

uint8_t *dest, uint8_t *uDest, uint8_t *vDest, uint8_t *aDest, long dstW, long chrDstW)

939

{

940

int i;

941

if(!(c->flags & SWS_BITEXACT)) {

942

long p= 4;

943

const uint8_t *src[4]= {alpSrc + dstW, lumSrc + dstW, chrSrc + chrDstW, chrSrc + VOFW + chrDstW};

944

uint8_t *dst[4]= {aDest, dest, uDest, vDest};

945

x86_reg counter[4]= {dstW, dstW, chrDstW, chrDstW};

946

947

if (c->flags & SWS_ACCURATE_RND) {

948

while(p--) {

949

if (dst[p]) {

950

__asm__ volatile(

951

YSCALEYUV2YV121_ACCURATE

952

:: "r" (src[p]), "r" (dst[p] + counter[p]),

953

"g" (-counter[p])

954

: "%"REG_a

955

);

956

}

957

}

958

} else {

959

while(p--) {

960

if (dst[p]) {

961

__asm__ volatile(

962

YSCALEYUV2YV121

963

:: "r" (src[p]), "r" (dst[p] + counter[p]),

964

"g" (-counter[p])

965

: "%"REG_a

966

);

967

}

968

}

969

}

970

return;

971

}

972

for (i=0; i<dstW; i++) {

973

int val= (lumSrc[i]+64)>>7;

974

975

if (val&256) {

976

if (val<0) val=0;

977

else val=255;

978

}

979

980

dest[i]= val;

981

}

982

983

if (uDest)

984

for (i=0; i<chrDstW; i++) {

985

int u=(chrSrc[i ]+64)>>7;

986

int v=(chrSrc[i + VOFW]+64)>>7;

987

988

if ((u|v)&256) {

989

if (u<0) u=0;

990

else if (u>255) u=255;

991

if (v<0) v=0;

992

else if (v>255) v=255;

993

}

994

995

uDest[i]= u;

996

vDest[i]= v;

997

}

998

999

if (CONFIG_SWSCALE_ALPHA && aDest)

1000

for (i=0; i<dstW; i++) {

1001

int val= (alpSrc[i]+64)>>7;

1002

aDest[i]= av_clip_uint8(val);

1003

}

1004

}

1005

1006

1007

/**

1008

* vertical scale YV12 to RGB

1009

1010

static inline void RENAME(yuv2packedX)(SwsContext *c, const int16_t *lumFilter, const int16_t **lumSrc, int lumFilterSize,

1011

const int16_t *chrFilter, const int16_t **chrSrc, int chrFilterSize,

1012

const int16_t **alpSrc, uint8_t *dest, long dstW, long dstY)

1013

{

1014

x86_reg dummy=0;

1015

x86_reg dstW_reg = dstW;

1016

if(!(c->flags & SWS_BITEXACT)) {

1017

if (c->flags & SWS_ACCURATE_RND) {

1018

switch(c->dstFormat) {

1019

case PIX_FMT_RGB32:

1020

if (CONFIG_SWSCALE_ALPHA && c->alpPixBuf) {

1021

YSCALEYUV2PACKEDX_ACCURATE

1022

YSCALEYUV2RGBX

1023

"movq %%mm2, "U_TEMP"(%0) \n\t"

1024

"movq %%mm4, "V_TEMP"(%0) \n\t"

1025

"movq %%mm5, "Y_TEMP"(%0) \n\t"

1026

YSCALEYUV2PACKEDX_ACCURATE_YA(ALP_MMX_FILTER_OFFSET)

1027

"movq "Y_TEMP"(%0), %%mm5 \n\t"

1028

"psraw $3, %%mm1 \n\t"

1029

"psraw $3, %%mm7 \n\t"

1030

"packuswb %%mm7, %%mm1 \n\t"

1031

WRITEBGR32(%4, %5, %%REGa, %%mm3, %%mm4, %%mm5, %%mm1, %%mm0, %%mm7, %%mm2, %%mm6)

1032

1033

YSCALEYUV2PACKEDX_END

1034

} else {

1035

YSCALEYUV2PACKEDX_ACCURATE

1036

YSCALEYUV2RGBX

1037

"pcmpeqd %%mm7, %%mm7 \n\t"

1038

WRITEBGR32(%4, %5, %%REGa, %%mm2, %%mm4, %%mm5, %%mm7, %%mm0, %%mm1, %%mm3, %%mm6)

1039

1040

YSCALEYUV2PACKEDX_END

1041

}

1042

return;

1043

case PIX_FMT_BGR24:

1044

YSCALEYUV2PACKEDX_ACCURATE

1045

YSCALEYUV2RGBX

1046

"pxor %%mm7, %%mm7 \n\t"

1047

"lea (%%"REG_a", %%"REG_a", 2), %%"REG_c"\n\t" //FIXME optimize

1048

"add %4, %%"REG_c" \n\t"

1049

WRITEBGR24(%%REGc, %5, %%REGa)

1050

1051

1052

:: "r" (&c->redDither),

1053

"m" (dummy), "m" (dummy), "m" (dummy),

1054

"r" (dest), "m" (dstW_reg)

1055

: "%"REG_a, "%"REG_c, "%"REG_d, "%"REG_S

1056

);

1057

return;

1058

case PIX_FMT_RGB555:

1059

YSCALEYUV2PACKEDX_ACCURATE

1060

YSCALEYUV2RGBX

1061

"pxor %%mm7, %%mm7 \n\t"

1062

/* mm2=B, %%mm4=G, %%mm5=R, %%mm7=0 */

1063

#ifdef DITHER1XBPP

1064

"paddusb "BLUE_DITHER"(%0), %%mm2\n\t"

1065

"paddusb "GREEN_DITHER"(%0), %%mm4\n\t"

1066

"paddusb "RED_DITHER"(%0), %%mm5\n\t"

1067

#endif

1068

1069

WRITERGB15(%4, %5, %%REGa)

1070

YSCALEYUV2PACKEDX_END

1071

return;

1072

case PIX_FMT_RGB565:

1073

YSCALEYUV2PACKEDX_ACCURATE

1074

YSCALEYUV2RGBX

1075

"pxor %%mm7, %%mm7 \n\t"

1076

/* mm2=B, %%mm4=G, %%mm5=R, %%mm7=0 */

1077

#ifdef DITHER1XBPP

1078

"paddusb "BLUE_DITHER"(%0), %%mm2\n\t"

1079

"paddusb "GREEN_DITHER"(%0), %%mm4\n\t"

1080

"paddusb "RED_DITHER"(%0), %%mm5\n\t"

1081

#endif

1082

1083

WRITERGB16(%4, %5, %%REGa)

1084

YSCALEYUV2PACKEDX_END

1085

return;

1086

case PIX_FMT_YUYV422:

1087

YSCALEYUV2PACKEDX_ACCURATE

1088

/* mm2=B, %%mm4=G, %%mm5=R, %%mm7=0 */

1089

1090

"psraw $3, %%mm3 \n\t"

1091

"psraw $3, %%mm4 \n\t"

1092

"psraw $3, %%mm1 \n\t"

1093

"psraw $3, %%mm7 \n\t"

1094

WRITEYUY2(%4, %5, %%REGa)

1095

YSCALEYUV2PACKEDX_END

1096

return;

1097

}

1098

} else {

1099

switch(c->dstFormat) {

1100

case PIX_FMT_RGB32:

1101

if (CONFIG_SWSCALE_ALPHA && c->alpPixBuf) {

1102

YSCALEYUV2PACKEDX

1103

YSCALEYUV2RGBX

1104

YSCALEYUV2PACKEDX_YA(ALP_MMX_FILTER_OFFSET, %%mm0, %%mm3, %%mm6, %%mm1, %%mm7)

1105

"psraw $3, %%mm1 \n\t"

1106

"psraw $3, %%mm7 \n\t"

1107

"packuswb %%mm7, %%mm1 \n\t"

1108

WRITEBGR32(%4, %5, %%REGa, %%mm2, %%mm4, %%mm5, %%mm1, %%mm0, %%mm7, %%mm3, %%mm6)

1109

YSCALEYUV2PACKEDX_END

1110

} else {

1111

YSCALEYUV2PACKEDX

1112

YSCALEYUV2RGBX

1113

"pcmpeqd %%mm7, %%mm7 \n\t"

1114

WRITEBGR32(%4, %5, %%REGa, %%mm2, %%mm4, %%mm5, %%mm7, %%mm0, %%mm1, %%mm3, %%mm6)

1115

YSCALEYUV2PACKEDX_END

1116

}

1117

return;

1118

case PIX_FMT_BGR24:

1119

YSCALEYUV2PACKEDX

1120

YSCALEYUV2RGBX

1121

"pxor %%mm7, %%mm7 \n\t"

1122

"lea (%%"REG_a", %%"REG_a", 2), %%"REG_c" \n\t" //FIXME optimize

1123

"add %4, %%"REG_c" \n\t"

1124

WRITEBGR24(%%REGc, %5, %%REGa)

1125

1126

:: "r" (&c->redDither),

1127

"m" (dummy), "m" (dummy), "m" (dummy),

1128

"r" (dest), "m" (dstW_reg)

1129

: "%"REG_a, "%"REG_c, "%"REG_d, "%"REG_S

1130

);

1131

return;

1132

case PIX_FMT_RGB555:

1133

YSCALEYUV2PACKEDX

1134

YSCALEYUV2RGBX

1135

"pxor %%mm7, %%mm7 \n\t"

1136

/* mm2=B, %%mm4=G, %%mm5=R, %%mm7=0 */

1137

#ifdef DITHER1XBPP

1138

"paddusb "BLUE_DITHER"(%0), %%mm2 \n\t"

1139

"paddusb "GREEN_DITHER"(%0), %%mm4 \n\t"

1140

"paddusb "RED_DITHER"(%0), %%mm5 \n\t"

1141

#endif

1142

1143

WRITERGB15(%4, %5, %%REGa)

1144

YSCALEYUV2PACKEDX_END

1145

return;

1146

case PIX_FMT_RGB565:

1147

YSCALEYUV2PACKEDX

1148

YSCALEYUV2RGBX

1149

"pxor %%mm7, %%mm7 \n\t"

1150

/* mm2=B, %%mm4=G, %%mm5=R, %%mm7=0 */

1151

#ifdef DITHER1XBPP

1152

"paddusb "BLUE_DITHER"(%0), %%mm2 \n\t"

1153

"paddusb "GREEN_DITHER"(%0), %%mm4 \n\t"

1154

"paddusb "RED_DITHER"(%0), %%mm5 \n\t"

1155

#endif

1156

1157

WRITERGB16(%4, %5, %%REGa)

1158

YSCALEYUV2PACKEDX_END

1159

return;

1160

case PIX_FMT_YUYV422:

1161

YSCALEYUV2PACKEDX

1162

/* mm2=B, %%mm4=G, %%mm5=R, %%mm7=0 */

1163

1164

"psraw $3, %%mm3 \n\t"

1165

"psraw $3, %%mm4 \n\t"

1166

"psraw $3, %%mm1 \n\t"

1167

"psraw $3, %%mm7 \n\t"

1168

WRITEYUY2(%4, %5, %%REGa)

1169

YSCALEYUV2PACKEDX_END

1170

return;

1171

}

1172

}

1173

}

1174

yuv2packedXinC(c, lumFilter, lumSrc, lumFilterSize,

1175

chrFilter, chrSrc, chrFilterSize,

1176

alpSrc, dest, dstW, dstY);

1177

}

1178

1179

/**

1180

* vertical bilinear scale YV12 to RGB

1181

1182

static inline void RENAME(yuv2packed2)(SwsContext *c, const uint16_t *buf0, const uint16_t *buf1, const uint16_t *uvbuf0, const uint16_t *uvbuf1,

1183

const uint16_t *abuf0, const uint16_t *abuf1, uint8_t *dest, int dstW, int yalpha, int uvalpha, int y)

1184

{

1185

int yalpha1=4095- yalpha;

1186

int uvalpha1=4095-uvalpha;

1187

int i;

1188

1189

if(!(c->flags & SWS_BITEXACT)) {

1190

switch(c->dstFormat) {

1191

//Note 8280 == DSTW_OFFSET but the preprocessor can't handle that there :(

1192

case PIX_FMT_RGB32:

1193

if (CONFIG_SWSCALE_ALPHA && c->alpPixBuf) {

1194

#if ARCH_X86_64

1195

__asm__ volatile(

1196

YSCALEYUV2RGB(%%r8, %5)

1197

YSCALEYUV2RGB_YA(%%r8, %5, %6, %7)

1198

"psraw $3, %%mm1 \n\t" /* abuf0[eax] - abuf1[eax] >>7*/

1199

"psraw $3, %%mm7 \n\t" /* abuf0[eax] - abuf1[eax] >>7*/

1200

"packuswb %%mm7, %%mm1 \n\t"

1201

WRITEBGR32(%4, 8280(%5), %%r8, %%mm2, %%mm4, %%mm5, %%mm1, %%mm0, %%mm7, %%mm3, %%mm6)

1202

1203

:: "c" (buf0), "d" (buf1), "S" (uvbuf0), "D" (uvbuf1), "r" (dest),

1204

"a" (&c->redDither)

1205

,"r" (abuf0), "r" (abuf1)

1206

: "%r8"

1207

);

1208

#else

1209

*(const uint16_t **)(&c->u_temp)=abuf0;

1210

*(const uint16_t **)(&c->v_temp)=abuf1;

1211

__asm__ volatile(

1212

"mov %%"REG_b", "ESP_OFFSET"(%5) \n\t"

1213

"mov %4, %%"REG_b" \n\t"

1214

"push %%"REG_BP" \n\t"

1215

YSCALEYUV2RGB(%%REGBP, %5)

1216

"push %0 \n\t"

1217

"push %1 \n\t"

1218

"mov "U_TEMP"(%5), %0 \n\t"

1219

"mov "V_TEMP"(%5), %1 \n\t"

1220

YSCALEYUV2RGB_YA(%%REGBP, %5, %0, %1)

1221

"psraw $3, %%mm1 \n\t" /* abuf0[eax] - abuf1[eax] >>7*/

1222

"psraw $3, %%mm7 \n\t" /* abuf0[eax] - abuf1[eax] >>7*/

1223

"packuswb %%mm7, %%mm1 \n\t"

1224

"pop %1 \n\t"

1225

"pop %0 \n\t"

1226

WRITEBGR32(%%REGb, 8280(%5), %%REGBP, %%mm2, %%mm4, %%mm5, %%mm1, %%mm0, %%mm7, %%mm3, %%mm6)

1227

"pop %%"REG_BP" \n\t"

1228

"mov "ESP_OFFSET"(%5), %%"REG_b" \n\t"

1229

1230

:: "c" (buf0), "d" (buf1), "S" (uvbuf0), "D" (uvbuf1), "m" (dest),

1231

"a" (&c->redDither)

1232

);

1233

#endif

1234

} else {

1235

__asm__ volatile(

1236

"mov %%"REG_b", "ESP_OFFSET"(%5) \n\t"

1237

"mov %4, %%"REG_b" \n\t"

1238

"push %%"REG_BP" \n\t"

1239

YSCALEYUV2RGB(%%REGBP, %5)

1240

"pcmpeqd %%mm7, %%mm7 \n\t"

1241

WRITEBGR32(%%REGb, 8280(%5), %%REGBP, %%mm2, %%mm4, %%mm5, %%mm7, %%mm0, %%mm1, %%mm3, %%mm6)

1242

"pop %%"REG_BP" \n\t"

1243

"mov "ESP_OFFSET"(%5), %%"REG_b" \n\t"

1244

1245

:: "c" (buf0), "d" (buf1), "S" (uvbuf0), "D" (uvbuf1), "m" (dest),

1246

"a" (&c->redDither)

1247

);

1248

}

1249

return;

1250

case PIX_FMT_BGR24:

1251

__asm__ volatile(

1252

"mov %%"REG_b", "ESP_OFFSET"(%5) \n\t"

1253

"mov %4, %%"REG_b" \n\t"

1254

"push %%"REG_BP" \n\t"

1255

YSCALEYUV2RGB(%%REGBP, %5)

1256

"pxor %%mm7, %%mm7 \n\t"

1257

WRITEBGR24(%%REGb, 8280(%5), %%REGBP)

1258

"pop %%"REG_BP" \n\t"

1259

"mov "ESP_OFFSET"(%5), %%"REG_b" \n\t"

1260

:: "c" (buf0), "d" (buf1), "S" (uvbuf0), "D" (uvbuf1), "m" (dest),

1261

"a" (&c->redDither)

1262

);

1263

return;

1264

case PIX_FMT_RGB555:

1265

__asm__ volatile(

1266

"mov %%"REG_b", "ESP_OFFSET"(%5) \n\t"

1267

"mov %4, %%"REG_b" \n\t"

1268

"push %%"REG_BP" \n\t"

1269

YSCALEYUV2RGB(%%REGBP, %5)

1270

"pxor %%mm7, %%mm7 \n\t"

1271

/* mm2=B, %%mm4=G, %%mm5=R, %%mm7=0 */

1272

#ifdef DITHER1XBPP

1273

"paddusb "BLUE_DITHER"(%5), %%mm2 \n\t"

1274

"paddusb "GREEN_DITHER"(%5), %%mm4 \n\t"

1275

"paddusb "RED_DITHER"(%5), %%mm5 \n\t"

1276

#endif

1277

1278

WRITERGB15(%%REGb, 8280(%5), %%REGBP)

1279

"pop %%"REG_BP" \n\t"

1280

"mov "ESP_OFFSET"(%5), %%"REG_b" \n\t"

1281

1282

:: "c" (buf0), "d" (buf1), "S" (uvbuf0), "D" (uvbuf1), "m" (dest),

1283

"a" (&c->redDither)

1284

);

1285

return;

1286

case PIX_FMT_RGB565:

1287

__asm__ volatile(

1288

"mov %%"REG_b", "ESP_OFFSET"(%5) \n\t"

1289

"mov %4, %%"REG_b" \n\t"

1290

"push %%"REG_BP" \n\t"

1291

YSCALEYUV2RGB(%%REGBP, %5)

1292

"pxor %%mm7, %%mm7 \n\t"

1293

/* mm2=B, %%mm4=G, %%mm5=R, %%mm7=0 */

1294

#ifdef DITHER1XBPP

1295

"paddusb "BLUE_DITHER"(%5), %%mm2 \n\t"

1296

"paddusb "GREEN_DITHER"(%5), %%mm4 \n\t"

1297

"paddusb "RED_DITHER"(%5), %%mm5 \n\t"

1298

#endif

1299

1300

WRITERGB16(%%REGb, 8280(%5), %%REGBP)

1301

"pop %%"REG_BP" \n\t"

1302

"mov "ESP_OFFSET"(%5), %%"REG_b" \n\t"

1303

:: "c" (buf0), "d" (buf1), "S" (uvbuf0), "D" (uvbuf1), "m" (dest),

1304

"a" (&c->redDither)

1305

);

1306

return;

1307

case PIX_FMT_YUYV422:

1308

__asm__ volatile(

1309

"mov %%"REG_b", "ESP_OFFSET"(%5) \n\t"

1310

"mov %4, %%"REG_b" \n\t"

1311

"push %%"REG_BP" \n\t"

1312

YSCALEYUV2PACKED(%%REGBP, %5)

1313

WRITEYUY2(%%REGb, 8280(%5), %%REGBP)

1314

"pop %%"REG_BP" \n\t"

1315

"mov "ESP_OFFSET"(%5), %%"REG_b" \n\t"

1316

:: "c" (buf0), "d" (buf1), "S" (uvbuf0), "D" (uvbuf1), "m" (dest),

1317

"a" (&c->redDither)

1318

);

1319

return;

1320

default: break;

1321

}

1322

}

1323

YSCALE_YUV_2_ANYRGB_C(YSCALE_YUV_2_RGB2_C, YSCALE_YUV_2_PACKED2_C(void,0), YSCALE_YUV_2_GRAY16_2_C, YSCALE_YUV_2_MONO2_C)

1324

}

1325

1326

/**

1327

* YV12 to RGB without scaling or interpolating

1328

1329

static inline void RENAME(yuv2packed1)(SwsContext *c, const uint16_t *buf0, const uint16_t *uvbuf0, const uint16_t *uvbuf1,

1330

const uint16_t *abuf0, uint8_t *dest, int dstW, int uvalpha, enum PixelFormat dstFormat, int flags, int y)

1331

{

1332

const int yalpha1=0;

1333

int i;

1334

1335

const uint16_t *buf1= buf0; //FIXME needed for RGB1/BGR1

1336

const int yalpha= 4096; //FIXME ...

1337

1338

if (flags&SWS_FULL_CHR_H_INT) {

1339

c->yuv2packed2(c, buf0, buf0, uvbuf0, uvbuf1, abuf0, abuf0, dest, dstW, 0, uvalpha, y);

1340

return;

1341

}

1342

1343

if(!(flags & SWS_BITEXACT)) {

1344

if (uvalpha < 2048) { // note this is not correct (shifts chrominance by 0.5 pixels) but it is a bit faster

1345

switch(dstFormat) {

1346

case PIX_FMT_RGB32:

1347

if (CONFIG_SWSCALE_ALPHA && c->alpPixBuf) {

1348

__asm__ volatile(

1349

"mov %%"REG_b", "ESP_OFFSET"(%5) \n\t"

1350

"mov %4, %%"REG_b" \n\t"

1351

"push %%"REG_BP" \n\t"

1352

YSCALEYUV2RGB1(%%REGBP, %5)

1353

YSCALEYUV2RGB1_ALPHA(%%REGBP)

1354

WRITEBGR32(%%REGb, 8280(%5), %%REGBP, %%mm2, %%mm4, %%mm5, %%mm7, %%mm0, %%mm1, %%mm3, %%mm6)

1355

"pop %%"REG_BP" \n\t"

1356

"mov "ESP_OFFSET"(%5), %%"REG_b" \n\t"

1357

1358

:: "c" (buf0), "d" (abuf0), "S" (uvbuf0), "D" (uvbuf1), "m" (dest),

1359

"a" (&c->redDither)

1360

);

1361

} else {

1362

__asm__ volatile(

1363

"mov %%"REG_b", "ESP_OFFSET"(%5) \n\t"

1364

"mov %4, %%"REG_b" \n\t"

1365

"push %%"REG_BP" \n\t"

1366

YSCALEYUV2RGB1(%%REGBP, %5)

1367

"pcmpeqd %%mm7, %%mm7 \n\t"

1368

WRITEBGR32(%%REGb, 8280(%5), %%REGBP, %%mm2, %%mm4, %%mm5, %%mm7, %%mm0, %%mm1, %%mm3, %%mm6)

1369

"pop %%"REG_BP" \n\t"

1370

"mov "ESP_OFFSET"(%5), %%"REG_b" \n\t"

1371

1372

:: "c" (buf0), "d" (buf1), "S" (uvbuf0), "D" (uvbuf1), "m" (dest),

1373

"a" (&c->redDither)

1374

);

1375

}

1376

return;

1377

case PIX_FMT_BGR24:

1378

__asm__ volatile(

1379

"mov %%"REG_b", "ESP_OFFSET"(%5) \n\t"

1380

"mov %4, %%"REG_b" \n\t"

1381

"push %%"REG_BP" \n\t"

1382

YSCALEYUV2RGB1(%%REGBP, %5)

1383

"pxor %%mm7, %%mm7 \n\t"

1384

WRITEBGR24(%%REGb, 8280(%5), %%REGBP)

1385

"pop %%"REG_BP" \n\t"

1386

"mov "ESP_OFFSET"(%5), %%"REG_b" \n\t"

1387

1388

:: "c" (buf0), "d" (buf1), "S" (uvbuf0), "D" (uvbuf1), "m" (dest),

1389

"a" (&c->redDither)

1390

);

1391

return;

1392

case PIX_FMT_RGB555:

1393

__asm__ volatile(

1394

"mov %%"REG_b", "ESP_OFFSET"(%5) \n\t"

1395

"mov %4, %%"REG_b" \n\t"

1396

"push %%"REG_BP" \n\t"

1397

YSCALEYUV2RGB1(%%REGBP, %5)

1398

"pxor %%mm7, %%mm7 \n\t"

1399

/* mm2=B, %%mm4=G, %%mm5=R, %%mm7=0 */

1400

#ifdef DITHER1XBPP

1401

"paddusb "BLUE_DITHER"(%5), %%mm2 \n\t"

1402

"paddusb "GREEN_DITHER"(%5), %%mm4 \n\t"

1403

"paddusb "RED_DITHER"(%5), %%mm5 \n\t"

1404

#endif

1405

WRITERGB15(%%REGb, 8280(%5), %%REGBP)

1406

"pop %%"REG_BP" \n\t"

1407

"mov "ESP_OFFSET"(%5), %%"REG_b" \n\t"

1408

1409

:: "c" (buf0), "d" (buf1), "S" (uvbuf0), "D" (uvbuf1), "m" (dest),

1410

"a" (&c->redDither)

1411

);

1412

return;

1413

case PIX_FMT_RGB565:

1414

__asm__ volatile(

1415

"mov %%"REG_b", "ESP_OFFSET"(%5) \n\t"

1416

"mov %4, %%"REG_b" \n\t"

1417

"push %%"REG_BP" \n\t"

1418

YSCALEYUV2RGB1(%%REGBP, %5)

1419

"pxor %%mm7, %%mm7 \n\t"

1420

/* mm2=B, %%mm4=G, %%mm5=R, %%mm7=0 */

1421

#ifdef DITHER1XBPP

1422

"paddusb "BLUE_DITHER"(%5), %%mm2 \n\t"

1423

"paddusb "GREEN_DITHER"(%5), %%mm4 \n\t"

1424

"paddusb "RED_DITHER"(%5), %%mm5 \n\t"

1425

#endif

1426

1427

WRITERGB16(%%REGb, 8280(%5), %%REGBP)

1428

"pop %%"REG_BP" \n\t"

1429

"mov "ESP_OFFSET"(%5), %%"REG_b" \n\t"

1430

1431

:: "c" (buf0), "d" (buf1), "S" (uvbuf0), "D" (uvbuf1), "m" (dest),

1432

"a" (&c->redDither)

1433

);

1434

return;

1435

case PIX_FMT_YUYV422:

1436

__asm__ volatile(

1437

"mov %%"REG_b", "ESP_OFFSET"(%5) \n\t"

1438

"mov %4, %%"REG_b" \n\t"

1439

"push %%"REG_BP" \n\t"

1440

YSCALEYUV2PACKED1(%%REGBP, %5)

1441

WRITEYUY2(%%REGb, 8280(%5), %%REGBP)

1442

"pop %%"REG_BP" \n\t"

1443

"mov "ESP_OFFSET"(%5), %%"REG_b" \n\t"

1444

1445

:: "c" (buf0), "d" (buf1), "S" (uvbuf0), "D" (uvbuf1), "m" (dest),

1446

"a" (&c->redDither)

1447

);

1448

return;

1449

}

1450

} else {

1451

switch(dstFormat) {

1452

case PIX_FMT_RGB32:

1453

if (CONFIG_SWSCALE_ALPHA && c->alpPixBuf) {

1454

__asm__ volatile(

1455

"mov %%"REG_b", "ESP_OFFSET"(%5) \n\t"

1456

"mov %4, %%"REG_b" \n\t"

1457

"push %%"REG_BP" \n\t"

1458

YSCALEYUV2RGB1b(%%REGBP, %5)

1459

YSCALEYUV2RGB1_ALPHA(%%REGBP)

1460

WRITEBGR32(%%REGb, 8280(%5), %%REGBP, %%mm2, %%mm4, %%mm5, %%mm7, %%mm0, %%mm1, %%mm3, %%mm6)

1461

"pop %%"REG_BP" \n\t"

1462

"mov "ESP_OFFSET"(%5), %%"REG_b" \n\t"

1463

1464

:: "c" (buf0), "d" (abuf0), "S" (uvbuf0), "D" (uvbuf1), "m" (dest),

1465

"a" (&c->redDither)

1466

);

1467

} else {

1468

__asm__ volatile(

1469

"mov %%"REG_b", "ESP_OFFSET"(%5) \n\t"

1470

"mov %4, %%"REG_b" \n\t"

1471

"push %%"REG_BP" \n\t"

1472

YSCALEYUV2RGB1b(%%REGBP, %5)

1473

"pcmpeqd %%mm7, %%mm7 \n\t"

1474

WRITEBGR32(%%REGb, 8280(%5), %%REGBP, %%mm2, %%mm4, %%mm5, %%mm7, %%mm0, %%mm1, %%mm3, %%mm6)

1475

"pop %%"REG_BP" \n\t"

1476

"mov "ESP_OFFSET"(%5), %%"REG_b" \n\t"

1477

1478

:: "c" (buf0), "d" (buf1), "S" (uvbuf0), "D" (uvbuf1), "m" (dest),

1479

"a" (&c->redDither)

1480

);

1481

}

1482

return;

1483

case PIX_FMT_BGR24:

1484

__asm__ volatile(

1485

"mov %%"REG_b", "ESP_OFFSET"(%5) \n\t"

1486

"mov %4, %%"REG_b" \n\t"

1487

"push %%"REG_BP" \n\t"

1488

YSCALEYUV2RGB1b(%%REGBP, %5)

1489

"pxor %%mm7, %%mm7 \n\t"

1490

WRITEBGR24(%%REGb, 8280(%5), %%REGBP)

1491

"pop %%"REG_BP" \n\t"

1492

"mov "ESP_OFFSET"(%5), %%"REG_b" \n\t"

1493

1494

:: "c" (buf0), "d" (buf1), "S" (uvbuf0), "D" (uvbuf1), "m" (dest),

1495

"a" (&c->redDither)

1496

);

1497

return;

1498

case PIX_FMT_RGB555:

1499

__asm__ volatile(

1500

"mov %%"REG_b", "ESP_OFFSET"(%5) \n\t"

1501

"mov %4, %%"REG_b" \n\t"

1502

"push %%"REG_BP" \n\t"

1503

YSCALEYUV2RGB1b(%%REGBP, %5)

1504

"pxor %%mm7, %%mm7 \n\t"

1505

/* mm2=B, %%mm4=G, %%mm5=R, %%mm7=0 */

1506

#ifdef DITHER1XBPP

1507

"paddusb "BLUE_DITHER"(%5), %%mm2 \n\t"

1508

"paddusb "GREEN_DITHER"(%5), %%mm4 \n\t"

1509

"paddusb "RED_DITHER"(%5), %%mm5 \n\t"

1510

#endif

1511

WRITERGB15(%%REGb, 8280(%5), %%REGBP)

1512

"pop %%"REG_BP" \n\t"

1513

"mov "ESP_OFFSET"(%5), %%"REG_b" \n\t"

1514

1515

:: "c" (buf0), "d" (buf1), "S" (uvbuf0), "D" (uvbuf1), "m" (dest),

1516

"a" (&c->redDither)

1517

);

1518

return;

1519

case PIX_FMT_RGB565:

1520

__asm__ volatile(

1521

"mov %%"REG_b", "ESP_OFFSET"(%5) \n\t"

1522

"mov %4, %%"REG_b" \n\t"

1523

"push %%"REG_BP" \n\t"

1524

YSCALEYUV2RGB1b(%%REGBP, %5)

1525

"pxor %%mm7, %%mm7 \n\t"

1526

/* mm2=B, %%mm4=G, %%mm5=R, %%mm7=0 */

1527

#ifdef DITHER1XBPP

1528

"paddusb "BLUE_DITHER"(%5), %%mm2 \n\t"

1529

"paddusb "GREEN_DITHER"(%5), %%mm4 \n\t"

1530

"paddusb "RED_DITHER"(%5), %%mm5 \n\t"

1531

#endif

1532

1533

WRITERGB16(%%REGb, 8280(%5), %%REGBP)

1534

"pop %%"REG_BP" \n\t"

1535

"mov "ESP_OFFSET"(%5), %%"REG_b" \n\t"

1536

1537

:: "c" (buf0), "d" (buf1), "S" (uvbuf0), "D" (uvbuf1), "m" (dest),

1538

"a" (&c->redDither)

1539

);

1540

return;

1541

case PIX_FMT_YUYV422:

1542

__asm__ volatile(

1543

"mov %%"REG_b", "ESP_OFFSET"(%5) \n\t"

1544

"mov %4, %%"REG_b" \n\t"

1545

"push %%"REG_BP" \n\t"

1546

YSCALEYUV2PACKED1b(%%REGBP, %5)

1547

WRITEYUY2(%%REGb, 8280(%5), %%REGBP)

1548

"pop %%"REG_BP" \n\t"

1549

"mov "ESP_OFFSET"(%5), %%"REG_b" \n\t"

1550

1551

:: "c" (buf0), "d" (buf1), "S" (uvbuf0), "D" (uvbuf1), "m" (dest),

1552

"a" (&c->redDither)

1553

);

1554

return;

1555

}

1556

}

1557

}

1558

if (uvalpha < 2048) {

1559

YSCALE_YUV_2_ANYRGB_C(YSCALE_YUV_2_RGB1_C, YSCALE_YUV_2_PACKED1_C(void,0), YSCALE_YUV_2_GRAY16_1_C, YSCALE_YUV_2_MONO2_C)

1560

} else {

1561

YSCALE_YUV_2_ANYRGB_C(YSCALE_YUV_2_RGB1B_C, YSCALE_YUV_2_PACKED1B_C(void,0), YSCALE_YUV_2_GRAY16_1_C, YSCALE_YUV_2_MONO2_C)

1562

}

1563

}

1564

1565

//FIXME yuy2* can read up to 7 samples too much

1566

1567

static inline void RENAME(yuy2ToY)(uint8_t *dst, const uint8_t *src, long width, uint32_t *unused)

1568

{

1569

__asm__ volatile(

1570

"movq "MANGLE(bm01010101)", %%mm2 \n\t"

1571

"mov %0, %%"REG_a" \n\t"

1572

"1: \n\t"

1573

"movq (%1, %%"REG_a",2), %%mm0 \n\t"

1574

"movq 8(%1, %%"REG_a",2), %%mm1 \n\t"

1575

"pand %%mm2, %%mm0 \n\t"

1576

"pand %%mm2, %%mm1 \n\t"

1577

"packuswb %%mm1, %%mm0 \n\t"

1578

"movq %%mm0, (%2, %%"REG_a") \n\t"

1579

"add $8, %%"REG_a" \n\t"

1580

" js 1b \n\t"

1581

: : "g" ((x86_reg)-width), "r" (src+width*2), "r" (dst+width)

1582

: "%"REG_a

1583

);

1584

}

1585

1586

static inline void RENAME(yuy2ToUV)(uint8_t *dstU, uint8_t *dstV, const uint8_t *src1, const uint8_t *src2, long width, uint32_t *unused)

1587

{

1588

__asm__ volatile(

1589

"movq "MANGLE(bm01010101)", %%mm4 \n\t"

1590

"mov %0, %%"REG_a" \n\t"

1591

"1: \n\t"

1592

"movq (%1, %%"REG_a",4), %%mm0 \n\t"

1593

"movq 8(%1, %%"REG_a",4), %%mm1 \n\t"

1594

"psrlw $8, %%mm0 \n\t"

1595

"psrlw $8, %%mm1 \n\t"

1596

"packuswb %%mm1, %%mm0 \n\t"

1597

"movq %%mm0, %%mm1 \n\t"

1598

"psrlw $8, %%mm0 \n\t"

1599

"pand %%mm4, %%mm1 \n\t"

1600

"packuswb %%mm0, %%mm0 \n\t"

1601

"packuswb %%mm1, %%mm1 \n\t"

1602

"movd %%mm0, (%3, %%"REG_a") \n\t"

1603

"movd %%mm1, (%2, %%"REG_a") \n\t"

1604

"add $4, %%"REG_a" \n\t"

1605

" js 1b \n\t"

1606

: : "g" ((x86_reg)-width), "r" (src1+width*4), "r" (dstU+width), "r" (dstV+width)

1607

: "%"REG_a

1608

);

1609

assert(src1 == src2);

1610

}

1611

1612

static inline void RENAME(LEToUV)(uint8_t *dstU, uint8_t *dstV, const uint8_t *src1, const uint8_t *src2, long width, uint32_t *unused)

1613

{

1614

__asm__ volatile(

1615

"mov %0, %%"REG_a" \n\t"

1616

"1: \n\t"

1617

"movq (%1, %%"REG_a",2), %%mm0 \n\t"

1618

"movq 8(%1, %%"REG_a",2), %%mm1 \n\t"

1619

"movq (%2, %%"REG_a",2), %%mm2 \n\t"

1620

"movq 8(%2, %%"REG_a",2), %%mm3 \n\t"

1621

"psrlw $8, %%mm0 \n\t"

1622

"psrlw $8, %%mm1 \n\t"

1623

"psrlw $8, %%mm2 \n\t"

1624

"psrlw $8, %%mm3 \n\t"

1625

"packuswb %%mm1, %%mm0 \n\t"

1626

"packuswb %%mm3, %%mm2 \n\t"

1627

"movq %%mm0, (%3, %%"REG_a") \n\t"

1628

"movq %%mm2, (%4, %%"REG_a") \n\t"

1629

"add $8, %%"REG_a" \n\t"

1630

" js 1b \n\t"

1631

: : "g" ((x86_reg)-width), "r" (src1+width*2), "r" (src2+width*2), "r" (dstU+width), "r" (dstV+width)

1632

: "%"REG_a

1633

);

1634

}

1635

1636

/* This is almost identical to the previous, end exists only because

1637

* yuy2ToY/UV)(dst, src+1, ...) would have 100% unaligned accesses. */

1638

static inline void RENAME(uyvyToY)(uint8_t *dst, const uint8_t *src, long width, uint32_t *unused)

1639

{

1640

__asm__ volatile(

1641

"mov %0, %%"REG_a" \n\t"

1642

"1: \n\t"

1643

"movq (%1, %%"REG_a",2), %%mm0 \n\t"

1644

"movq 8(%1, %%"REG_a",2), %%mm1 \n\t"

1645

"psrlw $8, %%mm0 \n\t"

1646

"psrlw $8, %%mm1 \n\t"

1647

"packuswb %%mm1, %%mm0 \n\t"

1648

"movq %%mm0, (%2, %%"REG_a") \n\t"

1649

"add $8, %%"REG_a" \n\t"

1650

" js 1b \n\t"

1651

: : "g" ((x86_reg)-width), "r" (src+width*2), "r" (dst+width)

1652

: "%"REG_a

1653

);

1654

}

1655

1656

static inline void RENAME(uyvyToUV)(uint8_t *dstU, uint8_t *dstV, const uint8_t *src1, const uint8_t *src2, long width, uint32_t *unused)

1657

{

1658

__asm__ volatile(

1659

"movq "MANGLE(bm01010101)", %%mm4 \n\t"

1660

"mov %0, %%"REG_a" \n\t"

1661

"1: \n\t"

1662

"movq (%1, %%"REG_a",4), %%mm0 \n\t"

1663

"movq 8(%1, %%"REG_a",4), %%mm1 \n\t"

1664

"pand %%mm4, %%mm0 \n\t"

1665

"pand %%mm4, %%mm1 \n\t"

1666

"packuswb %%mm1, %%mm0 \n\t"

1667

"movq %%mm0, %%mm1 \n\t"

1668

"psrlw $8, %%mm0 \n\t"

1669

"pand %%mm4, %%mm1 \n\t"

1670

"packuswb %%mm0, %%mm0 \n\t"

1671

"packuswb %%mm1, %%mm1 \n\t"

1672

"movd %%mm0, (%3, %%"REG_a") \n\t"

1673

"movd %%mm1, (%2, %%"REG_a") \n\t"

1674

"add $4, %%"REG_a" \n\t"

1675

" js 1b \n\t"

1676

: : "g" ((x86_reg)-width), "r" (src1+width*4), "r" (dstU+width), "r" (dstV+width)

1677

: "%"REG_a

1678

);

1679

assert(src1 == src2);

1680

}

1681

1682

static inline void RENAME(BEToUV)(uint8_t *dstU, uint8_t *dstV, const uint8_t *src1, const uint8_t *src2, long width, uint32_t *unused)

1683

{

1684

__asm__ volatile(

1685

"movq "MANGLE(bm01010101)", %%mm4 \n\t"

1686

"mov %0, %%"REG_a" \n\t"

1687

"1: \n\t"

1688

"movq (%1, %%"REG_a",2), %%mm0 \n\t"

1689

"movq 8(%1, %%"REG_a",2), %%mm1 \n\t"

1690

"movq (%2, %%"REG_a",2), %%mm2 \n\t"

1691

"movq 8(%2, %%"REG_a",2), %%mm3 \n\t"

1692

"pand %%mm4, %%mm0 \n\t"

1693

"pand %%mm4, %%mm1 \n\t"

1694

"pand %%mm4, %%mm2 \n\t"

1695

"pand %%mm4, %%mm3 \n\t"

1696

"packuswb %%mm1, %%mm0 \n\t"

1697

"packuswb %%mm3, %%mm2 \n\t"

1698

"movq %%mm0, (%3, %%"REG_a") \n\t"

1699

"movq %%mm2, (%4, %%"REG_a") \n\t"

1700

"add $8, %%"REG_a" \n\t"

1701

" js 1b \n\t"

1702

: : "g" ((x86_reg)-width), "r" (src1+width*2), "r" (src2+width*2), "r" (dstU+width), "r" (dstV+width)

1703

: "%"REG_a

1704

);

1705

}

1706

1707

static inline void RENAME(nvXXtoUV)(uint8_t *dst1, uint8_t *dst2,

1708

const uint8_t *src, long width)

1709

{

1710

__asm__ volatile(

1711

"movq "MANGLE(bm01010101)", %%mm4 \n\t"

1712

"mov %0, %%"REG_a" \n\t"

1713

"1: \n\t"

1714

"movq (%1, %%"REG_a",2), %%mm0 \n\t"

1715

"movq 8(%1, %%"REG_a",2), %%mm1 \n\t"

1716

"movq %%mm0, %%mm2 \n\t"

1717

"movq %%mm1, %%mm3 \n\t"

1718

"pand %%mm4, %%mm0 \n\t"

1719

"pand %%mm4, %%mm1 \n\t"

1720

"psrlw $8, %%mm2 \n\t"

1721

"psrlw $8, %%mm3 \n\t"

1722

"packuswb %%mm1, %%mm0 \n\t"

1723

"packuswb %%mm3, %%mm2 \n\t"

1724

"movq %%mm0, (%2, %%"REG_a") \n\t"

1725

"movq %%mm2, (%3, %%"REG_a") \n\t"

1726

"add $8, %%"REG_a" \n\t"

1727

" js 1b \n\t"

1728

: : "g" ((x86_reg)-width), "r" (src+width*2), "r" (dst1+width), "r" (dst2+width)

1729

: "%"REG_a

1730

);

1731

}

1732

1733

static inline void RENAME(nv12ToUV)(uint8_t *dstU, uint8_t *dstV,

1734

const uint8_t *src1, const uint8_t *src2,

1735

long width, uint32_t *unused)

1736

{

1737

RENAME(nvXXtoUV)(dstU, dstV, src1, width);

1738

}

1739

1740

static inline void RENAME(nv21ToUV)(uint8_t *dstU, uint8_t *dstV,

1741

const uint8_t *src1, const uint8_t *src2,

1742

long width, uint32_t *unused)

1743

{

1744

RENAME(nvXXtoUV)(dstV, dstU, src1, width);

1745

}

1746

1747

static inline void RENAME(bgr24ToY_mmx)(uint8_t *dst, const uint8_t *src, long width, enum PixelFormat srcFormat)

1748

{

1749

1750

if(srcFormat == PIX_FMT_BGR24) {

1751

__asm__ volatile(

1752

"movq "MANGLE(ff_bgr24toY1Coeff)", %%mm5 \n\t"

1753

"movq "MANGLE(ff_bgr24toY2Coeff)", %%mm6 \n\t"

1754

1755

);

1756

} else {

1757

__asm__ volatile(

1758

"movq "MANGLE(ff_rgb24toY1Coeff)", %%mm5 \n\t"

1759

"movq "MANGLE(ff_rgb24toY2Coeff)", %%mm6 \n\t"

1760

1761

);

1762

}

1763

1764

__asm__ volatile(

1765

"movq "MANGLE(ff_bgr24toYOffset)", %%mm4 \n\t"

1766

"mov %2, %%"REG_a" \n\t"

1767

"pxor %%mm7, %%mm7 \n\t"

1768

"1: \n\t"

1769

PREFETCH" 64(%0) \n\t"

1770

"movd (%0), %%mm0 \n\t"

1771

"movd 2(%0), %%mm1 \n\t"

1772

"movd 6(%0), %%mm2 \n\t"

1773

"movd 8(%0), %%mm3 \n\t"

1774

"add $12, %0 \n\t"

1775

"punpcklbw %%mm7, %%mm0 \n\t"

1776

"punpcklbw %%mm7, %%mm1 \n\t"

1777

"punpcklbw %%mm7, %%mm2 \n\t"

1778

"punpcklbw %%mm7, %%mm3 \n\t"

1779

"pmaddwd %%mm5, %%mm0 \n\t"

1780

"pmaddwd %%mm6, %%mm1 \n\t"

1781

"pmaddwd %%mm5, %%mm2 \n\t"

1782

"pmaddwd %%mm6, %%mm3 \n\t"

1783

"paddd %%mm1, %%mm0 \n\t"

1784

"paddd %%mm3, %%mm2 \n\t"

1785

"paddd %%mm4, %%mm0 \n\t"

1786

"paddd %%mm4, %%mm2 \n\t"

1787

"psrad $15, %%mm0 \n\t"

1788

"psrad $15, %%mm2 \n\t"

1789

"packssdw %%mm2, %%mm0 \n\t"

1790

"packuswb %%mm0, %%mm0 \n\t"

1791

"movd %%mm0, (%1, %%"REG_a") \n\t"

1792

"add $4, %%"REG_a" \n\t"

1793

" js 1b \n\t"

1794

: "+r" (src)

1795

: "r" (dst+width), "g" ((x86_reg)-width)

1796

: "%"REG_a

1797

);

1798

}

1799

1800

static inline void RENAME(bgr24ToUV_mmx)(uint8_t *dstU, uint8_t *dstV, const uint8_t *src, long width, enum PixelFormat srcFormat)

1801

{

1802

__asm__ volatile(

1803

"movq 24(%4), %%mm6 \n\t"

1804

"mov %3, %%"REG_a" \n\t"

1805

"pxor %%mm7, %%mm7 \n\t"

1806

"1: \n\t"

1807

PREFETCH" 64(%0) \n\t"

1808

"movd (%0), %%mm0 \n\t"

1809

"movd 2(%0), %%mm1 \n\t"

1810

"punpcklbw %%mm7, %%mm0 \n\t"

1811

"punpcklbw %%mm7, %%mm1 \n\t"

1812

"movq %%mm0, %%mm2 \n\t"

1813

"movq %%mm1, %%mm3 \n\t"

1814

"pmaddwd (%4), %%mm0 \n\t"

1815

"pmaddwd 8(%4), %%mm1 \n\t"

1816

"pmaddwd 16(%4), %%mm2 \n\t"

1817

"pmaddwd %%mm6, %%mm3 \n\t"

1818

"paddd %%mm1, %%mm0 \n\t"

1819

"paddd %%mm3, %%mm2 \n\t"

1820

1821

"movd 6(%0), %%mm1 \n\t"

1822

"movd 8(%0), %%mm3 \n\t"

1823

"add $12, %0 \n\t"

1824

"punpcklbw %%mm7, %%mm1 \n\t"

1825

"punpcklbw %%mm7, %%mm3 \n\t"

1826

"movq %%mm1, %%mm4 \n\t"

1827

"movq %%mm3, %%mm5 \n\t"

1828

"pmaddwd (%4), %%mm1 \n\t"

1829

"pmaddwd 8(%4), %%mm3 \n\t"

1830

"pmaddwd 16(%4), %%mm4 \n\t"

1831

"pmaddwd %%mm6, %%mm5 \n\t"

1832

"paddd %%mm3, %%mm1 \n\t"

1833

"paddd %%mm5, %%mm4 \n\t"

1834

1835

"movq "MANGLE(ff_bgr24toUVOffset)", %%mm3 \n\t"

1836

"paddd %%mm3, %%mm0 \n\t"

1837

"paddd %%mm3, %%mm2 \n\t"

1838

"paddd %%mm3, %%mm1 \n\t"

1839

"paddd %%mm3, %%mm4 \n\t"

1840

"psrad $15, %%mm0 \n\t"

1841

"psrad $15, %%mm2 \n\t"

1842

"psrad $15, %%mm1 \n\t"

1843

"psrad $15, %%mm4 \n\t"

1844

"packssdw %%mm1, %%mm0 \n\t"

1845

"packssdw %%mm4, %%mm2 \n\t"

1846

"packuswb %%mm0, %%mm0 \n\t"

1847

"packuswb %%mm2, %%mm2 \n\t"

1848

"movd %%mm0, (%1, %%"REG_a") \n\t"

1849

"movd %%mm2, (%2, %%"REG_a") \n\t"

1850

"add $4, %%"REG_a" \n\t"

1851

" js 1b \n\t"

1852

: "+r" (src)

1853

: "r" (dstU+width), "r" (dstV+width), "g" ((x86_reg)-width), "r"(ff_bgr24toUV[srcFormat == PIX_FMT_RGB24])

1854

: "%"REG_a

1855

);

1856

}

1857

1858

static inline void RENAME(bgr24ToY)(uint8_t *dst, const uint8_t *src, long width, uint32_t *unused)

1859

{

1860

RENAME(bgr24ToY_mmx)(dst, src, width, PIX_FMT_BGR24);

1861

}

1862

1863

static inline void RENAME(bgr24ToUV)(uint8_t *dstU, uint8_t *dstV, const uint8_t *src1, const uint8_t *src2, long width, uint32_t *unused)

1864

{

1865

RENAME(bgr24ToUV_mmx)(dstU, dstV, src1, width, PIX_FMT_BGR24);

1866

assert(src1 == src2);

1867

}

1868

1869

static inline void RENAME(bgr24ToUV_half)(uint8_t *dstU, uint8_t *dstV, const uint8_t *src1, const uint8_t *src2, long width, uint32_t *unused)

1870

{

1871

int i;

1872

for (i=0; i<width; i++) {

1873

int b= src1[6*i + 0] + src1[6*i + 3];

1874

int g= src1[6*i + 1] + src1[6*i + 4];

1875

int r= src1[6*i + 2] + src1[6*i + 5];

1876

1877

dstU[i]= (RU*r + GU*g + BU*b + (257<<RGB2YUV_SHIFT))>>(RGB2YUV_SHIFT+1);

1878

dstV[i]= (RV*r + GV*g + BV*b + (257<<RGB2YUV_SHIFT))>>(RGB2YUV_SHIFT+1);

1879

}

1880

assert(src1 == src2);

1881

}

1882

1883

static inline void RENAME(rgb24ToY)(uint8_t *dst, const uint8_t *src, long width, uint32_t *unused)

1884

{

1885

RENAME(bgr24ToY_mmx)(dst, src, width, PIX_FMT_RGB24);

1886

}

1887

1888

static inline void RENAME(rgb24ToUV)(uint8_t *dstU, uint8_t *dstV, const uint8_t *src1, const uint8_t *src2, long width, uint32_t *unused)

1889

{

1890

assert(src1==src2);

1891

RENAME(bgr24ToUV_mmx)(dstU, dstV, src1, width, PIX_FMT_RGB24);

1892

}

1893

1894

static inline void RENAME(rgb24ToUV_half)(uint8_t *dstU, uint8_t *dstV, const uint8_t *src1, const uint8_t *src2, long width, uint32_t *unused)

1895

{

1896

int i;

1897

assert(src1==src2);

1898

for (i=0; i<width; i++) {

1899

int r= src1[6*i + 0] + src1[6*i + 3];

1900

int g= src1[6*i + 1] + src1[6*i + 4];

1901

int b= src1[6*i + 2] + src1[6*i + 5];

1902

1903

dstU[i]= (RU*r + GU*g + BU*b + (257<<RGB2YUV_SHIFT))>>(RGB2YUV_SHIFT+1);

1904

dstV[i]= (RV*r + GV*g + BV*b + (257<<RGB2YUV_SHIFT))>>(RGB2YUV_SHIFT+1);

1905

}

1906

}

1907

1908

1909

// bilinear / bicubic scaling

1910

static inline void RENAME(hScale)(int16_t *dst, int dstW, const uint8_t *src, int srcW, int xInc,

1911

const int16_t *filter, const int16_t *filterPos, long filterSize)

1912

{

1913

assert(filterSize % 4 == 0 && filterSize>0);

1914

if (filterSize==4) { // Always true for upscaling, sometimes for down, too.

1915

x86_reg counter= -2*dstW;

1916

filter-= counter*2;

1917

filterPos-= counter/2;

1918

dst-= counter/2;

1919

__asm__ volatile(

1920

#if defined(PIC)

1921

"push %%"REG_b" \n\t"

1922

#endif

1923

"pxor %%mm7, %%mm7 \n\t"

1924

"push %%"REG_BP" \n\t" // we use 7 regs here ...

1925

"mov %%"REG_a", %%"REG_BP" \n\t"

1926

".p2align 4 \n\t"

1927

"1: \n\t"

1928

"movzwl (%2, %%"REG_BP"), %%eax \n\t"

1929

"movzwl 2(%2, %%"REG_BP"), %%ebx \n\t"

1930

"movq (%1, %%"REG_BP", 4), %%mm1 \n\t"

1931

"movq 8(%1, %%"REG_BP", 4), %%mm3 \n\t"

1932

"movd (%3, %%"REG_a"), %%mm0 \n\t"

1933

"movd (%3, %%"REG_b"), %%mm2 \n\t"

1934

"punpcklbw %%mm7, %%mm0 \n\t"

1935

"punpcklbw %%mm7, %%mm2 \n\t"

1936

"pmaddwd %%mm1, %%mm0 \n\t"

1937

"pmaddwd %%mm2, %%mm3 \n\t"

1938

"movq %%mm0, %%mm4 \n\t"

1939

"punpckldq %%mm3, %%mm0 \n\t"

1940

"punpckhdq %%mm3, %%mm4 \n\t"

1941

"paddd %%mm4, %%mm0 \n\t"

1942

"psrad $7, %%mm0 \n\t"

1943

"packssdw %%mm0, %%mm0 \n\t"

1944

"movd %%mm0, (%4, %%"REG_BP") \n\t"

1945

"add $4, %%"REG_BP" \n\t"

1946

" jnc 1b \n\t"

1947

1948

"pop %%"REG_BP" \n\t"

1949

#if defined(PIC)

1950

"pop %%"REG_b" \n\t"

1951

#endif

1952

: "+a" (counter)

1953

: "c" (filter), "d" (filterPos), "S" (src), "D" (dst)

1954

#if !defined(PIC)

1955

: "%"REG_b

1956

#endif

1957

);

1958

} else if (filterSize==8) {

1959

x86_reg counter= -2*dstW;

1960

filter-= counter*4;

1961

filterPos-= counter/2;

1962

dst-= counter/2;

1963

__asm__ volatile(

1964

#if defined(PIC)

1965

"push %%"REG_b" \n\t"

1966

#endif

1967

"pxor %%mm7, %%mm7 \n\t"

1968

"push %%"REG_BP" \n\t" // we use 7 regs here ...

1969

"mov %%"REG_a", %%"REG_BP" \n\t"

1970

".p2align 4 \n\t"

1971

"1: \n\t"

1972

"movzwl (%2, %%"REG_BP"), %%eax \n\t"

1973

"movzwl 2(%2, %%"REG_BP"), %%ebx \n\t"

1974

"movq (%1, %%"REG_BP", 8), %%mm1 \n\t"

1975

"movq 16(%1, %%"REG_BP", 8), %%mm3 \n\t"

1976

"movd (%3, %%"REG_a"), %%mm0 \n\t"

1977

"movd (%3, %%"REG_b"), %%mm2 \n\t"

1978

"punpcklbw %%mm7, %%mm0 \n\t"

1979

"punpcklbw %%mm7, %%mm2 \n\t"

1980

"pmaddwd %%mm1, %%mm0 \n\t"

1981

"pmaddwd %%mm2, %%mm3 \n\t"

1982

1983

"movq 8(%1, %%"REG_BP", 8), %%mm1 \n\t"

1984

"movq 24(%1, %%"REG_BP", 8), %%mm5 \n\t"

1985

"movd 4(%3, %%"REG_a"), %%mm4 \n\t"

1986

"movd 4(%3, %%"REG_b"), %%mm2 \n\t"

1987

"punpcklbw %%mm7, %%mm4 \n\t"

1988

"punpcklbw %%mm7, %%mm2 \n\t"

1989

"pmaddwd %%mm1, %%mm4 \n\t"

1990

"pmaddwd %%mm2, %%mm5 \n\t"

1991

"paddd %%mm4, %%mm0 \n\t"

1992

"paddd %%mm5, %%mm3 \n\t"

1993

"movq %%mm0, %%mm4 \n\t"

1994

"punpckldq %%mm3, %%mm0 \n\t"

1995

"punpckhdq %%mm3, %%mm4 \n\t"

1996

"paddd %%mm4, %%mm0 \n\t"

1997

"psrad $7, %%mm0 \n\t"

1998

"packssdw %%mm0, %%mm0 \n\t"

1999

"movd %%mm0, (%4, %%"REG_BP") \n\t"

2000

"add $4, %%"REG_BP" \n\t"

2001

" jnc 1b \n\t"

2002

2003

"pop %%"REG_BP" \n\t"

2004

#if defined(PIC)

2005

"pop %%"REG_b" \n\t"

2006

#endif

2007

: "+a" (counter)

2008

: "c" (filter), "d" (filterPos), "S" (src), "D" (dst)

2009

#if !defined(PIC)

2010

: "%"REG_b

2011

#endif

2012

);

2013

} else {

2014

const uint8_t *offset = src+filterSize;

2015

x86_reg counter= -2*dstW;

2016

//filter-= counter*filterSize/2;

2017

filterPos-= counter/2;

2018

dst-= counter/2;

2019

__asm__ volatile(

2020

"pxor %%mm7, %%mm7 \n\t"

2021

".p2align 4 \n\t"

2022

"1: \n\t"

2023

"mov %2, %%"REG_c" \n\t"

2024

"movzwl (%%"REG_c", %0), %%eax \n\t"

2025

"movzwl 2(%%"REG_c", %0), %%edx \n\t"

2026

"mov %5, %%"REG_c" \n\t"

2027

"pxor %%mm4, %%mm4 \n\t"

2028

"pxor %%mm5, %%mm5 \n\t"

2029

"2: \n\t"

2030

"movq (%1), %%mm1 \n\t"

2031

"movq (%1, %6), %%mm3 \n\t"

2032

"movd (%%"REG_c", %%"REG_a"), %%mm0 \n\t"

2033

"movd (%%"REG_c", %%"REG_d"), %%mm2 \n\t"

2034

"punpcklbw %%mm7, %%mm0 \n\t"

2035

"punpcklbw %%mm7, %%mm2 \n\t"

2036

"pmaddwd %%mm1, %%mm0 \n\t"

2037

"pmaddwd %%mm2, %%mm3 \n\t"

2038

"paddd %%mm3, %%mm5 \n\t"

2039

"paddd %%mm0, %%mm4 \n\t"

2040

"add $8, %1 \n\t"

2041

"add $4, %%"REG_c" \n\t"

2042

"cmp %4, %%"REG_c" \n\t"

2043

" jb 2b \n\t"

2044

"add %6, %1 \n\t"

2045

"movq %%mm4, %%mm0 \n\t"

2046

"punpckldq %%mm5, %%mm4 \n\t"

2047

"punpckhdq %%mm5, %%mm0 \n\t"

2048

"paddd %%mm0, %%mm4 \n\t"

2049

"psrad $7, %%mm4 \n\t"

2050

"packssdw %%mm4, %%mm4 \n\t"

2051

"mov %3, %%"REG_a" \n\t"

2052

"movd %%mm4, (%%"REG_a", %0) \n\t"

2053

"add $4, %0 \n\t"

2054

" jnc 1b \n\t"

2055

2056

: "+r" (counter), "+r" (filter)

2057

: "m" (filterPos), "m" (dst), "m"(offset),

2058

"m" (src), "r" ((x86_reg)filterSize*2)

2059

: "%"REG_a, "%"REG_c, "%"REG_d

2060

);

2061

}

2062

}

2063

2064

//FIXME all pal and rgb srcFormats could do this convertion as well

2065

//FIXME all scalers more complex than bilinear could do half of this transform

2066

static void RENAME(chrRangeToJpeg)(uint16_t *dst, int width)

2067

{

2068

int i;

2069

for (i = 0; i < width; i++) {

2070

dst[i ] = (FFMIN(dst[i ],30775)*4663 - 9289992)>>12; //-264

2071

dst[i+VOFW] = (FFMIN(dst[i+VOFW],30775)*4663 - 9289992)>>12; //-264

2072

}

2073

}

2074

static void RENAME(chrRangeFromJpeg)(uint16_t *dst, int width)

2075

{

2076

int i;

2077

for (i = 0; i < width; i++) {

2078

dst[i ] = (dst[i ]*1799 + 4081085)>>11; //1469

2079

dst[i+VOFW] = (dst[i+VOFW]*1799 + 4081085)>>11; //1469

2080

}

2081

}

2082

static void RENAME(lumRangeToJpeg)(uint16_t *dst, int width)

2083

{

2084

int i;

2085

for (i = 0; i < width; i++)

2086

dst[i] = (FFMIN(dst[i],30189)*19077 - 39057361)>>14;

2087

}

2088

static void RENAME(lumRangeFromJpeg)(uint16_t *dst, int width)

2089

{

2090

int i;

2091

for (i = 0; i < width; i++)

2092

dst[i] = (dst[i]*14071 + 33561947)>>14;

2093

}

2094

2095

#define FAST_BILINEAR_X86 \

2096

"subl %%edi, %%esi \n\t" /* src[xx+1] - src[xx] */ \

2097

"imull %%ecx, %%esi \n\t" /* (src[xx+1] - src[xx])*xalpha */ \

2098

"shll $16, %%edi \n\t" \

2099

"addl %%edi, %%esi \n\t" /* src[xx+1]*xalpha + src[xx]*(1-xalpha) */ \

2100

"mov %1, %%"REG_D"\n\t" \

2101

"shrl $9, %%esi \n\t" \

2102

2103

static inline void RENAME(hyscale_fast)(SwsContext *c, int16_t *dst,

2104

long dstWidth, const uint8_t *src, int srcW,

2105

int xInc)

2106

{

2107

#if COMPILE_TEMPLATE_MMX2

2108

int32_t *filterPos = c->hLumFilterPos;

2109

int16_t *filter = c->hLumFilter;

2110

int canMMX2BeUsed = c->canMMX2BeUsed;

2111

void *mmx2FilterCode= c->lumMmx2FilterCode;

2112

int i;

2113

#if defined(PIC)

2114

DECLARE_ALIGNED(8, uint64_t, ebxsave);

2115

#endif

2116

if (canMMX2BeUsed) {

2117

__asm__ volatile(

2118

#if defined(PIC)

2119

"mov %%"REG_b", %5 \n\t"

2120

#endif

2121

"pxor %%mm7, %%mm7 \n\t"

2122

"mov %0, %%"REG_c" \n\t"

2123

"mov %1, %%"REG_D" \n\t"

2124

"mov %2, %%"REG_d" \n\t"

2125

"mov %3, %%"REG_b" \n\t"

2126

"xor %%"REG_a", %%"REG_a" \n\t" // i

2127

PREFETCH" (%%"REG_c") \n\t"

2128

PREFETCH" 32(%%"REG_c") \n\t"

2129

PREFETCH" 64(%%"REG_c") \n\t"

2130

2131

#if ARCH_X86_64

2132

2133

#define CALL_MMX2_FILTER_CODE \

2134

"movl (%%"REG_b"), %%esi \n\t"\

2135

"call *%4 \n\t"\

2136

"movl (%%"REG_b", %%"REG_a"), %%esi \n\t"\

2137

"add %%"REG_S", %%"REG_c" \n\t"\

2138

"add %%"REG_a", %%"REG_D" \n\t"\

2139

"xor %%"REG_a", %%"REG_a" \n\t"\

2140

2141

#else

2142

2143

#define CALL_MMX2_FILTER_CODE \

2144

"movl (%%"REG_b"), %%esi \n\t"\

2145

"call *%4 \n\t"\

2146

"addl (%%"REG_b", %%"REG_a"), %%"REG_c" \n\t"\

2147

"add %%"REG_a", %%"REG_D" \n\t"\

2148

"xor %%"REG_a", %%"REG_a" \n\t"\

2149

2150

#endif /* ARCH_X86_64 */

2151

2152

CALL_MMX2_FILTER_CODE

2153

CALL_MMX2_FILTER_CODE

2154

CALL_MMX2_FILTER_CODE

2155

CALL_MMX2_FILTER_CODE

2156

CALL_MMX2_FILTER_CODE

2157

CALL_MMX2_FILTER_CODE

2158

CALL_MMX2_FILTER_CODE

2159

CALL_MMX2_FILTER_CODE

2160

2161

#if defined(PIC)

2162

"mov %5, %%"REG_b" \n\t"

2163

#endif

2164

:: "m" (src), "m" (dst), "m" (filter), "m" (filterPos),

2165

"m" (mmx2FilterCode)

2166

#if defined(PIC)

2167

,"m" (ebxsave)

2168

#endif

2169

: "%"REG_a, "%"REG_c, "%"REG_d, "%"REG_S, "%"REG_D

2170

#if !defined(PIC)

2171

,"%"REG_b

2172

#endif

2173

);

2174

for (i=dstWidth-1; (i*xInc)>>16 >=srcW-1; i--) dst[i] = src[srcW-1]*128;

2175

} else {

2176

#endif /* COMPILE_TEMPLATE_MMX2 */

2177

x86_reg xInc_shr16 = xInc >> 16;

2178

uint16_t xInc_mask = xInc & 0xffff;

2179

x86_reg dstWidth_reg = dstWidth;

2180

//NO MMX just normal asm ...

2181

__asm__ volatile(

2182

"xor %%"REG_a", %%"REG_a" \n\t" // i

2183

"xor %%"REG_d", %%"REG_d" \n\t" // xx

2184

"xorl %%ecx, %%ecx \n\t" // xalpha

2185

".p2align 4 \n\t"

2186

"1: \n\t"

2187

"movzbl (%0, %%"REG_d"), %%edi \n\t" //src[xx]

2188

"movzbl 1(%0, %%"REG_d"), %%esi \n\t" //src[xx+1]

2189

FAST_BILINEAR_X86

2190

"movw %%si, (%%"REG_D", %%"REG_a", 2) \n\t"

2191

"addw %4, %%cx \n\t" //xalpha += xInc&0xFFFF

2192

"adc %3, %%"REG_d" \n\t" //xx+= xInc>>16 + carry

2193

2194

"movzbl (%0, %%"REG_d"), %%edi \n\t" //src[xx]

2195

"movzbl 1(%0, %%"REG_d"), %%esi \n\t" //src[xx+1]

2196

FAST_BILINEAR_X86

2197

"movw %%si, 2(%%"REG_D", %%"REG_a", 2) \n\t"

2198

"addw %4, %%cx \n\t" //xalpha += xInc&0xFFFF

2199

"adc %3, %%"REG_d" \n\t" //xx+= xInc>>16 + carry

2200

2201

2202

"add $2, %%"REG_a" \n\t"

2203

"cmp %2, %%"REG_a" \n\t"

2204

" jb 1b \n\t"

2205

2206

2207

:: "r" (src), "m" (dst), "m" (dstWidth_reg), "m" (xInc_shr16), "m" (xInc_mask)

2208

: "%"REG_a, "%"REG_d, "%ecx", "%"REG_D, "%esi"

2209

);

2210

#if COMPILE_TEMPLATE_MMX2

2211

} //if MMX2 can't be used

2212

#endif

2213

}

2214

2215

// *** horizontal scale Y line to temp buffer

2216

static inline void RENAME(hyscale)(SwsContext *c, uint16_t *dst, long dstWidth, const uint8_t *src, int srcW, int xInc,

2217

const int16_t *hLumFilter,

2218

const int16_t *hLumFilterPos, int hLumFilterSize,

2219

uint8_t *formatConvBuffer,

2220

uint32_t *pal, int isAlpha)

2221

{

2222

void (*toYV12)(uint8_t *, const uint8_t *, long, uint32_t *) = isAlpha ? c->alpToYV12 : c->lumToYV12;

2223

void (*convertRange)(uint16_t *, int) = isAlpha ? NULL : c->lumConvertRange;

2224

2225

src += isAlpha ? c->alpSrcOffset : c->lumSrcOffset;

2226

2227

if (toYV12) {

2228

toYV12(formatConvBuffer, src, srcW, pal);

2229

src= formatConvBuffer;

2230

}

2231

2232

if (!c->hyscale_fast) {

2233

c->hScale(dst, dstWidth, src, srcW, xInc, hLumFilter, hLumFilterPos, hLumFilterSize);

2234

} else { // fast bilinear upscale / crap downscale

2235

c->hyscale_fast(c, dst, dstWidth, src, srcW, xInc);

2236

}

2237

2238

if (convertRange)

2239

convertRange(dst, dstWidth);

2240

}

2241

2242

static inline void RENAME(hcscale_fast)(SwsContext *c, int16_t *dst,

2243

long dstWidth, const uint8_t *src1,

2244

const uint8_t *src2, int srcW, int xInc)

2245

{

2246

#if COMPILE_TEMPLATE_MMX2

2247

int32_t *filterPos = c->hChrFilterPos;

2248

int16_t *filter = c->hChrFilter;

2249

int canMMX2BeUsed = c->canMMX2BeUsed;

2250

void *mmx2FilterCode= c->chrMmx2FilterCode;

2251

int i;

2252

#if defined(PIC)

2253

DECLARE_ALIGNED(8, uint64_t, ebxsave);

2254

#endif

2255

if (canMMX2BeUsed) {

2256

__asm__ volatile(

2257

#if defined(PIC)

2258

"mov %%"REG_b", %6 \n\t"

2259

#endif

2260

"pxor %%mm7, %%mm7 \n\t"

2261

"mov %0, %%"REG_c" \n\t"

2262

"mov %1, %%"REG_D" \n\t"

2263

"mov %2, %%"REG_d" \n\t"

2264

"mov %3, %%"REG_b" \n\t"

2265

"xor %%"REG_a", %%"REG_a" \n\t" // i

2266

PREFETCH" (%%"REG_c") \n\t"

2267

PREFETCH" 32(%%"REG_c") \n\t"

2268

PREFETCH" 64(%%"REG_c") \n\t"

2269

2270

CALL_MMX2_FILTER_CODE

2271

CALL_MMX2_FILTER_CODE

2272

CALL_MMX2_FILTER_CODE

2273

CALL_MMX2_FILTER_CODE

2274

"xor %%"REG_a", %%"REG_a" \n\t" // i

2275

"mov %5, %%"REG_c" \n\t" // src

2276

"mov %1, %%"REG_D" \n\t" // buf1

2277

"add $"AV_STRINGIFY(VOF)", %%"REG_D" \n\t"

2278

PREFETCH" (%%"REG_c") \n\t"

2279

PREFETCH" 32(%%"REG_c") \n\t"

2280

PREFETCH" 64(%%"REG_c") \n\t"

2281

2282

CALL_MMX2_FILTER_CODE

2283

CALL_MMX2_FILTER_CODE

2284

CALL_MMX2_FILTER_CODE

2285

CALL_MMX2_FILTER_CODE

2286

2287

#if defined(PIC)

2288

"mov %6, %%"REG_b" \n\t"

2289

#endif

2290

:: "m" (src1), "m" (dst), "m" (filter), "m" (filterPos),

2291

"m" (mmx2FilterCode), "m" (src2)

2292

#if defined(PIC)

2293

,"m" (ebxsave)

2294

#endif

2295

: "%"REG_a, "%"REG_c, "%"REG_d, "%"REG_S, "%"REG_D

2296

#if !defined(PIC)

2297

,"%"REG_b

2298

#endif

2299

);

2300

for (i=dstWidth-1; (i*xInc)>>16 >=srcW-1; i--) {

2301

//printf("%d %d %d\n", dstWidth, i, srcW);

2302

dst[i] = src1[srcW-1]*128;

2303

dst[i+VOFW] = src2[srcW-1]*128;

2304

}

2305

} else {

2306

#endif /* COMPILE_TEMPLATE_MMX2 */

2307

x86_reg xInc_shr16 = (x86_reg) (xInc >> 16);

2308

uint16_t xInc_mask = xInc & 0xffff;

2309

x86_reg dstWidth_reg = dstWidth;

2310

__asm__ volatile(

2311

"xor %%"REG_a", %%"REG_a" \n\t" // i

2312

"xor %%"REG_d", %%"REG_d" \n\t" // xx

2313

"xorl %%ecx, %%ecx \n\t" // xalpha

2314

".p2align 4 \n\t"

2315

"1: \n\t"

2316

"mov %0, %%"REG_S" \n\t"

2317

"movzbl (%%"REG_S", %%"REG_d"), %%edi \n\t" //src[xx]

2318

"movzbl 1(%%"REG_S", %%"REG_d"), %%esi \n\t" //src[xx+1]

2319

FAST_BILINEAR_X86

2320

"movw %%si, (%%"REG_D", %%"REG_a", 2) \n\t"

2321

2322

"movzbl (%5, %%"REG_d"), %%edi \n\t" //src[xx]

2323

"movzbl 1(%5, %%"REG_d"), %%esi \n\t" //src[xx+1]

2324

FAST_BILINEAR_X86

2325

"movw %%si, "AV_STRINGIFY(VOF)"(%%"REG_D", %%"REG_a", 2) \n\t"

2326

2327

"addw %4, %%cx \n\t" //xalpha += xInc&0xFFFF

2328

"adc %3, %%"REG_d" \n\t" //xx+= xInc>>16 + carry

2329

"add $1, %%"REG_a" \n\t"

2330

"cmp %2, %%"REG_a" \n\t"

2331

" jb 1b \n\t"

2332

2333

/* GCC 3.3 makes MPlayer crash on IA-32 machines when using "g" operand here,

2334

which is needed to support GCC 4.0. */

2335

#if ARCH_X86_64 && AV_GCC_VERSION_AT_LEAST(3,4)

2336

:: "m" (src1), "m" (dst), "g" (dstWidth_reg), "m" (xInc_shr16), "m" (xInc_mask),

2337

#else

2338

:: "m" (src1), "m" (dst), "m" (dstWidth_reg), "m" (xInc_shr16), "m" (xInc_mask),

2339

#endif

2340

"r" (src2)

2341

: "%"REG_a, "%"REG_d, "%ecx", "%"REG_D, "%esi"

2342

);

2343

#if COMPILE_TEMPLATE_MMX2

2344

} //if MMX2 can't be used

2345

#endif

2346

}

2347

2348

inline static void RENAME(hcscale)(SwsContext *c, uint16_t *dst, long dstWidth, const uint8_t *src1, const uint8_t *src2,

2349

int srcW, int xInc, const int16_t *hChrFilter,

2350

const int16_t *hChrFilterPos, int hChrFilterSize,

2351

uint8_t *formatConvBuffer,

2352

uint32_t *pal)

2353

{

2354

2355

src1 += c->chrSrcOffset;

2356

src2 += c->chrSrcOffset;

2357

2358

if (c->chrToYV12) {

2359

c->chrToYV12(formatConvBuffer, formatConvBuffer+VOFW, src1, src2, srcW, pal);

2360

src1= formatConvBuffer;

2361

src2= formatConvBuffer+VOFW;

2362

}

2363

2364

if (!c->hcscale_fast) {

2365

c->hScale(dst , dstWidth, src1, srcW, xInc, hChrFilter, hChrFilterPos, hChrFilterSize);

2366

c->hScale(dst+VOFW, dstWidth, src2, srcW, xInc, hChrFilter, hChrFilterPos, hChrFilterSize);

2367

} else { // fast bilinear upscale / crap downscale

2368

c->hcscale_fast(c, dst, dstWidth, src1, src2, srcW, xInc);

2369

}

2370

2371

if (c->chrConvertRange)

2372

c->chrConvertRange(dst, dstWidth);

2373

}

2374

2375

#define DEBUG_SWSCALE_BUFFERS 0

2376

#define DEBUG_BUFFERS(...) if (DEBUG_SWSCALE_BUFFERS) av_log(c, AV_LOG_DEBUG, __VA_ARGS__)

2377

2378

static int RENAME(swScale)(SwsContext *c, const uint8_t* src[], int srcStride[], int srcSliceY,

2379

int srcSliceH, uint8_t* dst[], int dstStride[])

2380

{

2381

/* load a few things into local vars to make the code more readable? and faster */

2382

const int srcW= c->srcW;

2383

const int dstW= c->dstW;

2384

const int dstH= c->dstH;

2385

const int chrDstW= c->chrDstW;

2386

const int chrSrcW= c->chrSrcW;

2387

const int lumXInc= c->lumXInc;

2388

const int chrXInc= c->chrXInc;

2389

const enum PixelFormat dstFormat= c->dstFormat;

2390

const int flags= c->flags;

2391

int16_t *vLumFilterPos= c->vLumFilterPos;

2392

int16_t *vChrFilterPos= c->vChrFilterPos;

2393

int16_t *hLumFilterPos= c->hLumFilterPos;

2394

int16_t *hChrFilterPos= c->hChrFilterPos;

2395

int16_t *vLumFilter= c->vLumFilter;

2396

int16_t *vChrFilter= c->vChrFilter;

2397

int16_t *hLumFilter= c->hLumFilter;

2398

int16_t *hChrFilter= c->hChrFilter;

2399

int32_t *lumMmxFilter= c->lumMmxFilter;

2400

int32_t *chrMmxFilter= c->chrMmxFilter;

2401

int32_t av_unused *alpMmxFilter= c->alpMmxFilter;

2402

const int vLumFilterSize= c->vLumFilterSize;

2403

const int vChrFilterSize= c->vChrFilterSize;

2404

const int hLumFilterSize= c->hLumFilterSize;

2405

const int hChrFilterSize= c->hChrFilterSize;

2406

int16_t **lumPixBuf= c->lumPixBuf;

2407

int16_t **chrPixBuf= c->chrPixBuf;

2408

int16_t **alpPixBuf= c->alpPixBuf;

2409

const int vLumBufSize= c->vLumBufSize;

2410

const int vChrBufSize= c->vChrBufSize;

2411

uint8_t *formatConvBuffer= c->formatConvBuffer;

2412

const int chrSrcSliceY= srcSliceY >> c->chrSrcVSubSample;

2413

const int chrSrcSliceH= -((-srcSliceH) >> c->chrSrcVSubSample);

2414

int lastDstY;

2415

uint32_t *pal=c->pal_yuv;

2416

2417

/* vars which will change and which we need to store back in the context */

2418

int dstY= c->dstY;

2419

int lumBufIndex= c->lumBufIndex;

2420

int chrBufIndex= c->chrBufIndex;

2421

int lastInLumBuf= c->lastInLumBuf;

2422

int lastInChrBuf= c->lastInChrBuf;

2423

2424

if (isPacked(c->srcFormat)) {

2425

src[0]=

2426

src[1]=

2427

src[2]=

2428

src[3]= src[0];

2429

srcStride[0]=

2430

srcStride[1]=

2431

srcStride[2]=

2432

srcStride[3]= srcStride[0];

2433

}

2434

srcStride[1]<<= c->vChrDrop;

2435

srcStride[2]<<= c->vChrDrop;

2436

2437

DEBUG_BUFFERS("swScale() %p[%d] %p[%d] %p[%d] %p[%d] -> %p[%d] %p[%d] %p[%d] %p[%d]\n",

2438

src[0], srcStride[0], src[1], srcStride[1], src[2], srcStride[2], src[3], srcStride[3],

2439

dst[0], dstStride[0], dst[1], dstStride[1], dst[2], dstStride[2], dst[3], dstStride[3]);

2440

DEBUG_BUFFERS("srcSliceY: %d srcSliceH: %d dstY: %d dstH: %d\n",

2441

srcSliceY, srcSliceH, dstY, dstH);

2442

DEBUG_BUFFERS("vLumFilterSize: %d vLumBufSize: %d vChrFilterSize: %d vChrBufSize: %d\n",

2443

vLumFilterSize, vLumBufSize, vChrFilterSize, vChrBufSize);

2444

2445

if (dstStride[0]%8 !=0 || dstStride[1]%8 !=0 || dstStride[2]%8 !=0 || dstStride[3]%8 != 0) {

2446

static int warnedAlready=0; //FIXME move this into the context perhaps

2447

if (flags & SWS_PRINT_INFO && !warnedAlready) {

2448

av_log(c, AV_LOG_WARNING, "Warning: dstStride is not aligned!\n"

2449

" ->cannot do aligned memory accesses anymore\n");

2450

warnedAlready=1;

2451

}

2452

}

2453

2454

/* Note the user might start scaling the picture in the middle so this

2455

will not get executed. This is not really intended but works

2456

currently, so people might do it. */

2457

if (srcSliceY ==0) {

2458

lumBufIndex=-1;

2459

chrBufIndex=-1;

2460

dstY=0;

2461

lastInLumBuf= -1;

2462

lastInChrBuf= -1;

2463

}

2464

2465

lastDstY= dstY;

2466

2467

for (;dstY < dstH; dstY++) {

2468

unsigned char *dest =dst[0]+dstStride[0]*dstY;

2469

const int chrDstY= dstY>>c->chrDstVSubSample;

2470

unsigned char *uDest=dst[1]+dstStride[1]*chrDstY;

2471

unsigned char *vDest=dst[2]+dstStride[2]*chrDstY;

2472

unsigned char *aDest=(CONFIG_SWSCALE_ALPHA && alpPixBuf) ? dst[3]+dstStride[3]*dstY : NULL;

2473

2474

const int firstLumSrcY= vLumFilterPos[dstY]; //First line needed as input

2475

const int firstLumSrcY2= vLumFilterPos[FFMIN(dstY | ((1<<c->chrDstVSubSample) - 1), dstH-1)];

2476

const int firstChrSrcY= vChrFilterPos[chrDstY]; //First line needed as input

2477

int lastLumSrcY= firstLumSrcY + vLumFilterSize -1; // Last line needed as input

2478

int lastLumSrcY2=firstLumSrcY2+ vLumFilterSize -1; // Last line needed as input

2479

int lastChrSrcY= firstChrSrcY + vChrFilterSize -1; // Last line needed as input

2480

int enough_lines;

2481

2482

//handle holes (FAST_BILINEAR & weird filters)

2483

if (firstLumSrcY > lastInLumBuf) lastInLumBuf= firstLumSrcY-1;

2484

if (firstChrSrcY > lastInChrBuf) lastInChrBuf= firstChrSrcY-1;

2485

assert(firstLumSrcY >= lastInLumBuf - vLumBufSize + 1);

2486

assert(firstChrSrcY >= lastInChrBuf - vChrBufSize + 1);

2487

2488

DEBUG_BUFFERS("dstY: %d\n", dstY);

2489

DEBUG_BUFFERS("\tfirstLumSrcY: %d lastLumSrcY: %d lastInLumBuf: %d\n",

2490

firstLumSrcY, lastLumSrcY, lastInLumBuf);

2491

DEBUG_BUFFERS("\tfirstChrSrcY: %d lastChrSrcY: %d lastInChrBuf: %d\n",

2492

firstChrSrcY, lastChrSrcY, lastInChrBuf);

2493

2494

// Do we have enough lines in this slice to output the dstY line

2495

enough_lines = lastLumSrcY2 < srcSliceY + srcSliceH && lastChrSrcY < -((-srcSliceY - srcSliceH)>>c->chrSrcVSubSample);

2496

2497

if (!enough_lines) {

2498

lastLumSrcY = srcSliceY + srcSliceH - 1;

2499

lastChrSrcY = chrSrcSliceY + chrSrcSliceH - 1;

2500

DEBUG_BUFFERS("buffering slice: lastLumSrcY %d lastChrSrcY %d\n",

2501

lastLumSrcY, lastChrSrcY);

2502

}

2503

2504

//Do horizontal scaling

2505

while(lastInLumBuf < lastLumSrcY) {

2506

const uint8_t *src1= src[0]+(lastInLumBuf + 1 - srcSliceY)*srcStride[0];

2507

const uint8_t *src2= src[3]+(lastInLumBuf + 1 - srcSliceY)*srcStride[3];

2508

lumBufIndex++;

2509

assert(lumBufIndex < 2*vLumBufSize);

2510

assert(lastInLumBuf + 1 - srcSliceY < srcSliceH);

2511

assert(lastInLumBuf + 1 - srcSliceY >= 0);

2512

RENAME(hyscale)(c, lumPixBuf[ lumBufIndex ], dstW, src1, srcW, lumXInc,

2513

hLumFilter, hLumFilterPos, hLumFilterSize,

2514

formatConvBuffer,

2515

pal, 0);

2516

if (CONFIG_SWSCALE_ALPHA && alpPixBuf)

2517

RENAME(hyscale)(c, alpPixBuf[ lumBufIndex ], dstW, src2, srcW, lumXInc,

2518

hLumFilter, hLumFilterPos, hLumFilterSize,

2519

formatConvBuffer,

2520

pal, 1);

2521

lastInLumBuf++;

2522

DEBUG_BUFFERS("\t\tlumBufIndex %d: lastInLumBuf: %d\n",

2523

lumBufIndex, lastInLumBuf);

2524

}

2525

while(lastInChrBuf < lastChrSrcY) {

2526

const uint8_t *src1= src[1]+(lastInChrBuf + 1 - chrSrcSliceY)*srcStride[1];

2527

const uint8_t *src2= src[2]+(lastInChrBuf + 1 - chrSrcSliceY)*srcStride[2];

2528

chrBufIndex++;

2529

assert(chrBufIndex < 2*vChrBufSize);

2530

assert(lastInChrBuf + 1 - chrSrcSliceY < (chrSrcSliceH));

2531

assert(lastInChrBuf + 1 - chrSrcSliceY >= 0);

2532

//FIXME replace parameters through context struct (some at least)

2533

2534

if (c->needs_hcscale)

2535

RENAME(hcscale)(c, chrPixBuf[ chrBufIndex ], chrDstW, src1, src2, chrSrcW, chrXInc,

2536

hChrFilter, hChrFilterPos, hChrFilterSize,

2537

formatConvBuffer,

2538

pal);

2539

lastInChrBuf++;

2540

DEBUG_BUFFERS("\t\tchrBufIndex %d: lastInChrBuf: %d\n",

2541

chrBufIndex, lastInChrBuf);

2542

}

2543

//wrap buf index around to stay inside the ring buffer

2544

if (lumBufIndex >= vLumBufSize) lumBufIndex-= vLumBufSize;

2545

if (chrBufIndex >= vChrBufSize) chrBufIndex-= vChrBufSize;

2546

if (!enough_lines)

2547

break; //we can't output a dstY line so let's try with the next slice

2548

2549

c->blueDither= ff_dither8[dstY&1];

2550

if (c->dstFormat == PIX_FMT_RGB555 || c->dstFormat == PIX_FMT_BGR555)

2551

c->greenDither= ff_dither8[dstY&1];

2552

else

2553

c->greenDither= ff_dither4[dstY&1];

2554

c->redDither= ff_dither8[(dstY+1)&1];

2555

if (dstY < dstH-2) {

2556

const int16_t **lumSrcPtr= (const int16_t **) lumPixBuf + lumBufIndex + firstLumSrcY - lastInLumBuf + vLumBufSize;

2557

const int16_t **chrSrcPtr= (const int16_t **) chrPixBuf + chrBufIndex + firstChrSrcY - lastInChrBuf + vChrBufSize;

2558

const int16_t **alpSrcPtr= (CONFIG_SWSCALE_ALPHA && alpPixBuf) ? (const int16_t **) alpPixBuf + lumBufIndex + firstLumSrcY - lastInLumBuf + vLumBufSize : NULL;

2559

int i;

2560

if (flags & SWS_ACCURATE_RND) {

2561

int s= APCK_SIZE / 8;

2562

for (i=0; i<vLumFilterSize; i+=2) {

2563

*(const void**)&lumMmxFilter[s*i ]= lumSrcPtr[i ];

2564

*(const void**)&lumMmxFilter[s*i+APCK_PTR2/4 ]= lumSrcPtr[i+(vLumFilterSize>1)];

2565

lumMmxFilter[s*i+APCK_COEF/4 ]=

2566

lumMmxFilter[s*i+APCK_COEF/4+1]= vLumFilter[dstY*vLumFilterSize + i ]

2567

+ (vLumFilterSize>1 ? vLumFilter[dstY*vLumFilterSize + i + 1]<<16 : 0);

2568

if (CONFIG_SWSCALE_ALPHA && alpPixBuf) {

2569

*(const void**)&alpMmxFilter[s*i ]= alpSrcPtr[i ];

2570

*(const void**)&alpMmxFilter[s*i+APCK_PTR2/4 ]= alpSrcPtr[i+(vLumFilterSize>1)];

2571

alpMmxFilter[s*i+APCK_COEF/4 ]=

2572

alpMmxFilter[s*i+APCK_COEF/4+1]= lumMmxFilter[s*i+APCK_COEF/4 ];

2573

}

2574

}

2575

for (i=0; i<vChrFilterSize; i+=2) {

2576

*(const void**)&chrMmxFilter[s*i ]= chrSrcPtr[i ];

2577

*(const void**)&chrMmxFilter[s*i+APCK_PTR2/4 ]= chrSrcPtr[i+(vChrFilterSize>1)];

2578

chrMmxFilter[s*i+APCK_COEF/4 ]=

2579

chrMmxFilter[s*i+APCK_COEF/4+1]= vChrFilter[chrDstY*vChrFilterSize + i ]

2580

+ (vChrFilterSize>1 ? vChrFilter[chrDstY*vChrFilterSize + i + 1]<<16 : 0);

2581

}

2582

} else {

2583

for (i=0; i<vLumFilterSize; i++) {

2584

lumMmxFilter[4*i+0]= (int32_t)lumSrcPtr[i];

2585

lumMmxFilter[4*i+1]= (uint64_t)lumSrcPtr[i] >> 32;

2586

lumMmxFilter[4*i+2]=

2587

lumMmxFilter[4*i+3]=

2588

((uint16_t)vLumFilter[dstY*vLumFilterSize + i])*0x10001;

2589

if (CONFIG_SWSCALE_ALPHA && alpPixBuf) {

2590

alpMmxFilter[4*i+0]= (int32_t)alpSrcPtr[i];

2591

alpMmxFilter[4*i+1]= (uint64_t)alpSrcPtr[i] >> 32;

2592

alpMmxFilter[4*i+2]=

2593

alpMmxFilter[4*i+3]= lumMmxFilter[4*i+2];

2594

}

2595

}

2596

for (i=0; i<vChrFilterSize; i++) {

2597

chrMmxFilter[4*i+0]= (int32_t)chrSrcPtr[i];

2598

chrMmxFilter[4*i+1]= (uint64_t)chrSrcPtr[i] >> 32;

2599

chrMmxFilter[4*i+2]=

2600

chrMmxFilter[4*i+3]=

2601

((uint16_t)vChrFilter[chrDstY*vChrFilterSize + i])*0x10001;

2602

}

2603

}

2604

if (dstFormat == PIX_FMT_NV12 || dstFormat == PIX_FMT_NV21) {

2605

const int chrSkipMask= (1<<c->chrDstVSubSample)-1;

2606

if (dstY&chrSkipMask) uDest= NULL; //FIXME split functions in lumi / chromi

2607

c->yuv2nv12X(c,

2608

vLumFilter+dstY*vLumFilterSize , lumSrcPtr, vLumFilterSize,

2609

vChrFilter+chrDstY*vChrFilterSize, chrSrcPtr, vChrFilterSize,

2610

dest, uDest, dstW, chrDstW, dstFormat);

2611

} else if (isPlanarYUV(dstFormat) || dstFormat==PIX_FMT_GRAY8) { //YV12 like

2612

const int chrSkipMask= (1<<c->chrDstVSubSample)-1;

2613

if ((dstY&chrSkipMask) || isGray(dstFormat)) uDest=vDest= NULL; //FIXME split functions in lumi / chromi

2614

if (is16BPS(dstFormat)) {

2615

yuv2yuvX16inC(

2616

vLumFilter+dstY*vLumFilterSize , lumSrcPtr, vLumFilterSize,

2617

vChrFilter+chrDstY*vChrFilterSize, chrSrcPtr, vChrFilterSize,

2618

alpSrcPtr, (uint16_t *) dest, (uint16_t *) uDest, (uint16_t *) vDest, (uint16_t *) aDest, dstW, chrDstW,

2619

dstFormat);

2620

} else if (vLumFilterSize == 1 && vChrFilterSize == 1) { // unscaled YV12

2621

const int16_t *lumBuf = lumSrcPtr[0];

2622

const int16_t *chrBuf= chrSrcPtr[0];

2623

const int16_t *alpBuf= (CONFIG_SWSCALE_ALPHA && alpPixBuf) ? alpSrcPtr[0] : NULL;

2624

c->yuv2yuv1(c, lumBuf, chrBuf, alpBuf, dest, uDest, vDest, aDest, dstW, chrDstW);

2625

} else { //General YV12

2626

c->yuv2yuvX(c,

2627

vLumFilter+dstY*vLumFilterSize , lumSrcPtr, vLumFilterSize,

2628

vChrFilter+chrDstY*vChrFilterSize, chrSrcPtr, vChrFilterSize,

2629

alpSrcPtr, dest, uDest, vDest, aDest, dstW, chrDstW);

2630

}

2631

} else {

2632

assert(lumSrcPtr + vLumFilterSize - 1 < lumPixBuf + vLumBufSize*2);

2633

assert(chrSrcPtr + vChrFilterSize - 1 < chrPixBuf + vChrBufSize*2);

2634

if (vLumFilterSize == 1 && vChrFilterSize == 2) { //unscaled RGB

2635

int chrAlpha= vChrFilter[2*dstY+1];

2636

if(flags & SWS_FULL_CHR_H_INT) {

2637

yuv2rgbXinC_full(c, //FIXME write a packed1_full function

2638

vLumFilter+dstY*vLumFilterSize, lumSrcPtr, vLumFilterSize,

2639

vChrFilter+dstY*vChrFilterSize, chrSrcPtr, vChrFilterSize,

2640

alpSrcPtr, dest, dstW, dstY);

2641

} else {

2642

c->yuv2packed1(c, *lumSrcPtr, *chrSrcPtr, *(chrSrcPtr+1),

2643

alpPixBuf ? *alpSrcPtr : NULL,

2644

dest, dstW, chrAlpha, dstFormat, flags, dstY);

2645

}

2646

} else if (vLumFilterSize == 2 && vChrFilterSize == 2) { //bilinear upscale RGB

2647

int lumAlpha= vLumFilter[2*dstY+1];

2648

int chrAlpha= vChrFilter[2*dstY+1];

2649

lumMmxFilter[2]=

2650

lumMmxFilter[3]= vLumFilter[2*dstY ]*0x10001;

2651

chrMmxFilter[2]=

2652

chrMmxFilter[3]= vChrFilter[2*chrDstY]*0x10001;

2653

if(flags & SWS_FULL_CHR_H_INT) {

2654

yuv2rgbXinC_full(c, //FIXME write a packed2_full function

2655

vLumFilter+dstY*vLumFilterSize, lumSrcPtr, vLumFilterSize,

2656

vChrFilter+dstY*vChrFilterSize, chrSrcPtr, vChrFilterSize,

2657

alpSrcPtr, dest, dstW, dstY);

2658

} else {

2659

c->yuv2packed2(c, *lumSrcPtr, *(lumSrcPtr+1), *chrSrcPtr, *(chrSrcPtr+1),

2660

alpPixBuf ? *alpSrcPtr : NULL, alpPixBuf ? *(alpSrcPtr+1) : NULL,

2661

dest, dstW, lumAlpha, chrAlpha, dstY);

2662

}

2663

} else { //general RGB

2664

if(flags & SWS_FULL_CHR_H_INT) {

2665

yuv2rgbXinC_full(c,

2666

vLumFilter+dstY*vLumFilterSize, lumSrcPtr, vLumFilterSize,

2667

vChrFilter+dstY*vChrFilterSize, chrSrcPtr, vChrFilterSize,

2668

alpSrcPtr, dest, dstW, dstY);

2669

} else {

2670

c->yuv2packedX(c,

2671

vLumFilter+dstY*vLumFilterSize, lumSrcPtr, vLumFilterSize,

2672

vChrFilter+dstY*vChrFilterSize, chrSrcPtr, vChrFilterSize,

2673

alpSrcPtr, dest, dstW, dstY);

2674

}

2675

}

2676

}

2677

} else { // hmm looks like we can't use MMX here without overwriting this array's tail

2678

const int16_t **lumSrcPtr= (const int16_t **)lumPixBuf + lumBufIndex + firstLumSrcY - lastInLumBuf + vLumBufSize;

2679

const int16_t **chrSrcPtr= (const int16_t **)chrPixBuf + chrBufIndex + firstChrSrcY - lastInChrBuf + vChrBufSize;

2680

const int16_t **alpSrcPtr= (CONFIG_SWSCALE_ALPHA && alpPixBuf) ? (const int16_t **)alpPixBuf + lumBufIndex + firstLumSrcY - lastInLumBuf + vLumBufSize : NULL;

2681

if (dstFormat == PIX_FMT_NV12 || dstFormat == PIX_FMT_NV21) {

2682

const int chrSkipMask= (1<<c->chrDstVSubSample)-1;

2683

if (dstY&chrSkipMask) uDest= NULL; //FIXME split functions in lumi / chromi

2684

yuv2nv12XinC(

2685

vLumFilter+dstY*vLumFilterSize , lumSrcPtr, vLumFilterSize,

2686

vChrFilter+chrDstY*vChrFilterSize, chrSrcPtr, vChrFilterSize,

2687

dest, uDest, dstW, chrDstW, dstFormat);

2688

} else if (isPlanarYUV(dstFormat) || dstFormat==PIX_FMT_GRAY8) { //YV12

2689

const int chrSkipMask= (1<<c->chrDstVSubSample)-1;

2690

if ((dstY&chrSkipMask) || isGray(dstFormat)) uDest=vDest= NULL; //FIXME split functions in lumi / chromi

2691

if (is16BPS(dstFormat)) {

2692

yuv2yuvX16inC(

2693

vLumFilter+dstY*vLumFilterSize , lumSrcPtr, vLumFilterSize,

2694

vChrFilter+chrDstY*vChrFilterSize, chrSrcPtr, vChrFilterSize,

2695

alpSrcPtr, (uint16_t *) dest, (uint16_t *) uDest, (uint16_t *) vDest, (uint16_t *) aDest, dstW, chrDstW,

2696

dstFormat);

2697

} else {

2698

yuv2yuvXinC(

2699

vLumFilter+dstY*vLumFilterSize , lumSrcPtr, vLumFilterSize,

2700

vChrFilter+chrDstY*vChrFilterSize, chrSrcPtr, vChrFilterSize,

2701

alpSrcPtr, dest, uDest, vDest, aDest, dstW, chrDstW);

2702

}

2703

} else {

2704

assert(lumSrcPtr + vLumFilterSize - 1 < lumPixBuf + vLumBufSize*2);

2705

assert(chrSrcPtr + vChrFilterSize - 1 < chrPixBuf + vChrBufSize*2);

2706

if(flags & SWS_FULL_CHR_H_INT) {

2707

yuv2rgbXinC_full(c,

2708

vLumFilter+dstY*vLumFilterSize, lumSrcPtr, vLumFilterSize,

2709

vChrFilter+dstY*vChrFilterSize, chrSrcPtr, vChrFilterSize,

2710

alpSrcPtr, dest, dstW, dstY);

2711

} else {

2712

yuv2packedXinC(c,

2713

vLumFilter+dstY*vLumFilterSize, lumSrcPtr, vLumFilterSize,

2714

vChrFilter+dstY*vChrFilterSize, chrSrcPtr, vChrFilterSize,

2715

alpSrcPtr, dest, dstW, dstY);

2716

}

2717

}

2718

}

2719

}

2720

2721

if ((dstFormat == PIX_FMT_YUVA420P) && !alpPixBuf)

2722

fillPlane(dst[3], dstStride[3], dstW, dstY-lastDstY, lastDstY, 255);

2723

2724

if (flags & SWS_CPU_CAPS_MMX2 ) __asm__ volatile("sfence":::"memory");

2725

/* On K6 femms is faster than emms. On K7 femms is directly mapped to emms. */

2726

if (flags & SWS_CPU_CAPS_3DNOW) __asm__ volatile("femms" :::"memory");

2727

else __asm__ volatile("emms" :::"memory");

2728

/* store changed local vars back in the context */

2729

c->dstY= dstY;

2730

c->lumBufIndex= lumBufIndex;

2731

c->chrBufIndex= chrBufIndex;

2732

c->lastInLumBuf= lastInLumBuf;

2733

c->lastInChrBuf= lastInChrBuf;

2734

2735

return dstY - lastDstY;

2736

}

2737

2738

static void RENAME(sws_init_swScale)(SwsContext *c)

2739

{

2740

enum PixelFormat srcFormat = c->srcFormat;

2741

2742

c->yuv2nv12X = RENAME(yuv2nv12X );

2743

c->yuv2yuv1 = RENAME(yuv2yuv1 );

2744

c->yuv2yuvX = RENAME(yuv2yuvX );

2745

c->yuv2packed1 = RENAME(yuv2packed1 );

2746

c->yuv2packed2 = RENAME(yuv2packed2 );

2747

c->yuv2packedX = RENAME(yuv2packedX );

2748

2749

c->hScale = RENAME(hScale );

2750

2751

// Use the new MMX scaler if the MMX2 one can't be used (it is faster than the x86 ASM one).

2752

if (c->flags & SWS_FAST_BILINEAR && c->canMMX2BeUsed)

2753

{

2754

c->hyscale_fast = RENAME(hyscale_fast);

2755

c->hcscale_fast = RENAME(hcscale_fast);

2756

} else {

2757

c->hyscale_fast = NULL;

2758

c->hcscale_fast = NULL;

2759

}

2760

2761

switch(srcFormat) {

2762

case PIX_FMT_YUYV422 : c->chrToYV12 = RENAME(yuy2ToUV); break;

2763

case PIX_FMT_UYVY422 : c->chrToYV12 = RENAME(uyvyToUV); break;

2764

case PIX_FMT_NV12 : c->chrToYV12 = RENAME(nv12ToUV); break;

2765

case PIX_FMT_NV21 : c->chrToYV12 = RENAME(nv21ToUV); break;

2766

case PIX_FMT_YUV420P16BE:

2767

case PIX_FMT_YUV422P16BE:

2768

case PIX_FMT_YUV444P16BE: c->chrToYV12 = RENAME(BEToUV); break;

2769

case PIX_FMT_YUV420P16LE:

2770

case PIX_FMT_YUV422P16LE:

2771

case PIX_FMT_YUV444P16LE: c->chrToYV12 = RENAME(LEToUV); break;

2772

default: break;

2773

}

2774

if (c->chrSrcHSubSample) {

2775

switch(srcFormat) {

2776

case PIX_FMT_BGR24 : c->chrToYV12 = RENAME(bgr24ToUV_half); break;

2777

case PIX_FMT_RGB24 : c->chrToYV12 = RENAME(rgb24ToUV_half); break;

2778

default: break;

2779

}

2780

} else {

2781

switch(srcFormat) {

2782

case PIX_FMT_BGR24 : c->chrToYV12 = RENAME(bgr24ToUV); break;

2783

case PIX_FMT_RGB24 : c->chrToYV12 = RENAME(rgb24ToUV); break;

2784

default: break;

2785

}

2786

}

2787

2788

switch (srcFormat) {

2789

case PIX_FMT_YUYV422 :

2790

case PIX_FMT_YUV420P16BE:

2791

case PIX_FMT_YUV422P16BE:

2792

case PIX_FMT_YUV444P16BE:

2793

case PIX_FMT_Y400A :

2794

case PIX_FMT_GRAY16BE : c->lumToYV12 = RENAME(yuy2ToY); break;

2795

case PIX_FMT_UYVY422 :

2796

case PIX_FMT_YUV420P16LE:

2797

case PIX_FMT_YUV422P16LE:

2798

case PIX_FMT_YUV444P16LE:

2799

case PIX_FMT_GRAY16LE : c->lumToYV12 = RENAME(uyvyToY); break;

2800

case PIX_FMT_BGR24 : c->lumToYV12 = RENAME(bgr24ToY); break;

2801

case PIX_FMT_RGB24 : c->lumToYV12 = RENAME(rgb24ToY); break;

2802

default: break;

2803

}

2804

if (c->alpPixBuf) {

2805

switch (srcFormat) {

2806

case PIX_FMT_Y400A : c->alpToYV12 = RENAME(yuy2ToY); break;

2807

default: break;

2808

}

2809

}

2810

2811

if (c->srcRange != c->dstRange && !isAnyRGB(c->dstFormat)) {

2812

if (c->srcRange) {

2813

c->lumConvertRange = RENAME(lumRangeFromJpeg);

2814

c->chrConvertRange = RENAME(chrRangeFromJpeg);

2815

} else {

2816

c->lumConvertRange = RENAME(lumRangeToJpeg);

2817

c->chrConvertRange = RENAME(chrRangeToJpeg);

2818

}

2819

}

2820

}

Older »