~ubuntu-branches/ubuntu/feisty/avidemux/feisty

Viewing changes to adm_lavcodec/ppc/dsputil_altivec.c

Committer: Bazaar Package Importer
Author(s): Daniel T Chen
Date: 2006-12-15 17:13:20 UTC
mfrom: (1.1.6 upstream)
Revision ID: james.westby@ubuntu.com-20061215171320-w79pvpehxx2fr217

Tags: 1:2.3.0-0.0ubuntu1

* Merge from debian-multimedia.org, remaining Ubuntu change:
- desktop file,
- no support for ccache and make -j.
* Closes Ubuntu: #69614.

files added:
addons/avisynthproxy

addons/avisynthproxy/avisynth.h

addons/avisynthproxy/avsHeader.h

addons/avisynthproxy/avsproxy.cpp

addons/avisynthproxy/avsproxy.vcproj

addons/avisynthproxy/internal.h

addons/avisynthproxy/proxytype.h

addons/avisynthproxy/sket.cpp

addons/avisynthproxy/sket.h

admin/configure.in.bot.end

autononreg

autononreg/audio

autononreg/audio/lame.js

autononreg/audio/stream.js

autononreg/codecwrite

autononreg/codecwrite/codecwrite.js

autononreg/fcctest.js

autononreg/foreach.pl

autononreg/fpstest.js

autononreg/functiontest

autononreg/functiontest/direread.js

autononreg/functiontest/fcctest.js

autononreg/functiontest/fileread.js

autononreg/functiontest/fpstest.js

autononreg/functiontest/savejpg_seek.js

autononreg/functiontest/width.js

autononreg/run_non_reg.sh

autononreg/utils

autononreg/utils/trytoreadall.js

autononreg/width.js

avidemux/ADM_asf

avidemux/ADM_asf/ADM_asf.cpp

avidemux/ADM_asf/ADM_asf.h

avidemux/ADM_asf/ADM_asfChunk.cpp

avidemux/ADM_asf/ADM_asfIo.h

avidemux/ADM_asf/ADM_asfPacket.cpp

avidemux/ADM_asf/ADM_asfPacket.h

avidemux/ADM_asf/ADM_asf_audio.cpp

avidemux/ADM_asf/Makefile.am

avidemux/ADM_asf/Makefile.in

avidemux/ADM_audio/ADM_audiodef.h

avidemux/ADM_audio/ADM_dcainfo.cpp

avidemux/ADM_audio/ADM_dcainfo.h

avidemux/ADM_audiocodec/ADM_dca.cpp

avidemux/ADM_audiodevice/ADM_deviceAudioCore.h

avidemux/ADM_audiofilter/audio_raw.cpp

avidemux/ADM_audiofilter/audio_raw.h

avidemux/ADM_audiofilter/audioencoder.cpp

avidemux/ADM_audiofilter/audioencoder.h

avidemux/ADM_audiofilter/audioencoder_aften.cpp

avidemux/ADM_audiofilter/audioencoder_aften.h

avidemux/ADM_audiofilter/audioencoder_aften_param.h

avidemux/ADM_audiofilter/audioencoder_config.h

avidemux/ADM_audiofilter/audioencoder_faac.cpp

avidemux/ADM_audiofilter/audioencoder_faac.h

avidemux/ADM_audiofilter/audioencoder_faac_param.h

avidemux/ADM_audiofilter/audioencoder_lame.cpp

avidemux/ADM_audiofilter/audioencoder_lame.h

avidemux/ADM_audiofilter/audioencoder_lame_param.h

avidemux/ADM_audiofilter/audioencoder_lavcodec.cpp

avidemux/ADM_audiofilter/audioencoder_lavcodec.h

avidemux/ADM_audiofilter/audioencoder_pcm.cpp

avidemux/ADM_audiofilter/audioencoder_pcm.h

avidemux/ADM_audiofilter/audioencoder_twolame.cpp

avidemux/ADM_audiofilter/audioencoder_twolame.h

avidemux/ADM_audiofilter/audioencoder_twolame_param.h

avidemux/ADM_audiofilter/audioencoder_vorbis.cpp

avidemux/ADM_audiofilter/audioencoder_vorbis.h

avidemux/ADM_audiofilter/audioencoder_vorbis_param.h

avidemux/ADM_audiofilter/audioeng_process.cpp

avidemux/ADM_audiofilter/audioeng_process.h

avidemux/ADM_audiofilter/audiofilter_bridge.cpp

avidemux/ADM_audiofilter/audiofilter_bridge.h

avidemux/ADM_audiofilter/audiofilter_buildchain.cpp

avidemux/ADM_audiofilter/audiofilter_channel_route.cpp

avidemux/ADM_audiofilter/audiofilter_channel_route.h

avidemux/ADM_audiofilter/audiofilter_dolby.cpp

avidemux/ADM_audiofilter/audiofilter_dolby.h

avidemux/ADM_audiofilter/audiofilter_film2pal.cpp

avidemux/ADM_audiofilter/audiofilter_film2pal.h

avidemux/ADM_audiofilter/audiofilter_limiter.cpp

avidemux/ADM_audiofilter/audiofilter_limiter.h

avidemux/ADM_audiofilter/audiofilter_limiter_param.h

avidemux/ADM_audiofilter/audiofilter_mixer.cpp

avidemux/ADM_audiofilter/audiofilter_mixer.h

avidemux/ADM_audiofilter/audiofilter_normalize.cpp

avidemux/ADM_audiofilter/audiofilter_normalize.h

avidemux/ADM_audiofilter/audiofilter_normalize_param.h

avidemux/ADM_audiofilter/audiofilter_sox.cpp

avidemux/ADM_audiofilter/audiofilter_sox.h

avidemux/ADM_audiofilter/audiolib_sox.cpp

avidemux/ADM_audiofilter/audiolib_sox.h

avidemux/ADM_avsproxy

avidemux/ADM_avsproxy/ADM_avsproxy.cpp

avidemux/ADM_avsproxy/ADM_avsproxy.h

avidemux/ADM_avsproxy/ADM_avsproxy_internal.h

avidemux/ADM_avsproxy/ADM_avsproxy_net.cpp

avidemux/ADM_avsproxy/Makefile.am

avidemux/ADM_avsproxy/Makefile.in

avidemux/ADM_dialog/DIA_animated.cpp

avidemux/ADM_dialog/DIA_ass.cpp

avidemux/ADM_dialog/DIA_chromaShift.cpp

avidemux/ADM_dialog/DIA_clean.cpp

avidemux/ADM_dialog/DIA_coloryuv.cpp

avidemux/ADM_dialog/DIA_contrast.cpp

avidemux/ADM_dialog/DIA_conv.cpp

avidemux/ADM_dialog/DIA_defaultAudio.cpp

avidemux/ADM_dialog/DIA_denoise.cpp

avidemux/ADM_dialog/DIA_fade.cpp

avidemux/ADM_dialog/DIA_mcdeint.cpp

avidemux/ADM_dialog/DIA_partial.cpp

avidemux/ADM_dialog/DIA_preview.cpp

avidemux/ADM_dialog/DIA_rotate.cpp

avidemux/ADM_dialog/DIA_srt.cpp

avidemux/ADM_dialog/DIA_vorbis.cpp

avidemux/ADM_encoder/adm_encCopy.cpp

avidemux/ADM_encoder/adm_encCopy.h

avidemux/ADM_encoder/adm_encRequant.cpp

avidemux/ADM_encoder/adm_encRequant.h

avidemux/ADM_encoder/adm_encmpeg2enc.cpp

avidemux/ADM_encoder/adm_encmpeg2enc.h

avidemux/ADM_encoder/adm_encyv12.cpp

avidemux/ADM_encoder/adm_encyv12.h

avidemux/ADM_filter/gui_filtermanager.cpp

avidemux/ADM_filter/gui_filtermanager_dialog.cpp

avidemux/ADM_lavcodec

avidemux/ADM_lavcodec/4xm.c

avidemux/ADM_lavcodec/8bps.c

avidemux/ADM_lavcodec/Makefile.am

avidemux/ADM_lavcodec/Makefile.in

avidemux/ADM_lavcodec/a52dec.c

avidemux/ADM_lavcodec/ac3.h

avidemux/ADM_lavcodec/ac3dec.c

avidemux/ADM_lavcodec/ac3enc.c

avidemux/ADM_lavcodec/ac3tab.h

avidemux/ADM_lavcodec/adpcm.c

avidemux/ADM_lavcodec/adx.c

avidemux/ADM_lavcodec/allcodecs.c

avidemux/ADM_lavcodec/amr.c

avidemux/ADM_lavcodec/amr_float

avidemux/ADM_lavcodec/amr_float/decoder.c

avidemux/ADM_lavcodec/amr_float/encoder.c

avidemux/ADM_lavcodec/amr_float/interf_dec.c

avidemux/ADM_lavcodec/amr_float/interf_dec.h

avidemux/ADM_lavcodec/amr_float/interf_enc.c

avidemux/ADM_lavcodec/amr_float/interf_enc.h

avidemux/ADM_lavcodec/amr_float/interf_rom.h

avidemux/ADM_lavcodec/amr_float/rom_dec.h

avidemux/ADM_lavcodec/amr_float/rom_enc.h

avidemux/ADM_lavcodec/amr_float/sp_dec.c

avidemux/ADM_lavcodec/amr_float/sp_dec.h

avidemux/ADM_lavcodec/amr_float/sp_enc.c

avidemux/ADM_lavcodec/amr_float/sp_enc.h

avidemux/ADM_lavcodec/amr_float/typedef.h

avidemux/ADM_lavcodec/apiexample.c

avidemux/ADM_lavcodec/asv1.c

avidemux/ADM_lavcodec/avcodec.c

avidemux/ADM_lavcodec/avcodec.h

avidemux/ADM_lavcodec/bitstream.c

avidemux/ADM_lavcodec/bitstream.h

avidemux/ADM_lavcodec/bitstream_filter.c

avidemux/ADM_lavcodec/cabac.c

avidemux/ADM_lavcodec/cabac.h

avidemux/ADM_lavcodec/cinepak.c

avidemux/ADM_lavcodec/cljr.c

avidemux/ADM_lavcodec/common.c

avidemux/ADM_lavcodec/config.mak

avidemux/ADM_lavcodec/cyuv.c

avidemux/ADM_lavcodec/dct-test.c

avidemux/ADM_lavcodec/dpcm.c

avidemux/ADM_lavcodec/dsputil.c

avidemux/ADM_lavcodec/dsputil.h

avidemux/ADM_lavcodec/dtsdec.c

avidemux/ADM_lavcodec/dv.c

avidemux/ADM_lavcodec/dvdata.h

avidemux/ADM_lavcodec/error_resilience.c

avidemux/ADM_lavcodec/eval.c

avidemux/ADM_lavcodec/faac.c

avidemux/ADM_lavcodec/faad.c

avidemux/ADM_lavcodec/faandct.c

avidemux/ADM_lavcodec/faandct.h

avidemux/ADM_lavcodec/fastmemcpy.h

avidemux/ADM_lavcodec/fdctref.c

avidemux/ADM_lavcodec/fft-test.c

avidemux/ADM_lavcodec/fft.c

avidemux/ADM_lavcodec/ffv1.c

avidemux/ADM_lavcodec/flac.c

avidemux/ADM_lavcodec/flicvideo.c

avidemux/ADM_lavcodec/g726.c

avidemux/ADM_lavcodec/golomb.c

avidemux/ADM_lavcodec/golomb.h

avidemux/ADM_lavcodec/h261.c

avidemux/ADM_lavcodec/h261data.h

avidemux/ADM_lavcodec/h263.c

avidemux/ADM_lavcodec/h263data.h

avidemux/ADM_lavcodec/h263dec.c

avidemux/ADM_lavcodec/h264.c

avidemux/ADM_lavcodec/h264data.h

avidemux/ADM_lavcodec/h264idct.c

avidemux/ADM_lavcodec/huffyuv.c

avidemux/ADM_lavcodec/i386

avidemux/ADM_lavcodec/i386/Makefile.am

avidemux/ADM_lavcodec/i386/Makefile.in

avidemux/ADM_lavcodec/i386/cputest.c

avidemux/ADM_lavcodec/i386/dsputil_h264_template_mmx.c

avidemux/ADM_lavcodec/i386/dsputil_mmx.c

avidemux/ADM_lavcodec/i386/dsputil_mmx_avg.h

avidemux/ADM_lavcodec/i386/dsputil_mmx_rnd.h

avidemux/ADM_lavcodec/i386/fdct_mmx.c

avidemux/ADM_lavcodec/i386/fft_3dn.c

avidemux/ADM_lavcodec/i386/fft_3dn2.c

avidemux/ADM_lavcodec/i386/fft_sse.c

avidemux/ADM_lavcodec/i386/h264dsp_mmx.c

avidemux/ADM_lavcodec/i386/idct_mmx.c

avidemux/ADM_lavcodec/i386/idct_mmx_xvid.c

avidemux/ADM_lavcodec/i386/mmx.h

avidemux/ADM_lavcodec/i386/motion_est_mmx.c

avidemux/ADM_lavcodec/i386/mpegvideo_mmx.c

avidemux/ADM_lavcodec/i386/mpegvideo_mmx_template.c

avidemux/ADM_lavcodec/i386/simple_idct_mmx.c

avidemux/ADM_lavcodec/i386/snowdsp_mmx.c

avidemux/ADM_lavcodec/i386/vp3dsp_mmx.c

avidemux/ADM_lavcodec/i386/vp3dsp_sse2.c

avidemux/ADM_lavcodec/idcinvideo.c

avidemux/ADM_lavcodec/imgconvert.c

avidemux/ADM_lavcodec/imgconvert_template.h

avidemux/ADM_lavcodec/imgresample.c

avidemux/ADM_lavcodec/indeo3.c

avidemux/ADM_lavcodec/indeo3data.h

avidemux/ADM_lavcodec/interplayvideo.c

avidemux/ADM_lavcodec/jfdctfst.c

avidemux/ADM_lavcodec/jfdctint.c

avidemux/ADM_lavcodec/jpeg_ls.c

avidemux/ADM_lavcodec/jrevdct.c

avidemux/ADM_lavcodec/lcl.c

avidemux/ADM_lavcodec/libpostproc

avidemux/ADM_lavcodec/libpostproc/Makefile.am

avidemux/ADM_lavcodec/libpostproc/Makefile.in

avidemux/ADM_lavcodec/libpostproc/mangle.h

avidemux/ADM_lavcodec/libpostproc/postprocess.c

avidemux/ADM_lavcodec/libpostproc/postprocess.h

avidemux/ADM_lavcodec/libpostproc/postprocess_altivec_template.c

avidemux/ADM_lavcodec/libpostproc/postprocess_internal.h

avidemux/ADM_lavcodec/libpostproc/postprocess_template.c

avidemux/ADM_lavcodec/mace.c

avidemux/ADM_lavcodec/mdct.c

avidemux/ADM_lavcodec/mdec.c

avidemux/ADM_lavcodec/mem.c

avidemux/ADM_lavcodec/mjpeg.c

avidemux/ADM_lavcodec/motion_est.c

avidemux/ADM_lavcodec/motion_est_template.c

avidemux/ADM_lavcodec/motion_test.c

avidemux/ADM_lavcodec/mp3lameaudio.c

avidemux/ADM_lavcodec/mpeg12.c

avidemux/ADM_lavcodec/mpeg12data.h

avidemux/ADM_lavcodec/mpeg4data.h

avidemux/ADM_lavcodec/mpegaudio.c

avidemux/ADM_lavcodec/mpegaudio.h

avidemux/ADM_lavcodec/mpegaudiodec.c

avidemux/ADM_lavcodec/mpegaudiodectab.h

avidemux/ADM_lavcodec/mpegaudiotab.h

avidemux/ADM_lavcodec/mpegvideo.c

avidemux/ADM_lavcodec/mpegvideo.h

avidemux/ADM_lavcodec/msmpeg4.c

avidemux/ADM_lavcodec/msmpeg4data.h

avidemux/ADM_lavcodec/msrle.c

avidemux/ADM_lavcodec/msvideo1.c

avidemux/ADM_lavcodec/oggvorbis.c

avidemux/ADM_lavcodec/oggvorbis.h

avidemux/ADM_lavcodec/opt.h

avidemux/ADM_lavcodec/opts.c

avidemux/ADM_lavcodec/os_support.h

avidemux/ADM_lavcodec/parser.c

avidemux/ADM_lavcodec/pcm.c

avidemux/ADM_lavcodec/ppc

avidemux/ADM_lavcodec/ppc/Makefile.am

avidemux/ADM_lavcodec/ppc/Makefile.in

avidemux/ADM_lavcodec/ppc/dsputil_altivec.c

avidemux/ADM_lavcodec/ppc/dsputil_altivec.h

avidemux/ADM_lavcodec/ppc/dsputil_h264_altivec.c

avidemux/ADM_lavcodec/ppc/dsputil_h264_template_altivec.c

avidemux/ADM_lavcodec/ppc/dsputil_ppc.c

avidemux/ADM_lavcodec/ppc/dsputil_ppc.h

avidemux/ADM_lavcodec/ppc/fdct_altivec.c

avidemux/ADM_lavcodec/ppc/fft_altivec.c

avidemux/ADM_lavcodec/ppc/gcc_fixes.h

avidemux/ADM_lavcodec/ppc/gmc_altivec.c

avidemux/ADM_lavcodec/ppc/idct_altivec.c

avidemux/ADM_lavcodec/ppc/mpegvideo_altivec.c

avidemux/ADM_lavcodec/ppc/mpegvideo_ppc.c

avidemux/ADM_lavcodec/ppc/snow_altivec.c

avidemux/ADM_lavcodec/pthread.c

avidemux/ADM_lavcodec/qdm2.c

avidemux/ADM_lavcodec/qdm2data.h

avidemux/ADM_lavcodec/qtrle.c

avidemux/ADM_lavcodec/ra144.c

avidemux/ADM_lavcodec/ra144.h

avidemux/ADM_lavcodec/ra288.c

avidemux/ADM_lavcodec/ra288.h

avidemux/ADM_lavcodec/rangecoder.c

avidemux/ADM_lavcodec/rangecoder.h

avidemux/ADM_lavcodec/ratecontrol.c

avidemux/ADM_lavcodec/raw.c

avidemux/ADM_lavcodec/resample.c

avidemux/ADM_lavcodec/resample2.c

avidemux/ADM_lavcodec/roqvideo.c

avidemux/ADM_lavcodec/rpza.c

avidemux/ADM_lavcodec/rv10.c

avidemux/ADM_lavcodec/simple_idct.c

avidemux/ADM_lavcodec/simple_idct.h

avidemux/ADM_lavcodec/smc.c

avidemux/ADM_lavcodec/snow.c

avidemux/ADM_lavcodec/snow.h

avidemux/ADM_lavcodec/sonic.c

avidemux/ADM_lavcodec/sp5x.h

avidemux/ADM_lavcodec/svq1.c

avidemux/ADM_lavcodec/svq1_cb.h

avidemux/ADM_lavcodec/svq1_vlc.h

avidemux/ADM_lavcodec/svq3.c

avidemux/ADM_lavcodec/swscale.h

avidemux/ADM_lavcodec/truemotion1.c

avidemux/ADM_lavcodec/truemotion1data.h

avidemux/ADM_lavcodec/tscc.c

avidemux/ADM_lavcodec/utils.c

avidemux/ADM_lavcodec/vc1.c

avidemux/ADM_lavcodec/vc1acdata.h

avidemux/ADM_lavcodec/vc1data.h

avidemux/ADM_lavcodec/vc1dsp.c

avidemux/ADM_lavcodec/vcr1.c

avidemux/ADM_lavcodec/vmdav.c

avidemux/ADM_lavcodec/vp3.c

avidemux/ADM_lavcodec/vp3data.h

avidemux/ADM_lavcodec/vp3dsp.c

avidemux/ADM_lavcodec/vqavideo.c

avidemux/ADM_lavcodec/w32thread.c

avidemux/ADM_lavcodec/wmadata.h

avidemux/ADM_lavcodec/wmadec.c

avidemux/ADM_lavcodec/wmv2.c

avidemux/ADM_lavcodec/xan.c

avidemux/ADM_lavcodec/xvmcvideo.c

avidemux/ADM_lavformat/avienc.c

avidemux/ADM_lavformat/isom.c

avidemux/ADM_lavformat/isom.h

avidemux/ADM_lavformat/matroska.c

avidemux/ADM_lavformat/mov.c

avidemux/ADM_lavformat/mov.h

avidemux/ADM_lavformat/riff.h

avidemux/ADM_lavformat/wav.c

avidemux/ADM_lavutil/adler32.c

avidemux/ADM_lavutil/adler32.h

avidemux/ADM_lavutil/crc.c

avidemux/ADM_lavutil/crc.h

avidemux/ADM_lavutil/internal.h

avidemux/ADM_lavutil/lls.c

avidemux/ADM_lavutil/lls.h

avidemux/ADM_lavutil/log.c

avidemux/ADM_lavutil/log.h

avidemux/ADM_lavutil/md5.c

avidemux/ADM_lavutil/md5.h

avidemux/ADM_lavutil/mem.c

avidemux/ADM_lavutil/x86_cpu.h

avidemux/ADM_libMad

avidemux/ADM_libMad/D.dat

avidemux/ADM_libMad/Makefile.am

avidemux/ADM_libMad/Makefile.in

avidemux/ADM_libMad/bit.c

avidemux/ADM_libMad/bit.h

avidemux/ADM_libMad/decoder.c

avidemux/ADM_libMad/decoder.h

avidemux/ADM_libMad/fixed.c

avidemux/ADM_libMad/fixed.h

avidemux/ADM_libMad/frame.c

avidemux/ADM_libMad/frame.h

avidemux/ADM_libMad/global.h

avidemux/ADM_libMad/huffman.c

avidemux/ADM_libMad/huffman.h

avidemux/ADM_libMad/imdct_s.dat

avidemux/ADM_libMad/layer12.c

avidemux/ADM_libMad/layer12.h

avidemux/ADM_libMad/layer3.c

avidemux/ADM_libMad/layer3.h

avidemux/ADM_libMad/mad.h

avidemux/ADM_libMad/madmem.h

avidemux/ADM_libMad/minimad.c

avidemux/ADM_libMad/qc_table.dat

avidemux/ADM_libMad/rq_table.dat

avidemux/ADM_libMad/sf_table.dat

avidemux/ADM_libMad/stream.c

avidemux/ADM_libMad/stream.h

avidemux/ADM_libMad/synth.c

avidemux/ADM_libMad/synth.h

avidemux/ADM_libMad/timer.c

avidemux/ADM_libMad/timer.h

avidemux/ADM_libMad/version.c

avidemux/ADM_libMad/version.h

avidemux/ADM_liba52

avidemux/ADM_liba52/Makefile.am

avidemux/ADM_liba52/Makefile.in

avidemux/ADM_liba52/a52.h

avidemux/ADM_liba52/a52_internal.h

avidemux/ADM_liba52/attributes.h

avidemux/ADM_liba52/bit_allocate.c

avidemux/ADM_liba52/bitstream.c

avidemux/ADM_liba52/bitstream.h

avidemux/ADM_liba52/downmix.c

avidemux/ADM_liba52/imdct.c

avidemux/ADM_liba52/mm_accel.h

avidemux/ADM_liba52/parse.c

avidemux/ADM_liba52/tables.h

avidemux/ADM_library/ADM_bitstream.cpp

avidemux/ADM_library/ADM_bitstream.h

avidemux/ADM_library/ADM_imageResizer.cpp

avidemux/ADM_library/avidemutils.h

avidemux/ADM_libswscale

avidemux/ADM_libswscale/ADM_mp.cpp

avidemux/ADM_libswscale/ADM_mp.h

avidemux/ADM_libswscale/Makefile.am

avidemux/ADM_libswscale/Makefile.in

avidemux/ADM_libswscale/rgb2rgb.c

avidemux/ADM_libswscale/rgb2rgb.h

avidemux/ADM_libswscale/rgb2rgb_template.c

avidemux/ADM_libswscale/swscale-example.c

avidemux/ADM_libswscale/swscale.c

avidemux/ADM_libswscale/swscale.h

avidemux/ADM_libswscale/swscale_altivec_template.c

avidemux/ADM_libswscale/swscale_internal.h

avidemux/ADM_libswscale/swscale_template.c

avidemux/ADM_libswscale/wrapper.h

avidemux/ADM_libswscale/yuv2rgb.c

avidemux/ADM_libswscale/yuv2rgb_altivec.c

avidemux/ADM_libswscale/yuv2rgb_mlib.c

avidemux/ADM_libswscale/yuv2rgb_template.c

avidemux/ADM_matroska

avidemux/ADM_matroska/ADM_mkv.cpp

avidemux/ADM_matroska/ADM_mkv.h

avidemux/ADM_matroska/ADM_mkv_audio.cpp

avidemux/ADM_matroska/Makefile.am

avidemux/ADM_matroska/Makefile.in

avidemux/ADM_mpegdemuxer/dmx_demuxerMSDVR.cpp

avidemux/ADM_mpegdemuxer/dmx_demuxerMSDVR.h

avidemux/ADM_mplex/ADM_mthread.cpp

avidemux/ADM_mplex/ADM_mthread.h

avidemux/ADM_mplex/streamType.h

avidemux/ADM_openDML/ADM_odml_audio.cpp

avidemux/ADM_openDML/ADM_odml_audio.h

avidemux/ADM_script/ADM_JSDirectorySearch.cpp

avidemux/ADM_script/ADM_JSDirectorySearch.h

avidemux/ADM_script/DirectorySearch.cpp

avidemux/ADM_script/DirectorySearch.h

avidemux/ADM_script/StdFile.h

avidemux/ADM_toolkit/ADM_audioQueue.cpp

avidemux/ADM_toolkit/ADM_audioQueue.h

avidemux/ADM_toolkit/ADM_intfloat.cpp

avidemux/ADM_toolkit/ADM_intfloat.h

avidemux/ADM_toolkit/ADM_packetQueue.cpp

avidemux/ADM_toolkit/ADM_packetQueue.h

avidemux/ADM_toolkit/ADM_queue.cpp

avidemux/ADM_toolkit/ADM_queue.h

avidemux/ADM_toolkit/ADM_threads.cpp

avidemux/ADM_toolkit/ADM_threads.h

avidemux/ADM_video/ADM_vidASS.cpp

avidemux/ADM_video/ADM_vidASS.h

avidemux/ADM_video/ADM_vidAnimated.cpp

avidemux/ADM_video/ADM_vidAnimated.h

avidemux/ADM_video/ADM_vidAnimated_param.h

avidemux/ADM_video/ADM_vidAss_Params.h

avidemux/ADM_video/ADM_vidColorYuv.cpp

avidemux/ADM_video/ADM_vidColorYuv.h

avidemux/ADM_video/ADM_vidColorYuv_param.h

avidemux/ADM_video/ADM_vidFade.cpp

avidemux/ADM_video/ADM_vidFade_param.h

avidemux/ADM_video/ADM_vidMcDeint.cpp

avidemux/ADM_video/ADM_vidMcDeint_param.h

avidemux/ADM_video/ADM_vidPartial_param.h

avidemux/ADM_video/ADM_vidReverse.cpp

avidemux/libass

avidemux/libass/Makefile.am

avidemux/libass/Makefile.in

avidemux/libass/ass.c

avidemux/libass/ass.h

avidemux/libass/ass_cache.c

avidemux/libass/ass_cache.h

avidemux/libass/ass_fontconfig.c

avidemux/libass/ass_fontconfig.h

avidemux/libass/ass_mp.c

avidemux/libass/ass_mp.h

avidemux/libass/ass_render.c

avidemux/libass/ass_types.h

avidemux/libass/ass_utils.c

avidemux/libass/ass_utils.h

avidemux/libass/mputils.c

avidemux/libass/mputils.h

avidemux/libtoolame/readme.txt

avidemux/libtoolame/twolame.c

avidemux/libtoolame/twolame.h

avidemux/libtoolame/util.c

avidemux/libtoolame/util.h

avidemux/oplug_mp4

avidemux/oplug_mp4/Makefile.am

avidemux/oplug_mp4/Makefile.in

avidemux/oplug_mp4/oplug_mp4.cpp

avidemux/oplug_mp4/oplug_mp4.h

avidemux/xpm/adm.ico

avidemux/xpm/adm.o

avidemux/xpm/adm.rc

avidemux/xpm/build/film1.png

avidemux/xpm/build/film11.png

avidemux/xpm/build/film13.png

avidemux/xpm/build/film15.png

avidemux/xpm/build/film17.png

avidemux/xpm/build/film19.png

avidemux/xpm/build/film21.png

avidemux/xpm/build/film23.png

avidemux/xpm/build/film3.png

avidemux/xpm/build/film5.png

avidemux/xpm/build/film7.png

avidemux/xpm/build/film9.png

avidemux/xpm/build/preview-button.png

avidemux/xpm/build/systray.png

avidemux/xpm/build/systray2.png

avidemux/xpm/film1.inc

avidemux/xpm/film11.inc

avidemux/xpm/film13.inc

avidemux/xpm/film15.inc

avidemux/xpm/film17.inc

avidemux/xpm/film19.inc

avidemux/xpm/film21.inc

avidemux/xpm/film23.inc

avidemux/xpm/film3.inc

avidemux/xpm/film5.inc

avidemux/xpm/film7.inc

avidemux/xpm/film9.inc

avidemux/xpm/preview-button.inc

avidemux/xpm/systray.inc

avidemux/xpm/systray2.inc

configure.bak

configure.in.bot

po/Makefile.in.in

po/cs.po

files removed:
aclocal.log

adm_lavcodec/4xm.c

adm_lavcodec/8bps.c

adm_lavcodec/Makefile.am

adm_lavcodec/Makefile.in

adm_lavcodec/a52dec.c

adm_lavcodec/ac3.h

adm_lavcodec/ac3dec.c

adm_lavcodec/ac3enc.c

adm_lavcodec/ac3tab.h

adm_lavcodec/adpcm.c

adm_lavcodec/adx.c

adm_lavcodec/allcodecs.c

adm_lavcodec/amr.c

adm_lavcodec/amr_float

adm_lavcodec/amr_float/decoder.c

adm_lavcodec/amr_float/encoder.c

adm_lavcodec/amr_float/interf_dec.c

adm_lavcodec/amr_float/interf_dec.h

adm_lavcodec/amr_float/interf_enc.c

adm_lavcodec/amr_float/interf_enc.h

adm_lavcodec/amr_float/interf_rom.h

adm_lavcodec/amr_float/rom_dec.h

adm_lavcodec/amr_float/rom_enc.h

adm_lavcodec/amr_float/sp_dec.c

adm_lavcodec/amr_float/sp_dec.h

adm_lavcodec/amr_float/sp_enc.c

adm_lavcodec/amr_float/sp_enc.h

adm_lavcodec/amr_float/typedef.h

adm_lavcodec/apiexample.c

adm_lavcodec/asv1.c

adm_lavcodec/avcodec.c

adm_lavcodec/avcodec.h

adm_lavcodec/bitstream.c

adm_lavcodec/bitstream.h

adm_lavcodec/cabac.c

adm_lavcodec/cabac.h

adm_lavcodec/cinepak.c

adm_lavcodec/cljr.c

adm_lavcodec/common.c

adm_lavcodec/config.mak

adm_lavcodec/cyuv.c

adm_lavcodec/dct-test.c

adm_lavcodec/dpcm.c

adm_lavcodec/dsputil.c

adm_lavcodec/dsputil.h

adm_lavcodec/dtsdec.c

adm_lavcodec/dv.c

adm_lavcodec/dvdata.h

adm_lavcodec/error_resilience.c

adm_lavcodec/faac.c

adm_lavcodec/faad.c

adm_lavcodec/faandct.c

adm_lavcodec/faandct.h

adm_lavcodec/fastmemcpy.h

adm_lavcodec/fdctref.c

adm_lavcodec/fft-test.c

adm_lavcodec/fft.c

adm_lavcodec/ffv1.c

adm_lavcodec/flac.c

adm_lavcodec/flicvideo.c

adm_lavcodec/g726.c

adm_lavcodec/golomb.c

adm_lavcodec/golomb.h

adm_lavcodec/h261.c

adm_lavcodec/h261data.h

adm_lavcodec/h263.c

adm_lavcodec/h263data.h

adm_lavcodec/h263dec.c

adm_lavcodec/h264.c

adm_lavcodec/h264data.h

adm_lavcodec/h264idct.c

adm_lavcodec/huffyuv.c

adm_lavcodec/i386

adm_lavcodec/i386/Makefile.am

adm_lavcodec/i386/Makefile.in

adm_lavcodec/i386/cputest.c

adm_lavcodec/i386/dsputil_h264_template_mmx.c

adm_lavcodec/i386/dsputil_mmx.c

adm_lavcodec/i386/dsputil_mmx_avg.h

adm_lavcodec/i386/dsputil_mmx_rnd.h

adm_lavcodec/i386/fdct_mmx.c

adm_lavcodec/i386/fft_sse.c

adm_lavcodec/i386/h264dsp_mmx.c

adm_lavcodec/i386/idct_mmx.c

adm_lavcodec/i386/mmx.h

adm_lavcodec/i386/motion_est_mmx.c

adm_lavcodec/i386/mpegvideo_mmx.c

adm_lavcodec/i386/mpegvideo_mmx_template.c

adm_lavcodec/i386/simple_idct_mmx.c

adm_lavcodec/i386/vp3dsp_mmx.c

adm_lavcodec/i386/vp3dsp_sse2.c

adm_lavcodec/idcinvideo.c

adm_lavcodec/imgconvert.c

adm_lavcodec/imgconvert_template.h

adm_lavcodec/imgresample.c

adm_lavcodec/indeo3.c

adm_lavcodec/indeo3data.h

adm_lavcodec/interplayvideo.c

adm_lavcodec/jfdctfst.c

adm_lavcodec/jfdctint.c

adm_lavcodec/jpeg_ls.c

adm_lavcodec/jrevdct.c

adm_lavcodec/lcl.c

adm_lavcodec/libpostproc

adm_lavcodec/libpostproc/Makefile.am

adm_lavcodec/libpostproc/Makefile.in

adm_lavcodec/libpostproc/mangle.h

adm_lavcodec/libpostproc/postprocess.c

adm_lavcodec/libpostproc/postprocess.h

adm_lavcodec/libpostproc/postprocess_altivec_template.c

adm_lavcodec/libpostproc/postprocess_internal.h

adm_lavcodec/libpostproc/postprocess_template.c

adm_lavcodec/mace.c

adm_lavcodec/mdct.c

adm_lavcodec/mdec.c

adm_lavcodec/mem.c

adm_lavcodec/mjpeg.c

adm_lavcodec/motion_est.c

adm_lavcodec/motion_est_template.c

adm_lavcodec/motion_test.c

adm_lavcodec/mp3lameaudio.c

adm_lavcodec/mpeg12.c

adm_lavcodec/mpeg12data.h

adm_lavcodec/mpeg4data.h

adm_lavcodec/mpegaudio.c

adm_lavcodec/mpegaudio.h

adm_lavcodec/mpegaudiodec.c

adm_lavcodec/mpegaudiodectab.h

adm_lavcodec/mpegaudiotab.h

adm_lavcodec/mpegvideo.c

adm_lavcodec/mpegvideo.h

adm_lavcodec/msmpeg4.c

adm_lavcodec/msmpeg4data.h

adm_lavcodec/msrle.c

adm_lavcodec/msvideo1.c

adm_lavcodec/oggvorbis.c

adm_lavcodec/oggvorbis.h

adm_lavcodec/opt.h

adm_lavcodec/opts.c

adm_lavcodec/os_support.h

adm_lavcodec/parser.c

adm_lavcodec/pcm.c

adm_lavcodec/ppc

adm_lavcodec/ppc/Makefile.am

adm_lavcodec/ppc/Makefile.in

adm_lavcodec/ppc/dsputil_altivec.c

adm_lavcodec/ppc/dsputil_altivec.h

adm_lavcodec/ppc/dsputil_h264_altivec.c

adm_lavcodec/ppc/dsputil_h264_template_altivec.c

adm_lavcodec/ppc/dsputil_ppc.c

adm_lavcodec/ppc/dsputil_ppc.h

adm_lavcodec/ppc/fdct_altivec.c

adm_lavcodec/ppc/fft_altivec.c

adm_lavcodec/ppc/gcc_fixes.h

adm_lavcodec/ppc/gmc_altivec.c

adm_lavcodec/ppc/idct_altivec.c

adm_lavcodec/ppc/mpegvideo_altivec.c

adm_lavcodec/ppc/mpegvideo_ppc.c

adm_lavcodec/pthread.c

adm_lavcodec/qtrle.c

adm_lavcodec/ra144.c

adm_lavcodec/ra144.h

adm_lavcodec/ra288.c

adm_lavcodec/ra288.h

adm_lavcodec/rangecoder.c

adm_lavcodec/rangecoder.h

adm_lavcodec/ratecontrol.c

adm_lavcodec/raw.c

adm_lavcodec/resample.c

adm_lavcodec/resample2.c

adm_lavcodec/roqvideo.c

adm_lavcodec/rpza.c

adm_lavcodec/rv10.c

adm_lavcodec/simple_idct.c

adm_lavcodec/simple_idct.h

adm_lavcodec/smc.c

adm_lavcodec/snow.c

adm_lavcodec/sonic.c

adm_lavcodec/sp5x.h

adm_lavcodec/svq1.c

adm_lavcodec/svq1_cb.h

adm_lavcodec/svq1_vlc.h

adm_lavcodec/svq3.c

adm_lavcodec/truemotion1.c

adm_lavcodec/truemotion1data.h

adm_lavcodec/tscc.c

adm_lavcodec/utils.c

adm_lavcodec/vcr1.c

adm_lavcodec/vmdav.c

adm_lavcodec/vp3.c

adm_lavcodec/vp3data.h

adm_lavcodec/vp3dsp.c

adm_lavcodec/vqavideo.c

adm_lavcodec/w32thread.c

adm_lavcodec/wmadata.h

adm_lavcodec/wmadec.c

adm_lavcodec/wmv2.c

adm_lavcodec/xan.c

adm_lavcodec/xvmcvideo.c

avidemux/ADM_audio/aviaudio.cpp

avidemux/ADM_audiocodec/ADM_AC3.cpp

avidemux/ADM_audiocodec/ADM_AC3.h

avidemux/ADM_audiocodec/ADM_ffwma.cpp

avidemux/ADM_audiocodec/avdm_mad.h

avidemux/ADM_audiocodec/mad.cpp

avidemux/ADM_audiofilter/ADM_libresample.cpp

avidemux/ADM_audiofilter/ADM_libresample.h

avidemux/ADM_audiofilter/audieng_piper.h

avidemux/ADM_audiofilter/audioeng_44sample.cpp

avidemux/ADM_audiofilter/audioeng_6dbpress.cpp

avidemux/ADM_audiofilter/audioeng_app.cpp

avidemux/ADM_audiofilter/audioeng_exlame.cpp

avidemux/ADM_audiofilter/audioeng_faac.cpp

avidemux/ADM_audiofilter/audioeng_faac.h

avidemux/ADM_audiofilter/audioeng_ffmp2.cpp

avidemux/ADM_audiofilter/audioeng_ffmp2.h

avidemux/ADM_audiofilter/audioeng_film2pal.cpp

avidemux/ADM_audiofilter/audioeng_film2pal.h

avidemux/ADM_audiofilter/audioeng_lame.cpp

avidemux/ADM_audiofilter/audioeng_lame.h

avidemux/ADM_audiofilter/audioeng_lebe.cpp

avidemux/ADM_audiofilter/audioeng_libtoolame.cpp

avidemux/ADM_audiofilter/audioeng_libtoolame.h

avidemux/ADM_audiofilter/audioeng_lpcm.cpp

avidemux/ADM_audiofilter/audioeng_lpcm.h

avidemux/ADM_audiofilter/audioeng_mono.cpp

avidemux/ADM_audiofilter/audioeng_normalize.cpp

avidemux/ADM_audiofilter/audioeng_null.cpp

avidemux/ADM_audiofilter/audioeng_piper.cpp

avidemux/ADM_audiofilter/audioeng_piper.h

avidemux/ADM_audiofilter/audioeng_rawshift.cpp

avidemux/ADM_audiofilter/audioeng_sox.cpp

avidemux/ADM_audiofilter/audioeng_sox.h

avidemux/ADM_audiofilter/audioeng_soxresample.cpp

avidemux/ADM_audiofilter/audioeng_toolame.cpp

avidemux/ADM_audiofilter/audioeng_toolame.h

avidemux/ADM_audiofilter/audioeng_tshift.cpp

avidemux/ADM_audiofilter/audioeng_vorbis.cpp

avidemux/ADM_audiofilter/audioeng_vorbis.h

avidemux/ADM_audiofilter/audioprocess.cpp

avidemux/ADM_lavutil/eval.c

avidemux/ADM_library/riffparser.cpp

avidemux/ADM_library/riffparser.h

avidemux/ADM_requantize.cpp

avidemux/ADM_video/ADM_guiChromaShift.cpp

avidemux/ADM_video/ADM_guiClean.cpp

avidemux/ADM_video/ADM_guiContrast.cpp

avidemux/ADM_video/ADM_guiConv.cpp

avidemux/ADM_video/ADM_guiDenoise.cpp

avidemux/ADM_video/ADM_guiRotate.cpp

avidemux/ADM_video/ADM_guiSRT.cpp

avidemux/ADM_video/ADM_vidpreview.cpp

avidemux/MPlayer_pp

avidemux/MPlayer_pp/ADM_mp.cpp

avidemux/MPlayer_pp/ADM_mp.h

avidemux/MPlayer_pp/Makefile.am

avidemux/MPlayer_pp/Makefile.in

avidemux/MPlayer_pp/img_format.h

avidemux/MPlayer_pp/rgb2rgb.c

avidemux/MPlayer_pp/rgb2rgb.h

avidemux/MPlayer_pp/rgb2rgb_template.c

avidemux/MPlayer_pp/swscale.c

avidemux/MPlayer_pp/swscale.h

avidemux/MPlayer_pp/swscale_altivec_template.c

avidemux/MPlayer_pp/swscale_internal.h

avidemux/MPlayer_pp/swscale_template.c

avidemux/MPlayer_pp/wrapper.h

avidemux/MPlayer_pp/yuv2rgb.c

avidemux/MPlayer_pp/yuv2rgb_altivec.c

avidemux/MPlayer_pp/yuv2rgb_template.c

avidemux/libtoolame/toolame.c

avidemux/libtoolame/toolame.h

avidemux/libtoolame/toolame_global_flags.h

avidemux/libtoolame/version.c

avidemux/oplug_mpeg/op_mpeg.cpp

avidemux/oplug_mpeg/op_mpeg.h

avidemux/oplug_mpeg/op_mpeg_write.h

avidemux/oplug_mpeg/op_mpegwrite.cpp

avidemux/wget-log

po/Makefile.iii

po/Makevars.template

po/Mokefile

po/Rules-quot

po/avidemux2.pot

po/avidemux2.tst

po/boldquot.sed

po/es.gmo

po/fr.gmo

po/insert-header.sin

po/klingon.gmo

po/quot.sed

po/ru.gmo

files modified:
Makefile.am

Makefile.in

aclocal.m4

addons/ffv1rec/Makefile

addons/ffv1rec/ffv1codec.c

addons/ffv1rec/ffv1rec.c

addons/tsscan/tsscan.cpp

admin/config.pl

admin/cvs.sh

admin/prefs_gen.pl

avidemux/ADM_3gp/ADM_3gp.cpp

avidemux/ADM_3gp/ADM_3gp.h

avidemux/ADM_3gp/ADM_3gpAudio.cpp

avidemux/ADM_3gp/ADM_atom.cpp

avidemux/ADM_3gp/ADM_infoextractor.cpp

avidemux/ADM_3gp/Makefile.am

avidemux/ADM_3gp/Makefile.in

avidemux/ADM_audio/ADM_a52info.cpp

avidemux/ADM_audio/Makefile.am

avidemux/ADM_audio/Makefile.in

avidemux/ADM_audio/audio_packetizer.cpp

avidemux/ADM_audio/audioac3ex.cpp

avidemux/ADM_audio/audiogen.cpp

avidemux/ADM_audio/audiomp3ex.cpp

avidemux/ADM_audio/audiosource_ext.cpp

avidemux/ADM_audio/audiotimeline.cpp

avidemux/ADM_audio/audiowavex.cpp

avidemux/ADM_audio/aviaudio.hxx

avidemux/ADM_audiocodec/ADM_8bits.cpp

avidemux/ADM_audiocodec/ADM_audiocodec.cpp

avidemux/ADM_audiocodec/ADM_audiocodec.h

avidemux/ADM_audiocodec/ADM_audiocodeclist.h

avidemux/ADM_audiocodec/ADM_codecac3.cpp

avidemux/ADM_audiocodec/ADM_codecfaad.cpp

avidemux/ADM_audiocodec/ADM_codecimaadpcm.cpp

avidemux/ADM_audiocodec/ADM_codecmp3.cpp

avidemux/ADM_audiocodec/ADM_codeculaw.cpp

avidemux/ADM_audiocodec/ADM_codecwav.cpp

avidemux/ADM_audiocodec/ADM_codecwma.cpp

avidemux/ADM_audiocodec/ADM_lpcm.cpp

avidemux/ADM_audiocodec/Makefile.am

avidemux/ADM_audiocodec/Makefile.in

avidemux/ADM_audiocodec/audiocodec_ogg.cpp

avidemux/ADM_audiodevice/ADM_audiodevice.cpp

avidemux/ADM_audiodevice/ADM_audiodevice.h

avidemux/ADM_audiodevice/ADM_deviceALSA.cpp

avidemux/ADM_audiodevice/ADM_deviceALSA.h

avidemux/ADM_audiodevice/ADM_deviceArts.cpp

avidemux/ADM_audiodevice/ADM_deviceArts.h

avidemux/ADM_audiodevice/ADM_deviceAudioCore.cpp

avidemux/ADM_audiodevice/ADM_deviceEsd.cpp

avidemux/ADM_audiodevice/ADM_deviceEsd.h

avidemux/ADM_audiodevice/ADM_deviceSDL.cpp

avidemux/ADM_audiodevice/ADM_deviceSDL.h

avidemux/ADM_audiodevice/ADM_deviceWin32.cpp

avidemux/ADM_audiodevice/ADM_deviceWin32.h

avidemux/ADM_audiodevice/ADM_deviceoss.cpp

avidemux/ADM_audiodevice/ADM_deviceoss.h

avidemux/ADM_audiodevice/Makefile.am

avidemux/ADM_audiodevice/Makefile.in

avidemux/ADM_audiodevice/audio_out.h

avidemux/ADM_audiofilter/Makefile.am

avidemux/ADM_audiofilter/Makefile.in

avidemux/ADM_audiofilter/audiodeng_buildfilters.cpp

avidemux/ADM_audiofilter/audioeng_buff.cpp

avidemux/ADM_audiofilter/audioeng_buildfilters.h

avidemux/ADM_audiofilter/audioprocess.hxx

avidemux/ADM_codecs/ADM_codec.h

avidemux/ADM_codecs/ADM_codecNull.h

avidemux/ADM_codecs/ADM_codecs.cpp

avidemux/ADM_codecs/ADM_divx4.cpp

avidemux/ADM_codecs/ADM_divx4.h

avidemux/ADM_codecs/ADM_divxEncode.cpp

avidemux/ADM_codecs/ADM_divxEncode.h

avidemux/ADM_codecs/ADM_divxInc.h

avidemux/ADM_codecs/ADM_ffmp43.cpp

avidemux/ADM_codecs/ADM_ffmp43.h

avidemux/ADM_codecs/ADM_ffmpeg.cpp

avidemux/ADM_codecs/ADM_ffmpeg.h

avidemux/ADM_codecs/ADM_ffmpegConfig.h

avidemux/ADM_codecs/ADM_mjpeg.cpp

avidemux/ADM_codecs/ADM_mjpeg.h

avidemux/ADM_codecs/ADM_mjpegEncode.cpp

avidemux/ADM_codecs/ADM_mjpegEncode.h

avidemux/ADM_codecs/ADM_mpeg.cpp

avidemux/ADM_codecs/ADM_mpeg.h

avidemux/ADM_codecs/ADM_png.cpp

avidemux/ADM_codecs/ADM_png.h

avidemux/ADM_codecs/ADM_rgb16.cpp

avidemux/ADM_codecs/ADM_rgb16.h

avidemux/ADM_codecs/ADM_theora_dec.cpp

avidemux/ADM_codecs/ADM_theora_dec.h

avidemux/ADM_codecs/ADM_theora_enc.h

avidemux/ADM_codecs/ADM_uyvy.cpp

avidemux/ADM_codecs/ADM_uyvy.h

avidemux/ADM_codecs/ADM_vp3.cpp

avidemux/ADM_codecs/ADM_vp3.h

avidemux/ADM_codecs/ADM_x264.cpp

avidemux/ADM_codecs/ADM_x264.h

avidemux/ADM_codecs/ADM_x264param.h

avidemux/ADM_codecs/ADM_xvid.cpp

avidemux/ADM_codecs/ADM_xvid.h

avidemux/ADM_codecs/ADM_xvid4.cpp

avidemux/ADM_codecs/ADM_xvid4.h

avidemux/ADM_codecs/ADM_xvid4param.h

avidemux/ADM_codecs/ADM_xvidcvs.cpp

avidemux/ADM_codecs/ADM_xvideco.h

avidemux/ADM_codecs/Makefile.am

avidemux/ADM_codecs/Makefile.in

avidemux/ADM_colorspace/ADM_rgb.cpp

avidemux/ADM_colorspace/ADM_rgb.h

avidemux/ADM_colorspace/Makefile.am

avidemux/ADM_colorspace/Makefile.in

avidemux/ADM_dialog/DIA_DVDff.cpp

avidemux/ADM_dialog/DIA_about.cpp

avidemux/ADM_dialog/DIA_audio.cpp

avidemux/ADM_dialog/DIA_audioTrack.cpp

avidemux/ADM_dialog/DIA_builtin.cpp

avidemux/ADM_dialog/DIA_busy.cpp

avidemux/ADM_dialog/DIA_busy.h

avidemux/ADM_dialog/DIA_calculator.cpp

avidemux/ADM_dialog/DIA_dnr.cpp

avidemux/ADM_dialog/DIA_encoding.cpp

avidemux/ADM_dialog/DIA_encoding.h

avidemux/ADM_dialog/DIA_enter.cpp

avidemux/ADM_dialog/DIA_idx_pg.cpp

avidemux/ADM_dialog/DIA_jobs.cpp

avidemux/ADM_dialog/DIA_jobs_save.cpp

avidemux/ADM_dialog/DIA_lame.cpp

avidemux/ADM_dialog/DIA_pause.cpp

avidemux/ADM_dialog/DIA_prefs.cpp

avidemux/ADM_dialog/DIA_properties.cpp

avidemux/ADM_dialog/DIA_requant.cpp

avidemux/ADM_dialog/DIA_resizeWiz.cpp

avidemux/ADM_dialog/DIA_resizeWiz.h

avidemux/ADM_dialog/DIA_v2v.cpp

avidemux/ADM_dialog/DIA_vobsub.cpp

avidemux/ADM_dialog/DIA_working.cpp

avidemux/ADM_dialog/DIA_x264.cpp

avidemux/ADM_dialog/DIA_xvid4.cpp

avidemux/ADM_dialog/Makefile.am

avidemux/ADM_dialog/Makefile.in

avidemux/ADM_editor/ADM_Video.cpp

avidemux/ADM_editor/ADM_Video.h

avidemux/ADM_editor/ADM_edAudio.cpp

avidemux/ADM_editor/ADM_edFrameType.cpp

avidemux/ADM_editor/ADM_edIdentify.cpp

avidemux/ADM_editor/ADM_edLoadSave.cpp

avidemux/ADM_editor/ADM_edRender.cpp

avidemux/ADM_editor/ADM_edit.cpp

avidemux/ADM_editor/ADM_edit.hxx

avidemux/ADM_editor/ADM_outputfmt.h

avidemux/ADM_editor/ADMedAVIAUD.cpp

avidemux/ADM_editor/Makefile.am

avidemux/ADM_editor/Makefile.in

avidemux/ADM_encoder/ADM_encCodecDesc.h

avidemux/ADM_encoder/ADM_vidEncode.hxx

avidemux/ADM_encoder/ADM_videocodeclist.h

avidemux/ADM_encoder/Makefile.am

avidemux/ADM_encoder/Makefile.in

avidemux/ADM_encoder/adm_encConfig.cpp

avidemux/ADM_encoder/adm_encConfig.h

avidemux/ADM_encoder/adm_encXvid4.cpp

avidemux/ADM_encoder/adm_encXvid4.h

avidemux/ADM_encoder/adm_encdivx.cpp

avidemux/ADM_encoder/adm_encdivx.h

avidemux/ADM_encoder/adm_encffmatrix.h

avidemux/ADM_encoder/adm_encffmpeg.cpp

avidemux/ADM_encoder/adm_encffmpeg.h

avidemux/ADM_encoder/adm_encffmpeg1.cpp

avidemux/ADM_encoder/adm_encmjpeg.cpp

avidemux/ADM_encoder/adm_encmjpeg.h

avidemux/ADM_encoder/adm_encmjpeg_param.h

avidemux/ADM_encoder/adm_encoder.cpp

avidemux/ADM_encoder/adm_encoder.h

avidemux/ADM_encoder/adm_encx264.cpp

avidemux/ADM_encoder/adm_encx264.h

avidemux/ADM_encoder/adm_encxvid.cpp

avidemux/ADM_encoder/adm_encxvid.h

avidemux/ADM_encoder/xvid_vbr.h

avidemux/ADM_filter/Makefile.am

avidemux/ADM_filter/Makefile.in

avidemux/ADM_filter/filter.cpp

avidemux/ADM_filter/filter_declaration.cpp

avidemux/ADM_filter/filter_saveload.cpp

avidemux/ADM_filter/gui_filter.cpp

avidemux/ADM_filter/vidVCD.cpp

avidemux/ADM_filter/vidVCD.h

avidemux/ADM_filter/video_filters.h

avidemux/ADM_gui2/GUI_bindings.cpp

avidemux/ADM_gui2/GUI_keymap.cpp

avidemux/ADM_gui2/GUI_main2.cpp

avidemux/ADM_gui2/GUI_menumap.h

avidemux/ADM_gui2/GUI_render.cpp

avidemux/ADM_gui2/GUI_ui.h

avidemux/ADM_gui2/Makefile.am

avidemux/ADM_gui2/Makefile.in

avidemux/ADM_gui2/support.cpp

avidemux/ADM_guiBitrate.cpp

avidemux/ADM_h263/ADM_h263.cpp

avidemux/ADM_h263/Makefile.am

avidemux/ADM_h263/Makefile.in

avidemux/ADM_inpics/ADM_pics.cpp

avidemux/ADM_inpics/Makefile.am

avidemux/ADM_inpics/Makefile.in

avidemux/ADM_lavcodec.h

avidemux/ADM_lavformat/ADM_lavformat.cpp

avidemux/ADM_lavformat/ADM_lavformat.h

avidemux/ADM_lavformat/ADM_muxts.cpp

avidemux/ADM_lavformat/Makefile.am

avidemux/ADM_lavformat/Makefile.in

avidemux/ADM_lavformat/avformat.h

avidemux/ADM_lavformat/movenc.c

avidemux/ADM_lavformat/mpeg.c

avidemux/ADM_lavformat/utils.c

avidemux/ADM_lavutil/Makefile.am

avidemux/ADM_lavutil/Makefile.in

avidemux/ADM_lavutil/avutil.h

avidemux/ADM_lavutil/bswap.h

avidemux/ADM_lavutil/common.h

avidemux/ADM_lavutil/integer.c

avidemux/ADM_lavutil/integer.h

avidemux/ADM_lavutil/intfloat_readwrite.c

avidemux/ADM_lavutil/intfloat_readwrite.h

avidemux/ADM_lavutil/mathematics.c

avidemux/ADM_lavutil/rational.c

avidemux/ADM_lavutil/rational.h

avidemux/ADM_library/ADM_image.cpp

avidemux/ADM_library/ADM_image.h

avidemux/ADM_library/Makefile.am

avidemux/ADM_library/Makefile.in

avidemux/ADM_library/avidemutils.cpp

avidemux/ADM_library/avifmt.h

avidemux/ADM_library/avifmt2.h

avidemux/ADM_library/default.h

avidemux/ADM_lvemux/ADM_muxer.cpp

avidemux/ADM_lvemux/Makefile.am

avidemux/ADM_lvemux/Makefile.in

avidemux/ADM_memsupport.cpp

avidemux/ADM_mpegdemuxer/Makefile.am

avidemux/ADM_mpegdemuxer/Makefile.in

avidemux/ADM_mpegdemuxer/dmx_audio.cpp

avidemux/ADM_mpegdemuxer/dmx_audio.h

avidemux/ADM_mpegdemuxer/dmx_demuxerPS.cpp

avidemux/ADM_mpegdemuxer/dmx_demuxerTS.cpp

avidemux/ADM_mpegdemuxer/dmx_identify.cpp

avidemux/ADM_mpegdemuxer/dmx_identify.h

avidemux/ADM_mpegdemuxer/dmx_indexer.cpp

avidemux/ADM_mpegdemuxer/dmx_probe.cpp

avidemux/ADM_mpegdemuxer/dmx_video.cpp

avidemux/ADM_mpegdemuxer/dmx_video.h

avidemux/ADM_mplex/ADM_inout.h

avidemux/ADM_mplex/ADM_mplexmuxer.cpp

avidemux/ADM_mplex/ADM_mplexout.cpp

avidemux/ADM_mplex/ADM_transfert.cpp

avidemux/ADM_mplex/ADM_transfert.h

avidemux/ADM_mplex/Makefile.am

avidemux/ADM_mplex/Makefile.in

avidemux/ADM_mplex/bits.hpp

avidemux/ADM_mplex/interact.cpp

avidemux/ADM_mplex/interact.hpp

avidemux/ADM_nuv/ADM_nuv.cpp

avidemux/ADM_nuv/ADM_nuvAudio.cpp

avidemux/ADM_nuv/Makefile.am

avidemux/ADM_nuv/Makefile.in

avidemux/ADM_ocr/ADM_ocrLoadSave.h

avidemux/ADM_ocr/ADM_vob2vobsub.cpp

avidemux/ADM_ocr/Makefile.am

avidemux/ADM_ocr/Makefile.in

avidemux/ADM_ocr/adm_ocr.cpp

avidemux/ADM_ogm/ADM_ogm.cpp

avidemux/ADM_ogm/ADM_ogm.h

avidemux/ADM_ogm/Makefile.am

avidemux/ADM_ogm/Makefile.in

avidemux/ADM_openDML/ADM_odml_odml.cpp

avidemux/ADM_openDML/ADM_openDML.cpp

avidemux/ADM_openDML/ADM_openDML.h

avidemux/ADM_openDML/ADM_openDMLDepack.cpp

avidemux/ADM_openDML/Makefile.am

avidemux/ADM_openDML/Makefile.in

avidemux/ADM_pp.cpp

avidemux/ADM_pp.h

avidemux/ADM_requant/Makefile.am

avidemux/ADM_requant/Makefile.in

avidemux/ADM_script/ADM_Avidemux.cpp

avidemux/ADM_script/ADM_Avidemux.h

avidemux/ADM_script/ADM_AvidemuxAudio.h

avidemux/ADM_script/ADM_JSAvidemux.cpp

avidemux/ADM_script/ADM_JSAvidemux.h

avidemux/ADM_script/ADM_JSAvidemuxAudio.cpp

avidemux/ADM_script/ADM_JSAvidemuxAudio.h

avidemux/ADM_script/ADM_JSAvidemuxVideo.cpp

avidemux/ADM_script/ADM_JSAvidemuxVideo.h

avidemux/ADM_script/ADM_JSFunctions.cpp

avidemux/ADM_script/ADM_JSGlobal.cpp

avidemux/ADM_script/ADM_JSGlobal.h

avidemux/ADM_script/ADM_container.h

avidemux/ADM_script/Makefile.am

avidemux/ADM_script/Makefile.in

avidemux/ADM_toolkit/ADM_cpuCap.cpp

avidemux/ADM_toolkit/ADM_cpuCap.h

avidemux/ADM_toolkit/ADM_debug.cpp

avidemux/ADM_toolkit/ADM_debugID.h

avidemux/ADM_toolkit/ADM_memcpy.cpp

avidemux/ADM_toolkit/Makefile.am

avidemux/ADM_toolkit/Makefile.in

avidemux/ADM_toolkit/TLK_clock.cpp

avidemux/ADM_toolkit/TLK_filesel.cpp

avidemux/ADM_toolkit/automation.cpp

avidemux/ADM_toolkit/eggtray_win32.c

avidemux/ADM_toolkit/eggtrayicon.c

avidemux/ADM_toolkit/filesel.h

avidemux/ADM_toolkit/systray.h

avidemux/ADM_toolkit/toolkit.cpp

avidemux/ADM_toolkit/toolkit.hxx

avidemux/ADM_toolkit/toolkit_dialog.cpp

avidemux/ADM_toolkit/win32.cpp

avidemux/ADM_tray/ADM_tray.cpp

avidemux/ADM_tray/Makefile.am

avidemux/ADM_tray/Makefile.in

avidemux/ADM_video/ADM_confCouple.h

avidemux/ADM_video/ADM_confCouples.cpp

avidemux/ADM_video/ADM_genvideo.cpp

avidemux/ADM_video/ADM_genvideo.hxx

avidemux/ADM_video/ADM_guiAddBorder.cpp

avidemux/ADM_video/ADM_guiBSMear.cpp

avidemux/ADM_video/ADM_guiCrop.cpp

avidemux/ADM_video/ADM_guiResize.cpp

avidemux/ADM_video/ADM_vidChroma.h

avidemux/ADM_video/ADM_vidDelta.cpp

avidemux/ADM_video/ADM_vidFieldUnblend.cpp

avidemux/ADM_video/ADM_vidFields.cpp

avidemux/ADM_video/ADM_vidFlipV.h

avidemux/ADM_video/ADM_vidFlux.cpp

avidemux/ADM_video/ADM_vidFont.cpp

avidemux/ADM_video/ADM_vidForcedPP.cpp

avidemux/ADM_video/ADM_vidKernelDeint.cpp

avidemux/ADM_video/ADM_vidLargeMedian.cpp

avidemux/ADM_video/ADM_vidLuma.h

avidemux/ADM_video/ADM_vidMPLD3D.cpp

avidemux/ADM_video/ADM_vidMPLD3Dlow.cpp

avidemux/ADM_video/ADM_vidMPLResize.cpp

avidemux/ADM_video/ADM_vidMPdelogo.cpp

avidemux/ADM_video/ADM_vidMSharpen.cpp

avidemux/ADM_video/ADM_vidMosaic.cpp

avidemux/ADM_video/ADM_vidNull.cpp

avidemux/ADM_video/ADM_vidPalShift.cpp

avidemux/ADM_video/ADM_vidPartial.cpp

avidemux/ADM_video/ADM_vidPartial.h

avidemux/ADM_video/ADM_vidResampleFPS.cpp

avidemux/ADM_video/ADM_vidSRT.cpp

avidemux/ADM_video/ADM_vidSRT.h

avidemux/ADM_video/ADM_vidSRTload.cpp

avidemux/ADM_video/ADM_vidSeparateField.h

avidemux/ADM_video/ADM_vidSoften.cpp

avidemux/ADM_video/ADM_vidSwapFields.h

avidemux/ADM_video/ADM_vidSwapSmart.cpp

avidemux/ADM_video/ADM_vidSwapSmart.h

avidemux/ADM_video/ADM_vidUVSwap.h

avidemux/ADM_video/ADM_vidVlad.cpp

avidemux/ADM_video/ADM_vidVlad.h

avidemux/ADM_video/ADM_vidVobSubRender.cpp

avidemux/ADM_video/ADM_vobsubinfo.cpp

avidemux/ADM_video/Makefile.am

avidemux/ADM_video/Makefile.in

avidemux/ADM_vp32/DSystemDependant.c

avidemux/ADM_vp32/Huffman.c

avidemux/ADM_vp32/Makefile.am

avidemux/ADM_vp32/Makefile.in

avidemux/ADM_vp32/include/Makefile.in

avidemux/ADM_xvidratectl/ADM_xvidratectl.cpp

avidemux/ADM_xvidratectl/Makefile.am

avidemux/ADM_xvidratectl/Makefile.in

avidemux/GUI_jobs.cpp

avidemux/Makefile.am

avidemux/Makefile.in

avidemux/admmangle.h

avidemux/avilist.cpp

avidemux/callbacks.cpp

avidemux/gtk_gui.cpp

avidemux/gui_action.hxx

avidemux/gui_autodrive.cpp

avidemux/gui_navigate.cpp

avidemux/gui_savenew.cpp

avidemux/guiplay.cpp

avidemux/libMpeg2Dec/Makefile.am

avidemux/libMpeg2Dec/Makefile.in

avidemux/libtoolame/Makefile.am

avidemux/libtoolame/Makefile.in

avidemux/libtoolame/ath.c

avidemux/libtoolame/ath.h

avidemux/libtoolame/availbits.c

avidemux/libtoolame/availbits.h

avidemux/libtoolame/bitbuffer.c

avidemux/libtoolame/bitbuffer.h

avidemux/libtoolame/common.h

avidemux/libtoolame/crc.c

avidemux/libtoolame/crc.h

avidemux/libtoolame/dab.c

avidemux/libtoolame/dab.h

avidemux/libtoolame/encode.c

avidemux/libtoolame/encode.h

avidemux/libtoolame/energy.c

avidemux/libtoolame/energy.h

avidemux/libtoolame/enwindow.h

avidemux/libtoolame/fft.c

avidemux/libtoolame/fft.h

avidemux/libtoolame/get_set.c

avidemux/libtoolame/mem.c

avidemux/libtoolame/mem.h

avidemux/libtoolame/psycho_0.c

avidemux/libtoolame/psycho_0.h

avidemux/libtoolame/psycho_1.c

avidemux/libtoolame/psycho_1.h

avidemux/libtoolame/psycho_1_critband.h

avidemux/libtoolame/psycho_1_freqtable.h

avidemux/libtoolame/psycho_2.c

avidemux/libtoolame/psycho_2.h

avidemux/libtoolame/psycho_2_absthr.h

avidemux/libtoolame/psycho_3.c

avidemux/libtoolame/psycho_3.h

avidemux/libtoolame/psycho_4.c

avidemux/libtoolame/psycho_4.h

avidemux/libtoolame/psycho_n1.c

avidemux/libtoolame/psycho_n1.h

avidemux/libtoolame/subband.c

avidemux/libtoolame/subband.h

avidemux/main.cpp

avidemux/mpeg2enc/ADM_mpe2enc.cpp

avidemux/mpeg2enc/ADM_mpeg2enc.h

avidemux/mpeg2enc/Makefile.am

avidemux/mpeg2enc/Makefile.in

avidemux/mpeg2enc/altivec/Makefile.in

avidemux/mpeg2enc/motion.cc

avidemux/mpeg2enc/motionsearch.cc

avidemux/mpeg2enc/mpeg2enc_if.cc

avidemux/mpeg2enc/mpeg2parm.h

avidemux/mpeg2enc/mpeg2setup.cc

avidemux/mpeg2enc/predict_ref.cc

avidemux/mpeg2enc/quantize_ref.cc

avidemux/mpeg2enc/quantize_ref.h

avidemux/mpeg2enc/quantize_x86.cc

avidemux/mpeg2enc/ratectl.cc

avidemux/mpeg2enc/transfrm_ref.cc

avidemux/oplug_avi/Makefile.am

avidemux/oplug_avi/Makefile.in

avidemux/oplug_avi/op_avisave.cpp

avidemux/oplug_avi/op_avisave.h

avidemux/oplug_avi/op_avisavecopy.cpp

avidemux/oplug_avi/op_avisavedual.cpp

avidemux/oplug_avi/op_aviwrite.cpp

avidemux/oplug_avi/op_savecopy.h

avidemux/oplug_avi/op_saveprocess.cpp

avidemux/oplug_avi/op_saveprocess.h

avidemux/oplug_avi/op_savesmart.cpp

avidemux/oplug_avi/op_savesmart.hxx

avidemux/oplug_mpeg/Makefile.am

avidemux/oplug_mpeg/Makefile.in

avidemux/oplug_mpeg/op_mpegpass.cpp

avidemux/oplug_mpegFF/Makefile.am

avidemux/oplug_mpegFF/Makefile.in

avidemux/oplug_mpegFF/oplug_vcdff.cpp

avidemux/oplug_ogm/Makefile.am

avidemux/oplug_ogm/Makefile.in

avidemux/oplug_ogm/op_ogaudio.cpp

avidemux/oplug_ogm/op_ogpage.cpp

avidemux/oplug_ogm/op_ogsave.cpp

avidemux/oplug_ogm/op_ogsavecopy.cpp

avidemux/oplug_ogm/op_ogsaveprocess.cpp

avidemux/prefs.cpp

avidemux/prefs.h

avidemux/prefs.in

avidemux/xpm/Makefile.am

avidemux/xpm/Makefile.in

avidemux/xpm/build/Makefile

config.h.in

configure

configure.darwin

configure.files

configure.in

configure.in.in

debian/changelog

m4/Makefile.in

po/LINGUAS

po/Makefile.in

po/Makevars

po/POTFILES.in

po/avidemux.pot

po/es.po

po/fr.po

po/klingon.po

po/ru.po

po/update_pot.bash

subdirs

Show diffs side-by-side

added added

removed removed

adm_lavcodec/ppc/dsputil_altivec.c

* This library is free software; you can redistribute it and/or

* modify it under the terms of the GNU Lesser General Public

* License as published by the Free Software Foundation; either

* version 2 of the License, or (at your option) any later version.

* This library is distributed in the hope that it will be useful,

* but WITHOUT ANY WARRANTY; without even the implied warranty of

* MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE. See the GNU

* Lesser General Public License for more details.

* You should have received a copy of the GNU Lesser General Public

* License along with this library; if not, write to the Free Software

* Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA 02111-1307 USA

#include "../dsputil.h"

#include "gcc_fixes.h"

#include "dsputil_altivec.h"

#ifdef CONFIG_DARWIN

#include <sys/sysctl.h>

#else /* CONFIG_DARWIN */

#ifdef __AMIGAOS4__

#include <exec/exec.h>

#include <interfaces/exec.h>

#include <proto/exec.h>

#else /* __AMIGAOS4__ */

#include <signal.h>

#include <setjmp.h>

static sigjmp_buf jmpbuf;

static volatile sig_atomic_t canjump = 0;

static void sigill_handler (int sig)

{

if (!canjump) {

signal (sig, SIG_DFL);

raise (sig);

}

canjump = 0;

siglongjmp (jmpbuf, 1);

}

#endif /* CONFIG_DARWIN */

#endif /* __AMIGAOS4__ */

int sad16_x2_altivec(void *v, uint8_t *pix1, uint8_t *pix2, int line_size, int h)

{

int i;

int s __attribute__((aligned(16)));

const_vector unsigned char zero = (const_vector unsigned char)vec_splat_u8(0);

vector unsigned char *tv;

vector unsigned char pix1v, pix2v, pix2iv, avgv, t5;

vector unsigned int sad;

vector signed int sumdiffs;

s = 0;

sad = (vector unsigned int)vec_splat_u32(0);

for(i=0;i<h;i++) {

Read unaligned pixels into our vectors. The vectors are as follows:

pix1v: pix1[0]-pix1[15]

pix2v: pix2[0]-pix2[15] pix2iv: pix2[1]-pix2[16]

tv = (vector unsigned char *) pix1;

pix1v = vec_perm(tv[0], tv[1], vec_lvsl(0, pix1));

tv = (vector unsigned char *) &pix2[0];

pix2v = vec_perm(tv[0], tv[1], vec_lvsl(0, &pix2[0]));

tv = (vector unsigned char *) &pix2[1];

pix2iv = vec_perm(tv[0], tv[1], vec_lvsl(0, &pix2[1]));

/* Calculate the average vector */

avgv = vec_avg(pix2v, pix2iv);

/* Calculate a sum of abs differences vector */

t5 = vec_sub(vec_max(pix1v, avgv), vec_min(pix1v, avgv));

/* Add each 4 pixel group together and put 4 results into sad */

sad = vec_sum4s(t5, sad);

pix1 += line_size;

pix2 += line_size;

}

/* Sum up the four partial sums, and put the result into s */

sumdiffs = vec_sums((vector signed int) sad, (vector signed int) zero);

sumdiffs = vec_splat(sumdiffs, 3);

vec_ste(sumdiffs, 0, &s);

return s;

}

100

101

int sad16_y2_altivec(void *v, uint8_t *pix1, uint8_t *pix2, int line_size, int h)

102

{

103

int i;

104

int s __attribute__((aligned(16)));

105

const_vector unsigned char zero = (const_vector unsigned char)vec_splat_u8(0);

106

vector unsigned char *tv;

107

vector unsigned char pix1v, pix2v, pix3v, avgv, t5;

108

vector unsigned int sad;

109

vector signed int sumdiffs;

110

uint8_t *pix3 = pix2 + line_size;

111

112

s = 0;

113

sad = (vector unsigned int)vec_splat_u32(0);

114

115

116

Due to the fact that pix3 = pix2 + line_size, the pix3 of one

117

iteration becomes pix2 in the next iteration. We can use this

118

fact to avoid a potentially expensive unaligned read, each

119

time around the loop.

120

Read unaligned pixels into our vectors. The vectors are as follows:

121

pix2v: pix2[0]-pix2[15]

122

Split the pixel vectors into shorts

123

124

tv = (vector unsigned char *) &pix2[0];

125

pix2v = vec_perm(tv[0], tv[1], vec_lvsl(0, &pix2[0]));

126

127

for(i=0;i<h;i++) {

128

129

Read unaligned pixels into our vectors. The vectors are as follows:

130

pix1v: pix1[0]-pix1[15]

131

pix3v: pix3[0]-pix3[15]

132

133

tv = (vector unsigned char *) pix1;

134

pix1v = vec_perm(tv[0], tv[1], vec_lvsl(0, pix1));

135

136

tv = (vector unsigned char *) &pix3[0];

137

pix3v = vec_perm(tv[0], tv[1], vec_lvsl(0, &pix3[0]));

138

139

/* Calculate the average vector */

140

avgv = vec_avg(pix2v, pix3v);

141

142

/* Calculate a sum of abs differences vector */

143

t5 = vec_sub(vec_max(pix1v, avgv), vec_min(pix1v, avgv));

144

145

/* Add each 4 pixel group together and put 4 results into sad */

146

sad = vec_sum4s(t5, sad);

147

148

pix1 += line_size;

149

pix2v = pix3v;

150

pix3 += line_size;

151

152

}

153

154

/* Sum up the four partial sums, and put the result into s */

155

sumdiffs = vec_sums((vector signed int) sad, (vector signed int) zero);

156

sumdiffs = vec_splat(sumdiffs, 3);

157

vec_ste(sumdiffs, 0, &s);

158

return s;

159

}

160

161

int sad16_xy2_altivec(void *v, uint8_t *pix1, uint8_t *pix2, int line_size, int h)

162

{

163

int i;

164

int s __attribute__((aligned(16)));

165

uint8_t *pix3 = pix2 + line_size;

166

const_vector unsigned char zero = (const_vector unsigned char)vec_splat_u8(0);

167

const_vector unsigned short two = (const_vector unsigned short)vec_splat_u16(2);

168

vector unsigned char *tv, avgv, t5;

169

vector unsigned char pix1v, pix2v, pix3v, pix2iv, pix3iv;

170

vector unsigned short pix2lv, pix2hv, pix2ilv, pix2ihv;

171

vector unsigned short pix3lv, pix3hv, pix3ilv, pix3ihv;

172

vector unsigned short avghv, avglv;

173

vector unsigned short t1, t2, t3, t4;

174

vector unsigned int sad;

175

vector signed int sumdiffs;

176

177

sad = (vector unsigned int)vec_splat_u32(0);

178

179

s = 0;

180

181

182

Due to the fact that pix3 = pix2 + line_size, the pix3 of one

183

iteration becomes pix2 in the next iteration. We can use this

184

fact to avoid a potentially expensive unaligned read, as well

185

as some splitting, and vector addition each time around the loop.

186

Read unaligned pixels into our vectors. The vectors are as follows:

187

pix2v: pix2[0]-pix2[15] pix2iv: pix2[1]-pix2[16]

188

Split the pixel vectors into shorts

189

190

tv = (vector unsigned char *) &pix2[0];

191

pix2v = vec_perm(tv[0], tv[1], vec_lvsl(0, &pix2[0]));

192

193

tv = (vector unsigned char *) &pix2[1];

194

pix2iv = vec_perm(tv[0], tv[1], vec_lvsl(0, &pix2[1]));

195

196

pix2hv = (vector unsigned short) vec_mergeh(zero, pix2v);

197

pix2lv = (vector unsigned short) vec_mergel(zero, pix2v);

198

pix2ihv = (vector unsigned short) vec_mergeh(zero, pix2iv);

199

pix2ilv = (vector unsigned short) vec_mergel(zero, pix2iv);

200

t1 = vec_add(pix2hv, pix2ihv);

201

t2 = vec_add(pix2lv, pix2ilv);

202

203

for(i=0;i<h;i++) {

204

205

Read unaligned pixels into our vectors. The vectors are as follows:

206

pix1v: pix1[0]-pix1[15]

207

pix3v: pix3[0]-pix3[15] pix3iv: pix3[1]-pix3[16]

208

209

tv = (vector unsigned char *) pix1;

210

pix1v = vec_perm(tv[0], tv[1], vec_lvsl(0, pix1));

211

212

tv = (vector unsigned char *) &pix3[0];

213

pix3v = vec_perm(tv[0], tv[1], vec_lvsl(0, &pix3[0]));

214

215

tv = (vector unsigned char *) &pix3[1];

216

pix3iv = vec_perm(tv[0], tv[1], vec_lvsl(0, &pix3[1]));

217

218

219

Note that Altivec does have vec_avg, but this works on vector pairs

220

and rounds up. We could do avg(avg(a,b),avg(c,d)), but the rounding

221

would mean that, for example, avg(3,0,0,1) = 2, when it should be 1.

222

Instead, we have to split the pixel vectors into vectors of shorts,

223

and do the averaging by hand.

224

225

226

/* Split the pixel vectors into shorts */

227

pix3hv = (vector unsigned short) vec_mergeh(zero, pix3v);

228

pix3lv = (vector unsigned short) vec_mergel(zero, pix3v);

229

pix3ihv = (vector unsigned short) vec_mergeh(zero, pix3iv);

230

pix3ilv = (vector unsigned short) vec_mergel(zero, pix3iv);

231

232

/* Do the averaging on them */

233

t3 = vec_add(pix3hv, pix3ihv);

234

t4 = vec_add(pix3lv, pix3ilv);

235

236

avghv = vec_sr(vec_add(vec_add(t1, t3), two), two);

237

avglv = vec_sr(vec_add(vec_add(t2, t4), two), two);

238

239

/* Pack the shorts back into a result */

240

avgv = vec_pack(avghv, avglv);

241

242

/* Calculate a sum of abs differences vector */

243

t5 = vec_sub(vec_max(pix1v, avgv), vec_min(pix1v, avgv));

244

245

/* Add each 4 pixel group together and put 4 results into sad */

246

sad = vec_sum4s(t5, sad);

247

248

pix1 += line_size;

249

pix3 += line_size;

250

/* Transfer the calculated values for pix3 into pix2 */

251

t1 = t3;

252

t2 = t4;

253

}

254

/* Sum up the four partial sums, and put the result into s */

255

sumdiffs = vec_sums((vector signed int) sad, (vector signed int) zero);

256

sumdiffs = vec_splat(sumdiffs, 3);

257

vec_ste(sumdiffs, 0, &s);

258

259

return s;

260

}

261

262

int sad16_altivec(void *v, uint8_t *pix1, uint8_t *pix2, int line_size, int h)

263

{

264

int i;

265

int s __attribute__((aligned(16)));

266

const_vector unsigned int zero = (const_vector unsigned int)vec_splat_u32(0);

267

vector unsigned char perm1, perm2, *pix1v, *pix2v;

268

vector unsigned char t1, t2, t3,t4, t5;

269

vector unsigned int sad;

270

vector signed int sumdiffs;

271

272

sad = (vector unsigned int)vec_splat_u32(0);

273

274

275

for(i=0;i<h;i++) {

276

/* Read potentially unaligned pixels into t1 and t2 */

277

perm1 = vec_lvsl(0, pix1);

278

pix1v = (vector unsigned char *) pix1;

279

perm2 = vec_lvsl(0, pix2);

280

pix2v = (vector unsigned char *) pix2;

281

t1 = vec_perm(pix1v[0], pix1v[1], perm1);

282

t2 = vec_perm(pix2v[0], pix2v[1], perm2);

283

284

/* Calculate a sum of abs differences vector */

285

t3 = vec_max(t1, t2);

286

t4 = vec_min(t1, t2);

287

t5 = vec_sub(t3, t4);

288

289

/* Add each 4 pixel group together and put 4 results into sad */

290

sad = vec_sum4s(t5, sad);

291

292

pix1 += line_size;

293

pix2 += line_size;

294

}

295

296

/* Sum up the four partial sums, and put the result into s */

297

sumdiffs = vec_sums((vector signed int) sad, (vector signed int) zero);

298

sumdiffs = vec_splat(sumdiffs, 3);

299

vec_ste(sumdiffs, 0, &s);

300

301

return s;

302

}

303

304

int sad8_altivec(void *v, uint8_t *pix1, uint8_t *pix2, int line_size, int h)

305

{

306

int i;

307

int s __attribute__((aligned(16)));

308

const_vector unsigned int zero = (const_vector unsigned int)vec_splat_u32(0);

309

vector unsigned char perm1, perm2, permclear, *pix1v, *pix2v;

310

vector unsigned char t1, t2, t3,t4, t5;

311

vector unsigned int sad;

312

vector signed int sumdiffs;

313

314

sad = (vector unsigned int)vec_splat_u32(0);

315

316

permclear = (vector unsigned char)AVV(255,255,255,255,255,255,255,255,0,0,0,0,0,0,0,0);

317

318

for(i=0;i<h;i++) {

319

/* Read potentially unaligned pixels into t1 and t2

320

Since we're reading 16 pixels, and actually only want 8,

321

mask out the last 8 pixels. The 0s don't change the sum. */

322

perm1 = vec_lvsl(0, pix1);

323

pix1v = (vector unsigned char *) pix1;

324

perm2 = vec_lvsl(0, pix2);

325

pix2v = (vector unsigned char *) pix2;

326

t1 = vec_and(vec_perm(pix1v[0], pix1v[1], perm1), permclear);

327

t2 = vec_and(vec_perm(pix2v[0], pix2v[1], perm2), permclear);

328

329

/* Calculate a sum of abs differences vector */

330

t3 = vec_max(t1, t2);

331

t4 = vec_min(t1, t2);

332

t5 = vec_sub(t3, t4);

333

334

/* Add each 4 pixel group together and put 4 results into sad */

335

sad = vec_sum4s(t5, sad);

336

337

pix1 += line_size;

338

pix2 += line_size;

339

}

340

341

/* Sum up the four partial sums, and put the result into s */

342

sumdiffs = vec_sums((vector signed int) sad, (vector signed int) zero);

343

sumdiffs = vec_splat(sumdiffs, 3);

344

vec_ste(sumdiffs, 0, &s);

345

346

return s;

347

}

348

349

int pix_norm1_altivec(uint8_t *pix, int line_size)

350

{

351

int i;

352

int s __attribute__((aligned(16)));

353

const_vector unsigned int zero = (const_vector unsigned int)vec_splat_u32(0);

354

vector unsigned char *tv;

355

vector unsigned char pixv;

356

vector unsigned int sv;

357

vector signed int sum;

358

359

sv = (vector unsigned int)vec_splat_u32(0);

360

361

s = 0;

362

for (i = 0; i < 16; i++) {

363

/* Read in the potentially unaligned pixels */

364

tv = (vector unsigned char *) pix;

365

pixv = vec_perm(tv[0], tv[1], vec_lvsl(0, pix));

366

367

/* Square the values, and add them to our sum */

368

sv = vec_msum(pixv, pixv, sv);

369

370

pix += line_size;

371

}

372

/* Sum up the four partial sums, and put the result into s */

373

sum = vec_sums((vector signed int) sv, (vector signed int) zero);

374

sum = vec_splat(sum, 3);

375

vec_ste(sum, 0, &s);

376

377

return s;

378

}

379

380

/**

381

* Sum of Squared Errors for a 8x8 block.

382

* AltiVec-enhanced.

383

* It's the sad8_altivec code above w/ squaring added.

384

385

int sse8_altivec(void *v, uint8_t *pix1, uint8_t *pix2, int line_size, int h)

386

{

387

int i;

388

int s __attribute__((aligned(16)));

389

const_vector unsigned int zero = (const_vector unsigned int)vec_splat_u32(0);

390

vector unsigned char perm1, perm2, permclear, *pix1v, *pix2v;

391

vector unsigned char t1, t2, t3,t4, t5;

392

vector unsigned int sum;

393

vector signed int sumsqr;

394

395

sum = (vector unsigned int)vec_splat_u32(0);

396

397

permclear = (vector unsigned char)AVV(255,255,255,255,255,255,255,255,0,0,0,0,0,0,0,0);

398

399

400

for(i=0;i<h;i++) {

401

/* Read potentially unaligned pixels into t1 and t2

402

Since we're reading 16 pixels, and actually only want 8,

403

mask out the last 8 pixels. The 0s don't change the sum. */

404

perm1 = vec_lvsl(0, pix1);

405

pix1v = (vector unsigned char *) pix1;

406

perm2 = vec_lvsl(0, pix2);

407

pix2v = (vector unsigned char *) pix2;

408

t1 = vec_and(vec_perm(pix1v[0], pix1v[1], perm1), permclear);

409

t2 = vec_and(vec_perm(pix2v[0], pix2v[1], perm2), permclear);

410

411

412

Since we want to use unsigned chars, we can take advantage

413

of the fact that abs(a-b)^2 = (a-b)^2.

414

415

416

/* Calculate abs differences vector */

417

t3 = vec_max(t1, t2);

418

t4 = vec_min(t1, t2);

419

t5 = vec_sub(t3, t4);

420

421

/* Square the values and add them to our sum */

422

sum = vec_msum(t5, t5, sum);

423

424

pix1 += line_size;

425

pix2 += line_size;

426

}

427

428

/* Sum up the four partial sums, and put the result into s */

429

sumsqr = vec_sums((vector signed int) sum, (vector signed int) zero);

430

sumsqr = vec_splat(sumsqr, 3);

431

vec_ste(sumsqr, 0, &s);

432

433

return s;

434

}

435

436

/**

437

* Sum of Squared Errors for a 16x16 block.

438

* AltiVec-enhanced.

439

* It's the sad16_altivec code above w/ squaring added.

440

441

int sse16_altivec(void *v, uint8_t *pix1, uint8_t *pix2, int line_size, int h)

442

{

443

int i;

444

int s __attribute__((aligned(16)));

445

const_vector unsigned int zero = (const_vector unsigned int)vec_splat_u32(0);

446

vector unsigned char perm1, perm2, *pix1v, *pix2v;

447

vector unsigned char t1, t2, t3,t4, t5;

448

vector unsigned int sum;

449

vector signed int sumsqr;

450

451

sum = (vector unsigned int)vec_splat_u32(0);

452

453

for(i=0;i<h;i++) {

454

/* Read potentially unaligned pixels into t1 and t2 */

455

perm1 = vec_lvsl(0, pix1);

456

pix1v = (vector unsigned char *) pix1;

457

perm2 = vec_lvsl(0, pix2);

458

pix2v = (vector unsigned char *) pix2;

459

t1 = vec_perm(pix1v[0], pix1v[1], perm1);

460

t2 = vec_perm(pix2v[0], pix2v[1], perm2);

461

462

463

Since we want to use unsigned chars, we can take advantage

464

of the fact that abs(a-b)^2 = (a-b)^2.

465

466

467

/* Calculate abs differences vector */

468

t3 = vec_max(t1, t2);

469

t4 = vec_min(t1, t2);

470

t5 = vec_sub(t3, t4);

471

472

/* Square the values and add them to our sum */

473

sum = vec_msum(t5, t5, sum);

474

475

pix1 += line_size;

476

pix2 += line_size;

477

}

478

479

/* Sum up the four partial sums, and put the result into s */

480

sumsqr = vec_sums((vector signed int) sum, (vector signed int) zero);

481

sumsqr = vec_splat(sumsqr, 3);

482

vec_ste(sumsqr, 0, &s);

483

484

return s;

485

}

486

487

int pix_sum_altivec(uint8_t * pix, int line_size)

488

{

489

const_vector unsigned int zero = (const_vector unsigned int)vec_splat_u32(0);

490

vector unsigned char perm, *pixv;

491

vector unsigned char t1;

492

vector unsigned int sad;

493

vector signed int sumdiffs;

494

495

int i;

496

int s __attribute__((aligned(16)));

497

498

sad = (vector unsigned int)vec_splat_u32(0);

499

500

for (i = 0; i < 16; i++) {

501

/* Read the potentially unaligned 16 pixels into t1 */

502

perm = vec_lvsl(0, pix);

503

pixv = (vector unsigned char *) pix;

504

t1 = vec_perm(pixv[0], pixv[1], perm);

505

506

/* Add each 4 pixel group together and put 4 results into sad */

507

sad = vec_sum4s(t1, sad);

508

509

pix += line_size;

510

}

511

512

/* Sum up the four partial sums, and put the result into s */

513

sumdiffs = vec_sums((vector signed int) sad, (vector signed int) zero);

514

sumdiffs = vec_splat(sumdiffs, 3);

515

vec_ste(sumdiffs, 0, &s);

516

517

return s;

518

}

519

520

void get_pixels_altivec(DCTELEM *restrict block, const uint8_t *pixels, int line_size)

521

{

522

int i;

523

vector unsigned char perm, bytes, *pixv;

524

const_vector unsigned char zero = (const_vector unsigned char)vec_splat_u8(0);

525

vector signed short shorts;

526

527

for(i=0;i<8;i++)

528

{

529

// Read potentially unaligned pixels.

530

// We're reading 16 pixels, and actually only want 8,

531

// but we simply ignore the extras.

532

perm = vec_lvsl(0, pixels);

533

pixv = (vector unsigned char *) pixels;

534

bytes = vec_perm(pixv[0], pixv[1], perm);

535

536

// convert the bytes into shorts

537

shorts = (vector signed short)vec_mergeh(zero, bytes);

538

539

// save the data to the block, we assume the block is 16-byte aligned

540

vec_st(shorts, i*16, (vector signed short*)block);

541

542

pixels += line_size;

543

}

544

}

545

546

void diff_pixels_altivec(DCTELEM *restrict block, const uint8_t *s1,

547

const uint8_t *s2, int stride)

548

{

549

int i;

550

vector unsigned char perm, bytes, *pixv;

551

const_vector unsigned char zero = (const_vector unsigned char)vec_splat_u8(0);

552

vector signed short shorts1, shorts2;

553

554

for(i=0;i<4;i++)

555

{

556

// Read potentially unaligned pixels

557

// We're reading 16 pixels, and actually only want 8,

558

// but we simply ignore the extras.

559

perm = vec_lvsl(0, s1);

560

pixv = (vector unsigned char *) s1;

561

bytes = vec_perm(pixv[0], pixv[1], perm);

562

563

// convert the bytes into shorts

564

shorts1 = (vector signed short)vec_mergeh(zero, bytes);

565

566

// Do the same for the second block of pixels

567

perm = vec_lvsl(0, s2);

568

pixv = (vector unsigned char *) s2;

569

bytes = vec_perm(pixv[0], pixv[1], perm);

570

571

// convert the bytes into shorts

572

shorts2 = (vector signed short)vec_mergeh(zero, bytes);

573

574

// Do the subtraction

575

shorts1 = vec_sub(shorts1, shorts2);

576

577

// save the data to the block, we assume the block is 16-byte aligned

578

vec_st(shorts1, 0, (vector signed short*)block);

579

580

s1 += stride;

581

s2 += stride;

582

block += 8;

583

584

585

// The code below is a copy of the code above... This is a manual

586

// unroll.

587

588

// Read potentially unaligned pixels

589

// We're reading 16 pixels, and actually only want 8,

590

// but we simply ignore the extras.

591

perm = vec_lvsl(0, s1);

592

pixv = (vector unsigned char *) s1;

593

bytes = vec_perm(pixv[0], pixv[1], perm);

594

595

// convert the bytes into shorts

596

shorts1 = (vector signed short)vec_mergeh(zero, bytes);

597

598

// Do the same for the second block of pixels

599

perm = vec_lvsl(0, s2);

600

pixv = (vector unsigned char *) s2;

601

bytes = vec_perm(pixv[0], pixv[1], perm);

602

603

// convert the bytes into shorts

604

shorts2 = (vector signed short)vec_mergeh(zero, bytes);

605

606

// Do the subtraction

607

shorts1 = vec_sub(shorts1, shorts2);

608

609

// save the data to the block, we assume the block is 16-byte aligned

610

vec_st(shorts1, 0, (vector signed short*)block);

611

612

s1 += stride;

613

s2 += stride;

614

block += 8;

615

}

616

}

617

618

void add_bytes_altivec(uint8_t *dst, uint8_t *src, int w) {

619

#ifdef ALTIVEC_USE_REFERENCE_C_CODE

620

int i;

621

for(i=0; i+7<w; i++){

622

dst[i+0] += src[i+0];

623

dst[i+1] += src[i+1];

624

dst[i+2] += src[i+2];

625

dst[i+3] += src[i+3];

626

dst[i+4] += src[i+4];

627

dst[i+5] += src[i+5];

628

dst[i+6] += src[i+6];

629

dst[i+7] += src[i+7];

630

}

631

for(; i<w; i++)

632

dst[i+0] += src[i+0];

633

#else /* ALTIVEC_USE_REFERENCE_C_CODE */

634

635

636

637

/* dst and src are 16 bytes-aligned (guaranteed) */

638

for(i = 0 ; (i + 15) < w ; i++)

639

{

640

vdst = vec_ld(i << 4, (unsigned char*)dst);

641

vsrc = vec_ld(i << 4, (unsigned char*)src);

642

vdst = vec_add(vsrc, vdst);

643

vec_st(vdst, i << 4, (unsigned char*)dst);

644

}

645

/* if w is not a multiple of 16 */

646

for (; (i < w) ; i++)

647

{

648

dst[i] = src[i];

649

}

650

#endif /* ALTIVEC_USE_REFERENCE_C_CODE */

651

}

652

653

/* next one assumes that ((line_size % 16) == 0) */

654

void put_pixels16_altivec(uint8_t *block, const uint8_t *pixels, int line_size, int h)

655

{

656

POWERPC_PERF_DECLARE(altivec_put_pixels16_num, 1);

657

#ifdef ALTIVEC_USE_REFERENCE_C_CODE

658

int i;

659

660

POWERPC_PERF_START_COUNT(altivec_put_pixels16_num, 1);

661

662

for(i=0; i<h; i++) {

663

*((uint32_t*)(block)) = LD32(pixels);

664

*((uint32_t*)(block+4)) = LD32(pixels+4);

665

*((uint32_t*)(block+8)) = LD32(pixels+8);

666

*((uint32_t*)(block+12)) = LD32(pixels+12);

667

pixels+=line_size;

668

block +=line_size;

669

}

670

671

POWERPC_PERF_STOP_COUNT(altivec_put_pixels16_num, 1);

672

673

#else /* ALTIVEC_USE_REFERENCE_C_CODE */

674

675

676

677

678

679

680

int i;

681

682

683

684

685

POWERPC_PERF_START_COUNT(altivec_put_pixels16_num, 1);

686

// hand-unrolling the loop by 4 gains about 15%

687

// mininum execution time goes from 74 to 60 cycles

688

// it's faster than -funroll-loops, but using

689

// -funroll-loops w/ this is bad - 74 cycles again.

690

// all this is on a 7450, tuning for the 7450

691

#if 0

692

for(i=0; i<h; i++) {

693

pixelsv1 = vec_ld(0, (unsigned char*)pixels);

694

pixelsv2 = vec_ld(16, (unsigned char*)pixels);

695

vec_st(vec_perm(pixelsv1, pixelsv2, perm),

696

0, (unsigned char*)block);

697

pixels+=line_size;

698

block +=line_size;

699

}

700

#else

701

for(i=0; i<h; i+=4) {

702

pixelsv1 = vec_ld(0, (unsigned char*)pixels);

703

pixelsv2 = vec_ld(16, (unsigned char*)pixels);

704

pixelsv1B = vec_ld(line_size, (unsigned char*)pixels);

705

pixelsv2B = vec_ld(16 + line_size, (unsigned char*)pixels);

706

pixelsv1C = vec_ld(line_size_2, (unsigned char*)pixels);

707

pixelsv2C = vec_ld(16 + line_size_2, (unsigned char*)pixels);

708

pixelsv1D = vec_ld(line_size_3, (unsigned char*)pixels);

709

pixelsv2D = vec_ld(16 + line_size_3, (unsigned char*)pixels);

710

vec_st(vec_perm(pixelsv1, pixelsv2, perm),

711

0, (unsigned char*)block);

712

vec_st(vec_perm(pixelsv1B, pixelsv2B, perm),

713

line_size, (unsigned char*)block);

714

vec_st(vec_perm(pixelsv1C, pixelsv2C, perm),

715

line_size_2, (unsigned char*)block);

716

vec_st(vec_perm(pixelsv1D, pixelsv2D, perm),

717

line_size_3, (unsigned char*)block);

718

pixels+=line_size_4;

719

block +=line_size_4;

720

}

721

#endif

722

POWERPC_PERF_STOP_COUNT(altivec_put_pixels16_num, 1);

723

724

#endif /* ALTIVEC_USE_REFERENCE_C_CODE */

725

}

726

727

/* next one assumes that ((line_size % 16) == 0) */

728

#define op_avg(a,b) a = ( ((a)|(b)) - ((((a)^(b))&0xFEFEFEFEUL)>>1) )

729

void avg_pixels16_altivec(uint8_t *block, const uint8_t *pixels, int line_size, int h)

730

{

731

POWERPC_PERF_DECLARE(altivec_avg_pixels16_num, 1);

732

#ifdef ALTIVEC_USE_REFERENCE_C_CODE

733

int i;

734

735

POWERPC_PERF_START_COUNT(altivec_avg_pixels16_num, 1);

736

737

for(i=0; i<h; i++) {

738

op_avg(*((uint32_t*)(block)),LD32(pixels));

739

op_avg(*((uint32_t*)(block+4)),LD32(pixels+4));

740

op_avg(*((uint32_t*)(block+8)),LD32(pixels+8));

741

op_avg(*((uint32_t*)(block+12)),LD32(pixels+12));

742

pixels+=line_size;

743

block +=line_size;

744

}

745

746

POWERPC_PERF_STOP_COUNT(altivec_avg_pixels16_num, 1);

747

748

#else /* ALTIVEC_USE_REFERENCE_C_CODE */

749

750

751

int i;

752

753

POWERPC_PERF_START_COUNT(altivec_avg_pixels16_num, 1);

754

755

for(i=0; i<h; i++) {

756

pixelsv1 = vec_ld(0, (unsigned char*)pixels);

757

pixelsv2 = vec_ld(16, (unsigned char*)pixels);

758

blockv = vec_ld(0, block);

759

pixelsv = vec_perm(pixelsv1, pixelsv2, perm);

760

blockv = vec_avg(blockv,pixelsv);

761

vec_st(blockv, 0, (unsigned char*)block);

762

pixels+=line_size;

763

block +=line_size;

764

}

765

766

POWERPC_PERF_STOP_COUNT(altivec_avg_pixels16_num, 1);

767

768

#endif /* ALTIVEC_USE_REFERENCE_C_CODE */

769

}

770

771

/* next one assumes that ((line_size % 8) == 0) */

772

void avg_pixels8_altivec(uint8_t * block, const uint8_t * pixels, int line_size, int h)

773

{

774

POWERPC_PERF_DECLARE(altivec_avg_pixels8_num, 1);

775

#ifdef ALTIVEC_USE_REFERENCE_C_CODE

776

int i;

777

POWERPC_PERF_START_COUNT(altivec_avg_pixels8_num, 1);

778

for (i = 0; i < h; i++) {

779

*((uint32_t *) (block)) =

780

(((*((uint32_t *) (block))) |

781

((((const struct unaligned_32 *) (pixels))->l))) -

782

((((*((uint32_t *) (block))) ^

783

((((const struct unaligned_32 *) (pixels))->

784

l))) & 0xFEFEFEFEUL) >> 1));

785

*((uint32_t *) (block + 4)) =

786

(((*((uint32_t *) (block + 4))) |

787

((((const struct unaligned_32 *) (pixels + 4))->l))) -

788

((((*((uint32_t *) (block + 4))) ^

789

((((const struct unaligned_32 *) (pixels +

790

4))->

791

l))) & 0xFEFEFEFEUL) >> 1));

792

pixels += line_size;

793

block += line_size;

794

}

795

POWERPC_PERF_STOP_COUNT(altivec_avg_pixels8_num, 1);

796

797

#else /* ALTIVEC_USE_REFERENCE_C_CODE */

798

799

int i;

800

801

POWERPC_PERF_START_COUNT(altivec_avg_pixels8_num, 1);

802

803

for (i = 0; i < h; i++) {

804

805

block is 8 bytes-aligned, so we're either in the

806

left block (16 bytes-aligned) or in the right block (not)

807

808

int rightside = ((unsigned long)block & 0x0000000F);

809

810

blockv = vec_ld(0, block);

811

pixelsv1 = vec_ld(0, (unsigned char*)pixels);

812

pixelsv2 = vec_ld(16, (unsigned char*)pixels);

813

pixelsv = vec_perm(pixelsv1, pixelsv2, vec_lvsl(0, pixels));

814

815

if (rightside)

816

{

817

pixelsv = vec_perm(blockv, pixelsv, vcprm(0,1,s0,s1));

818

}

819

else

820

{

821

pixelsv = vec_perm(blockv, pixelsv, vcprm(s0,s1,2,3));

822

}

823

824

blockv = vec_avg(blockv, pixelsv);

825

826

vec_st(blockv, 0, block);

827

828

pixels += line_size;

829

block += line_size;

830

}

831

832

POWERPC_PERF_STOP_COUNT(altivec_avg_pixels8_num, 1);

833

834

#endif /* ALTIVEC_USE_REFERENCE_C_CODE */

835

}

836

837

/* next one assumes that ((line_size % 8) == 0) */

838

void put_pixels8_xy2_altivec(uint8_t *block, const uint8_t *pixels, int line_size, int h)

839

{

840

POWERPC_PERF_DECLARE(altivec_put_pixels8_xy2_num, 1);

841

#ifdef ALTIVEC_USE_REFERENCE_C_CODE

842

int j;

843

POWERPC_PERF_START_COUNT(altivec_put_pixels8_xy2_num, 1);

844

for (j = 0; j < 2; j++) {

845

int i;

846

const uint32_t a = (((const struct unaligned_32 *) (pixels))->l);

847

const uint32_t b =

848

(((const struct unaligned_32 *) (pixels + 1))->l);

849

uint32_t l0 =

850

(a & 0x03030303UL) + (b & 0x03030303UL) + 0x02020202UL;

851

uint32_t h0 =

852

((a & 0xFCFCFCFCUL) >> 2) + ((b & 0xFCFCFCFCUL) >> 2);

853

uint32_t l1, h1;

854

pixels += line_size;

855

for (i = 0; i < h; i += 2) {

856

uint32_t a = (((const struct unaligned_32 *) (pixels))->l);

857

uint32_t b = (((const struct unaligned_32 *) (pixels + 1))->l);

858

l1 = (a & 0x03030303UL) + (b & 0x03030303UL);

859

h1 = ((a & 0xFCFCFCFCUL) >> 2) + ((b & 0xFCFCFCFCUL) >> 2);

860

*((uint32_t *) block) =

861

h0 + h1 + (((l0 + l1) >> 2) & 0x0F0F0F0FUL);

862

pixels += line_size;

863

block += line_size;

864

a = (((const struct unaligned_32 *) (pixels))->l);

865

b = (((const struct unaligned_32 *) (pixels + 1))->l);

866

l0 = (a & 0x03030303UL) + (b & 0x03030303UL) + 0x02020202UL;

867

h0 = ((a & 0xFCFCFCFCUL) >> 2) + ((b & 0xFCFCFCFCUL) >> 2);

868

*((uint32_t *) block) =

869

h0 + h1 + (((l0 + l1) >> 2) & 0x0F0F0F0FUL);

870

pixels += line_size;

871

block += line_size;

872

} pixels += 4 - line_size * (h + 1);

873

block += 4 - line_size * h;

874

}

875

876

POWERPC_PERF_STOP_COUNT(altivec_put_pixels8_xy2_num, 1);

877

878

#else /* ALTIVEC_USE_REFERENCE_C_CODE */

879

880

881

pixelsv1, pixelsv2,

882

pixelsavg;

883

884

blockv, temp1, temp2;

885

886

pixelssum1, pixelssum2, temp3;

887

888

889

890

temp1 = vec_ld(0, pixels);

891

temp2 = vec_ld(16, pixels);

892

pixelsv1 = vec_perm(temp1, temp2, vec_lvsl(0, pixels));

893

if ((((unsigned long)pixels) & 0x0000000F) == 0x0000000F)

894

{

895

pixelsv2 = temp2;

896

}

897

else

898

{

899

pixelsv2 = vec_perm(temp1, temp2, vec_lvsl(1, pixels));

900

}

901

pixelsv1 = vec_mergeh(vczero, pixelsv1);

902

pixelsv2 = vec_mergeh(vczero, pixelsv2);

903

pixelssum1 = vec_add((vector unsigned short)pixelsv1,

904

(vector unsigned short)pixelsv2);

905

pixelssum1 = vec_add(pixelssum1, vctwo);

906

907

POWERPC_PERF_START_COUNT(altivec_put_pixels8_xy2_num, 1);

908

for (i = 0; i < h ; i++) {

909

int rightside = ((unsigned long)block & 0x0000000F);

910

blockv = vec_ld(0, block);

911

912

temp1 = vec_ld(line_size, pixels);

913

temp2 = vec_ld(line_size + 16, pixels);

914

pixelsv1 = vec_perm(temp1, temp2, vec_lvsl(line_size, pixels));

915

if (((((unsigned long)pixels) + line_size) & 0x0000000F) == 0x0000000F)

916

{

917

pixelsv2 = temp2;

918

}

919

else

920

{

921

pixelsv2 = vec_perm(temp1, temp2, vec_lvsl(line_size + 1, pixels));

922

}

923

924

pixelsv1 = vec_mergeh(vczero, pixelsv1);

925

pixelsv2 = vec_mergeh(vczero, pixelsv2);

926

pixelssum2 = vec_add((vector unsigned short)pixelsv1,

927

(vector unsigned short)pixelsv2);

928

temp3 = vec_add(pixelssum1, pixelssum2);

929

temp3 = vec_sra(temp3, vctwo);

930

pixelssum1 = vec_add(pixelssum2, vctwo);

931

pixelsavg = vec_packsu(temp3, (vector unsigned short) vczero);

932

933

if (rightside)

934

{

935

blockv = vec_perm(blockv, pixelsavg, vcprm(0, 1, s0, s1));

936

}

937

else

938

{

939

blockv = vec_perm(blockv, pixelsavg, vcprm(s0, s1, 2, 3));

940

}

941

942

vec_st(blockv, 0, block);

943

944

block += line_size;

945

pixels += line_size;

946

}

947

948

POWERPC_PERF_STOP_COUNT(altivec_put_pixels8_xy2_num, 1);

949

#endif /* ALTIVEC_USE_REFERENCE_C_CODE */

950

}

951

952

/* next one assumes that ((line_size % 8) == 0) */

953

void put_no_rnd_pixels8_xy2_altivec(uint8_t *block, const uint8_t *pixels, int line_size, int h)

954

{

955

POWERPC_PERF_DECLARE(altivec_put_no_rnd_pixels8_xy2_num, 1);

956

#ifdef ALTIVEC_USE_REFERENCE_C_CODE

957

int j;

958

POWERPC_PERF_START_COUNT(altivec_put_no_rnd_pixels8_xy2_num, 1);

959

for (j = 0; j < 2; j++) {

960

int i;

961

const uint32_t a = (((const struct unaligned_32 *) (pixels))->l);

962

const uint32_t b =

963

(((const struct unaligned_32 *) (pixels + 1))->l);

964

uint32_t l0 =

965

(a & 0x03030303UL) + (b & 0x03030303UL) + 0x01010101UL;

966

uint32_t h0 =

967

((a & 0xFCFCFCFCUL) >> 2) + ((b & 0xFCFCFCFCUL) >> 2);

968

uint32_t l1, h1;

969

pixels += line_size;

970

for (i = 0; i < h; i += 2) {

971

uint32_t a = (((const struct unaligned_32 *) (pixels))->l);

972

uint32_t b = (((const struct unaligned_32 *) (pixels + 1))->l);

973

l1 = (a & 0x03030303UL) + (b & 0x03030303UL);

974

h1 = ((a & 0xFCFCFCFCUL) >> 2) + ((b & 0xFCFCFCFCUL) >> 2);

975

*((uint32_t *) block) =

976

h0 + h1 + (((l0 + l1) >> 2) & 0x0F0F0F0FUL);

977

pixels += line_size;

978

block += line_size;

979

a = (((const struct unaligned_32 *) (pixels))->l);

980

b = (((const struct unaligned_32 *) (pixels + 1))->l);

981

l0 = (a & 0x03030303UL) + (b & 0x03030303UL) + 0x01010101UL;

982

h0 = ((a & 0xFCFCFCFCUL) >> 2) + ((b & 0xFCFCFCFCUL) >> 2);

983

*((uint32_t *) block) =

984

h0 + h1 + (((l0 + l1) >> 2) & 0x0F0F0F0FUL);

985

pixels += line_size;

986

block += line_size;

987

} pixels += 4 - line_size * (h + 1);

988

block += 4 - line_size * h;

989

}

990

991

POWERPC_PERF_STOP_COUNT(altivec_put_no_rnd_pixels8_xy2_num, 1);

992

993

#else /* ALTIVEC_USE_REFERENCE_C_CODE */

994

995

996

pixelsv1, pixelsv2,

997

pixelsavg;

998

999

blockv, temp1, temp2;

1000

1001

pixelssum1, pixelssum2, temp3;

1002

1003

1004

1005

1006

temp1 = vec_ld(0, pixels);

1007

temp2 = vec_ld(16, pixels);

1008

pixelsv1 = vec_perm(temp1, temp2, vec_lvsl(0, pixels));

1009

if ((((unsigned long)pixels) & 0x0000000F) == 0x0000000F)

1010

{

1011

pixelsv2 = temp2;

1012

}

1013

else

1014

{

1015

pixelsv2 = vec_perm(temp1, temp2, vec_lvsl(1, pixels));

1016

}

1017

pixelsv1 = vec_mergeh(vczero, pixelsv1);

1018

pixelsv2 = vec_mergeh(vczero, pixelsv2);

1019

pixelssum1 = vec_add((vector unsigned short)pixelsv1,

1020

(vector unsigned short)pixelsv2);

1021

pixelssum1 = vec_add(pixelssum1, vcone);

1022

1023

POWERPC_PERF_START_COUNT(altivec_put_no_rnd_pixels8_xy2_num, 1);

1024

for (i = 0; i < h ; i++) {

1025

int rightside = ((unsigned long)block & 0x0000000F);

1026

blockv = vec_ld(0, block);

1027

1028

temp1 = vec_ld(line_size, pixels);

1029

temp2 = vec_ld(line_size + 16, pixels);

1030

pixelsv1 = vec_perm(temp1, temp2, vec_lvsl(line_size, pixels));

1031

if (((((unsigned long)pixels) + line_size) & 0x0000000F) == 0x0000000F)

1032

{

1033

pixelsv2 = temp2;

1034

}

1035

else

1036

{

1037

pixelsv2 = vec_perm(temp1, temp2, vec_lvsl(line_size + 1, pixels));

1038

}

1039

1040

pixelsv1 = vec_mergeh(vczero, pixelsv1);

1041

pixelsv2 = vec_mergeh(vczero, pixelsv2);

1042

pixelssum2 = vec_add((vector unsigned short)pixelsv1,

1043

(vector unsigned short)pixelsv2);

1044

temp3 = vec_add(pixelssum1, pixelssum2);

1045

temp3 = vec_sra(temp3, vctwo);

1046

pixelssum1 = vec_add(pixelssum2, vcone);

1047

pixelsavg = vec_packsu(temp3, (vector unsigned short) vczero);

1048

1049

if (rightside)

1050

{

1051

blockv = vec_perm(blockv, pixelsavg, vcprm(0, 1, s0, s1));

1052

}

1053

else

1054

{

1055

blockv = vec_perm(blockv, pixelsavg, vcprm(s0, s1, 2, 3));

1056

}

1057

1058

vec_st(blockv, 0, block);

1059

1060

block += line_size;

1061

pixels += line_size;

1062

}

1063

1064

POWERPC_PERF_STOP_COUNT(altivec_put_no_rnd_pixels8_xy2_num, 1);

1065

#endif /* ALTIVEC_USE_REFERENCE_C_CODE */

1066

}

1067

1068

/* next one assumes that ((line_size % 16) == 0) */

1069

void put_pixels16_xy2_altivec(uint8_t * block, const uint8_t * pixels, int line_size, int h)

1070

{

1071

POWERPC_PERF_DECLARE(altivec_put_pixels16_xy2_num, 1);

1072

#ifdef ALTIVEC_USE_REFERENCE_C_CODE

1073

int j;

1074

POWERPC_PERF_START_COUNT(altivec_put_pixels16_xy2_num, 1);

1075

for (j = 0; j < 4; j++) {

1076

int i;

1077

const uint32_t a = (((const struct unaligned_32 *) (pixels))->l);

1078

const uint32_t b =

1079

(((const struct unaligned_32 *) (pixels + 1))->l);

1080

uint32_t l0 =

1081

(a & 0x03030303UL) + (b & 0x03030303UL) + 0x02020202UL;

1082

uint32_t h0 =

1083

((a & 0xFCFCFCFCUL) >> 2) + ((b & 0xFCFCFCFCUL) >> 2);

1084

uint32_t l1, h1;

1085

pixels += line_size;

1086

for (i = 0; i < h; i += 2) {

1087

uint32_t a = (((const struct unaligned_32 *) (pixels))->l);

1088

uint32_t b = (((const struct unaligned_32 *) (pixels + 1))->l);

1089

l1 = (a & 0x03030303UL) + (b & 0x03030303UL);

1090

h1 = ((a & 0xFCFCFCFCUL) >> 2) + ((b & 0xFCFCFCFCUL) >> 2);

1091

*((uint32_t *) block) =

1092

h0 + h1 + (((l0 + l1) >> 2) & 0x0F0F0F0FUL);

1093

pixels += line_size;

1094

block += line_size;

1095

a = (((const struct unaligned_32 *) (pixels))->l);

1096

b = (((const struct unaligned_32 *) (pixels + 1))->l);

1097

l0 = (a & 0x03030303UL) + (b & 0x03030303UL) + 0x02020202UL;

1098

h0 = ((a & 0xFCFCFCFCUL) >> 2) + ((b & 0xFCFCFCFCUL) >> 2);

1099

*((uint32_t *) block) =

1100

h0 + h1 + (((l0 + l1) >> 2) & 0x0F0F0F0FUL);

1101

pixels += line_size;

1102

block += line_size;

1103

} pixels += 4 - line_size * (h + 1);

1104

block += 4 - line_size * h;

1105

}

1106

1107

POWERPC_PERF_STOP_COUNT(altivec_put_pixels16_xy2_num, 1);

1108

1109

#else /* ALTIVEC_USE_REFERENCE_C_CODE */

1110

1111

1112

pixelsv1, pixelsv2, pixelsv3, pixelsv4;

1113

1114

blockv, temp1, temp2;

1115

1116

pixelssum1, pixelssum2, temp3,

1117

pixelssum3, pixelssum4, temp4;

1118

1119

1120

1121

POWERPC_PERF_START_COUNT(altivec_put_pixels16_xy2_num, 1);

1122

1123

temp1 = vec_ld(0, pixels);

1124

temp2 = vec_ld(16, pixels);

1125

pixelsv1 = vec_perm(temp1, temp2, vec_lvsl(0, pixels));

1126

if ((((unsigned long)pixels) & 0x0000000F) == 0x0000000F)

1127

{

1128

pixelsv2 = temp2;

1129

}

1130

else

1131

{

1132

pixelsv2 = vec_perm(temp1, temp2, vec_lvsl(1, pixels));

1133

}

1134

pixelsv3 = vec_mergel(vczero, pixelsv1);

1135

pixelsv4 = vec_mergel(vczero, pixelsv2);

1136

pixelsv1 = vec_mergeh(vczero, pixelsv1);

1137

pixelsv2 = vec_mergeh(vczero, pixelsv2);

1138

pixelssum3 = vec_add((vector unsigned short)pixelsv3,

1139

(vector unsigned short)pixelsv4);

1140

pixelssum3 = vec_add(pixelssum3, vctwo);

1141

pixelssum1 = vec_add((vector unsigned short)pixelsv1,

1142

(vector unsigned short)pixelsv2);

1143

pixelssum1 = vec_add(pixelssum1, vctwo);

1144

1145

for (i = 0; i < h ; i++) {

1146

blockv = vec_ld(0, block);

1147

1148

temp1 = vec_ld(line_size, pixels);

1149

temp2 = vec_ld(line_size + 16, pixels);

1150

pixelsv1 = vec_perm(temp1, temp2, vec_lvsl(line_size, pixels));

1151

if (((((unsigned long)pixels) + line_size) & 0x0000000F) == 0x0000000F)

1152

{

1153

pixelsv2 = temp2;

1154

}

1155

else

1156

{

1157

pixelsv2 = vec_perm(temp1, temp2, vec_lvsl(line_size + 1, pixels));

1158

}

1159

1160

pixelsv3 = vec_mergel(vczero, pixelsv1);

1161

pixelsv4 = vec_mergel(vczero, pixelsv2);

1162

pixelsv1 = vec_mergeh(vczero, pixelsv1);

1163

pixelsv2 = vec_mergeh(vczero, pixelsv2);

1164

1165

pixelssum4 = vec_add((vector unsigned short)pixelsv3,

1166

(vector unsigned short)pixelsv4);

1167

pixelssum2 = vec_add((vector unsigned short)pixelsv1,

1168

(vector unsigned short)pixelsv2);

1169

temp4 = vec_add(pixelssum3, pixelssum4);

1170

temp4 = vec_sra(temp4, vctwo);

1171

temp3 = vec_add(pixelssum1, pixelssum2);

1172

temp3 = vec_sra(temp3, vctwo);

1173

1174

pixelssum3 = vec_add(pixelssum4, vctwo);

1175

pixelssum1 = vec_add(pixelssum2, vctwo);

1176

1177

blockv = vec_packsu(temp3, temp4);

1178

1179

vec_st(blockv, 0, block);

1180

1181

block += line_size;

1182

pixels += line_size;

1183

}

1184

1185

POWERPC_PERF_STOP_COUNT(altivec_put_pixels16_xy2_num, 1);

1186

#endif /* ALTIVEC_USE_REFERENCE_C_CODE */

1187

}

1188

1189

/* next one assumes that ((line_size % 16) == 0) */

1190

void put_no_rnd_pixels16_xy2_altivec(uint8_t * block, const uint8_t * pixels, int line_size, int h)

1191

{

1192

POWERPC_PERF_DECLARE(altivec_put_no_rnd_pixels16_xy2_num, 1);

1193

#ifdef ALTIVEC_USE_REFERENCE_C_CODE

1194

int j;

1195

POWERPC_PERF_START_COUNT(altivec_put_no_rnd_pixels16_xy2_num, 1);

1196

for (j = 0; j < 4; j++) {

1197

int i;

1198

const uint32_t a = (((const struct unaligned_32 *) (pixels))->l);

1199

const uint32_t b =

1200

(((const struct unaligned_32 *) (pixels + 1))->l);

1201

uint32_t l0 =

1202

(a & 0x03030303UL) + (b & 0x03030303UL) + 0x01010101UL;

1203

uint32_t h0 =

1204

((a & 0xFCFCFCFCUL) >> 2) + ((b & 0xFCFCFCFCUL) >> 2);

1205

uint32_t l1, h1;

1206

pixels += line_size;

1207

for (i = 0; i < h; i += 2) {

1208

uint32_t a = (((const struct unaligned_32 *) (pixels))->l);

1209

uint32_t b = (((const struct unaligned_32 *) (pixels + 1))->l);

1210

l1 = (a & 0x03030303UL) + (b & 0x03030303UL);

1211

h1 = ((a & 0xFCFCFCFCUL) >> 2) + ((b & 0xFCFCFCFCUL) >> 2);

1212

*((uint32_t *) block) =

1213

h0 + h1 + (((l0 + l1) >> 2) & 0x0F0F0F0FUL);

1214

pixels += line_size;

1215

block += line_size;

1216

a = (((const struct unaligned_32 *) (pixels))->l);

1217

b = (((const struct unaligned_32 *) (pixels + 1))->l);

1218

l0 = (a & 0x03030303UL) + (b & 0x03030303UL) + 0x01010101UL;

1219

h0 = ((a & 0xFCFCFCFCUL) >> 2) + ((b & 0xFCFCFCFCUL) >> 2);

1220

*((uint32_t *) block) =

1221

h0 + h1 + (((l0 + l1) >> 2) & 0x0F0F0F0FUL);

1222

pixels += line_size;

1223

block += line_size;

1224

} pixels += 4 - line_size * (h + 1);

1225

block += 4 - line_size * h;

1226

}

1227

1228

POWERPC_PERF_STOP_COUNT(altivec_put_no_rnd_pixels16_xy2_num, 1);

1229

1230

#else /* ALTIVEC_USE_REFERENCE_C_CODE */

1231

1232

1233

pixelsv1, pixelsv2, pixelsv3, pixelsv4;

1234

1235

blockv, temp1, temp2;

1236

1237

pixelssum1, pixelssum2, temp3,

1238

pixelssum3, pixelssum4, temp4;

1239

1240

1241

1242

1243

POWERPC_PERF_START_COUNT(altivec_put_no_rnd_pixels16_xy2_num, 1);

1244

1245

temp1 = vec_ld(0, pixels);

1246

temp2 = vec_ld(16, pixels);

1247

pixelsv1 = vec_perm(temp1, temp2, vec_lvsl(0, pixels));

1248

if ((((unsigned long)pixels) & 0x0000000F) == 0x0000000F)

1249

{

1250

pixelsv2 = temp2;

1251

}

1252

else

1253

{

1254

pixelsv2 = vec_perm(temp1, temp2, vec_lvsl(1, pixels));

1255

}

1256

pixelsv3 = vec_mergel(vczero, pixelsv1);

1257

pixelsv4 = vec_mergel(vczero, pixelsv2);

1258

pixelsv1 = vec_mergeh(vczero, pixelsv1);

1259

pixelsv2 = vec_mergeh(vczero, pixelsv2);

1260

pixelssum3 = vec_add((vector unsigned short)pixelsv3,

1261

(vector unsigned short)pixelsv4);

1262

pixelssum3 = vec_add(pixelssum3, vcone);

1263

pixelssum1 = vec_add((vector unsigned short)pixelsv1,

1264

(vector unsigned short)pixelsv2);

1265

pixelssum1 = vec_add(pixelssum1, vcone);

1266

1267

for (i = 0; i < h ; i++) {

1268

blockv = vec_ld(0, block);

1269

1270

temp1 = vec_ld(line_size, pixels);

1271

temp2 = vec_ld(line_size + 16, pixels);

1272

pixelsv1 = vec_perm(temp1, temp2, vec_lvsl(line_size, pixels));

1273

if (((((unsigned long)pixels) + line_size) & 0x0000000F) == 0x0000000F)

1274

{

1275

pixelsv2 = temp2;

1276

}

1277

else

1278

{

1279

pixelsv2 = vec_perm(temp1, temp2, vec_lvsl(line_size + 1, pixels));

1280

}

1281

1282

pixelsv3 = vec_mergel(vczero, pixelsv1);

1283

pixelsv4 = vec_mergel(vczero, pixelsv2);

1284

pixelsv1 = vec_mergeh(vczero, pixelsv1);

1285

pixelsv2 = vec_mergeh(vczero, pixelsv2);

1286

1287

pixelssum4 = vec_add((vector unsigned short)pixelsv3,

1288

(vector unsigned short)pixelsv4);

1289

pixelssum2 = vec_add((vector unsigned short)pixelsv1,

1290

(vector unsigned short)pixelsv2);

1291

temp4 = vec_add(pixelssum3, pixelssum4);

1292

temp4 = vec_sra(temp4, vctwo);

1293

temp3 = vec_add(pixelssum1, pixelssum2);

1294

temp3 = vec_sra(temp3, vctwo);

1295

1296

pixelssum3 = vec_add(pixelssum4, vcone);

1297

pixelssum1 = vec_add(pixelssum2, vcone);

1298

1299

blockv = vec_packsu(temp3, temp4);

1300

1301

vec_st(blockv, 0, block);

1302

1303

block += line_size;

1304

pixels += line_size;

1305

}

1306

1307

POWERPC_PERF_STOP_COUNT(altivec_put_no_rnd_pixels16_xy2_num, 1);

1308

#endif /* ALTIVEC_USE_REFERENCE_C_CODE */

1309

}

1310

1311

#ifdef CONFIG_DARWIN

1312

int hadamard8_diff8x8_altivec(/*MpegEncContext*/ void *s, uint8_t *dst, uint8_t *src, int stride, int h){

1313

POWERPC_PERF_DECLARE(altivec_hadamard8_diff8x8_num, 1);

1314

int sum;

1315

POWERPC_PERF_START_COUNT(altivec_hadamard8_diff8x8_num, 1);

1316

1317

1318

{

1319

1320

1321

1322

1323

AVV(0x02, 0x03, 0x00, 0x01,

1324

0x06, 0x07, 0x04, 0x05,

1325

0x0A, 0x0B, 0x08, 0x09,

1326

0x0E, 0x0F, 0x0C, 0x0D);

1327

1328

AVV(0x04, 0x05, 0x06, 0x07,

1329

0x00, 0x01, 0x02, 0x03,

1330

0x0C, 0x0D, 0x0E, 0x0F,

1331

0x08, 0x09, 0x0A, 0x0B);

1332

1333

AVV(0x08, 0x09, 0x0A, 0x0B,

1334

0x0C, 0x0D, 0x0E, 0x0F,

1335

0x00, 0x01, 0x02, 0x03,

1336

0x04, 0x05, 0x06, 0x07);

1337

1338

#define ONEITERBUTTERFLY(i, res) \

1339

{ \

1340

1341

1342

src1 = vec_ld(stride * i, src); \

1343

if ((((stride * i) + (unsigned long)src) & 0x0000000F) > 8) \

1344

src2 = vec_ld((stride * i) + 16, src); \

1345

srcO = vec_perm(src1, src2, vec_lvsl(stride * i, src)); \

1346

dst1 = vec_ld(stride * i, dst); \

1347

if ((((stride * i) + (unsigned long)dst) & 0x0000000F) > 8) \

1348

dst2 = vec_ld((stride * i) + 16, dst); \

1349

dstO = vec_perm(dst1, dst2, vec_lvsl(stride * i, dst)); \

1350

/* promote the unsigned chars to signed shorts */ \

1351

/* we're in the 8x8 function, we only care for the first 8 */ \

1352

1353

(vector signed short)vec_mergeh((vector signed char)vzero, (vector signed char)srcO); \

1354

1355

(vector signed short)vec_mergeh((vector signed char)vzero, (vector signed char)dstO); \

1356

/* substractions inside the first butterfly */ \

1357

1358

1359

1360

1361

1362

1363

res = vec_mladd(but2, vprod3, op3); \

1364

}

1365

ONEITERBUTTERFLY(0, temp0);

1366

ONEITERBUTTERFLY(1, temp1);

1367

ONEITERBUTTERFLY(2, temp2);

1368

ONEITERBUTTERFLY(3, temp3);

1369

ONEITERBUTTERFLY(4, temp4);

1370

ONEITERBUTTERFLY(5, temp5);

1371

ONEITERBUTTERFLY(6, temp6);

1372

ONEITERBUTTERFLY(7, temp7);

1373

}

1374

#undef ONEITERBUTTERFLY

1375

{

1376

1377

1378

1379

1380

1381

1382

1383

1384

1385

1386

1387

1388

1389

1390

1391

1392

1393

1394

1395

1396

1397

1398

1399

1400

1401

1402

1403

1404

vsum = vec_sum4s(vec_abs(line0C), vec_splat_s32(0));

1405

vsum = vec_sum4s(vec_abs(line1C), vsum);

1406

vsum = vec_sum4s(vec_abs(line2C), vsum);

1407

vsum = vec_sum4s(vec_abs(line3C), vsum);

1408

vsum = vec_sum4s(vec_abs(line4C), vsum);

1409

vsum = vec_sum4s(vec_abs(line5C), vsum);

1410

vsum = vec_sum4s(vec_abs(line6C), vsum);

1411

vsum = vec_sum4s(vec_abs(line7C), vsum);

1412

vsum = vec_sums(vsum, (vector signed int)vzero);

1413

vsum = vec_splat(vsum, 3);

1414

vec_ste(vsum, 0, &sum);

1415

}

1416

POWERPC_PERF_STOP_COUNT(altivec_hadamard8_diff8x8_num, 1);

1417

return sum;

1418

}

1419

1420

1421

16x8 works with 16 elements ; it allows to avoid replicating

1422

loads, and give the compiler more rooms for scheduling.

1423

It's only used from inside hadamard8_diff16_altivec.

1424

1425

Unfortunately, it seems gcc-3.3 is a bit dumb, and

1426

the compiled code has a LOT of spill code, it seems

1427

gcc (unlike xlc) cannot keep everything in registers

1428

by itself. The following code include hand-made

1429

registers allocation. It's not clean, but on

1430

a 7450 the resulting code is much faster (best case

1431

fall from 700+ cycles to 550).

1432

1433

xlc doesn't add spill code, but it doesn't know how to

1434

schedule for the 7450, and its code isn't much faster than

1435

gcc-3.3 on the 7450 (but uses 25% less instructions...)

1436

1437

On the 970, the hand-made RA is still a win (arount 690

1438

vs. around 780), but xlc goes to around 660 on the

1439

regular C code...

1440

1441

1442

static int hadamard8_diff16x8_altivec(/*MpegEncContext*/ void *s, uint8_t *dst, uint8_t *src, int stride, int h) {

1443

int sum;

1444

1445

temp0 asm ("v0"),

1446

temp1 asm ("v1"),

1447

temp2 asm ("v2"),

1448

temp3 asm ("v3"),

1449

temp4 asm ("v4"),

1450

temp5 asm ("v5"),

1451

temp6 asm ("v6"),

1452

temp7 asm ("v7");

1453

1454

temp0S asm ("v8"),

1455

temp1S asm ("v9"),

1456

temp2S asm ("v10"),

1457

temp3S asm ("v11"),

1458

temp4S asm ("v12"),

1459

temp5S asm ("v13"),

1460

temp6S asm ("v14"),

1461

temp7S asm ("v15");

1462

1463

{

1464

1465

1466

1467

1468

AVV(0x02, 0x03, 0x00, 0x01,

1469

0x06, 0x07, 0x04, 0x05,

1470

0x0A, 0x0B, 0x08, 0x09,

1471

0x0E, 0x0F, 0x0C, 0x0D);

1472

1473

AVV(0x04, 0x05, 0x06, 0x07,

1474

0x00, 0x01, 0x02, 0x03,

1475

0x0C, 0x0D, 0x0E, 0x0F,

1476

0x08, 0x09, 0x0A, 0x0B);

1477

1478

AVV(0x08, 0x09, 0x0A, 0x0B,

1479

0x0C, 0x0D, 0x0E, 0x0F,

1480

0x00, 0x01, 0x02, 0x03,

1481

0x04, 0x05, 0x06, 0x07);

1482

1483

#define ONEITERBUTTERFLY(i, res1, res2) \

1484

{ \

1485

1486

1487

src1 = vec_ld(stride * i, src); \

1488

src2 = vec_ld((stride * i) + 16, src); \

1489

1490

dst1 = vec_ld(stride * i, dst); \

1491

dst2 = vec_ld((stride * i) + 16, dst); \

1492

1493

/* promote the unsigned chars to signed shorts */ \

1494

1495

(vector signed short)vec_mergeh((vector signed char)vzero, (vector signed char)srcO); \

1496

1497

(vector signed short)vec_mergeh((vector signed char)vzero, (vector signed char)dstO); \

1498

1499

(vector signed short)vec_mergel((vector signed char)vzero, (vector signed char)srcO); \

1500

1501

(vector signed short)vec_mergel((vector signed char)vzero, (vector signed char)dstO); \

1502

/* substractions inside the first butterfly */ \

1503

1504

1505

1506

1507

1508

1509

1510

1511

1512

1513

1514

res1 = vec_mladd(but2, vprod3, op3); \

1515

1516

res2 = vec_mladd(but2S, vprod3, op3S); \

1517

}

1518

ONEITERBUTTERFLY(0, temp0, temp0S);

1519

ONEITERBUTTERFLY(1, temp1, temp1S);

1520

ONEITERBUTTERFLY(2, temp2, temp2S);

1521

ONEITERBUTTERFLY(3, temp3, temp3S);

1522

ONEITERBUTTERFLY(4, temp4, temp4S);

1523

ONEITERBUTTERFLY(5, temp5, temp5S);

1524

ONEITERBUTTERFLY(6, temp6, temp6S);

1525

ONEITERBUTTERFLY(7, temp7, temp7S);

1526

}

1527

#undef ONEITERBUTTERFLY

1528

{

1529

1530

1531

1532

1533

1534

1535

1536

1537

1538

1539

1540

1541

1542

1543

1544

1545

1546

1547

1548

1549

1550

1551

1552

1553

1554

1555

1556

1557

vsum = vec_sum4s(vec_abs(line0C), vec_splat_s32(0));

1558

vsum = vec_sum4s(vec_abs(line1C), vsum);

1559

vsum = vec_sum4s(vec_abs(line2C), vsum);

1560

vsum = vec_sum4s(vec_abs(line3C), vsum);

1561

vsum = vec_sum4s(vec_abs(line4C), vsum);

1562

vsum = vec_sum4s(vec_abs(line5C), vsum);

1563

vsum = vec_sum4s(vec_abs(line6C), vsum);

1564

vsum = vec_sum4s(vec_abs(line7C), vsum);

1565

1566

1567

1568

1569

1570

1571

1572

1573

1574

1575

1576

1577

1578

1579

1580

1581

1582

1583

1584

1585

1586

1587

1588

1589

1590

1591

1592

1593

vsum = vec_sum4s(vec_abs(line0CS), vsum);

1594

vsum = vec_sum4s(vec_abs(line1CS), vsum);

1595

vsum = vec_sum4s(vec_abs(line2CS), vsum);

1596

vsum = vec_sum4s(vec_abs(line3CS), vsum);

1597

vsum = vec_sum4s(vec_abs(line4CS), vsum);

1598

vsum = vec_sum4s(vec_abs(line5CS), vsum);

1599

vsum = vec_sum4s(vec_abs(line6CS), vsum);

1600

vsum = vec_sum4s(vec_abs(line7CS), vsum);

1601

vsum = vec_sums(vsum, (vector signed int)vzero);

1602

vsum = vec_splat(vsum, 3);

1603

vec_ste(vsum, 0, &sum);

1604

}

1605

return sum;

1606

}

1607

1608

int hadamard8_diff16_altivec(/*MpegEncContext*/ void *s, uint8_t *dst, uint8_t *src, int stride, int h){

1609

POWERPC_PERF_DECLARE(altivec_hadamard8_diff16_num, 1);

1610

int score;

1611

POWERPC_PERF_START_COUNT(altivec_hadamard8_diff16_num, 1);

1612

score = hadamard8_diff16x8_altivec(s, dst, src, stride, 8);

1613

if (h==16) {

1614

dst += 8*stride;

1615

src += 8*stride;

1616

score += hadamard8_diff16x8_altivec(s, dst, src, stride, 8);

1617

}

1618

POWERPC_PERF_STOP_COUNT(altivec_hadamard8_diff16_num, 1);

1619

return score;

1620

}

1621

#endif //CONFIG_DARWIN

1622

1623

int has_altivec(void)

1624

{

1625

#ifdef __AMIGAOS4__

1626

ULONG result = 0;

1627

extern struct ExecIFace *IExec;

1628

1629

IExec->GetCPUInfoTags(GCIT_VectorUnit, &result, TAG_DONE);

1630

if (result == VECTORTYPE_ALTIVEC) return 1;

1631

return 0;

1632

#else /* __AMIGAOS4__ */

1633

1634

#ifdef CONFIG_DARWIN

1635

int sels[2] = {CTL_HW, HW_VECTORUNIT};

1636

int has_vu = 0;

1637

size_t len = sizeof(has_vu);

1638

int err;

1639

1640

err = sysctl(sels, 2, &has_vu, &len, NULL, 0);

1641

1642

if (err == 0) return (has_vu != 0);

1643

#else /* CONFIG_DARWIN */

1644

/* no Darwin, do it the brute-force way */

1645

/* this is borrowed from the libmpeg2 library */

1646

{

1647

signal (SIGILL, sigill_handler);

1648

if (sigsetjmp (jmpbuf, 1)) {

1649

signal (SIGILL, SIG_DFL);

1650

} else {

1651

canjump = 1;

1652

1653

asm volatile ("mtspr 256, %0\n\t"

1654

"vand %%v0, %%v0, %%v0"

1655

1656

: "r" (-1));

1657

1658

signal (SIGILL, SIG_DFL);

1659

return 1;

1660

}

1661

}

1662

#endif /* CONFIG_DARWIN */

1663

return 0;

1664

#endif /* __AMIGAOS4__ */

1665

}

1666

1667

/* next one assumes that ((line_size % 8) == 0) */

1668

void avg_pixels8_xy2_altivec(uint8_t *block, const uint8_t *pixels, int line_size, int h)

1669

{

1670

POWERPC_PERF_DECLARE(altivec_avg_pixels8_xy2_num, 1);

1671

#ifdef ALTIVEC_USE_REFERENCE_C_CODE

1672

1673

int j;

1674

POWERPC_PERF_START_COUNT(altivec_avg_pixels8_xy2_num, 1);

1675

for (j = 0; j < 2; j++) {

1676

int i;

1677

const uint32_t a = (((const struct unaligned_32 *) (pixels))->l);

1678

const uint32_t b = (((const struct unaligned_32 *) (pixels + 1))->l);

1679

uint32_t l0 = (a & 0x03030303UL) + (b & 0x03030303UL) + 0x02020202UL;

1680

uint32_t h0 = ((a & 0xFCFCFCFCUL) >> 2) + ((b & 0xFCFCFCFCUL) >> 2);

1681

uint32_t l1, h1;

1682

pixels += line_size;

1683

for (i = 0; i < h; i += 2) {

1684

uint32_t a = (((const struct unaligned_32 *) (pixels))->l);

1685

uint32_t b = (((const struct unaligned_32 *) (pixels + 1))->l);

1686

l1 = (a & 0x03030303UL) + (b & 0x03030303UL);

1687

h1 = ((a & 0xFCFCFCFCUL) >> 2) + ((b & 0xFCFCFCFCUL) >> 2);

1688

*((uint32_t *) block) = rnd_avg32(*((uint32_t *) block), h0 + h1 + (((l0 + l1) >> 2) & 0x0F0F0F0FUL));

1689

pixels += line_size;

1690

block += line_size;

1691

a = (((const struct unaligned_32 *) (pixels))->l);

1692

b = (((const struct unaligned_32 *) (pixels + 1))->l);

1693

l0 = (a & 0x03030303UL) + (b & 0x03030303UL) + 0x02020202UL;

1694

h0 = ((a & 0xFCFCFCFCUL) >> 2) + ((b & 0xFCFCFCFCUL) >> 2);

1695

*((uint32_t *) block) = rnd_avg32(*((uint32_t *) block), h0 + h1 + (((l0 + l1) >> 2) & 0x0F0F0F0FUL));

1696

pixels += line_size;

1697

block += line_size;

1698

} pixels += 4 - line_size * (h + 1);

1699

block += 4 - line_size * h;

1700

}

1701

POWERPC_PERF_STOP_COUNT(altivec_avg_pixels8_xy2_num, 1);

1702

#else /* ALTIVEC_USE_REFERENCE_C_CODE */

1703

1704

1705

pixelsv1, pixelsv2,

1706

pixelsavg;

1707

1708

blockv, temp1, temp2, blocktemp;

1709

1710

pixelssum1, pixelssum2, temp3;

1711

1712

1713

1714

temp1 = vec_ld(0, pixels);

1715

temp2 = vec_ld(16, pixels);

1716

pixelsv1 = vec_perm(temp1, temp2, vec_lvsl(0, pixels));

1717

if ((((unsigned long)pixels) & 0x0000000F) == 0x0000000F)

1718

{

1719

pixelsv2 = temp2;

1720

}

1721

else

1722

{

1723

pixelsv2 = vec_perm(temp1, temp2, vec_lvsl(1, pixels));

1724

}

1725

pixelsv1 = vec_mergeh(vczero, pixelsv1);

1726

pixelsv2 = vec_mergeh(vczero, pixelsv2);

1727

pixelssum1 = vec_add((vector unsigned short)pixelsv1,

1728

(vector unsigned short)pixelsv2);

1729

pixelssum1 = vec_add(pixelssum1, vctwo);

1730

1731

POWERPC_PERF_START_COUNT(altivec_avg_pixels8_xy2_num, 1);

1732

for (i = 0; i < h ; i++) {

1733

int rightside = ((unsigned long)block & 0x0000000F);

1734

blockv = vec_ld(0, block);

1735

1736

temp1 = vec_ld(line_size, pixels);

1737

temp2 = vec_ld(line_size + 16, pixels);

1738

pixelsv1 = vec_perm(temp1, temp2, vec_lvsl(line_size, pixels));

1739

if (((((unsigned long)pixels) + line_size) & 0x0000000F) == 0x0000000F)

1740

{

1741

pixelsv2 = temp2;

1742

}

1743

else

1744

{

1745

pixelsv2 = vec_perm(temp1, temp2, vec_lvsl(line_size + 1, pixels));

1746

}

1747

1748

pixelsv1 = vec_mergeh(vczero, pixelsv1);

1749

pixelsv2 = vec_mergeh(vczero, pixelsv2);

1750

pixelssum2 = vec_add((vector unsigned short)pixelsv1,

1751

(vector unsigned short)pixelsv2);

1752

temp3 = vec_add(pixelssum1, pixelssum2);

1753

temp3 = vec_sra(temp3, vctwo);

1754

pixelssum1 = vec_add(pixelssum2, vctwo);

1755

pixelsavg = vec_packsu(temp3, (vector unsigned short) vczero);

1756

1757

if (rightside)

1758

{

1759

blocktemp = vec_perm(blockv, pixelsavg, vcprm(0, 1, s0, s1));

1760

}

1761

else

1762

{

1763

blocktemp = vec_perm(blockv, pixelsavg, vcprm(s0, s1, 2, 3));

1764

}

1765

1766

blockv = vec_avg(blocktemp, blockv);

1767

vec_st(blockv, 0, block);

1768

1769

block += line_size;

1770

pixels += line_size;

1771

}

1772

1773

POWERPC_PERF_STOP_COUNT(altivec_avg_pixels8_xy2_num, 1);

1774

#endif /* ALTIVEC_USE_REFERENCE_C_CODE */

1775

}

Older »