~ubuntu-branches/ubuntu/feisty/avidemux/feisty

« back to all changes in this revision

Viewing changes to avidemux/mpeg2enc/idct_mmx.s

Committer: Bazaar Package Importer
Author(s): Christian Marillat
Date: 2005-05-25 13:02:29 UTC
mfrom: (1.1.2 upstream)
Revision ID: james.westby@ubuntu.com-20050525130229-jw94cav0yhmg7vjw

Tags: 1:2.0.40-0.0

New upstream release.

files added:
addons/ad2_vcdimager

addons/ad2_vcdimager/ad2_vcdimager

addons/tsscan/tsscan.cpp

adm_lavcodec/amr_float

adm_lavcodec/amr_float/decoder.c

adm_lavcodec/amr_float/encoder.c

adm_lavcodec/amr_float/interf_dec.c

adm_lavcodec/amr_float/interf_dec.h

adm_lavcodec/amr_float/interf_enc.c

adm_lavcodec/amr_float/interf_enc.h

adm_lavcodec/amr_float/interf_rom.h

adm_lavcodec/amr_float/rom_dec.h

adm_lavcodec/amr_float/rom_enc.h

adm_lavcodec/amr_float/sp_dec.c

adm_lavcodec/amr_float/sp_dec.h

adm_lavcodec/amr_float/sp_enc.c

adm_lavcodec/amr_float/sp_enc.h

adm_lavcodec/amr_float/typedef.h

adm_lavcodec/bitstream.c

adm_lavcodec/bitstream.h

adm_lavcodec/h264idct.c

adm_lavcodec/rangecoder.c

adm_lavcodec/rangecoder.h

avidemux/ADM_3gp/ADM_infoextractor.cpp

avidemux/ADM_codecs/ADM_x264.cpp

avidemux/ADM_codecs/ADM_x264.h

avidemux/ADM_codecs/ADM_x264param.h

avidemux/ADM_dialog/DIA_asharp.cpp

avidemux/ADM_dialog/DIA_dgbob.cpp

avidemux/ADM_dialog/DIA_eq2.cpp

avidemux/ADM_dialog/DIA_hue.cpp

avidemux/ADM_dialog/DIA_lavpp_deint.cpp

avidemux/ADM_dialog/DIA_msharpen.cpp

avidemux/ADM_dialog/DIA_ocr.cpp

avidemux/ADM_dialog/DIA_vobsub.cpp

avidemux/ADM_dialog/DIA_x264.cpp

avidemux/ADM_encoder/adm_encx264.cpp

avidemux/ADM_encoder/adm_encx264.h

avidemux/ADM_lavformat/ADM_muxts.cpp

avidemux/ADM_lavformat/ADM_tscrc.h

avidemux/ADM_lavformat/mpegts.h

avidemux/ADM_lavformat/mpegtsenc.c

avidemux/ADM_mplex

avidemux/ADM_mplex/ADM_inout.h

avidemux/ADM_mplex/ADM_mplexin.cpp

avidemux/ADM_mplex/ADM_mplexmuxer.cpp

avidemux/ADM_mplex/ADM_mplexout.cpp

avidemux/ADM_mplex/ADM_transfert.cpp

avidemux/ADM_mplex/ADM_transfert.h

avidemux/ADM_mplex/Makefile

avidemux/ADM_mplex/Makefile.am

avidemux/ADM_mplex/Makefile.in

avidemux/ADM_mplex/ac3strm_in.cpp

avidemux/ADM_mplex/audiostrm.hpp

avidemux/ADM_mplex/audiostrm_out.cpp

avidemux/ADM_mplex/aunit.hpp

avidemux/ADM_mplex/bits.cpp

avidemux/ADM_mplex/bits.hpp

avidemux/ADM_mplex/buffer.cpp

avidemux/ADM_mplex/buffer.hpp

avidemux/ADM_mplex/dtsstrm_in.cpp

avidemux/ADM_mplex/inputstrm.cpp

avidemux/ADM_mplex/inputstrm.hpp

avidemux/ADM_mplex/interact.cpp

avidemux/ADM_mplex/interact.hpp

avidemux/ADM_mplex/lpcmstrm_in.cpp

avidemux/ADM_mplex/main_example.cpp

avidemux/ADM_mplex/mpastrm_in.cpp

avidemux/ADM_mplex/mpegconsts.c

avidemux/ADM_mplex/mplexconsts.hpp

avidemux/ADM_mplex/multiplexor.cpp

avidemux/ADM_mplex/multiplexor.hpp

avidemux/ADM_mplex/outputstrm.hpp

avidemux/ADM_mplex/padstrm.cpp

avidemux/ADM_mplex/padstrm.hpp

avidemux/ADM_mplex/stillsstream.cpp

avidemux/ADM_mplex/stillsstream.hpp

avidemux/ADM_mplex/stream_params.cpp

avidemux/ADM_mplex/stream_params.hpp

avidemux/ADM_mplex/systems.cpp

avidemux/ADM_mplex/systems.hpp

avidemux/ADM_mplex/vector.cpp

avidemux/ADM_mplex/vector.hpp

avidemux/ADM_mplex/videostrm.hpp

avidemux/ADM_mplex/videostrm_in.cpp

avidemux/ADM_mplex/videostrm_out.cpp

avidemux/ADM_mplex/zalphastrm.hpp

avidemux/ADM_mplex/zalphastrm_in.cpp

avidemux/ADM_mplex/zalphastrm_out.cpp

avidemux/ADM_ocr

avidemux/ADM_ocr/ADM_leftturn.h

avidemux/ADM_ocr/ADM_ocrLoadSave.h

avidemux/ADM_ocr/Makefile

avidemux/ADM_ocr/Makefile.am

avidemux/ADM_ocr/Makefile.in

avidemux/ADM_ocr/adm_glyph.cpp

avidemux/ADM_ocr/adm_glyph.h

avidemux/ADM_ocr/adm_leftturn.cpp

avidemux/ADM_ocr/adm_ocr.cpp

avidemux/ADM_script/adm_lex.lex

avidemux/ADM_script/adm_yacc.ycc

avidemux/ADM_toolkit/ADM_memcpy.cpp

avidemux/ADM_video/ADM_lavpp_deint.cpp

avidemux/ADM_video/ADM_lavpp_deintparam.h

avidemux/ADM_video/ADM_vidASharp_param.h

avidemux/ADM_video/ADM_vidAsharp.cpp

avidemux/ADM_video/ADM_vidChangeFPS.cpp

avidemux/ADM_video/ADM_vidChangeFPS.h

avidemux/ADM_video/ADM_vidDGbob.cpp

avidemux/ADM_video/ADM_vidDGbob_param.h

avidemux/ADM_video/ADM_vidEq2.cpp

avidemux/ADM_video/ADM_vidEq2.h

avidemux/ADM_video/ADM_vidHue.cpp

avidemux/ADM_video/ADM_vidHue.h

avidemux/ADM_video/ADM_vidMSharpen.cpp

avidemux/ADM_video/ADM_vidMSharpen_param.h

avidemux/ADM_video/ADM_vidResampleFPS.cpp

avidemux/ADM_video/ADM_vidVobSub.h

avidemux/ADM_video/ADM_vidVobSubRender.cpp

avidemux/ADM_video/ADM_vidVobsub.cpp

avidemux/ADM_video/ADM_vobsubinfo.cpp

avidemux/ADM_video/ADM_vobsubinfo.h

avidemux/MPlayer_pp

avidemux/MPlayer_pp/Makefile

avidemux/MPlayer_pp/Makefile.am

avidemux/MPlayer_pp/Makefile.in

avidemux/MPlayer_pp/img_format.h

avidemux/MPlayer_pp/rgb2rgb.c

avidemux/MPlayer_pp/rgb2rgb.h

avidemux/MPlayer_pp/rgb2rgb_template.c

avidemux/MPlayer_pp/swscale.c

avidemux/MPlayer_pp/swscale.h

avidemux/MPlayer_pp/swscale_altivec_template.c

avidemux/MPlayer_pp/swscale_internal.h

avidemux/MPlayer_pp/swscale_template.c

avidemux/MPlayer_pp/wrapper.h

avidemux/MPlayer_pp/yuv2rgb.c

avidemux/MPlayer_pp/yuv2rgb_altivec.c

avidemux/MPlayer_pp/yuv2rgb_template.c

avidemux/mpeg2enc/fdct_mmx.cc

avidemux/mpeg2enc/fdct_x86.cc

avidemux/mpeg2enc/idct_mmx.cc

avidemux/mpeg2enc/mblock_bsad_mmx.cc

avidemux/mpeg2enc/mblock_bsumsq_mmx.cc

avidemux/mpeg2enc/mblock_sad_mmx.cc

avidemux/mpeg2enc/mblock_sad_mmxe.cc

avidemux/mpeg2enc/mblock_sumsq_mmx.cc

avidemux/mpeg2enc/predcomp_mmx.cc

avidemux/mpeg2enc/predcomp_mmxe.cc

avidemux/mpeg2enc/predict_mmx.cc

avidemux/mpeg2enc/quant_mmx2.cc

avidemux_icon.png

files removed:
addons/tsscan/tsscan

adm_lavcodec/x86_64

adm_lavcodec/x86_64/dsputil_a64.c

adm_lavcodec/x86_64/dsputil_a64_avg.h

adm_lavcodec/x86_64/dsputil_a64_rnd.h

adm_lavcodec/x86_64/fdct_a64.c

adm_lavcodec/x86_64/idct_a64.c

adm_lavcodec/x86_64/mmx.h

adm_lavcodec/x86_64/motion_est_a64.c

adm_lavcodec/x86_64/mpegvideo_a64.c

adm_lavcodec/x86_64/mpegvideo_a64_template.c

adm_lavcodec/x86_64/simple_idct_a64.c

adm_lavcodec/x86_64/vp3dsp_a64.c

avidemux/ADM_video/swscale.c

avidemux/ADM_video/swscale.h

avidemux/ADM_video/swscale_internal.h

avidemux/ADM_video/swscale_template.txt

avidemux/mpeg2enc/fdct_mmx.s

avidemux/mpeg2enc/idct_mmx.s

avidemux/mpeg2enc/mblock_bsad_mmx.s

avidemux/mpeg2enc/mblock_bsumsq_mmx.s

avidemux/mpeg2enc/mblock_sad_mmx.s

avidemux/mpeg2enc/mblock_sad_mmxe.s

avidemux/mpeg2enc/mblock_sumsq_mmx.s

avidemux/mpeg2enc/predcomp_mmx.s

avidemux/mpeg2enc/predcomp_mmxe.s

avidemux/mpeg2enc/predict_mmx.s

avidemux/mpeg2enc/quant_mmx.s

files modified:
History

Makefile

Makefile.in

aclocal.m4

addons/ffv1rec/Makefile

addons/ffv1rec/ffv1.h

addons/ffv1rec/ffv1codec.c

addons/ffv1rec/ffv1rec.c

addons/ffv1rec/frequencies.c

adm_lavcodec/4xm.c

adm_lavcodec/8bps.c

adm_lavcodec/Makefile

adm_lavcodec/Makefile.am

adm_lavcodec/Makefile.in

adm_lavcodec/ac3.h

adm_lavcodec/ac3enc.c

adm_lavcodec/adpcm.c

adm_lavcodec/allcodecs.c

adm_lavcodec/amr.c

adm_lavcodec/apiexample.c

adm_lavcodec/asv1.c

adm_lavcodec/avcodec.c

adm_lavcodec/avcodec.h

adm_lavcodec/cabac.c

adm_lavcodec/cabac.h

adm_lavcodec/common.h

adm_lavcodec/config.cpu

adm_lavcodec/dpcm.c

adm_lavcodec/dsputil.c

adm_lavcodec/dsputil.h

adm_lavcodec/dtsdec.c

adm_lavcodec/dv.c

adm_lavcodec/dvdata.h

adm_lavcodec/error_resilience.c

adm_lavcodec/fft.c

adm_lavcodec/ffv1.c

adm_lavcodec/flac.c

adm_lavcodec/flicvideo.c

adm_lavcodec/g726.c

adm_lavcodec/golomb.h

adm_lavcodec/h261.c

adm_lavcodec/h261data.h

adm_lavcodec/h263.c

adm_lavcodec/h263dec.c

adm_lavcodec/h264.c

adm_lavcodec/h264data.h

adm_lavcodec/huffyuv.c

adm_lavcodec/i386/Makefile

adm_lavcodec/i386/Makefile.in

adm_lavcodec/i386/cputest.c

adm_lavcodec/i386/dsputil_mmx.c

adm_lavcodec/i386/mpegvideo_mmx_template.c

adm_lavcodec/imgconvert.c

adm_lavcodec/imgresample.c

adm_lavcodec/indeo3.c

adm_lavcodec/jrevdct.c

adm_lavcodec/lcl.c

adm_lavcodec/libpostproc/Makefile

adm_lavcodec/libpostproc/Makefile.in

adm_lavcodec/libpostproc/postprocess.c

adm_lavcodec/libpostproc/postprocess_template.c

adm_lavcodec/mdec.c

adm_lavcodec/mem.c

adm_lavcodec/mjpeg.c

adm_lavcodec/motion_est.c

adm_lavcodec/motion_est_template.c

adm_lavcodec/mpeg12.c

adm_lavcodec/mpegaudio.c

adm_lavcodec/mpegaudiodec.c

adm_lavcodec/mpegvideo.c

adm_lavcodec/mpegvideo.h

adm_lavcodec/msmpeg4.c

adm_lavcodec/oggvorbis.c

adm_lavcodec/parser.c

adm_lavcodec/pcm.c

adm_lavcodec/ppc/Makefile

adm_lavcodec/ppc/Makefile.in

adm_lavcodec/ra144.c

adm_lavcodec/ra288.c

adm_lavcodec/ratecontrol.c

adm_lavcodec/raw.c

adm_lavcodec/resample.c

adm_lavcodec/resample2.c

adm_lavcodec/rv10.c

adm_lavcodec/snow.c

adm_lavcodec/sonic.c

adm_lavcodec/svq1.c

adm_lavcodec/truemotion1.c

adm_lavcodec/tscc.c

adm_lavcodec/utils.c

adm_lavcodec/vmdav.c

adm_lavcodec/vp3.c

adm_lavcodec/vqavideo.c

adm_lavcodec/wmadec.c

adm_lavcodec/xan.c

adm_lavcodec/xvmcvideo.c

admin/am_edit

admin/mkinstalldirs

admin/prefs_gen.pl

avidemux/ADM_3gp/ADM_3gp.cpp

avidemux/ADM_3gp/ADM_3gp.h

avidemux/ADM_3gp/Makefile

avidemux/ADM_3gp/Makefile.am

avidemux/ADM_3gp/Makefile.in

avidemux/ADM_assert.h

avidemux/ADM_audio/ADM_aacinfo.cpp

avidemux/ADM_audio/ADM_aacinfo.h

avidemux/ADM_audio/ADM_mp3info.cpp

avidemux/ADM_audio/ADM_mp3info.h

avidemux/ADM_audio/Makefile

avidemux/ADM_audio/Makefile.in

avidemux/ADM_audio/audio_mpegidentify.cpp

avidemux/ADM_audio/audio_packetizer.cpp

avidemux/ADM_audio/audiogen.cpp

avidemux/ADM_audiocodec/ADM_audiocodec.cpp

avidemux/ADM_audiocodec/ADM_audiocodec.h

avidemux/ADM_audiocodec/ADM_codecfaad.cpp

avidemux/ADM_audiocodec/ADM_codecmp3.cpp

avidemux/ADM_audiocodec/ADM_codecwma.cpp

avidemux/ADM_audiocodec/Makefile

avidemux/ADM_audiocodec/Makefile.in

avidemux/ADM_audiocodec/avdm_mad.h

avidemux/ADM_audiocodec/mad.cpp

avidemux/ADM_audiodevice/ADM_deviceALSA.cpp

avidemux/ADM_audiodevice/ADM_deviceArts.cpp

avidemux/ADM_audiodevice/ADM_deviceWin32.cpp

avidemux/ADM_audiodevice/ADM_deviceWin32.h

avidemux/ADM_audiodevice/Makefile

avidemux/ADM_audiodevice/Makefile.in

avidemux/ADM_audiofilter/Makefile

avidemux/ADM_audiofilter/Makefile.in

avidemux/ADM_audiofilter/audioeng_film2pal.cpp

avidemux/ADM_audiofilter/audioeng_lame.h

avidemux/ADM_audiofilter/audioeng_vorbis.cpp

avidemux/ADM_audiofilter/audioeng_vorbis.h

avidemux/ADM_codecs/ADM_codec.h

avidemux/ADM_codecs/ADM_codecs.cpp

avidemux/ADM_codecs/ADM_ffmp43.cpp

avidemux/ADM_codecs/ADM_ffmp43.h

avidemux/ADM_codecs/ADM_ffmpeg.cpp

avidemux/ADM_codecs/ADM_ffmpeg.h

avidemux/ADM_codecs/ADM_mpeg.cpp

avidemux/ADM_codecs/ADM_mpeg.h

avidemux/ADM_codecs/ADM_xvid4.cpp

avidemux/ADM_codecs/ADM_xvideco.cpp

avidemux/ADM_codecs/Makefile

avidemux/ADM_codecs/Makefile.am

avidemux/ADM_codecs/Makefile.in

avidemux/ADM_colorspace/Makefile

avidemux/ADM_colorspace/Makefile.in

avidemux/ADM_colorspace/yv12_422p.cpp

avidemux/ADM_colorspace/yv12_rgb.cpp

avidemux/ADM_colorspace/yv2bmp.cpp

avidemux/ADM_dialog/DIA_DVDff.cpp

avidemux/ADM_dialog/DIA_Msmooth.cpp

avidemux/ADM_dialog/DIA_acodec.cpp

avidemux/ADM_dialog/DIA_calculator.cpp

avidemux/ADM_dialog/DIA_decimate.cpp

avidemux/ADM_dialog/DIA_dectel.cpp

avidemux/ADM_dialog/DIA_encoding.cpp

avidemux/ADM_dialog/DIA_encoding.h

avidemux/ADM_dialog/DIA_equalizer.cpp

avidemux/ADM_dialog/DIA_lame.cpp

avidemux/ADM_dialog/DIA_prefs.cpp

avidemux/ADM_dialog/DIA_vcodec.cpp

avidemux/ADM_dialog/Makefile

avidemux/ADM_dialog/Makefile.am

avidemux/ADM_dialog/Makefile.in

avidemux/ADM_editor/ADM_edFrameType.cpp

avidemux/ADM_editor/ADM_edIdentify.cpp

avidemux/ADM_editor/ADM_edLoadSave.cpp

avidemux/ADM_editor/ADM_edRender.cpp

avidemux/ADM_editor/ADM_edit.cpp

avidemux/ADM_editor/ADM_outputfmt.h

avidemux/ADM_editor/ADMedAVIAUD.cpp

avidemux/ADM_editor/Makefile

avidemux/ADM_editor/Makefile.in

avidemux/ADM_encoder/Makefile

avidemux/ADM_encoder/Makefile.am

avidemux/ADM_encoder/Makefile.in

avidemux/ADM_encoder/adm_encConfig.cpp

avidemux/ADM_encoder/adm_encffmpeg.cpp

avidemux/ADM_encoder/adm_encffmpeg.h

avidemux/ADM_encoder/adm_encoder.h

avidemux/ADM_filter/Makefile

avidemux/ADM_filter/Makefile.in

avidemux/ADM_filter/filter_declaration.cpp

avidemux/ADM_filter/filter_saveload.cpp

avidemux/ADM_filter/gui_filter.cpp

avidemux/ADM_filter/video_filters.h

avidemux/ADM_gui/GUI_DivxEncoder.cpp

avidemux/ADM_gui/GUI_cutWiz.cpp

avidemux/ADM_gui/GUI_decodersettings.cpp

avidemux/ADM_gui/Makefile

avidemux/ADM_gui/Makefile.in

avidemux/ADM_gui2/GUI_bindings.cpp

avidemux/ADM_gui2/GUI_main2.cpp

avidemux/ADM_gui2/GUI_menumap.h

avidemux/ADM_gui2/GUI_render.cpp

avidemux/ADM_gui2/GUI_render.h

avidemux/ADM_gui2/Makefile

avidemux/ADM_gui2/Makefile.in

avidemux/ADM_h263/Makefile

avidemux/ADM_h263/Makefile.in

avidemux/ADM_inpics/Makefile

avidemux/ADM_inpics/Makefile.in

avidemux/ADM_lavformat/ADM_lavformat.cpp

avidemux/ADM_lavformat/ADM_lavformat.h

avidemux/ADM_lavformat/Makefile

avidemux/ADM_lavformat/Makefile.am

avidemux/ADM_lavformat/Makefile.in

avidemux/ADM_lavformat/avformat.h

avidemux/ADM_lavformat/aviobuf.c

avidemux/ADM_lavformat/file.c

avidemux/ADM_lavformat/img2.c

avidemux/ADM_lavformat/mpeg.c

avidemux/ADM_lavformat/utils.c

avidemux/ADM_library/ADM_fileio.cpp

avidemux/ADM_library/ADM_image.cpp

avidemux/ADM_library/ADM_image.h

avidemux/ADM_library/Makefile

avidemux/ADM_library/Makefile.in

avidemux/ADM_library/avifmt.h

avidemux/ADM_library/avifmt2.h

avidemux/ADM_lvemux/Makefile

avidemux/ADM_lvemux/Makefile.in

avidemux/ADM_memsupport.cpp

avidemux/ADM_mpeg2dec/ADM_mpegpacket_PS.cpp

avidemux/ADM_mpeg2dec/ADM_mpegpacket_PS.h

avidemux/ADM_mpeg2dec/Makefile

avidemux/ADM_mpeg2dec/Makefile.in

avidemux/ADM_mpegindexer/ADM_mpegparser.cpp

avidemux/ADM_mpegindexer/Makefile

avidemux/ADM_mpegindexer/Makefile.in

avidemux/ADM_nuv/Makefile

avidemux/ADM_nuv/Makefile.in

avidemux/ADM_nuv/RTjpeg.c

avidemux/ADM_ogm/Makefile

avidemux/ADM_ogm/Makefile.in

avidemux/ADM_openDML/ADM_odml_odml.cpp

avidemux/ADM_openDML/ADM_openDML.cpp

avidemux/ADM_openDML/ADM_riff.cpp

avidemux/ADM_openDML/Makefile

avidemux/ADM_openDML/Makefile.in

avidemux/ADM_pp.cpp

avidemux/ADM_requant/Makefile

avidemux/ADM_requant/Makefile.in

avidemux/ADM_requantize.cpp

avidemux/ADM_script/Makefile

avidemux/ADM_script/Makefile.in

avidemux/ADM_script/adm_command.cpp

avidemux/ADM_script/adm_command.h

avidemux/ADM_script/adm_lexgen.c

avidemux/ADM_script/adm_scanner.cpp

avidemux/ADM_script/adm_scanner.h

avidemux/ADM_toolkit/ADM_cpuCap.cpp

avidemux/ADM_toolkit/ADM_cpuCap.h

avidemux/ADM_toolkit/ADM_debug.cpp

avidemux/ADM_toolkit/ADM_debugID.h

avidemux/ADM_toolkit/ADM_memory.cpp

avidemux/ADM_toolkit/Makefile

avidemux/ADM_toolkit/Makefile.am

avidemux/ADM_toolkit/Makefile.in

avidemux/ADM_toolkit/TLK_filesel.cpp

avidemux/ADM_toolkit/automation.cpp

avidemux/ADM_toolkit/toolkit.hxx

avidemux/ADM_toolkit/win32.cpp

avidemux/ADM_video/ADM_confCouples.cpp

avidemux/ADM_video/ADM_genvideo.hxx

avidemux/ADM_video/ADM_guiClean.cpp

avidemux/ADM_video/ADM_guiConv.cpp

avidemux/ADM_video/ADM_interlaced.cpp

avidemux/ADM_video/ADM_mpdetc.cpp

avidemux/ADM_video/ADM_vidBlend.cpp

avidemux/ADM_video/ADM_vidDecDec.cpp

avidemux/ADM_video/ADM_vidDecTelecide.cpp

avidemux/ADM_video/ADM_vidDecTelecide.h

avidemux/ADM_video/ADM_vidDeintASM.cpp

avidemux/ADM_video/ADM_vidEqualizer.cpp

avidemux/ADM_video/ADM_vidEqualizer.h

avidemux/ADM_video/ADM_vidFieldUtil.cpp

avidemux/ADM_video/ADM_vidFieldUtil.h

avidemux/ADM_video/ADM_vidFields.cpp

avidemux/ADM_video/ADM_vidFlux.cpp

avidemux/ADM_video/ADM_vidFont.h

avidemux/ADM_video/ADM_vidMPLD3D.cpp

avidemux/ADM_video/ADM_vidMPLD3Dlow.cpp

avidemux/ADM_video/ADM_vidMPLResize.cpp

avidemux/ADM_video/ADM_vidMsmooth.cpp

avidemux/ADM_video/ADM_vidPartial.cpp

avidemux/ADM_video/ADM_vidSRTload.cpp

avidemux/ADM_video/ADM_vidSeparateField.cpp

avidemux/ADM_video/ADM_vidSeparateField.h

avidemux/ADM_video/ADM_vidVlad.cpp

avidemux/ADM_video/Makefile

avidemux/ADM_video/Makefile.am

avidemux/ADM_video/Makefile.in

avidemux/ADM_vp32/Makefile

avidemux/ADM_vp32/Makefile.in

avidemux/ADM_vp32/include/Makefile

avidemux/ADM_vp32/include/Makefile.in

avidemux/ADM_xvidratectl/ADM_xvidr_internal.h

avidemux/ADM_xvidratectl/ADM_xvidratectl.cpp

avidemux/ADM_xvidratectl/Makefile

avidemux/ADM_xvidratectl/Makefile.in

avidemux/Makefile

avidemux/Makefile.am

avidemux/Makefile.in

avidemux/admmangle.h

avidemux/avilist.cpp

avidemux/avilist.h

avidemux/gtk_gui.cpp

avidemux/gtkgui.h

avidemux/gui_action.hxx

avidemux/gui_keyframes.cpp

avidemux/gui_navigate.cpp

avidemux/gui_savenew.cpp

avidemux/libMpeg2Dec/Makefile

avidemux/libMpeg2Dec/Makefile.in

avidemux/libMpeg2Dec/mpeg2.h

avidemux/libtoolame/Makefile

avidemux/libtoolame/Makefile.in

avidemux/libtoolame/freqtable.h

avidemux/libtoolame/musicin.h

avidemux/main.cpp

avidemux/mpeg2enc/ADM_mpeg2Param.h

avidemux/mpeg2enc/Makefile

avidemux/mpeg2enc/Makefile.am

avidemux/mpeg2enc/Makefile.in

avidemux/mpeg2enc/cpu_accel.cc

avidemux/mpeg2enc/find_best_one_pel.cc

avidemux/mpeg2enc/format_codes.h

avidemux/mpeg2enc/idct.cc

avidemux/mpeg2enc/ioio.c

avidemux/mpeg2enc/mblock_sub44_sads_x86.cc

avidemux/mpeg2enc/mblock_sub44_sads_x86.h

avidemux/mpeg2enc/mjpeg_logging.h

avidemux/mpeg2enc/mjpeg_types.h

avidemux/mpeg2enc/mmx.h

avidemux/mpeg2enc/mmxsse_motion.h

avidemux/mpeg2enc/motion.cc

avidemux/mpeg2enc/motionsearch.cc

avidemux/mpeg2enc/mpegconsts.h

avidemux/mpeg2enc/predict.cc

avidemux/mpeg2enc/predict_ref.cc

avidemux/mpeg2enc/predict_ref.h

avidemux/mpeg2enc/predict_x86.cc

avidemux/mpeg2enc/quantize_ref.cc

avidemux/mpeg2enc/quantize_ref.h

avidemux/mpeg2enc/quantize_x86.cc

avidemux/mpeg2enc/ratectl.hh

avidemux/mpeg2enc/readpic.cc

avidemux/mpeg2enc/simd.h

avidemux/mpeg2enc/transfrm_ref.cc

avidemux/mpeg2enc/transfrm_ref.h

avidemux/mpeg2enc/transfrm_x86.cc

avidemux/oplug_avi/Makefile

avidemux/oplug_avi/Makefile.in

avidemux/oplug_avi/op_avisave.cpp

avidemux/oplug_avi/op_aviwrite.cpp

avidemux/oplug_avi/op_aviwrite.hxx

avidemux/oplug_avi/op_savesmart.cpp

avidemux/oplug_mpeg/Makefile

avidemux/oplug_mpeg/Makefile.in

avidemux/oplug_mpeg/op_mpeg.cpp

avidemux/oplug_mpeg/op_mpeg.h

avidemux/oplug_mpeg/op_mpeg_write.h

avidemux/oplug_mpeg/op_mpegpass.cpp

avidemux/oplug_mpeg/op_mpegwrite.cpp

avidemux/oplug_mpegFF/Makefile

avidemux/oplug_mpegFF/Makefile.in

avidemux/oplug_mpegFF/oplug_vcdff.cpp

avidemux/oplug_mpegFF/oplug_vcdff.h

avidemux/oplug_ogm/Makefile

avidemux/oplug_ogm/Makefile.in

avidemux/oplug_ogm/op_ogaudio.cpp

avidemux/oplug_ogm/op_ogsave.cpp

avidemux/prefs.cpp

avidemux/prefs.h

avidemux/prefs.in

avidemux/wget-log

avidemux/xpm/Makefile

avidemux/xpm/Makefile.in

config.h

config.h.in

config.log

config.status

configure

configure.in

configure.in.in

debian/changelog

debian/control

debian/rules

libtool

m4/Makefile

m4/Makefile.in

po/Makefile

po/Makefile.iii

po/Makefile.in

po/es.gmo

po/fr.gmo

po/ru.gmo

Show diffs side-by-side

added added

removed removed

avidemux/mpeg2enc/idct_mmx.s

;

; MMX32 iDCT algorithm (IEEE-1180 compliant) :: idct_mmx32()

;

; MPEG2AVI

; --------

; v0.16B33 initial release

;

; This was one of the harder pieces of work to code.

; Intel's app-note focuses on the numerical issues of the algorithm, but

; assumes the programmer is familiar with IDCT mathematics, leaving the

; form of the complete function up to the programmer's imagination.

;

; ALGORITHM OVERVIEW

; ------------------

; I played around with the code for quite a few hours. I came up

; with *A* working IDCT algorithm, however I'm not sure whether my routine

; is "the correct one." But rest assured, my code passes all six IEEE

; accuracy tests with plenty of margin.

;

; My IDCT algorithm consists of 4 steps:

;

; 1) IDCT-row transformation (using the IDCT-row function) on all 8 rows

; This yields an intermediate 8x8 matrix.

;

; 2) intermediate matrix transpose (mandatory)

;

; 3) IDCT-row transformation (2nd time) on all 8 rows of the intermediate

; matrix. The output is the final-result, in transposed form.

;

; 4) post-transformation matrix transpose

; (not necessary if the input-data is already transposed, this could

; be done during the MPEG "zig-zag" scan, but since my algorithm

; requires at least one transpose operation, why not re-use the

; transpose-code.)

;

; Although the (1st) and (3rd) steps use the SAME row-transform operation,

; the (3rd) step uses different shift&round constants (explained later.)

;

; Also note that the intermediate transpose (2) would not be neccessary,

; if the subsequent operation were a iDCT-column transformation. Since

; we only have the iDCT-row transform, we transpose the intermediate

; matrix and use the iDCT-row transform a 2nd time.

;

; I had to change some constants/variables for my method to work :

;

; As given by Intel, the #defines for SHIFT_INV_COL and RND_INV_COL are

; wrong. Not surprising since I'm not using a true column-transform

; operation, but the row-transform operation (as mentioned earlier.)

; round_inv_col[], which is given as "4 short" values, should have the

; same dimensions as round_inv_row[]. The corrected variables are

; shown.

;

; Intel's code defines a different table for each each row operation.

; The tables given are 0/4, 1/7, 2/6, and 5/3. My code only uses row#0.

; Using the other rows messes up the overall transform.

;

; IMPLEMENTATION DETAILs

; ----------------------

;

; I divided the algorithm's work into two subroutines,

; 1) idct_mmx32_rows() - transforms 8 rows, then transpose

; 2) idct_mmx32_cols() - transforms 8 rows, then transpose

; yields final result ("drop-in" direct replacement for INT32 IDCT)

;

; The 2nd function is a clone of the 1st, with changes made only to the

; shift&rounding instructions.

;

; In the 1st function (rows), the shift & round instructions use

; SHIFT_INV_ROW & round_inv_row[] (renamed to r_inv_row[])

;

; In the 2nd function (cols)-> r_inv_col[], and

; SHIFT_INV_COL & round_inv_col[] (renamed to r_inv_col[])

;

; Each function contains an integrated transpose-operator, which comes

; AFTER the primary transformation operation. In the future, I'll optimize

; the code to do more of the transpose-work "in-place". Right now, I've

; left the code as two subroutines and a main calling function, so other

; people can read the code more easily.

;

; liaor@umcc.ais.org http:;members.tripod.com/~liaor

;

;;;

;;; A.Stevens Jul 2000 easy-peasy quick port to nasm

;;; Isn't open source a sensible idea...

;;;

;=============================================================================

;

; AP-922 http:;developer.intel.com/vtune/cbts/strmsimd

; These examples contain code fragments for first stage iDCT 8x8

; (for rows) and first stage DCT 8x8 (for columns)

;

;============================================================================

%define INP eax ; pointer to (short *blk)

%define OUT ecx ; pointer to output (temporary store space qwTemp[])

%define TABLE ebx ; pointer to idct_tab_01234567[]

%define round_inv_row edx

100

%define round_inv_col edx

101

102

103

%define ROW_STRIDE 16 ; for 8x8 matrix transposer

104

%define BITS_INV_ACC 4 ; 4 or 5 for IEEE

105

%define SHIFT_INV_ROW (16 - BITS_INV_ACC)

106

%define SHIFT_INV_COL (1 + BITS_INV_ACC +14 ) ; changed from Intel's val)

107

108

;;

109

;; Variables and tables defined in C for convenience

110

;;

111

extern idct_r_inv_row ; 2 DWORDSs

112

extern idct_r_inv_col ; "

113

extern idct_r_inv_corr ; "

114

extern idct_tab_01234567 ; Catenated table of coefficients

115

116

;;

117

;; private variables and functions

118

;;

119

120

SECTION .bss

121

align 16

122

qwTemp: resw 64 ; temporary storage space, 8x8 of shorts

123

124

125

SECTION .text

126

127

;; static void idct_mmx( short *blk

128

global mp2_idct_mmx

129

130

mp2_idct_mmx:

131

push ebp ; save frame pointer

132

mov ebp, esp

133

134

push ebx

135

push ecx

136

push edx

137

push edi

138

139

;;

140

;; transform all 8 rows of 8x8 iDCT block

141

;;

142

143

; this subroutine performs two operations

144

; 1) iDCT row transform

145

; for( i = 0; i < 8; ++ i)

146

; DCT_8_INV_ROW_1( blk[i*8], qwTemp[i] );

147

;

148

; 2) transpose the matrix (which was stored in qwTemp[])

149

; qwTemp[] -> [8x8 matrix transpose] -> blk[]

150

151

mov INP, [ebp+8] ; INP = blk

152

mov edi, 0x00; ; x = 0

153

154

lea TABLE,[idct_tab_01234567]; ; row 0

155

156

157

lea OUT, [qwTemp];

158

lea round_inv_row, [idct_r_inv_row]

159

jmp lpa

160

161

; for ( x = 0; x < 8; ++x ) ; transform one row per iteration

162

align 32

163

lpa:

164

movq mm0, [INP] ; 0 ; x3 x2 x1 x0

165

166

movq mm1, [INP+8] ; 1 ; x7 x6 x5 x4

167

movq mm2, mm0 ; ; 2 ; x3 x2 x1 x0

168

169

movq mm3, [TABLE] ; 3 ; w06 w04 w02 w00

170

punpcklwd mm0, mm1 ; x5 x1 x4 x0

171

172

; ----------

173

movq mm5, mm0 ; ; 5 ; x5 x1 x4 x0

174

punpckldq mm0, mm0 ; ; x4 x0 x4 x0

175

176

movq mm4, [TABLE+8] ; ; 4 ; w07 w05 w03 w01

177

punpckhwd mm2, mm1 ; ; 1 ; x7 x3 x6 x2

178

179

pmaddwd mm3, mm0 ; ; x4*w06+x0*w04 x4*w02+x0*w00

180

movq mm6, mm2 ; ; 6 ; x7 x3 x6 x2

181

182

movq mm1, [TABLE+32] ;; 1 ; w22 w20 w18 w16

183

punpckldq mm2, mm2 ; ; x6 x2 x6 x2

184

185

pmaddwd mm4, mm2 ; ; x6*w07+x2*w05 x6*w03+x2*w01

186

punpckhdq mm5, mm5 ; ; x5 x1 x5 x1

187

188

pmaddwd mm0, [TABLE+16] ;; x4*w14+x0*w12 x4*w10+x0*w08

189

punpckhdq mm6, mm6 ; ; x7 x3 x7 x3

190

191

movq mm7, [TABLE+40] ;; 7 ; w23 w21 w19 w17

192

pmaddwd mm1, mm5 ; ; x5*w22+x1*w20 x5*w18+x1*w16

193

194

paddd mm3, [round_inv_row];; +rounder

195

pmaddwd mm7, mm6 ; ; x7*w23+x3*w21 x7*w19+x3*w17

196

197

pmaddwd mm2, [TABLE+24] ;; x6*w15+x2*w13 x6*w11+x2*w09

198

paddd mm3, mm4 ; ; 4 ; a1=sum(even1) a0=sum(even0)

199

200

pmaddwd mm5, [TABLE+48] ;; x5*w30+x1*w28 x5*w26+x1*w24

201

movq mm4, mm3 ; ; 4 ; a1 a0

202

203

pmaddwd mm6, [TABLE+56] ;; x7*w31+x3*w29 x7*w27+x3*w25

204

paddd mm1, mm7 ; ; 7 ; b1=sum(odd1) b0=sum(odd0)

205

206

paddd mm0, [round_inv_row];; +rounder

207

psubd mm3, mm1 ; ; a1-b1 a0-b0

208

209

psrad mm3, SHIFT_INV_ROW ; ; y6=a1-b1 y7=a0-b0

210

paddd mm1, mm4 ; ; 4 ; a1+b1 a0+b0

211

212

paddd mm0, mm2 ; ; 2 ; a3=sum(even3) a2=sum(even2)

213

psrad mm1, SHIFT_INV_ROW ; ; y1=a1+b1 y0=a0+b0

214

215

paddd mm5, mm6 ; ; 6 ; b3=sum(odd3) b2=sum(odd2)

216

movq mm4, mm0 ; ; 4 ; a3 a2

217

218

paddd mm0, mm5 ; ; a3+b3 a2+b2

219

psubd mm4, mm5 ; ; 5 ; a3-b3 a2-b2

220

221

add INP, 16; ; increment INPUT pointer -> row 1

222

psrad mm4, SHIFT_INV_ROW ; ; y4=a3-b3 y5=a2-b2

223

224

; add TABLE, 0; ; TABLE += 64 -> row 1

225

psrad mm0, SHIFT_INV_ROW ; ; y3=a3+b3 y2=a2+b2

226

227

; movq mm2, [INP] ; ; row+1; 0; x3 x2 x1 x0

228

packssdw mm4, mm3 ; ; 3 ; y6 y7 y4 y5

229

230

packssdw mm1, mm0 ; ; 0 ; y3 y2 y1 y0

231

movq mm7, mm4 ; ; 7 ; y6 y7 y4 y5

232

233

; movq mm0, mm2 ; ; row+1; 2 ; x3 x2 x1 x0

234

psrld mm4, 16 ; ; 0 y6 0 y4

235

236

movq [OUT], mm1 ; ; 1 ; save y3 y2 y1 y0

237

pslld mm7, 16 ; ; y7 0 y5 0

238

239

; movq mm1, [INP+8] ; ; row+1; 1 ; x7 x6 x5 x4

240

por mm7, mm4 ; ; 4 ; y7 y6 y5 y4

241

242

movq mm3, [TABLE] ; ; 3 ; w06 w04 w02 w00

243

; punpcklwd mm0, mm1 ; ; row+1; x5 x1 x4 x0

244

245

; begin processing row 1

246

movq [OUT+8], mm7 ; ; 7 ; save y7 y6 y5 y4

247

add edi, 0x01;

248

249

add OUT, 16; ; increment OUTPUT pointer -> row 1

250

cmp edi, 0x08;

251

jl near lpa; ; end for ( x = 0; x < 8; ++x )

252

253

; done with the iDCT row-transformation

254

255

; now we have to transpose the output 8x8 matrix

256

; 8x8 (OUT) -> 8x8't' (IN)

257

; the transposition is implemented as 4 sub-operations.

258

; 1) transpose upper-left quad

259

; 2) transpose lower-right quad

260

; 3) transpose lower-left quad

261

; 4) transpose upper-right quad

262

263

264

; mm0 = 1st row [ A B C D ] row1

265

; mm1 = 2nd row [ E F G H ] 2

266

; mm2 = 3rd row [ I J K L ] 3

267

; mm3 = 4th row [ M N O P ] 4

268

269

; 1) transpose upper-left quad

270

lea OUT, [qwTemp];

271

272

movq mm0, [OUT + ROW_STRIDE * 0 ]

273

274

movq mm1, [OUT + ROW_STRIDE * 1 ]

275

movq mm4, mm0; ; mm4 = copy of row1[A B C D]

276

277

movq mm2, [OUT + ROW_STRIDE * 2 ]

278

punpcklwd mm0, mm1; ; mm0 = [ 0 4 1 5]

279

280

movq mm3, [OUT + ROW_STRIDE * 3]

281

punpckhwd mm4, mm1; ; mm4 = [ 2 6 3 7]

282

283

movq mm6, mm2;

284

punpcklwd mm2, mm3; ; mm2 = [ 8 12 9 13]

285

286

punpckhwd mm6, mm3; ; mm6 = 10 14 11 15]

287

movq mm1, mm0; ; mm1 = [ 0 4 1 5]

288

289

mov INP, [ebp+8]; ; load input address

290

punpckldq mm0, mm2; ; final result mm0 = row1 [0 4 8 12]

291

292

movq mm3, mm4; ; mm3 = [ 2 6 3 7]

293

punpckhdq mm1, mm2; ; mm1 = final result mm1 = row2 [1 5 9 13]

294

295

movq [ INP + ROW_STRIDE * 0 ], mm0; ; store row 1

296

punpckldq mm4, mm6; ; final result mm4 = row3 [2 6 10 14]

297

298

; begin reading next quadrant (lower-right)

299

movq mm0, [OUT + ROW_STRIDE*4 + 8];

300

punpckhdq mm3, mm6; ; final result mm3 = row4 [3 7 11 15]

301

302

movq [ INP +ROW_STRIDE * 2], mm4; ; store row 3

303

movq mm4, mm0; ; mm4 = copy of row1[A B C D]

304

305

movq [ INP +ROW_STRIDE * 1], mm1; ; store row 2

306

307

movq mm1, [OUT + ROW_STRIDE*5 + 8]

308

309

movq [ INP +ROW_STRIDE * 3], mm3; ; store row 4

310

punpcklwd mm0, mm1; ; mm0 = [ 0 4 1 5]

311

312

; 2) transpose lower-right quadrant

313

314

; movq mm0, [OUT + ROW_STRIDE*4 + 8]

315

316

; movq mm1, [OUT + ROW_STRIDE*5 + 8]

317

; movq mm4, mm0; ; mm4 = copy of row1[A B C D]

318

319

movq mm2, [OUT + ROW_STRIDE*6 + 8]

320

; punpcklwd mm0, mm1; ; mm0 = [ 0 4 1 5]

321

punpckhwd mm4, mm1; ; mm4 = [ 2 6 3 7]

322

323

movq mm3, [OUT + ROW_STRIDE*7 + 8]

324

movq mm6, mm2;

325

326

punpcklwd mm2, mm3; ; mm2 = [ 8 12 9 13]

327

movq mm1, mm0; ; mm1 = [ 0 4 1 5]

328

329

punpckhwd mm6, mm3; ; mm6 = 10 14 11 15]

330

movq mm3, mm4; ; mm3 = [ 2 6 3 7]

331

332

punpckldq mm0, mm2; ; final result mm0 = row1 [0 4 8 12]

333

334

punpckhdq mm1, mm2; ; mm1 = final result mm1 = row2 [1 5 9 13]

335

; ; slot

336

337

movq [ INP + ROW_STRIDE*4 + 8], mm0; ; store row 1

338

punpckldq mm4, mm6; ; final result mm4 = row3 [2 6 10 14]

339

340

movq mm0, [OUT + ROW_STRIDE * 4 ]

341

punpckhdq mm3, mm6; ; final result mm3 = row4 [3 7 11 15]

342

movq [ INP +ROW_STRIDE*6 + 8], mm4; ; store row 3

343

movq mm4, mm0; ; mm4 = copy of row1[A B C D]

344

movq [ INP +ROW_STRIDE*5 + 8], mm1; ; store row 2

345

; ; slot

346

movq mm1, [OUT + ROW_STRIDE * 5 ]

347

; ; slot

348

349

movq [ INP +ROW_STRIDE*7 + 8], mm3; ; store row 4

350

punpcklwd mm0, mm1; ; mm0 = [ 0 4 1 5]

351

352

; 3) transpose lower-left

353

; movq mm0, [OUT + ROW_STRIDE * 4 ]

354

355

; movq mm1, [OUT + ROW_STRIDE * 5 ]

356

; movq mm4, mm0; ; mm4 = copy of row1[A B C D]

357

358

movq mm2, [OUT + ROW_STRIDE * 6 ]

359

; punpcklwd mm0, mm1; ; mm0 = [ 0 4 1 5]

360

punpckhwd mm4, mm1; ; mm4 = [ 2 6 3 7]

361

362

movq mm3, [OUT + ROW_STRIDE * 7 ]

363

movq mm6, mm2;

364

365

punpcklwd mm2, mm3; ; mm2 = [ 8 12 9 13]

366

movq mm1, mm0; ; mm1 = [ 0 4 1 5]

367

368

punpckhwd mm6, mm3; ; mm6 = 10 14 11 15]

369

movq mm3, mm4; ; mm3 = [ 2 6 3 7]

370

371

punpckldq mm0, mm2; ; final result mm0 = row1 [0 4 8 12]

372

373

punpckhdq mm1, mm2; ; mm1 = final result mm1 = row2 [1 5 9 13]

374

; ; slot

375

376

movq [ INP + ROW_STRIDE * 0 + 8 ], mm0; ; store row 1

377

punpckldq mm4, mm6; ; final result mm4 = row3 [2 6 10 14]

378

379

; begin reading next quadrant (upper-right)

380

movq mm0, [OUT + ROW_STRIDE*0 + 8];

381

punpckhdq mm3, mm6; ; final result mm3 = row4 [3 7 11 15]

382

383

movq [ INP +ROW_STRIDE * 2 + 8], mm4; ; store row 3

384

movq mm4, mm0; ; mm4 = copy of row1[A B C D]

385

386

movq [ INP +ROW_STRIDE * 1 + 8 ], mm1; ; store row 2

387

movq mm1, [OUT + ROW_STRIDE*1 + 8]

388

389

movq [ INP +ROW_STRIDE * 3 + 8], mm3; ; store row 4

390

punpcklwd mm0, mm1; ; mm0 = [ 0 4 1 5]

391

392

393

; 2) transpose lower-right quadrant

394

395

; movq mm0, [OUT + ROW_STRIDE*4 + 8]

396

397

; movq mm1, [OUT + ROW_STRIDE*5 + 8]

398

; movq mm4, mm0; ; mm4 = copy of row1[A B C D]

399

400

movq mm2, [OUT + ROW_STRIDE*2 + 8]

401

; punpcklwd mm0, mm1; ; mm0 = [ 0 4 1 5]

402

punpckhwd mm4, mm1; ; mm4 = [ 2 6 3 7]

403

404

movq mm3, [OUT + ROW_STRIDE*3 + 8]

405

movq mm6, mm2;

406

407

punpcklwd mm2, mm3; ; mm2 = [ 8 12 9 13]

408

movq mm1, mm0; ; mm1 = [ 0 4 1 5]

409

410

punpckhwd mm6, mm3; ; mm6 = 10 14 11 15]

411

movq mm3, mm4; ; mm3 = [ 2 6 3 7]

412

413

punpckldq mm0, mm2; ; final result mm0 = row1 [0 4 8 12]

414

415

punpckhdq mm1, mm2; ; mm1 = final result mm1 = row2 [1 5 9 13]

416

; ; slot

417

418

movq [ INP + ROW_STRIDE*4 ], mm0; ; store row 1

419

punpckldq mm4, mm6; ; final result mm4 = row3 [2 6 10 14]

420

421

movq [ INP +ROW_STRIDE*5 ], mm1; ; store row 2

422

punpckhdq mm3, mm6; ; final result mm3 = row4 [3 7 11 15]

423

424

movq [ INP +ROW_STRIDE*6 ], mm4; ; store row 3

425

; ; slot

426

427

movq [ INP +ROW_STRIDE*7 ], mm3; ; store row 4

428

429

; Conceptually this is the column transform.

430

; Actually, the matrix is transformed

431

; row by row. This function is identical to idct_mmx32_rows(),

432

; except for the SHIFT amount and ROUND_INV amount.

433

434

; this subroutine performs two operations

435

; 1) iDCT row transform

436

; for( i = 0; i < 8; ++ i)

437

; DCT_8_INV_ROW_1( blk[i*8], qwTemp[i] );

438

;

439

; 2) transpose the matrix (which was stored in qwTemp[])

440

; qwTemp[] -> [8x8 matrix transpose] -> blk[]

441

442

443

mov INP, [ebp+8]; ; ; row 0

444

mov edi, 0x00; ; x = 0

445

446

lea TABLE, [idct_tab_01234567]; ; row 0

447

lea OUT, [qwTemp];

448

; mov OUT, INP; ; algorithm writes data in-place -> row 0

449

450

lea round_inv_col, [idct_r_inv_col]

451

jmp acc_idct_colloop1

452

453

; for ( x = 0; x < 8; ++x ) ; transform one row per iteration

454

align 32

455

acc_idct_colloop1:

456

457

movq mm0, [INP] ; ; 0 ; x3 x2 x1 x0

458

459

movq mm1, [INP+8] ; ; 1 ; x7 x6 x5 x4

460

movq mm2, mm0 ; ; 2 ; x3 x2 x1 x0

461

462

movq mm3, [TABLE] ; ; 3 ; w06 w04 w02 w00

463

punpcklwd mm0, mm1 ; ; x5 x1 x4 x0

464

465

; ----------

466

movq mm5, mm0 ; ; 5 ; x5 x1 x4 x0

467

punpckldq mm0, mm0 ; ; x4 x0 x4 x0

468

469

movq mm4, [TABLE+8] ; ; 4 ; w07 w05 w03 w01

470

punpckhwd mm2, mm1 ; ; 1 ; x7 x3 x6 x2

471

472

pmaddwd mm3, mm0 ; ; x4*w06+x0*w04 x4*w02+x0*w00

473

movq mm6, mm2 ; ; 6 ; x7 x3 x6 x2

474

475

movq mm1, [TABLE+32] ;; 1 ; w22 w20 w18 w16

476

punpckldq mm2, mm2 ; ; x6 x2 x6 x2

477

478

pmaddwd mm4, mm2 ; ; x6*w07+x2*w05 x6*w03+x2*w01

479

punpckhdq mm5, mm5 ; ; x5 x1 x5 x1

480

481

pmaddwd mm0, [TABLE+16] ;; x4*w14+x0*w12 x4*w10+x0*w08

482

punpckhdq mm6, mm6 ; ; x7 x3 x7 x3

483

484

movq mm7, [TABLE+40] ;; 7 ; w23 w21 w19 w17

485

pmaddwd mm1, mm5 ; ; x5*w22+x1*w20 x5*w18+x1*w16

486

487

paddd mm3, [round_inv_col] ;; +rounder

488

pmaddwd mm7, mm6 ; ; x7*w23+x3*w21 x7*w19+x3*w17

489

490

pmaddwd mm2, [TABLE+24] ;; x6*w15+x2*w13 x6*w11+x2*w09

491

paddd mm3, mm4 ; ; 4 ; a1=sum(even1) a0=sum(even0)

492

493

pmaddwd mm5, [TABLE+48] ;; x5*w30+x1*w28 x5*w26+x1*w24

494

movq mm4, mm3 ; ; 4 ; a1 a0

495

496

pmaddwd mm6, [TABLE+56] ;; x7*w31+x3*w29 x7*w27+x3*w25

497

paddd mm1, mm7 ; ; 7 ; b1=sum(odd1) b0=sum(odd0)

498

499

paddd mm0, [round_inv_col] ;; +rounder

500

psubd mm3, mm1 ; ; a1-b1 a0-b0

501

502

psrad mm3, SHIFT_INV_COL; ; y6=a1-b1 y7=a0-b0

503

paddd mm1, mm4 ; ; 4 ; a1+b1 a0+b0

504

505

paddd mm0, mm2 ; ; 2 ; a3=sum(even3) a2=sum(even2)

506

psrad mm1, SHIFT_INV_COL; ; y1=a1+b1 y0=a0+b0

507

508

paddd mm5, mm6 ; ; 6 ; b3=sum(odd3) b2=sum(odd2)

509

movq mm4, mm0 ; ; 4 ; a3 a2

510

511

paddd mm0, mm5 ; ; a3+b3 a2+b2

512

psubd mm4, mm5 ; ; 5 ; a3-b3 a2-b2

513

514

add INP, 16; ; increment INPUT pointer -> row 1

515

psrad mm4, SHIFT_INV_COL; ; y4=a3-b3 y5=a2-b2

516

517

add TABLE, 0; ; TABLE += 64 -> row 1

518

psrad mm0, SHIFT_INV_COL; ; y3=a3+b3 y2=a2+b2

519

520

; movq mm2, [INP] ; ; row+1; 0; x3 x2 x1 x0

521

packssdw mm4, mm3 ; ; 3 ; y6 y7 y4 y5

522

523

packssdw mm1, mm0 ; ; 0 ; y3 y2 y1 y0

524

movq mm7, mm4 ; ; 7 ; y6 y7 y4 y5

525

526

; movq mm0, mm2 ; ; row+1; 2 ; x3 x2 x1 x0

527

; por mm1, dct_one_corr ; ; correction y2 +0.5

528

psrld mm4, 16 ; ; 0 y6 0 y4

529

530

movq [OUT], mm1 ; ; 1 ; save y3 y2 y1 y0

531

pslld mm7, 16 ; ; y7 0 y5 0

532

533

; movq mm1, [INP+8] ; ; row+1; 1 ; x7 x6 x5 x4

534

; por mm7, dct_one_corr ; ; correction y2 +0.5

535

por mm7, mm4 ; ; 4 ; y7 y6 y5 y4

536

537

; movq mm3, [TABLE] ; ; 3 ; w06 w04 w02 w00

538

; punpcklwd mm0, mm1 ; ; row+1; x5 x1 x4 x0

539

540

; begin processing row 1

541

movq [OUT+8], mm7 ; ; 7 ; save y7 y6 y5 y4

542

add edi, 0x01;

543

544

add OUT, 16;

545

cmp edi, 0x08; ; compare x <> 8

546

547

jl near acc_idct_colloop1; ; end for ( x = 0; x < 8; ++x )

548

549

; done with the iDCT column-transformation

550

551

; now we have to transpose the output 8x8 matrix

552

; 8x8 (OUT) -> 8x8't' (IN)

553

554

; the transposition is implemented as 4 sub-operations.

555

; 1) transpose upper-left quad

556

; 2) transpose lower-right quad

557

; 3) transpose lower-left quad

558

; 4) transpose upper-right quad

559

560

561

562

; mm0 = 1st row [ A B C D ] row1

563

; mm1 = 2nd row [ E F G H ] 2

564

; mm2 = 3rd row [ I J K L ] 3

565

; mm3 = 4th row [ M N O P ] 4

566

567

; 1) transpose upper-left quad

568

lea OUT, [qwTemp];

569

570

movq mm0, [OUT + ROW_STRIDE * 0 ]

571

572

movq mm1, [OUT + ROW_STRIDE * 1 ]

573

movq mm4, mm0; ; mm4 = copy of row1[A B C D]

574

575

movq mm2, [OUT + ROW_STRIDE * 2 ]

576

punpcklwd mm0, mm1; ; mm0 = [ 0 4 1 5]

577

578

movq mm3, [OUT + ROW_STRIDE * 3]

579

punpckhwd mm4, mm1 ; mm4 = [ 2 6 3 7]

580

581

movq mm6, mm2

582

punpcklwd mm2, mm3 ; mm2 = [ 8 12 9 13]

583

584

punpckhwd mm6, mm3 ; mm6 = 10 14 11 15]

585

movq mm1, mm0 ; mm1 = [ 0 4 1 5]

586

587

mov INP, [ebp+8] ; load input address

588

punpckldq mm0, mm2 ; final result mm0 = row1 [0 4 8 12]

589

590

movq mm3, mm4; ; mm3 = [ 2 6 3 7]

591

punpckhdq mm1, mm2; ; mm1 = final result mm1 = row2 [1 5 9 13]

592

593

movq [ INP + ROW_STRIDE * 0 ], mm0; ; store row 1

594

punpckldq mm4, mm6; ; final result mm4 = row3 [2 6 10 14]

595

596

; begin reading next quadrant (lower-right)

597

movq mm0, [OUT + ROW_STRIDE*4 + 8];

598

punpckhdq mm3, mm6; ; final result mm3 = row4 [3 7 11 15]

599

600

movq [ INP +ROW_STRIDE * 2], mm4; ; store row 3

601

movq mm4, mm0; ; mm4 = copy of row1[A B C D]

602

603

movq [ INP +ROW_STRIDE * 1], mm1; ; store row 2

604

605

movq mm1, [OUT + ROW_STRIDE*5 + 8]

606

607

movq [ INP +ROW_STRIDE * 3], mm3; ; store row 4

608

punpcklwd mm0, mm1; ; mm0 = [ 0 4 1 5]

609

610

; 2) transpose lower-right quadrant

611

612

; movq mm0, [OUT + ROW_STRIDE*4 + 8]

613

614

; movq mm1, [OUT + ROW_STRIDE*5 + 8]

615

; movq mm4, mm0; ; mm4 = copy of row1[A B C D]

616

617

movq mm2, [OUT + ROW_STRIDE*6 + 8]

618

; punpcklwd mm0, mm1; ; mm0 = [ 0 4 1 5]

619

punpckhwd mm4, mm1; ; mm4 = [ 2 6 3 7]

620

621

movq mm3, [OUT + ROW_STRIDE*7 + 8]

622

movq mm6, mm2;

623

624

punpcklwd mm2, mm3; ; mm2 = [ 8 12 9 13]

625

movq mm1, mm0; ; mm1 = [ 0 4 1 5]

626

627

punpckhwd mm6, mm3; ; mm6 = 10 14 11 15]

628

movq mm3, mm4; ; mm3 = [ 2 6 3 7]

629

630

punpckldq mm0, mm2; ; final result mm0 = row1 [0 4 8 12]

631

632

punpckhdq mm1, mm2; ; mm1 = final result mm1 = row2 [1 5 9 13]

633

; ; slot

634

635

movq [ INP + ROW_STRIDE*4 + 8], mm0; ; store row 1

636

punpckldq mm4, mm6; ; final result mm4 = row3 [2 6 10 14]

637

638

movq mm0, [OUT + ROW_STRIDE * 4 ]

639

punpckhdq mm3, mm6; ; final result mm3 = row4 [3 7 11 15]

640

movq [ INP +ROW_STRIDE*6 + 8], mm4; ; store row 3

641

movq mm4, mm0; ; mm4 = copy of row1[A B C D]

642

643

movq [ INP +ROW_STRIDE*5 + 8], mm1; ; store row 2

644

; ; slot

645

movq mm1, [OUT + ROW_STRIDE * 5 ]

646

; ; slot

647

648

movq [ INP +ROW_STRIDE*7 + 8], mm3; ; store row 4

649

punpcklwd mm0, mm1; ; mm0 = [ 0 4 1 5]

650

651

; 3) transpose lower-left

652

; movq mm0, [OUT + ROW_STRIDE * 4 ]

653

654

; movq mm1, [OUT + ROW_STRIDE * 5 ]

655

; movq mm4, mm0; ; mm4 = copy of row1[A B C D]

656

657

movq mm2, [OUT + ROW_STRIDE * 6 ]

658

; punpcklwd mm0, mm1; ; mm0 = [ 0 4 1 5]

659

punpckhwd mm4, mm1; ; mm4 = [ 2 6 3 7]

660

661

movq mm3, [OUT + ROW_STRIDE * 7 ]

662

movq mm6, mm2;

663

664

punpcklwd mm2, mm3; ; mm2 = [ 8 12 9 13]

665

movq mm1, mm0; ; mm1 = [ 0 4 1 5]

666

667

punpckhwd mm6, mm3; ; mm6 = 10 14 11 15]

668

movq mm3, mm4; ; mm3 = [ 2 6 3 7]

669

670

punpckldq mm0, mm2; ; final result mm0 = row1 [0 4 8 12]

671

672

punpckhdq mm1, mm2; ; mm1 = final result mm1 = row2 [1 5 9 13]

673

; ; slot

674

675

movq [ INP + ROW_STRIDE * 0 + 8 ], mm0; ; store row 1

676

punpckldq mm4, mm6; ; final result mm4 = row3 [2 6 10 14]

677

678

; begin reading next quadrant (upper-right)

679

movq mm0, [OUT + ROW_STRIDE*0 + 8];

680

punpckhdq mm3, mm6; ; final result mm3 = row4 [3 7 11 15]

681

682

movq [ INP +ROW_STRIDE * 2 + 8], mm4; ; store row 3

683

movq mm4, mm0; ; mm4 = copy of row1[A B C D]

684

685

movq [ INP +ROW_STRIDE * 1 + 8 ], mm1; ; store row 2

686

movq mm1, [OUT + ROW_STRIDE*1 + 8]

687

688

movq [ INP +ROW_STRIDE * 3 + 8], mm3; ; store row 4

689

punpcklwd mm0, mm1; ; mm0 = [ 0 4 1 5]

690

691

692

; 2) transpose lower-right quadrant

693

694

; movq mm0, [OUT + ROW_STRIDE*4 + 8]

695

696

; movq mm1, [OUT + ROW_STRIDE*5 + 8]

697

; movq mm4, mm0; ; mm4 = copy of row1[A B C D]

698

699

movq mm2, [OUT + ROW_STRIDE*2 + 8]

700

; punpcklwd mm0, mm1; ; mm0 = [ 0 4 1 5]

701

punpckhwd mm4, mm1; ; mm4 = [ 2 6 3 7]

702

703

movq mm3, [OUT + ROW_STRIDE*3 + 8]

704

movq mm6, mm2;

705

706

punpcklwd mm2, mm3; ; mm2 = [ 8 12 9 13]

707

movq mm1, mm0; ; mm1 = [ 0 4 1 5]

708

709

punpckhwd mm6, mm3; ; mm6 = 10 14 11 15]

710

movq mm3, mm4; ; mm3 = [ 2 6 3 7]

711

712

punpckldq mm0, mm2; ; final result mm0 = row1 [0 4 8 12]

713

714

punpckhdq mm1, mm2; ; mm1 = final result mm1 = row2 [1 5 9 13]

715

; ; slot

716

717

movq [ INP + ROW_STRIDE*4 ], mm0; ; store row 1

718

punpckldq mm4, mm6; ; final result mm4 = row3 [2 6 10 14]

719

720

movq [ INP +ROW_STRIDE*5 ], mm1; ; store row 2

721

punpckhdq mm3, mm6; ; final result mm3 = row4 [3 7 11 15]

722

723

movq [ INP +ROW_STRIDE*6 ], mm4; ; store row 3

724

; ; slot

725

726

movq [ INP +ROW_STRIDE*7 ], mm3; ; store row 4

727

728

pop edi

729

pop edx

730

pop ecx

731

pop ebx

732

733

pop ebp ; restore frame pointer

734

735

emms

736

ret

Older »