~ubuntu-branches/ubuntu/raring/glmark2/raring

Viewing changes to src/libjpeg-turbo/jcdctmgr.c

Committer: Package Import Robot
Author(s): Ricardo Salveti de Araujo
Date: 2012-08-21 15:38:09 UTC
mfrom: (1.1.4)
Revision ID: package-import@ubuntu.com-20120821153809-bwux72bat8qp2n5v

Tags: 2012.08-0ubuntu1

* New upstream release 2012.08 (LP: #1039736)
  - Avoid crashing if gl used is not >= 2.0 (LP: #842279)
* Bumping dh compatibility level to v9
* debian/control:
  - Update Standards-Version to 3.9.3.
  - Add libjpeg-dev build dependency.
  - Use libegl1-x11-dev as an build-dep alternative instead of libegl1-dev.
  - Update description of glmark2-data binary package.
* debian/copyright:
  - Refresh copyright based on the current upstrem version
* debian/rules:
  - Clean compiled python code from unpacked waflib/ directory, as
    described in http://wiki.debian.org/UnpackWaf

files added:
.pc

.pc/.quilt_patches

.pc/.quilt_series

.pc/.version

.pc/applied-patches

COPYING.SGI

README.android

android/build.xml

android/project.properties

android/res/drawable

android/res/drawable/menu_about.png

android/res/drawable/menu_delete.png

android/res/drawable/menu_load.png

android/res/drawable/menu_results.png

android/res/drawable/menu_save.png

android/res/drawable/menu_settings.png

android/res/layout

android/res/layout/activity_about.xml

android/res/layout/activity_editor.xml

android/res/layout/activity_main.xml

android/res/layout/activity_results.xml

android/res/layout/list_header.xml

android/res/layout/list_item.xml

android/res/layout/save_dialog.xml

android/res/menu

android/res/menu/main_options_menu.xml

android/res/xml

android/res/xml/preferences.xml

android/src/org/linaro/glmark2/AboutActivity.java

android/src/org/linaro/glmark2/BenchmarkListManager.java

android/src/org/linaro/glmark2/EditorActivity.java

android/src/org/linaro/glmark2/GLVisualConfig.java

android/src/org/linaro/glmark2/Glmark2Native.java

android/src/org/linaro/glmark2/MainActivity.java

android/src/org/linaro/glmark2/MainPreferencesActivity.java

android/src/org/linaro/glmark2/ResultsActivity.java

android/src/org/linaro/glmark2/SceneInfo.java

data/models/jellyfish.jobj

data/shaders/buffer-wireframe.frag

data/shaders/buffer-wireframe.vert

data/shaders/bump-height.frag

data/shaders/bump-height.vert

data/shaders/bump-normals-tangent.frag

data/shaders/bump-normals-tangent.vert

data/shaders/gradient.frag

data/shaders/gradient.vert

data/shaders/ideas-lamp-lit.frag

data/shaders/ideas-lamp-lit.vert

data/shaders/ideas-lamp-unlit.frag

data/shaders/ideas-lamp-unlit.vert

data/shaders/ideas-logo-flat.frag

data/shaders/ideas-logo-flat.vert

data/shaders/ideas-logo-shadow.frag

data/shaders/ideas-logo-shadow.vert

data/shaders/ideas-logo.frag

data/shaders/ideas-logo.vert

data/shaders/ideas-paper.frag

data/shaders/ideas-paper.vert

data/shaders/ideas-table.frag

data/shaders/ideas-table.vert

data/shaders/ideas-text.frag

data/shaders/ideas-text.vert

data/shaders/ideas-under-table.frag

data/shaders/ideas-under-table.vert

data/shaders/jellyfish.frag

data/shaders/jellyfish.vert

data/shaders/light-basic-tex-bilinear.frag

data/shaders/light-basic-texgen.vert

data/shaders/terrain-blur.frag

data/shaders/terrain-luminance.frag

data/shaders/terrain-noise.frag

data/shaders/terrain-normalmap.frag

data/shaders/terrain-overlay.frag

data/shaders/terrain-texture.vert

data/shaders/terrain.frag

data/shaders/terrain.vert

data/shaders/text-renderer.frag

data/shaders/text-renderer.vert

data/textures/asteroid-height-map.png

data/textures/asteroid-normal-map-tangent.png

data/textures/desktop-shadow-corner.png

data/textures/desktop-shadow.png

data/textures/glyph-atlas.png

data/textures/jellyfish-caustics-01.png

data/textures/jellyfish-caustics-02.png

data/textures/jellyfish-caustics-03.png

data/textures/jellyfish-caustics-04.png

data/textures/jellyfish-caustics-05.png

data/textures/jellyfish-caustics-06.png

data/textures/jellyfish-caustics-07.png

data/textures/jellyfish-caustics-08.png

data/textures/jellyfish-caustics-09.png

data/textures/jellyfish-caustics-10.png

data/textures/jellyfish-caustics-11.png

data/textures/jellyfish-caustics-12.png

data/textures/jellyfish-caustics-13.png

data/textures/jellyfish-caustics-14.png

data/textures/jellyfish-caustics-15.png

data/textures/jellyfish-caustics-16.png

data/textures/jellyfish-caustics-17.png

data/textures/jellyfish-caustics-18.png

data/textures/jellyfish-caustics-19.png

data/textures/jellyfish-caustics-20.png

data/textures/jellyfish-caustics-21.png

data/textures/jellyfish-caustics-22.png

data/textures/jellyfish-caustics-23.png

data/textures/jellyfish-caustics-24.png

data/textures/jellyfish-caustics-25.png

data/textures/jellyfish-caustics-26.png

data/textures/jellyfish-caustics-27.png

data/textures/jellyfish-caustics-28.png

data/textures/jellyfish-caustics-29.png

data/textures/jellyfish-caustics-30.png

data/textures/jellyfish-caustics-31.png

data/textures/jellyfish-caustics-32.png

data/textures/jellyfish256.png

data/textures/nasa1.png

data/textures/nasa2.png

data/textures/nasa3.png

data/textures/terrain-backgrounddetailed6.jpg

data/textures/terrain-grasslight-512-nm.jpg

data/textures/terrain-grasslight-512.jpg

src/benchmark-collection.cpp

src/benchmark-collection.h

src/default-benchmarks.h

src/gl-headers.cpp

src/gl-visual-config.cpp

src/gl-visual-config.h

src/image-reader.cpp

src/image-reader.h

src/libjpeg-turbo

src/libjpeg-turbo/README

src/libjpeg-turbo/README-turbo.txt

src/libjpeg-turbo/config.h

src/libjpeg-turbo/jaricom.c

src/libjpeg-turbo/jcapimin.c

src/libjpeg-turbo/jcapistd.c

src/libjpeg-turbo/jcarith.c

src/libjpeg-turbo/jccoefct.c

src/libjpeg-turbo/jccolext.c.inc

src/libjpeg-turbo/jccolor.c

src/libjpeg-turbo/jcdctmgr.c

src/libjpeg-turbo/jchuff.c

src/libjpeg-turbo/jchuff.h

src/libjpeg-turbo/jcinit.c

src/libjpeg-turbo/jcmainct.c

src/libjpeg-turbo/jcmarker.c

src/libjpeg-turbo/jcmaster.c

src/libjpeg-turbo/jcomapi.c

src/libjpeg-turbo/jconfig.h

src/libjpeg-turbo/jcparam.c

src/libjpeg-turbo/jcphuff.c

src/libjpeg-turbo/jcprepct.c

src/libjpeg-turbo/jcsample.c

src/libjpeg-turbo/jctrans.c

src/libjpeg-turbo/jdapimin.c

src/libjpeg-turbo/jdapistd.c

src/libjpeg-turbo/jdarith.c

src/libjpeg-turbo/jdatadst-tj.c

src/libjpeg-turbo/jdatasrc-tj.c

src/libjpeg-turbo/jdcoefct.c

src/libjpeg-turbo/jdcolext.c.inc

src/libjpeg-turbo/jdcolor.c

src/libjpeg-turbo/jdct.h

src/libjpeg-turbo/jddctmgr.c

src/libjpeg-turbo/jdhuff.c

src/libjpeg-turbo/jdhuff.h

src/libjpeg-turbo/jdinput.c

src/libjpeg-turbo/jdmainct.c

src/libjpeg-turbo/jdmarker.c

src/libjpeg-turbo/jdmaster.c

src/libjpeg-turbo/jdmerge.c

src/libjpeg-turbo/jdmrgext.c.inc

src/libjpeg-turbo/jdphuff.c

src/libjpeg-turbo/jdpostct.c

src/libjpeg-turbo/jdsample.c

src/libjpeg-turbo/jdtrans.c

src/libjpeg-turbo/jerror.c

src/libjpeg-turbo/jerror.h

src/libjpeg-turbo/jfdctflt.c

src/libjpeg-turbo/jfdctfst.c

src/libjpeg-turbo/jfdctint.c

src/libjpeg-turbo/jidctflt.c

src/libjpeg-turbo/jidctfst.c

src/libjpeg-turbo/jidctint.c

src/libjpeg-turbo/jidctred.c

src/libjpeg-turbo/jinclude.h

src/libjpeg-turbo/jmemmgr.c

src/libjpeg-turbo/jmemnobs.c

src/libjpeg-turbo/jmemsys.h

src/libjpeg-turbo/jmorecfg.h

src/libjpeg-turbo/jpegcomp.h

src/libjpeg-turbo/jpegint.h

src/libjpeg-turbo/jpeglib.h

src/libjpeg-turbo/jquant1.c

src/libjpeg-turbo/jquant2.c

src/libjpeg-turbo/jsimd.h

src/libjpeg-turbo/jsimddct.h

src/libjpeg-turbo/jutils.c

src/libjpeg-turbo/jversion.h

src/libjpeg-turbo/simd

src/libjpeg-turbo/simd/jsimd.h

src/libjpeg-turbo/simd/jsimd_arm.c

src/libjpeg-turbo/simd/jsimd_arm_neon.S

src/libmatrix/gl-if.h

src/libmatrix/log.cc

src/libmatrix/log.h

src/libmatrix/shader-source.cc

src/libmatrix/shader-source.h

src/libmatrix/test

src/libmatrix/test/basic-global-const.vert

src/libmatrix/test/basic.frag

src/libmatrix/test/basic.vert

src/libmatrix/test/const_vec_test.cc

src/libmatrix/test/const_vec_test.h

src/libmatrix/test/inverse_test.cc

src/libmatrix/test/inverse_test.h

src/libmatrix/test/libmatrix_test.cc

src/libmatrix/test/libmatrix_test.h

src/libmatrix/test/options.cc

src/libmatrix/test/shader_source_test.cc

src/libmatrix/test/shader_source_test.h

src/libmatrix/test/transpose_test.cc

src/libmatrix/test/transpose_test.h

src/libmatrix/test/util_split_test.cc

src/libmatrix/test/util_split_test.h

src/libmatrix/util.cc

src/libmatrix/util.h

src/main-loop.cpp

src/main-loop.h

src/scene-buffer.cpp

src/scene-ideas

src/scene-ideas.cpp

src/scene-ideas/a.cc

src/scene-ideas/characters.h

src/scene-ideas/d.cc

src/scene-ideas/e.cc

src/scene-ideas/i.cc

src/scene-ideas/lamp.cc

src/scene-ideas/lamp.h

src/scene-ideas/logo.cc

src/scene-ideas/logo.h

src/scene-ideas/m.cc

src/scene-ideas/n.cc

src/scene-ideas/o.cc

src/scene-ideas/s.cc

src/scene-ideas/splines.cc

src/scene-ideas/splines.h

src/scene-ideas/t.cc

src/scene-ideas/table.cc

src/scene-ideas/table.h

src/scene-jellyfish.cpp

src/scene-jellyfish.h

src/scene-terrain

src/scene-terrain.cpp

src/scene-terrain/base-renderer.cpp

src/scene-terrain/blur-renderer.cpp

src/scene-terrain/copy-renderer.cpp

src/scene-terrain/luminance-renderer.cpp

src/scene-terrain/normal-from-height-renderer.cpp

src/scene-terrain/overlay-renderer.cpp

src/scene-terrain/renderer-chain.cpp

src/scene-terrain/renderer.h

src/scene-terrain/simplex-noise-renderer.cpp

src/scene-terrain/terrain-renderer.cpp

src/scene-terrain/texture-renderer.cpp

src/text-renderer.cpp

src/text-renderer.h

waflib

waflib/Build.py

waflib/ConfigSet.py

waflib/Configure.py

waflib/Context.py

waflib/Errors.py

waflib/Logs.py

waflib/Node.py

waflib/Options.py

waflib/Runner.py

waflib/Scripting.py

waflib/Task.py

waflib/TaskGen.py

waflib/Tools

waflib/Tools/__init__.py

waflib/Tools/ar.py

waflib/Tools/asm.py

waflib/Tools/bison.py

waflib/Tools/c.py

waflib/Tools/c_aliases.py

waflib/Tools/c_config.py

waflib/Tools/c_osx.py

waflib/Tools/c_preproc.py

waflib/Tools/c_tests.py

waflib/Tools/ccroot.py

waflib/Tools/compiler_c.py

waflib/Tools/compiler_cxx.py

waflib/Tools/compiler_d.py

waflib/Tools/compiler_fc.py

waflib/Tools/cs.py

waflib/Tools/cxx.py

waflib/Tools/d.py

waflib/Tools/d_config.py

waflib/Tools/d_scan.py

waflib/Tools/dbus.py

waflib/Tools/dmd.py

waflib/Tools/errcheck.py

waflib/Tools/fc.py

waflib/Tools/fc_config.py

waflib/Tools/fc_scan.py

waflib/Tools/flex.py

waflib/Tools/g95.py

waflib/Tools/gas.py

waflib/Tools/gcc.py

waflib/Tools/gdc.py

waflib/Tools/gfortran.py

waflib/Tools/glib2.py

waflib/Tools/gnu_dirs.py

waflib/Tools/gxx.py

waflib/Tools/icc.py

waflib/Tools/icpc.py

waflib/Tools/ifort.py

waflib/Tools/intltool.py

waflib/Tools/irixcc.py

waflib/Tools/javaw.py

waflib/Tools/kde4.py

waflib/Tools/lua.py

waflib/Tools/msvc.py

waflib/Tools/nasm.py

waflib/Tools/perl.py

waflib/Tools/python.py

waflib/Tools/qt4.py

waflib/Tools/ruby.py

waflib/Tools/suncc.py

waflib/Tools/suncxx.py

waflib/Tools/tex.py

waflib/Tools/vala.py

waflib/Tools/waf_unit_test.py

waflib/Tools/winres.py

waflib/Tools/xlc.py

waflib/Tools/xlcxx.py

waflib/Utils.py

waflib/__init__.py

waflib/ansiterm.py

waflib/extras

waflib/extras/__init__.py

waflib/extras/compat15.py

waflib/fixpy2.py

files removed:
android/default.properties

src/libmatrix/matrix_inverse_test.cc

src/log.cpp

src/log.h

src/shader-source.cpp

src/shader-source.h

src/util.cpp

src/util.h

files modified:
NEWS

android/AndroidManifest.xml

android/jni/Android.mk

android/jni/Android.ndk.mk

android/res/values/strings.xml

android/src/org/linaro/glmark2/Glmark2Activity.java

android/src/org/linaro/glmark2/Glmark2SurfaceView.java

data/shaders/bump-normals.frag

data/shaders/bump-normals.vert

data/shaders/bump-poly.frag

data/shaders/bump-poly.vert

data/shaders/desktop-blur.frag

data/shaders/desktop.vert

data/shaders/effect-2d-convolution.frag

data/shaders/effect-2d.vert

data/shaders/light-advanced.frag

data/shaders/light-advanced.vert

data/shaders/light-basic.frag

data/shaders/light-basic.vert

data/shaders/light-phong.frag

data/shaders/light-phong.vert

data/shaders/pulsar-light.vert

data/shaders/pulsar.vert

debian/changelog

debian/compat

debian/control

debian/copyright

debian/rules

doc/glmark2.1.in

doc/wscript_build

src/android.cpp

src/benchmark.cpp

src/benchmark.h

src/canvas-android.cpp

src/canvas-android.h

src/canvas-x11-egl.cpp

src/canvas-x11-egl.h

src/canvas-x11-glx.cpp

src/canvas-x11-glx.h

src/canvas-x11.cpp

src/canvas-x11.h

src/canvas.h

src/gl-headers.h

src/libmatrix/Makefile

src/libmatrix/mat.h

src/libmatrix/program.cc

src/libmatrix/program.h

src/libmatrix/vec.h

src/main.cpp

src/mesh.cpp

src/mesh.h

src/model.cpp

src/model.h

src/options.cpp

src/options.h

src/scene-build.cpp

src/scene-bump.cpp

src/scene-conditionals.cpp

src/scene-default-options.cpp

src/scene-desktop.cpp

src/scene-effect-2d.cpp

src/scene-function.cpp

src/scene-grid.cpp

src/scene-loop.cpp

src/scene-pulsar.cpp

src/scene-shading.cpp

src/scene-texture.cpp

src/scene.cpp

src/scene.h

src/texture.cpp

src/texture.h

src/wscript_build

wscript

Show diffs side-by-side

added added

removed removed

src/libjpeg-turbo/jcdctmgr.c

* jcdctmgr.c

* This file is part of the Independent JPEG Group's software.

* For conditions of distribution and use, see the accompanying README file.

* This file contains the forward-DCT management logic.

* This code selects a particular DCT implementation to be used,

* and it performs related housekeeping chores including coefficient

* quantization.

#define JPEG_INTERNALS

#include "jinclude.h"

#include "jpeglib.h"

#include "jdct.h" /* Private declarations for DCT subsystem */

#include "jsimddct.h"

/* Private subobject for this module */

typedef JMETHOD(void, forward_DCT_method_ptr, (DCTELEM * data));

typedef JMETHOD(void, float_DCT_method_ptr, (FAST_FLOAT * data));

typedef JMETHOD(void, convsamp_method_ptr,

(JSAMPARRAY sample_data, JDIMENSION start_col,

DCTELEM * workspace));

typedef JMETHOD(void, float_convsamp_method_ptr,

(JSAMPARRAY sample_data, JDIMENSION start_col,

FAST_FLOAT *workspace));

typedef JMETHOD(void, quantize_method_ptr,

(JCOEFPTR coef_block, DCTELEM * divisors,

DCTELEM * workspace));

typedef JMETHOD(void, float_quantize_method_ptr,

(JCOEFPTR coef_block, FAST_FLOAT * divisors,

FAST_FLOAT * workspace));

METHODDEF(void) quantize (JCOEFPTR, DCTELEM *, DCTELEM *);

typedef struct {

struct jpeg_forward_dct pub; /* public fields */

/* Pointer to the DCT routine actually in use */

forward_DCT_method_ptr dct;

convsamp_method_ptr convsamp;

quantize_method_ptr quantize;

/* The actual post-DCT divisors --- not identical to the quant table

* entries, because of scaling (especially for an unnormalized DCT).

* Each table is given in normal array order.

DCTELEM * divisors[NUM_QUANT_TBLS];

/* work area for FDCT subroutine */

DCTELEM * workspace;

#ifdef DCT_FLOAT_SUPPORTED

/* Same as above for the floating-point case. */

float_DCT_method_ptr float_dct;

float_convsamp_method_ptr float_convsamp;

float_quantize_method_ptr float_quantize;

FAST_FLOAT * float_divisors[NUM_QUANT_TBLS];

FAST_FLOAT * float_workspace;

#endif

} my_fdct_controller;

typedef my_fdct_controller * my_fdct_ptr;

* Find the highest bit in an integer through binary search.

LOCAL(int)

flss (UINT16 val)

{

int bit;

bit = 16;

if (!val)

return 0;

if (!(val & 0xff00)) {

bit -= 8;

val <<= 8;

}

if (!(val & 0xf000)) {

bit -= 4;

val <<= 4;

}

if (!(val & 0xc000)) {

bit -= 2;

val <<= 2;

}

100

if (!(val & 0x8000)) {

101

bit -= 1;

102

val <<= 1;

103

}

104

105

return bit;

106

}

107

108

109

* Compute values to do a division using reciprocal.

110

111

* This implementation is based on an algorithm described in

112

* "How to optimize for the Pentium family of microprocessors"

113

* (http://www.agner.org/assem/).

114

* More information about the basic algorithm can be found in

115

* the paper "Integer Division Using Reciprocals" by Robert Alverson.

116

117

* The basic idea is to replace x/d by x * d^-1. In order to store

118

* d^-1 with enough precision we shift it left a few places. It turns

119

* out that this algoright gives just enough precision, and also fits

120

* into DCTELEM:

121

122

* b = (the number of significant bits in divisor) - 1

123

* r = (word size) + b

124

* f = 2^r / divisor

125

126

* f will not be an integer for most cases, so we need to compensate

127

* for the rounding error introduced:

128

129

* no fractional part:

130

131

* result = input >> r

132

133

* fractional part of f < 0.5:

134

135

* round f down to nearest integer

136

* result = ((input + 1) * f) >> r

137

138

* fractional part of f > 0.5:

139

140

* round f up to nearest integer

141

* result = (input * f) >> r

142

143

* This is the original algorithm that gives truncated results. But we

144

* want properly rounded results, so we replace "input" with

145

* "input + divisor/2".

146

147

* In order to allow SIMD implementations we also tweak the values to

148

* allow the same calculation to be made at all times:

149

150

* dctbl[0] = f rounded to nearest integer

151

* dctbl[1] = divisor / 2 (+ 1 if fractional part of f < 0.5)

152

* dctbl[2] = 1 << ((word size) * 2 - r)

153

* dctbl[3] = r - (word size)

154

155

* dctbl[2] is for stupid instruction sets where the shift operation

156

* isn't member wise (e.g. MMX).

157

158

* The reason dctbl[2] and dctbl[3] reduce the shift with (word size)

159

* is that most SIMD implementations have a "multiply and store top

160

* half" operation.

161

162

* Lastly, we store each of the values in their own table instead

163

* of in a consecutive manner, yet again in order to allow SIMD

164

* routines.

165

166

LOCAL(int)

167

compute_reciprocal (UINT16 divisor, DCTELEM * dtbl)

168

{

169

UDCTELEM2 fq, fr;

170

UDCTELEM c;

171

int b, r;

172

173

b = flss(divisor) - 1;

174

r = sizeof(DCTELEM) * 8 + b;

175

176

fq = ((UDCTELEM2)1 << r) / divisor;

177

fr = ((UDCTELEM2)1 << r) % divisor;

178

179

c = divisor / 2; /* for rounding */

180

181

if (fr == 0) { /* divisor is power of two */

182

/* fq will be one bit too large to fit in DCTELEM, so adjust */

183

fq >>= 1;

184

r--;

185

} else if (fr <= (divisor / 2U)) { /* fractional part is < 0.5 */

186

c++;

187

} else { /* fractional part is > 0.5 */

188

fq++;

189

}

190

191

dtbl[DCTSIZE2 * 0] = (DCTELEM) fq; /* reciprocal */

192

dtbl[DCTSIZE2 * 1] = (DCTELEM) c; /* correction + roundfactor */

193

dtbl[DCTSIZE2 * 2] = (DCTELEM) (1 << (sizeof(DCTELEM)*8*2 - r)); /* scale */

194

dtbl[DCTSIZE2 * 3] = (DCTELEM) r - sizeof(DCTELEM)*8; /* shift */

195

196

if(r <= 16) return 0;

197

else return 1;

198

}

199

200

201

* Initialize for a processing pass.

202

* Verify that all referenced Q-tables are present, and set up

203

* the divisor table for each one.

204

* In the current implementation, DCT of all components is done during

205

* the first pass, even if only some components will be output in the

206

* first scan. Hence all components should be examined here.

207

208

209

METHODDEF(void)

210

start_pass_fdctmgr (j_compress_ptr cinfo)

211

{

212

my_fdct_ptr fdct = (my_fdct_ptr) cinfo->fdct;

213

int ci, qtblno, i;

214

jpeg_component_info *compptr;

215

JQUANT_TBL * qtbl;

216

DCTELEM * dtbl;

217

218

for (ci = 0, compptr = cinfo->comp_info; ci < cinfo->num_components;

219

ci++, compptr++) {

220

qtblno = compptr->quant_tbl_no;

221

/* Make sure specified quantization table is present */

222

if (qtblno < 0 || qtblno >= NUM_QUANT_TBLS ||

223

cinfo->quant_tbl_ptrs[qtblno] == NULL)

224

ERREXIT1(cinfo, JERR_NO_QUANT_TABLE, qtblno);

225

qtbl = cinfo->quant_tbl_ptrs[qtblno];

226

/* Compute divisors for this quant table */

227

/* We may do this more than once for same table, but it's not a big deal */

228

switch (cinfo->dct_method) {

229

#ifdef DCT_ISLOW_SUPPORTED

230

case JDCT_ISLOW:

231

/* For LL&M IDCT method, divisors are equal to raw quantization

232

* coefficients multiplied by 8 (to counteract scaling).

233

234

if (fdct->divisors[qtblno] == NULL) {

235

fdct->divisors[qtblno] = (DCTELEM *)

236

(*cinfo->mem->alloc_small) ((j_common_ptr) cinfo, JPOOL_IMAGE,

237

(DCTSIZE2 * 4) * SIZEOF(DCTELEM));

238

}

239

dtbl = fdct->divisors[qtblno];

240

for (i = 0; i < DCTSIZE2; i++) {

241

if(!compute_reciprocal(qtbl->quantval[i] << 3, &dtbl[i])

242

&& fdct->quantize == jsimd_quantize)

243

fdct->quantize = quantize;

244

}

245

break;

246

#endif

247

#ifdef DCT_IFAST_SUPPORTED

248

case JDCT_IFAST:

249

{

250

/* For AA&N IDCT method, divisors are equal to quantization

251

* coefficients scaled by scalefactor[row]*scalefactor[col], where

252

* scalefactor[0] = 1

253

* scalefactor[k] = cos(k*PI/16) * sqrt(2) for k=1..7

254

* We apply a further scale factor of 8.

255

256

#define CONST_BITS 14

257

static const INT16 aanscales[DCTSIZE2] = {

258

/* precomputed values scaled up by 14 bits */

259

16384, 22725, 21407, 19266, 16384, 12873, 8867, 4520,

260

22725, 31521, 29692, 26722, 22725, 17855, 12299, 6270,

261

21407, 29692, 27969, 25172, 21407, 16819, 11585, 5906,

262

19266, 26722, 25172, 22654, 19266, 15137, 10426, 5315,

263

16384, 22725, 21407, 19266, 16384, 12873, 8867, 4520,

264

12873, 17855, 16819, 15137, 12873, 10114, 6967, 3552,

265

8867, 12299, 11585, 10426, 8867, 6967, 4799, 2446,

266

4520, 6270, 5906, 5315, 4520, 3552, 2446, 1247

267

};

268

SHIFT_TEMPS

269

270

if (fdct->divisors[qtblno] == NULL) {

271

fdct->divisors[qtblno] = (DCTELEM *)

272

(*cinfo->mem->alloc_small) ((j_common_ptr) cinfo, JPOOL_IMAGE,

273

(DCTSIZE2 * 4) * SIZEOF(DCTELEM));

274

}

275

dtbl = fdct->divisors[qtblno];

276

for (i = 0; i < DCTSIZE2; i++) {

277

if(!compute_reciprocal(

278

DESCALE(MULTIPLY16V16((INT32) qtbl->quantval[i],

279

(INT32) aanscales[i]),

280

CONST_BITS-3), &dtbl[i])

281

&& fdct->quantize == jsimd_quantize)

282

fdct->quantize = quantize;

283

}

284

}

285

break;

286

#endif

287

#ifdef DCT_FLOAT_SUPPORTED

288

case JDCT_FLOAT:

289

{

290

/* For float AA&N IDCT method, divisors are equal to quantization

291

* coefficients scaled by scalefactor[row]*scalefactor[col], where

292

* scalefactor[0] = 1

293

* scalefactor[k] = cos(k*PI/16) * sqrt(2) for k=1..7

294

* We apply a further scale factor of 8.

295

* What's actually stored is 1/divisor so that the inner loop can

296

* use a multiplication rather than a division.

297

298

FAST_FLOAT * fdtbl;

299

int row, col;

300

static const double aanscalefactor[DCTSIZE] = {

301

1.0, 1.387039845, 1.306562965, 1.175875602,

302

1.0, 0.785694958, 0.541196100, 0.275899379

303

};

304

305

if (fdct->float_divisors[qtblno] == NULL) {

306

fdct->float_divisors[qtblno] = (FAST_FLOAT *)

307

(*cinfo->mem->alloc_small) ((j_common_ptr) cinfo, JPOOL_IMAGE,

308

DCTSIZE2 * SIZEOF(FAST_FLOAT));

309

}

310

fdtbl = fdct->float_divisors[qtblno];

311

i = 0;

312

for (row = 0; row < DCTSIZE; row++) {

313

for (col = 0; col < DCTSIZE; col++) {

314

fdtbl[i] = (FAST_FLOAT)

315

(1.0 / (((double) qtbl->quantval[i] *

316

aanscalefactor[row] * aanscalefactor[col] * 8.0)));

317

i++;

318

}

319

}

320

}

321

break;

322

#endif

323

default:

324

ERREXIT(cinfo, JERR_NOT_COMPILED);

325

break;

326

}

327

}

328

}

329

330

331

332

* Load data into workspace, applying unsigned->signed conversion.

333

334

335

METHODDEF(void)

336

convsamp (JSAMPARRAY sample_data, JDIMENSION start_col, DCTELEM * workspace)

337

{

338

339

340

341

342

workspaceptr = workspace;

343

for (elemr = 0; elemr < DCTSIZE; elemr++) {

344

elemptr = sample_data[elemr] + start_col;

345

346

#if DCTSIZE == 8 /* unroll the inner loop */

347

*workspaceptr++ = GETJSAMPLE(*elemptr++) - CENTERJSAMPLE;

348

*workspaceptr++ = GETJSAMPLE(*elemptr++) - CENTERJSAMPLE;

349

*workspaceptr++ = GETJSAMPLE(*elemptr++) - CENTERJSAMPLE;

350

*workspaceptr++ = GETJSAMPLE(*elemptr++) - CENTERJSAMPLE;

351

*workspaceptr++ = GETJSAMPLE(*elemptr++) - CENTERJSAMPLE;

352

*workspaceptr++ = GETJSAMPLE(*elemptr++) - CENTERJSAMPLE;

353

*workspaceptr++ = GETJSAMPLE(*elemptr++) - CENTERJSAMPLE;

354

*workspaceptr++ = GETJSAMPLE(*elemptr++) - CENTERJSAMPLE;

355

#else

356

{

357

358

for (elemc = DCTSIZE; elemc > 0; elemc--)

359

*workspaceptr++ = GETJSAMPLE(*elemptr++) - CENTERJSAMPLE;

360

}

361

#endif

362

}

363

}

364

365

366

367

* Quantize/descale the coefficients, and store into coef_blocks[].

368

369

370

METHODDEF(void)

371

quantize (JCOEFPTR coef_block, DCTELEM * divisors, DCTELEM * workspace)

372

{

373

int i;

374

DCTELEM temp;

375

UDCTELEM recip, corr, shift;

376

UDCTELEM2 product;

377

JCOEFPTR output_ptr = coef_block;

378

379

for (i = 0; i < DCTSIZE2; i++) {

380

temp = workspace[i];

381

recip = divisors[i + DCTSIZE2 * 0];

382

corr = divisors[i + DCTSIZE2 * 1];

383

shift = divisors[i + DCTSIZE2 * 3];

384

385

if (temp < 0) {

386

temp = -temp;

387

product = (UDCTELEM2)(temp + corr) * recip;

388

product >>= shift + sizeof(DCTELEM)*8;

389

temp = product;

390

temp = -temp;

391

} else {

392

product = (UDCTELEM2)(temp + corr) * recip;

393

product >>= shift + sizeof(DCTELEM)*8;

394

temp = product;

395

}

396

397

output_ptr[i] = (JCOEF) temp;

398

}

399

}

400

401

402

403

* Perform forward DCT on one or more blocks of a component.

404

405

* The input samples are taken from the sample_data[] array starting at

406

* position start_row/start_col, and moving to the right for any additional

407

* blocks. The quantized coefficients are returned in coef_blocks[].

408

409

410

METHODDEF(void)

411

forward_DCT (j_compress_ptr cinfo, jpeg_component_info * compptr,

412

JSAMPARRAY sample_data, JBLOCKROW coef_blocks,

413

JDIMENSION start_row, JDIMENSION start_col,

414

JDIMENSION num_blocks)

415

/* This version is used for integer DCT implementations. */

416

{

417

/* This routine is heavily used, so it's worth coding it tightly. */

418

my_fdct_ptr fdct = (my_fdct_ptr) cinfo->fdct;

419

DCTELEM * divisors = fdct->divisors[compptr->quant_tbl_no];

420

DCTELEM * workspace;

421

JDIMENSION bi;

422

423

/* Make sure the compiler doesn't look up these every pass */

424

forward_DCT_method_ptr do_dct = fdct->dct;

425

convsamp_method_ptr do_convsamp = fdct->convsamp;

426

quantize_method_ptr do_quantize = fdct->quantize;

427

workspace = fdct->workspace;

428

429

sample_data += start_row; /* fold in the vertical offset once */

430

431

for (bi = 0; bi < num_blocks; bi++, start_col += DCTSIZE) {

432

/* Load data into workspace, applying unsigned->signed conversion */

433

(*do_convsamp) (sample_data, start_col, workspace);

434

435

/* Perform the DCT */

436

(*do_dct) (workspace);

437

438

/* Quantize/descale the coefficients, and store into coef_blocks[] */

439

(*do_quantize) (coef_blocks[bi], divisors, workspace);

440

}

441

}

442

443

444

#ifdef DCT_FLOAT_SUPPORTED

445

446

447

METHODDEF(void)

448

convsamp_float (JSAMPARRAY sample_data, JDIMENSION start_col, FAST_FLOAT * workspace)

449

{

450

451

452

453

454

workspaceptr = workspace;

455

for (elemr = 0; elemr < DCTSIZE; elemr++) {

456

elemptr = sample_data[elemr] + start_col;

457

#if DCTSIZE == 8 /* unroll the inner loop */

458

*workspaceptr++ = (FAST_FLOAT)(GETJSAMPLE(*elemptr++) - CENTERJSAMPLE);

459

*workspaceptr++ = (FAST_FLOAT)(GETJSAMPLE(*elemptr++) - CENTERJSAMPLE);

460

*workspaceptr++ = (FAST_FLOAT)(GETJSAMPLE(*elemptr++) - CENTERJSAMPLE);

461

*workspaceptr++ = (FAST_FLOAT)(GETJSAMPLE(*elemptr++) - CENTERJSAMPLE);

462

*workspaceptr++ = (FAST_FLOAT)(GETJSAMPLE(*elemptr++) - CENTERJSAMPLE);

463

*workspaceptr++ = (FAST_FLOAT)(GETJSAMPLE(*elemptr++) - CENTERJSAMPLE);

464

*workspaceptr++ = (FAST_FLOAT)(GETJSAMPLE(*elemptr++) - CENTERJSAMPLE);

465

*workspaceptr++ = (FAST_FLOAT)(GETJSAMPLE(*elemptr++) - CENTERJSAMPLE);

466

#else

467

{

468

469

for (elemc = DCTSIZE; elemc > 0; elemc--)

470

*workspaceptr++ = (FAST_FLOAT)

471

(GETJSAMPLE(*elemptr++) - CENTERJSAMPLE);

472

}

473

#endif

474

}

475

}

476

477

478

METHODDEF(void)

479

quantize_float (JCOEFPTR coef_block, FAST_FLOAT * divisors, FAST_FLOAT * workspace)

480

{

481

482

483

484

485

for (i = 0; i < DCTSIZE2; i++) {

486

/* Apply the quantization and scaling factor */

487

temp = workspace[i] * divisors[i];

488

489

/* Round to nearest integer.

490

* Since C does not specify the direction of rounding for negative

491

* quotients, we have to force the dividend positive for portability.

492

* The maximum coefficient size is +-16K (for 12-bit data), so this

493

* code should work for either 16-bit or 32-bit ints.

494

495

output_ptr[i] = (JCOEF) ((int) (temp + (FAST_FLOAT) 16384.5) - 16384);

496

}

497

}

498

499

500

METHODDEF(void)

501

forward_DCT_float (j_compress_ptr cinfo, jpeg_component_info * compptr,

502

JSAMPARRAY sample_data, JBLOCKROW coef_blocks,

503

JDIMENSION start_row, JDIMENSION start_col,

504

JDIMENSION num_blocks)

505

/* This version is used for floating-point DCT implementations. */

506

{

507

/* This routine is heavily used, so it's worth coding it tightly. */

508

my_fdct_ptr fdct = (my_fdct_ptr) cinfo->fdct;

509

FAST_FLOAT * divisors = fdct->float_divisors[compptr->quant_tbl_no];

510

FAST_FLOAT * workspace;

511

JDIMENSION bi;

512

513

514

/* Make sure the compiler doesn't look up these every pass */

515

float_DCT_method_ptr do_dct = fdct->float_dct;

516

float_convsamp_method_ptr do_convsamp = fdct->float_convsamp;

517

float_quantize_method_ptr do_quantize = fdct->float_quantize;

518

workspace = fdct->float_workspace;

519

520

sample_data += start_row; /* fold in the vertical offset once */

521

522

for (bi = 0; bi < num_blocks; bi++, start_col += DCTSIZE) {

523

/* Load data into workspace, applying unsigned->signed conversion */

524

(*do_convsamp) (sample_data, start_col, workspace);

525

526

/* Perform the DCT */

527

(*do_dct) (workspace);

528

529

/* Quantize/descale the coefficients, and store into coef_blocks[] */

530

(*do_quantize) (coef_blocks[bi], divisors, workspace);

531

}

532

}

533

534

#endif /* DCT_FLOAT_SUPPORTED */

535

536

537

538

* Initialize FDCT manager.

539

540

541

GLOBAL(void)

542

jinit_forward_dct (j_compress_ptr cinfo)

543

{

544

my_fdct_ptr fdct;

545

int i;

546

547

fdct = (my_fdct_ptr)

548

(*cinfo->mem->alloc_small) ((j_common_ptr) cinfo, JPOOL_IMAGE,

549

SIZEOF(my_fdct_controller));

550

cinfo->fdct = (struct jpeg_forward_dct *) fdct;

551

fdct->pub.start_pass = start_pass_fdctmgr;

552

553

/* First determine the DCT... */

554

switch (cinfo->dct_method) {

555

#ifdef DCT_ISLOW_SUPPORTED

556

case JDCT_ISLOW:

557

fdct->pub.forward_DCT = forward_DCT;

558

if (jsimd_can_fdct_islow())

559

fdct->dct = jsimd_fdct_islow;

560

else

561

fdct->dct = jpeg_fdct_islow;

562

break;

563

#endif

564

#ifdef DCT_IFAST_SUPPORTED

565

case JDCT_IFAST:

566

fdct->pub.forward_DCT = forward_DCT;

567

if (jsimd_can_fdct_ifast())

568

fdct->dct = jsimd_fdct_ifast;

569

else

570

fdct->dct = jpeg_fdct_ifast;

571

break;

572

#endif

573

#ifdef DCT_FLOAT_SUPPORTED

574

case JDCT_FLOAT:

575

fdct->pub.forward_DCT = forward_DCT_float;

576

if (jsimd_can_fdct_float())

577

fdct->float_dct = jsimd_fdct_float;

578

else

579

fdct->float_dct = jpeg_fdct_float;

580

break;

581

#endif

582

default:

583

ERREXIT(cinfo, JERR_NOT_COMPILED);

584

break;

585

}

586

587

/* ...then the supporting stages. */

588

switch (cinfo->dct_method) {

589

#ifdef DCT_ISLOW_SUPPORTED

590

case JDCT_ISLOW:

591

#endif

592

#ifdef DCT_IFAST_SUPPORTED

593

case JDCT_IFAST:

594

#endif

595

#if defined(DCT_ISLOW_SUPPORTED) || defined(DCT_IFAST_SUPPORTED)

596

if (jsimd_can_convsamp())

597

fdct->convsamp = jsimd_convsamp;

598

else

599

fdct->convsamp = convsamp;

600

if (jsimd_can_quantize())

601

fdct->quantize = jsimd_quantize;

602

else

603

fdct->quantize = quantize;

604

break;

605

#endif

606

#ifdef DCT_FLOAT_SUPPORTED

607

case JDCT_FLOAT:

608

if (jsimd_can_convsamp_float())

609

fdct->float_convsamp = jsimd_convsamp_float;

610

else

611

fdct->float_convsamp = convsamp_float;

612

if (jsimd_can_quantize_float())

613

fdct->float_quantize = jsimd_quantize_float;

614

else

615

fdct->float_quantize = quantize_float;

616

break;

617

#endif

618

default:

619

ERREXIT(cinfo, JERR_NOT_COMPILED);

620

break;

621

}

622

623

/* Allocate workspace memory */

624

#ifdef DCT_FLOAT_SUPPORTED

625

if (cinfo->dct_method == JDCT_FLOAT)

626

fdct->float_workspace = (FAST_FLOAT *)

627

(*cinfo->mem->alloc_small) ((j_common_ptr) cinfo, JPOOL_IMAGE,

628

SIZEOF(FAST_FLOAT) * DCTSIZE2);

629

else

630

#endif

631

fdct->workspace = (DCTELEM *)

632

(*cinfo->mem->alloc_small) ((j_common_ptr) cinfo, JPOOL_IMAGE,

633

SIZEOF(DCTELEM) * DCTSIZE2);

634

635

/* Mark divisor tables unallocated */

636

for (i = 0; i < NUM_QUANT_TBLS; i++) {

637

fdct->divisors[i] = NULL;

638

#ifdef DCT_FLOAT_SUPPORTED

639

fdct->float_divisors[i] = NULL;

640

#endif

641

}

642

}

Older »