~ubuntu-branches/ubuntu/lucid/gavl/lucid

Viewing changes to gavl/sse/scale_y_sse.c

Committer: Bazaar Package Importer
Author(s): Romain Beauxis
Date: 2008-11-07 13:47:46 UTC
mfrom: (1.1.2 upstream)
Revision ID: james.westby@ubuntu.com-20081107134746-s4s970fo1bcde9zw

Tags: 1.0.1-1

* Adopted package for debian, with the blessing of previous maintainer.
* Based new package on Christian Marillat's package for debian-multimedia.
* Removed support for ccache until I figure out how to make it work
with cdbs.
* Changed library package name since ABI is not backward compatible, but
upstream did not bump major soversion.

files added:
debian/control.in

debian/libgavl-1.0-0.install

debian/libgavl-1.0-0.symbols

debian/libgavl-doc.doc-base

debian/libgavl-doc.install

doc/Doxyfile.in

doc/Makefile.am

doc/Makefile.in

doc/mainpage.incl

gavl/3dnow

gavl/3dnow/Makefile.am

gavl/3dnow/Makefile.in

gavl/3dnow/deinterlace_blend_3dnow.c

gavl/c/deinterlace_blend_c.c

gavl/c/dsp_c.c

gavl/c/gray_gray_c.c

gavl/c/gray_rgb_c.c

gavl/c/gray_yuv_c.c

gavl/c/rgb_gray_c.c

gavl/c/rgb_rgb_c.c

gavl/c/rgb_yuv_c.c

gavl/c/scale_macros.h

gavl/c/yuv_gray_c.c

gavl/c/yuv_rgb_c.c

gavl/c/yuv_yuv_c.c

gavl/deinterlace_blend.c

gavl/deinterlace_scale.c

gavl/dsp.c

gavl/dsputils.c

gavl/hq/rgb_rgb_hq.c

gavl/hq/rgb_yuv_hq.c

gavl/hq/yuv_rgb_hq.c

gavl/hq/yuv_yuv_hq.c

gavl/mmx/deinterlace_blend_mmx.c

gavl/mmx/dsp_mmx.c

gavl/mmx/rgb_rgb_mmx.c

gavl/mmx/rgb_yuv_mmx.c

gavl/mmx/scale_x_mmx.c

gavl/mmx/scale_y.h

gavl/mmx/scale_y_linear.h

gavl/mmx/scale_y_mmx.c

gavl/mmx/yuv_rgb_mmx.c

gavl/mmx/yuv_yuv_mmx.c

gavl/mmxext/deinterlace_blend_mmxext.c

gavl/mmxext/dsp_mmxext.c

gavl/mmxext/rgb_rgb_mmxext.c

gavl/mmxext/rgb_yuv_mmxext.c

gavl/mmxext/scale_x_mmxext.c

gavl/mmxext/scale_y_mmxext.c

gavl/mmxext/yuv_rgb_mmxext.c

gavl/mmxext/yuv_yuv_mmxext.c

gavl/sse

gavl/sse/Makefile.am

gavl/sse/Makefile.in

gavl/sse/dsp_sse.c

gavl/sse/rgb_yuv_sse.c

gavl/sse/scale_x_sse.c

gavl/sse/scale_y.h

gavl/sse/scale_y_linear.h

gavl/sse/scale_y_sse.c

gavl/sse/sse.h

gavl/sse2

gavl/sse2/Makefile.am

gavl/sse2/Makefile.in

gavl/sse2/scale_y.h

gavl/sse2/scale_y_sse2.c

gavl/sse3

gavl/sse3/Makefile.am

gavl/sse3/Makefile.in

gavl/sse3/rgb_yuv_sse3.c

gavl/sse3/scale_x_sse3.c

include/bswap.h

include/dsp.h

include/gavl/gavl_version.h

include/gavl/gavl_version.h.in

include/gavl/gavldsp.h

include/macros.h

m4/gavl_float.m4

src/benchmark.c

src/convolvetest.c

src/deinterlace_time.c

src/deinterlacetest.c

src/pixelformat_penalty.c

src/pngutil.c

src/pngutil.h

src/timeutils.c

src/timeutils.h

src/volume_test.c

utils

utils/Makefile.am

utils/Makefile.in

utils/cpuinfo.c

files removed:
debian/dirs

debian/docs

debian/libgavl-dev.dirs

debian/libgavl.substvars

debian/libgavl0.dirs

debian/libgavl0.install

debian/menu

debian/patches

debian/patches/00list

debian/patches/fpic.dpatch

gavl/c/_rgb_rgb_c.c

gavl/c/_rgb_yuv_c.c

gavl/c/_yuv_rgb_c.c

gavl/c/_yuv_yuv_c.c

gavl/c/colorspace_c.c

gavl/hq/colorspace_hq.c

gavl/mmx/_rgb_rgb_mmx.c

gavl/mmx/_rgb_yuv_mmx.c

gavl/mmx/_yuv_rgb_mmx.c

gavl/mmx/_yuv_yuv_mmx.c

gavl/mmx/colorspace_mmx.c

gavl/mmx/scale_mmx.c

gavl/mmxext/colorspace_mmxext.c

gavl/mmxext/scale_mmxext.c

include/gavlconfig.h

include/gavlconfig.h.in

files modified:
COPYING

Makefile.am

Makefile.in

aclocal.m4

autogen.sh

config.guess

config.sub

configure

configure.ac

cpuinfo.sh

debian/changelog

debian/control

debian/copyright

debian/libgavl-dev.install

debian/rules

debian/watch

depcomp

gavl.pc.in

gavl/Makefile.am

gavl/Makefile.in

gavl/arith128.c

gavl/audioconverter.c

gavl/audioformat.c

gavl/audioframe.c

gavl/audiooptions.c

gavl/blend.c

gavl/c/Makefile.am

gavl/c/Makefile.in

gavl/c/_interleave_c.c

gavl/c/_mix_c.c

gavl/c/_sampleformat_c.c

gavl/c/blend_c.c

gavl/c/colorspace_macros.h

gavl/c/colorspace_tables.c

gavl/c/colorspace_tables.h

gavl/c/interleave_c.c

gavl/c/mix_c.c

gavl/c/sampleformat_c.c

gavl/c/scale_bicubic_c.c

gavl/c/scale_bicubic_noclip_c.c

gavl/c/scale_bilinear_c.c

gavl/c/scale_bilinear_x.h

gavl/c/scale_bilinear_xy.h

gavl/c/scale_bilinear_y.h

gavl/c/scale_generic_c.c

gavl/c/scale_generic_x.h

gavl/c/scale_generic_y.h

gavl/c/scale_nearest_c.c

gavl/c/scale_quadratic_c.c

gavl/c/scale_x.h

gavl/c/scale_y.h

gavl/c/volume_c.c

gavl/colorspace.c

gavl/cputest.c

gavl/csp_packed_packed.h

gavl/csp_packed_planar.h

gavl/csp_planar_packed.h

gavl/csp_planar_planar.h

gavl/deinterlace.c

gavl/deinterlace_copy.c

gavl/hq/Makefile.am

gavl/hq/Makefile.in

gavl/interleave.c

gavl/libgdither/Makefile.in

gavl/libgdither/gdither.c

gavl/libgdither/gdither.h

gavl/libgdither/gdither_types.h

gavl/libgdither/gdither_types_internal.h

gavl/libgdither/noise.h

gavl/libsamplerate/Makefile.in

gavl/libsamplerate/common.h

gavl/libsamplerate/samplerate.c

gavl/libsamplerate/src_linear.c

gavl/libsamplerate/src_sinc.c

gavl/libsamplerate/src_zoh.c

gavl/memcpy.c

gavl/mix.c

gavl/mmx/Makefile.am

gavl/mmx/Makefile.in

gavl/mmx/interpolate.h

gavl/mmx/mmx.h

gavl/mmx/mmx_macros.h

gavl/mmxext/Makefile.am

gavl/mmxext/Makefile.in

gavl/peakdetector.c

gavl/rectangle.c

gavl/sampleformat.c

gavl/samplerate.c

gavl/scale.c

gavl/scale_context.c

gavl/scale_kernels.c

gavl/scale_table.c

gavl/time.c

gavl/timer.c

gavl/video.c

gavl/videoformat.c

gavl/videoframe.c

gavl/videooptions.c

gavl/volume.c

include/Makefile.am

include/Makefile.in

include/accel.h

include/arith128.h

include/attributes.h

include/audio.h

include/blend.h

include/colorspace.h

include/deinterlace.h

include/gavl/Makefile.am

include/gavl/Makefile.in

include/gavl/config.h.in

include/gavl/gavl.h

include/gavl/gavltime.h

include/interleave.h

include/mix.h

include/sampleformat.h

include/samplerate.h

include/scale.h

include/video.h

include/volume.h

install-sh

ltmain.sh

m4/Makefile.am

m4/Makefile.in

m4/check_funcs.m4

m4/gavl_simd.m4

m4/lqt_opt_cflags.m4

missing

src/Makefile.am

src/Makefile.in

src/blend_test.c

src/colorspace_test.c

src/colorspace_time.c

src/fill_test.c

src/plot_scale_kernels.c

src/scale_time.c

src/scaletest.c

src/timescale_test.c

Show diffs side-by-side

added added

removed removed

gavl/sse/scale_y_sse.c

/*****************************************************************

* gavl - a general purpose audio/video processing library

* gmerlin-general@lists.sourceforge.net

* http://gmerlin.sourceforge.net

* This program is free software: you can redistribute it and/or modify

* it under the terms of the GNU General Public License as published by

* the Free Software Foundation, either version 2 of the License, or

* (at your option) any later version.

* This program is distributed in the hope that it will be useful,

* but WITHOUT ANY WARRANTY; without even the implied warranty of

* MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE. See the

* GNU General Public License for more details.

* You should have received a copy of the GNU General Public License

* along with this program. If not, see <http://www.gnu.org/licenses/>.

* *****************************************************************/

#include <config.h>

#include <attributes.h>

#include <stdio.h>

#include <gavl/gavl.h>

#include <video.h>

#include <scale.h>

// #include "../mmx/mmx.h"

#include "../sse/sse.h"

#if 0

static mmx_t mm_tmp;

#define DUMP_MM(name, reg) MOVQ_R2M(reg, mm_tmp);\

fprintf(stderr, "%s: %016llx\n", name, mm_tmp.q);

#endif

#define INIT_FLOAT_GLOBAL_4 \

movups_m2r(ctx->min_values_f[0], xmm5);\

movups_m2r(ctx->max_values_f[0], xmm6);

#define INIT_FLOAT_GLOBAL_2 \

movups_m2r(ctx->min_values_f[0], xmm5);\

movups_m2r(ctx->max_values_f[0], xmm6);\

shufps_r2ri(xmm5, xmm5, 0x44);\

shufps_r2ri(xmm6, xmm6, 0x44);

#define INIT_FLOAT_GLOBAL_1 \

movups_m2r(ctx->min_values_f[0], xmm5);\

movups_m2r(ctx->max_values_f[0], xmm6);\

shufps_r2ri(xmm5, xmm5, 0x00);\

shufps_r2ri(xmm6, xmm6, 0x00);

#define INIT_FLOAT \

xorps_r2r(xmm3, xmm3); \

xorps_r2r(xmm4, xmm4);

#define ACCUM_FLOAT(num) \

/* Load input */ \

movaps_m2r(*src,xmm1);\

movaps_m2r(*(src+16),xmm2);\

/* Load factor */ \

movss_m2r(ctx->table_v.pixels[ctx->scanline].factor_f[num], xmm0);\

shufps_r2ri(xmm0, xmm0, 0x00);\

/* Accumulate xmm0 */ \

mulps_r2r(xmm0, xmm1);\

addps_r2r(xmm1, xmm3);\

/* Accumulate xmm1 */ \

mulps_r2r(xmm0, xmm2);\

addps_r2r(xmm2, xmm4)

#define OUTPUT_FLOAT_NOCLIP \

movups_r2m(xmm3, *dst);\

movups_r2m(xmm4, *(dst+16));\

#define OUTPUT_FLOAT \

minps_r2r(xmm6, xmm3);\

minps_r2r(xmm6, xmm4);\

maxps_r2r(xmm5, xmm3);\

maxps_r2r(xmm5, xmm4);\

movups_r2m(xmm3, *dst);\

movups_r2m(xmm4, *(dst+16));

#define INIT_C_FLOAT \

xorps_r2r(xmm2, xmm2);

#define ACCUM_C_FLOAT(num) \

movss_m2r(*src, xmm1);\

mulss_m2r(ctx->table_v.pixels[ctx->scanline].factor_f[num], xmm1);\

addss_r2r(xmm1, xmm2);\

#define OUTPUT_C_FLOAT \

minss_r2r(xmm6, xmm2);\

maxss_r2r(xmm5, xmm2);\

movss_r2m(xmm2, *dst);

100

101

#define OUTPUT_C_FLOAT_NOCLIP \

102

movss_r2m(xmm2, *dst);

103

104

105

/* float */

106

107

/* scale_float_x_1_y_bicubic_sse */

108

109

#define FUNC_NAME scale_float_x_1_y_bicubic_sse

110

#define WIDTH_MUL 1

111

#define NUM_TAPS 4

112

113

#define INIT_GLOBAL INIT_FLOAT_GLOBAL_1

114

#define INIT INIT_FLOAT

115

#define ACCUM ACCUM_FLOAT

116

#define OUTPUT OUTPUT_FLOAT

117

#define INIT_C INIT_C_FLOAT

118

#define ACCUM_C ACCUM_C_FLOAT

119

#define OUTPUT_C OUTPUT_C_FLOAT

120

121

#include "../sse/scale_y.h"

122

123

/* scale_float_x_1_y_bicubic_noclip_sse */

124

125

#define FUNC_NAME scale_float_x_1_y_bicubic_noclip_sse

126

#define WIDTH_MUL 1

127

#define NUM_TAPS 4

128

129

#define INIT_GLOBAL INIT_FLOAT_GLOBAL_1

130

#define INIT INIT_FLOAT

131

#define ACCUM ACCUM_FLOAT

132

#define OUTPUT OUTPUT_FLOAT_NOCLIP

133

#define INIT_C INIT_C_FLOAT

134

#define ACCUM_C ACCUM_C_FLOAT

135

#define OUTPUT_C OUTPUT_C_FLOAT_NOCLIP

136

137

#include "../sse/scale_y.h"

138

139

/* scale_float_x_2_y_bicubic_sse */

140

141

#define FUNC_NAME scale_float_x_2_y_bicubic_sse

142

#define WIDTH_MUL 2

143

#define NUM_TAPS 4

144

145

#define INIT_GLOBAL INIT_FLOAT_GLOBAL_2

146

#define INIT INIT_FLOAT

147

#define ACCUM ACCUM_FLOAT

148

#define OUTPUT OUTPUT_FLOAT

149

#define INIT_C INIT_C_FLOAT

150

#define ACCUM_C ACCUM_C_FLOAT

151

#define OUTPUT_C OUTPUT_C_FLOAT

152

153

#include "../sse/scale_y.h"

154

155

/* scale_float_x_2_y_bicubic_noclip_sse */

156

157

#define FUNC_NAME scale_float_x_2_y_bicubic_noclip_sse

158

#define WIDTH_MUL 2

159

#define NUM_TAPS 4

160

161

#define INIT_GLOBAL INIT_FLOAT_GLOBAL_2

162

#define INIT INIT_FLOAT

163

#define ACCUM ACCUM_FLOAT

164

#define OUTPUT OUTPUT_FLOAT_NOCLIP

165

#define INIT_C INIT_C_FLOAT

166

#define ACCUM_C ACCUM_C_FLOAT

167

#define OUTPUT_C OUTPUT_C_FLOAT_NOCLIP

168

169

#include "../sse/scale_y.h"

170

171

172

/* scale_float_x_4_y_bicubic_sse */

173

174

#define FUNC_NAME scale_float_x_4_y_bicubic_sse

175

#define WIDTH_MUL 4

176

#define NUM_TAPS 4

177

178

#define INIT_GLOBAL INIT_FLOAT_GLOBAL_4

179

#define INIT INIT_FLOAT

180

#define ACCUM ACCUM_FLOAT

181

#define OUTPUT OUTPUT_FLOAT

182

#define INIT_C INIT_C_FLOAT

183

#define ACCUM_C ACCUM_C_FLOAT

184

#define OUTPUT_C OUTPUT_C_FLOAT

185

186

#include "../sse/scale_y.h"

187

188

/* scale_float_x_4_y_bicubic_noclip_sse */

189

190

#define FUNC_NAME scale_float_x_4_y_bicubic_noclip_sse

191

#define WIDTH_MUL 4

192

#define NUM_TAPS 4

193

194

#define INIT_GLOBAL INIT_FLOAT_GLOBAL_4

195

#define INIT INIT_FLOAT

196

#define ACCUM ACCUM_FLOAT

197

#define OUTPUT OUTPUT_FLOAT_NOCLIP

198

#define INIT_C INIT_C_FLOAT

199

#define ACCUM_C ACCUM_C_FLOAT

200

#define OUTPUT_C OUTPUT_C_FLOAT

201

202

#include "../sse/scale_y.h"

203

204

/* */

205

206

/* scale_float_x_1_y_quadratic_sse */

207

208

#define FUNC_NAME scale_float_x_1_y_quadratic_sse

209

#define WIDTH_MUL 1

210

#define NUM_TAPS 3

211

212

#define INIT_GLOBAL INIT_FLOAT_GLOBAL_1

213

#define INIT INIT_FLOAT

214

#define ACCUM ACCUM_FLOAT

215

#define OUTPUT OUTPUT_FLOAT_NOCLIP

216

#define INIT_C INIT_C_FLOAT

217

#define ACCUM_C ACCUM_C_FLOAT

218

#define OUTPUT_C OUTPUT_C_FLOAT_NOCLIP

219

220

#include "../sse/scale_y.h"

221

222

/* scale_float_x_2_y_quadratic_sse */

223

224

#define FUNC_NAME scale_float_x_2_y_quadratic_sse

225

#define WIDTH_MUL 2

226

#define NUM_TAPS 3

227

228

#define INIT_GLOBAL INIT_FLOAT_GLOBAL_2

229

#define INIT INIT_FLOAT

230

#define ACCUM ACCUM_FLOAT

231

#define OUTPUT OUTPUT_FLOAT_NOCLIP

232

#define INIT_C INIT_C_FLOAT

233

#define ACCUM_C ACCUM_C_FLOAT

234

#define OUTPUT_C OUTPUT_C_FLOAT_NOCLIP

235

236

#include "../sse/scale_y.h"

237

238

239

/* scale_float_x_4_y_quadratic_sse */

240

241

#define FUNC_NAME scale_float_x_4_y_quadratic_sse

242

#define WIDTH_MUL 4

243

#define NUM_TAPS 3

244

245

#define INIT_GLOBAL INIT_FLOAT_GLOBAL_4

246

#define INIT INIT_FLOAT

247

#define ACCUM ACCUM_FLOAT

248

#define OUTPUT OUTPUT_FLOAT_NOCLIP

249

#define INIT_C INIT_C_FLOAT

250

#define ACCUM_C ACCUM_C_FLOAT

251

#define OUTPUT_C OUTPUT_C_FLOAT_NOCLIP

252

253

#include "../sse/scale_y.h"

254

255

256

/* scale_float_x_1_y_generic_sse */

257

258

#define FUNC_NAME scale_float_x_1_y_generic_sse

259

#define WIDTH_MUL 1

260

#define NUM_TAPS -1

261

262

#define INIT_GLOBAL INIT_FLOAT_GLOBAL_1

263

#define INIT INIT_FLOAT

264

#define ACCUM ACCUM_FLOAT

265

#define OUTPUT OUTPUT_FLOAT

266

#define INIT_C INIT_C_FLOAT

267

#define ACCUM_C ACCUM_C_FLOAT

268

#define OUTPUT_C OUTPUT_C_FLOAT

269

270

#include "../sse/scale_y.h"

271

272

/* scale_float_x_2_y_generic_sse */

273

274

#define FUNC_NAME scale_float_x_2_y_generic_sse

275

#define WIDTH_MUL 2

276

#define NUM_TAPS -1

277

278

#define INIT_GLOBAL INIT_FLOAT_GLOBAL_2

279

#define INIT INIT_FLOAT

280

#define ACCUM ACCUM_FLOAT

281

#define OUTPUT OUTPUT_FLOAT

282

#define INIT_C INIT_C_FLOAT

283

#define ACCUM_C ACCUM_C_FLOAT

284

#define OUTPUT_C OUTPUT_C_FLOAT

285

286

#include "../sse/scale_y.h"

287

288

289

/* scale_float_x_4_y_generic_sse */

290

291

#define FUNC_NAME scale_float_x_4_y_generic_sse

292

#define WIDTH_MUL 4

293

#define NUM_TAPS -1

294

295

#define INIT_GLOBAL INIT_FLOAT_GLOBAL_4

296

#define INIT INIT_FLOAT

297

#define ACCUM ACCUM_FLOAT

298

#define OUTPUT OUTPUT_FLOAT

299

#define INIT_C INIT_C_FLOAT

300

#define ACCUM_C ACCUM_C_FLOAT

301

#define OUTPUT_C OUTPUT_C_FLOAT

302

303

#include "../sse/scale_y.h"

304

305

void gavl_init_scale_funcs_quadratic_y_sse(gavl_scale_funcs_t * tab,

306

int src_advance, int dst_advance)

307

{

308

tab->funcs_y.scale_float_x_1 = scale_float_x_1_y_quadratic_sse;

309

tab->funcs_y.scale_float_x_2 = scale_float_x_2_y_quadratic_sse;

310

tab->funcs_y.scale_float_x_4 = scale_float_x_4_y_quadratic_sse;

311

}

312

313

void gavl_init_scale_funcs_bicubic_y_sse(gavl_scale_funcs_t * tab,

314

int src_advance, int dst_advance)

315

{

316

tab->funcs_y.scale_float_x_1 = scale_float_x_1_y_bicubic_sse;

317

tab->funcs_y.scale_float_x_2 = scale_float_x_2_y_bicubic_sse;

318

tab->funcs_y.scale_float_x_4 = scale_float_x_4_y_bicubic_sse;

319

}

320

321

void gavl_init_scale_funcs_bicubic_y_noclip_sse(gavl_scale_funcs_t * tab,

322

int src_advance, int dst_advance)

323

{

324

tab->funcs_y.scale_float_x_1 = scale_float_x_1_y_bicubic_noclip_sse;

325

tab->funcs_y.scale_float_x_2 = scale_float_x_2_y_bicubic_noclip_sse;

326

tab->funcs_y.scale_float_x_4 = scale_float_x_4_y_bicubic_noclip_sse;

327

}

328

329

void gavl_init_scale_funcs_generic_y_sse(gavl_scale_funcs_t * tab,

330

int src_advance, int dst_advance)

331

{

332

tab->funcs_y.scale_float_x_1 = scale_float_x_1_y_generic_sse;

333

tab->funcs_y.scale_float_x_2 = scale_float_x_2_y_generic_sse;

334

tab->funcs_y.scale_float_x_4 = scale_float_x_4_y_generic_sse;

335

}

336

337

/* scale_uint8_x_1_y_bilinear_sse */

338

339

#define FUNC_NAME scale_float_x_1_y_bilinear_sse

340

#define WIDTH_MUL 1

341

342

#include "scale_y_linear.h"

343

344

/* scale_float_x_2_y_bilinear_sse */

345

346

#define FUNC_NAME scale_float_x_2_y_bilinear_sse

347

#define WIDTH_MUL 2

348

349

#include "scale_y_linear.h"

350

351

/* scale_float_x_4_y_bilinear_sse */

352

353

#define FUNC_NAME scale_float_x_4_y_bilinear_sse

354

#define WIDTH_MUL 4

355

356

#include "scale_y_linear.h"

357

358

/* scale_float_x_3_y_bilinear_sse */

359

360

#define FUNC_NAME scale_float_x_3_y_bilinear_sse

361

#define WIDTH_MUL 3

362

363

#include "scale_y_linear.h"

364

365

void gavl_init_scale_funcs_bilinear_y_sse(gavl_scale_funcs_t * tab,

366

int src_advance, int dst_advance)

367

{

368

#if 1 // Too slow

369

tab->funcs_y.scale_float_x_1 = scale_float_x_1_y_bilinear_sse;

370

tab->funcs_y.scale_float_x_2 = scale_float_x_2_y_bilinear_sse;

371

tab->funcs_y.scale_float_x_3 = scale_float_x_3_y_bilinear_sse;

372

tab->funcs_y.scale_float_x_4 = scale_float_x_4_y_bilinear_sse;

373

374

#endif

375

}

Older »