~ubuntu-branches/ubuntu/raring/fftw3/raring-proposed

« back to all changes in this revision

Viewing changes to rdft/codelets/hc2r/hc2rIII_8.c

  • Committer: Bazaar Package Importer
  • Author(s): Paul Brossier
  • Date: 2006-05-31 13:44:05 UTC
  • mfrom: (1.1.1 upstream)
  • Revision ID: james.westby@ubuntu.com-20060531134405-ol9hrbg6bh81sg0c
Tags: 3.1.1-1
* New upstream release (closes: #350327, #338487, #338501)
* Add --enable-portable-binary to use -mtune instead of -march
* Use --with-gcc-arch=G5 / pentium4 on powerpc / i386
* Updated Standards-Version

Show diffs side-by-side

added added

removed removed

Lines of Context:
1
1
/*
2
 
 * Copyright (c) 2003 Matteo Frigo
3
 
 * Copyright (c) 2003 Massachusetts Institute of Technology
 
2
 * Copyright (c) 2003, 2006 Matteo Frigo
 
3
 * Copyright (c) 2003, 2006 Massachusetts Institute of Technology
4
4
 *
5
5
 * This program is free software; you can redistribute it and/or modify
6
6
 * it under the terms of the GNU General Public License as published by
19
19
 */
20
20
 
21
21
/* This file was automatically generated --- DO NOT EDIT */
22
 
/* Generated on Sat Jul  5 22:12:01 EDT 2003 */
 
22
/* Generated on Tue Mar  7 11:55:08 EST 2006 */
23
23
 
24
24
#include "codelet-rdft.h"
25
25
 
26
 
/* Generated by: /homee/stevenj/cvs/fftw3.0.1/genfft/gen_hc2r -compact -variables 4 -sign 1 -n 8 -name hc2rIII_8 -dft-III -include hc2rIII.h */
 
26
#ifdef HAVE_FMA
 
27
 
 
28
/* Generated by: ../../../genfft/gen_hc2r -fma -reorder-insns -schedule-for-pipeline -compact -variables 4 -pipeline-latency 4 -sign 1 -n 8 -name hc2rIII_8 -dft-III -include hc2rIII.h */
 
29
 
 
30
/*
 
31
 * This function contains 22 FP additions, 12 FP multiplications,
 
32
 * (or, 18 additions, 8 multiplications, 4 fused multiply/add),
 
33
 * 23 stack variables, and 16 memory accesses
 
34
 */
 
35
/*
 
36
 * Generator Id's : 
 
37
 * $Id: algsimp.ml,v 1.9 2006-02-12 23:34:12 athena Exp $
 
38
 * $Id: fft.ml,v 1.4 2006-01-05 03:04:27 stevenj Exp $
 
39
 * $Id: gen_hc2r.ml,v 1.19 2006-02-12 23:34:12 athena Exp $
 
40
 */
 
41
 
 
42
#include "hc2rIII.h"
 
43
 
 
44
static void hc2rIII_8(const R *ri, const R *ii, R *O, stride ris, stride iis, stride os, INT v, INT ivs, INT ovs)
 
45
{
 
46
     DK(KP414213562, +0.414213562373095048801688724209698078569671875);
 
47
     DK(KP1_847759065, +1.847759065022573512256366378793576573644833252);
 
48
     DK(KP1_414213562, +1.414213562373095048801688724209698078569671875);
 
49
     DK(KP2_000000000, +2.000000000000000000000000000000000000000000000);
 
50
     INT i;
 
51
     for (i = v; i > 0; i = i - 1, ri = ri + ivs, ii = ii + ivs, O = O + ovs, MAKE_VOLATILE_STRIDE(ris), MAKE_VOLATILE_STRIDE(iis), MAKE_VOLATILE_STRIDE(os)) {
 
52
          E T4, T7, T3, Tl, Tf, T5, T8, T9, T6, Tc;
 
53
          {
 
54
               E T1, T2, Td, Te;
 
55
               T1 = ri[0];
 
56
               T2 = ri[WS(ris, 3)];
 
57
               Td = ii[0];
 
58
               Te = ii[WS(iis, 3)];
 
59
               T4 = ri[WS(ris, 2)];
 
60
               T7 = T1 - T2;
 
61
               T3 = T1 + T2;
 
62
               Tl = Te - Td;
 
63
               Tf = Td + Te;
 
64
               T5 = ri[WS(ris, 1)];
 
65
               T8 = ii[WS(iis, 2)];
 
66
               T9 = ii[WS(iis, 1)];
 
67
          }
 
68
          T6 = T4 + T5;
 
69
          Tc = T4 - T5;
 
70
          {
 
71
               E Ta, Tk, Tg, Th;
 
72
               Ta = T8 + T9;
 
73
               Tk = T8 - T9;
 
74
               Tg = Tc + Tf;
 
75
               Th = Tc - Tf;
 
76
               {
 
77
                    E Tj, Tm, Tb, Ti;
 
78
                    Tj = T3 - T6;
 
79
                    O[0] = KP2_000000000 * (T3 + T6);
 
80
                    Tm = Tk + Tl;
 
81
                    O[WS(os, 4)] = KP2_000000000 * (Tl - Tk);
 
82
                    Tb = T7 - Ta;
 
83
                    Ti = T7 + Ta;
 
84
                    O[WS(os, 6)] = KP1_414213562 * (Tm - Tj);
 
85
                    O[WS(os, 2)] = KP1_414213562 * (Tj + Tm);
 
86
                    O[WS(os, 7)] = -(KP1_847759065 * (FNMS(KP414213562, Th, Ti)));
 
87
                    O[WS(os, 3)] = KP1_847759065 * (FMA(KP414213562, Ti, Th));
 
88
                    O[WS(os, 5)] = -(KP1_847759065 * (FMA(KP414213562, Tb, Tg)));
 
89
                    O[WS(os, 1)] = KP1_847759065 * (FNMS(KP414213562, Tg, Tb));
 
90
               }
 
91
          }
 
92
     }
 
93
}
 
94
 
 
95
static const khc2r_desc desc = { 8, "hc2rIII_8", {18, 8, 4, 0}, &GENUS, 0, 0, 0, 0, 0 };
 
96
 
 
97
void X(codelet_hc2rIII_8) (planner *p) {
 
98
     X(khc2rIII_register) (p, hc2rIII_8, &desc);
 
99
}
 
100
 
 
101
#else                           /* HAVE_FMA */
 
102
 
 
103
/* Generated by: ../../../genfft/gen_hc2r -compact -variables 4 -pipeline-latency 4 -sign 1 -n 8 -name hc2rIII_8 -dft-III -include hc2rIII.h */
27
104
 
28
105
/*
29
106
 * This function contains 22 FP additions, 12 FP multiplications,
32
109
 */
33
110
/*
34
111
 * Generator Id's : 
35
 
 * $Id: algsimp.ml,v 1.7 2003/03/15 20:29:42 stevenj Exp $
36
 
 * $Id: fft.ml,v 1.2 2003/03/15 20:29:42 stevenj Exp $
37
 
 * $Id: gen_hc2r.ml,v 1.14 2003/04/17 19:25:50 athena Exp $
 
112
 * $Id: algsimp.ml,v 1.9 2006-02-12 23:34:12 athena Exp $
 
113
 * $Id: fft.ml,v 1.4 2006-01-05 03:04:27 stevenj Exp $
 
114
 * $Id: gen_hc2r.ml,v 1.19 2006-02-12 23:34:12 athena Exp $
38
115
 */
39
116
 
40
117
#include "hc2rIII.h"
41
118
 
42
 
static void hc2rIII_8(const R *ri, const R *ii, R *O, stride ris, stride iis, stride os, int v, int ivs, int ovs)
 
119
static void hc2rIII_8(const R *ri, const R *ii, R *O, stride ris, stride iis, stride os, INT v, INT ivs, INT ovs)
43
120
{
44
121
     DK(KP1_414213562, +1.414213562373095048801688724209698078569671875);
45
122
     DK(KP765366864, +0.765366864730179543456919968060797733522689125);
46
123
     DK(KP1_847759065, +1.847759065022573512256366378793576573644833252);
47
124
     DK(KP2_000000000, +2.000000000000000000000000000000000000000000000);
48
 
     int i;
49
 
     for (i = v; i > 0; i = i - 1, ri = ri + ivs, ii = ii + ivs, O = O + ovs) {
 
125
     INT i;
 
126
     for (i = v; i > 0; i = i - 1, ri = ri + ivs, ii = ii + ivs, O = O + ovs, MAKE_VOLATILE_STRIDE(ris), MAKE_VOLATILE_STRIDE(iis), MAKE_VOLATILE_STRIDE(os)) {
50
127
          E T3, T7, Tf, Tl, T6, Tc, Ta, Tk, Tb, Tg;
51
128
          {
52
129
               E T1, T2, Td, Te;
95
172
void X(codelet_hc2rIII_8) (planner *p) {
96
173
     X(khc2rIII_register) (p, hc2rIII_8, &desc);
97
174
}
 
175
 
 
176
#endif                          /* HAVE_FMA */