~ubuntu-branches/ubuntu/raring/fftw3/raring-proposed

« back to all changes in this revision

Viewing changes to rdft/codelets/r2hc/r2hc_10.c

  • Committer: Bazaar Package Importer
  • Author(s): Paul Brossier
  • Date: 2006-05-31 13:44:05 UTC
  • mfrom: (1.1.1 upstream)
  • Revision ID: james.westby@ubuntu.com-20060531134405-ol9hrbg6bh81sg0c
Tags: 3.1.1-1
* New upstream release (closes: #350327, #338487, #338501)
* Add --enable-portable-binary to use -mtune instead of -march
* Use --with-gcc-arch=G5 / pentium4 on powerpc / i386
* Updated Standards-Version

Show diffs side-by-side

added added

removed removed

Lines of Context:
1
1
/*
2
 
 * Copyright (c) 2003 Matteo Frigo
3
 
 * Copyright (c) 2003 Massachusetts Institute of Technology
 
2
 * Copyright (c) 2003, 2006 Matteo Frigo
 
3
 * Copyright (c) 2003, 2006 Massachusetts Institute of Technology
4
4
 *
5
5
 * This program is free software; you can redistribute it and/or modify
6
6
 * it under the terms of the GNU General Public License as published by
19
19
 */
20
20
 
21
21
/* This file was automatically generated --- DO NOT EDIT */
22
 
/* Generated on Sat Jul  5 21:56:41 EDT 2003 */
 
22
/* Generated on Tue Mar  7 10:52:13 EST 2006 */
23
23
 
24
24
#include "codelet-rdft.h"
25
25
 
26
 
/* Generated by: /homee/stevenj/cvs/fftw3.0.1/genfft/gen_r2hc -compact -variables 4 -n 10 -name r2hc_10 -include r2hc.h */
 
26
#ifdef HAVE_FMA
 
27
 
 
28
/* Generated by: ../../../genfft/gen_r2hc -fma -reorder-insns -schedule-for-pipeline -compact -variables 4 -pipeline-latency 4 -n 10 -name r2hc_10 -include r2hc.h */
 
29
 
 
30
/*
 
31
 * This function contains 34 FP additions, 14 FP multiplications,
 
32
 * (or, 24 additions, 4 multiplications, 10 fused multiply/add),
 
33
 * 29 stack variables, and 20 memory accesses
 
34
 */
 
35
/*
 
36
 * Generator Id's : 
 
37
 * $Id: algsimp.ml,v 1.9 2006-02-12 23:34:12 athena Exp $
 
38
 * $Id: fft.ml,v 1.4 2006-01-05 03:04:27 stevenj Exp $
 
39
 * $Id: gen_r2hc.ml,v 1.18 2006-02-12 23:34:12 athena Exp $
 
40
 */
 
41
 
 
42
#include "r2hc.h"
 
43
 
 
44
static void r2hc_10(const R *I, R *ro, R *io, stride is, stride ros, stride ios, INT v, INT ivs, INT ovs)
 
45
{
 
46
     DK(KP559016994, +0.559016994374947424102293417182819058860154590);
 
47
     DK(KP250000000, +0.250000000000000000000000000000000000000000000);
 
48
     DK(KP618033988, +0.618033988749894848204586834365638117720309180);
 
49
     DK(KP951056516, +0.951056516295153572116439333379382143405698634);
 
50
     INT i;
 
51
     for (i = v; i > 0; i = i - 1, I = I + ivs, ro = ro + ovs, io = io + ovs, MAKE_VOLATILE_STRIDE(is), MAKE_VOLATILE_STRIDE(ros), MAKE_VOLATILE_STRIDE(ios)) {
 
52
          E Tt, T3, T7, Tq, T6, Tv, Tp, Tm, Th, T8, T1, T2, T9, Tr;
 
53
          T1 = I[0];
 
54
          T2 = I[WS(is, 5)];
 
55
          {
 
56
               E Te, Tn, Td, Tf, Tb, Tc;
 
57
               Tb = I[WS(is, 4)];
 
58
               Tc = I[WS(is, 9)];
 
59
               Te = I[WS(is, 6)];
 
60
               Tt = T1 + T2;
 
61
               T3 = T1 - T2;
 
62
               Tn = Tb + Tc;
 
63
               Td = Tb - Tc;
 
64
               Tf = I[WS(is, 1)];
 
65
               {
 
66
                    E T4, T5, To, Tg;
 
67
                    T4 = I[WS(is, 2)];
 
68
                    T5 = I[WS(is, 7)];
 
69
                    T7 = I[WS(is, 8)];
 
70
                    To = Te + Tf;
 
71
                    Tg = Te - Tf;
 
72
                    Tq = T4 + T5;
 
73
                    T6 = T4 - T5;
 
74
                    Tv = Tn + To;
 
75
                    Tp = Tn - To;
 
76
                    Tm = Tg - Td;
 
77
                    Th = Td + Tg;
 
78
                    T8 = I[WS(is, 3)];
 
79
               }
 
80
          }
 
81
          T9 = T7 - T8;
 
82
          Tr = T7 + T8;
 
83
          {
 
84
               E Ty, Tk, Tx, Tj, Tu, Ts;
 
85
               Tu = Tq + Tr;
 
86
               Ts = Tq - Tr;
 
87
               {
 
88
                    E Ta, Tl, Tw, Ti;
 
89
                    Ta = T6 + T9;
 
90
                    Tl = T6 - T9;
 
91
                    io[WS(ios, 4)] = KP951056516 * (FMA(KP618033988, Tp, Ts));
 
92
                    io[WS(ios, 2)] = KP951056516 * (FNMS(KP618033988, Ts, Tp));
 
93
                    Ty = Tu - Tv;
 
94
                    Tw = Tu + Tv;
 
95
                    io[WS(ios, 3)] = KP951056516 * (FMA(KP618033988, Tl, Tm));
 
96
                    io[WS(ios, 1)] = -(KP951056516 * (FNMS(KP618033988, Tm, Tl)));
 
97
                    Tk = Ta - Th;
 
98
                    Ti = Ta + Th;
 
99
                    ro[0] = Tt + Tw;
 
100
                    Tx = FNMS(KP250000000, Tw, Tt);
 
101
                    ro[WS(ros, 5)] = T3 + Ti;
 
102
                    Tj = FNMS(KP250000000, Ti, T3);
 
103
               }
 
104
               ro[WS(ros, 4)] = FMA(KP559016994, Ty, Tx);
 
105
               ro[WS(ros, 2)] = FNMS(KP559016994, Ty, Tx);
 
106
               ro[WS(ros, 3)] = FNMS(KP559016994, Tk, Tj);
 
107
               ro[WS(ros, 1)] = FMA(KP559016994, Tk, Tj);
 
108
          }
 
109
     }
 
110
}
 
111
 
 
112
static const kr2hc_desc desc = { 10, "r2hc_10", {24, 4, 10, 0}, &GENUS, 0, 0, 0, 0, 0 };
 
113
 
 
114
void X(codelet_r2hc_10) (planner *p) {
 
115
     X(kr2hc_register) (p, r2hc_10, &desc);
 
116
}
 
117
 
 
118
#else                           /* HAVE_FMA */
 
119
 
 
120
/* Generated by: ../../../genfft/gen_r2hc -compact -variables 4 -pipeline-latency 4 -n 10 -name r2hc_10 -include r2hc.h */
27
121
 
28
122
/*
29
123
 * This function contains 34 FP additions, 12 FP multiplications,
32
126
 */
33
127
/*
34
128
 * Generator Id's : 
35
 
 * $Id: algsimp.ml,v 1.7 2003/03/15 20:29:42 stevenj Exp $
36
 
 * $Id: fft.ml,v 1.2 2003/03/15 20:29:42 stevenj Exp $
37
 
 * $Id: gen_r2hc.ml,v 1.13 2003/04/17 19:25:50 athena Exp $
 
129
 * $Id: algsimp.ml,v 1.9 2006-02-12 23:34:12 athena Exp $
 
130
 * $Id: fft.ml,v 1.4 2006-01-05 03:04:27 stevenj Exp $
 
131
 * $Id: gen_r2hc.ml,v 1.18 2006-02-12 23:34:12 athena Exp $
38
132
 */
39
133
 
40
134
#include "r2hc.h"
41
135
 
42
 
static void r2hc_10(const R *I, R *ro, R *io, stride is, stride ros, stride ios, int v, int ivs, int ovs)
 
136
static void r2hc_10(const R *I, R *ro, R *io, stride is, stride ros, stride ios, INT v, INT ivs, INT ovs)
43
137
{
44
138
     DK(KP250000000, +0.250000000000000000000000000000000000000000000);
45
139
     DK(KP559016994, +0.559016994374947424102293417182819058860154590);
46
140
     DK(KP951056516, +0.951056516295153572116439333379382143405698634);
47
141
     DK(KP587785252, +0.587785252292473129168705954639072768597652438);
48
 
     int i;
49
 
     for (i = v; i > 0; i = i - 1, I = I + ivs, ro = ro + ovs, io = io + ovs) {
 
142
     INT i;
 
143
     for (i = v; i > 0; i = i - 1, I = I + ivs, ro = ro + ovs, io = io + ovs, MAKE_VOLATILE_STRIDE(is), MAKE_VOLATILE_STRIDE(ros), MAKE_VOLATILE_STRIDE(ios)) {
50
144
          E Ti, Tt, Ta, Tn, Td, To, Te, Tv, T3, Tq, T6, Tr, T7, Tu, Tg;
51
145
          E Th;
52
146
          Tg = I[0];
113
207
void X(codelet_r2hc_10) (planner *p) {
114
208
     X(kr2hc_register) (p, r2hc_10, &desc);
115
209
}
 
210
 
 
211
#endif                          /* HAVE_FMA */