~ubuntu-branches/ubuntu/maverick/blender/maverick

« back to all changes in this revision

Viewing changes to extern/fftw/dft/codelets/standard/q1_2.c

  • Committer: Bazaar Package Importer
  • Author(s): Khashayar Naderehvandi, Khashayar Naderehvandi, Alessio Treglia
  • Date: 2009-01-22 16:53:59 UTC
  • mfrom: (14.1.1 experimental)
  • Revision ID: james.westby@ubuntu.com-20090122165359-v0996tn7fbit64ni
Tags: 2.48a+dfsg-1ubuntu1
[ Khashayar Naderehvandi ]
* Merge from debian experimental (LP: #320045), Ubuntu remaining changes:
  - Add patch correcting header file locations.
  - Add libvorbis-dev and libgsm1-dev to Build-Depends.
  - Use avcodec_decode_audio2() in source/blender/src/hddaudio.c

[ Alessio Treglia ]
* Add missing previous changelog entries.

Show diffs side-by-side

added added

removed removed

Lines of Context:
 
1
/*
 
2
 * Copyright (c) 2003, 2006 Matteo Frigo
 
3
 * Copyright (c) 2003, 2006 Massachusetts Institute of Technology
 
4
 *
 
5
 * This program is free software; you can redistribute it and/or modify
 
6
 * it under the terms of the GNU General Public License as published by
 
7
 * the Free Software Foundation; either version 2 of the License, or
 
8
 * (at your option) any later version.
 
9
 *
 
10
 * This program is distributed in the hope that it will be useful,
 
11
 * but WITHOUT ANY WARRANTY; without even the implied warranty of
 
12
 * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
 
13
 * GNU General Public License for more details.
 
14
 *
 
15
 * You should have received a copy of the GNU General Public License
 
16
 * along with this program; if not, write to the Free Software
 
17
 * Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA  02111-1307  USA
 
18
 *
 
19
 */
 
20
 
 
21
/* This file was automatically generated --- DO NOT EDIT */
 
22
/* Generated on Sat Jul  1 14:16:19 EDT 2006 */
 
23
 
 
24
#include "codelet-dft.h"
 
25
 
 
26
#ifdef HAVE_FMA
 
27
 
 
28
/* Generated by: ../../../genfft/gen_twidsq -fma -reorder-insns -schedule-for-pipeline -compact -variables 4 -pipeline-latency 4 -reload-twiddle -dif -n 2 -name q1_2 -include q.h */
 
29
 
 
30
/*
 
31
 * This function contains 12 FP additions, 8 FP multiplications,
 
32
 * (or, 8 additions, 4 multiplications, 4 fused multiply/add),
 
33
 * 21 stack variables, and 16 memory accesses
 
34
 */
 
35
/*
 
36
 * Generator Id's : 
 
37
 * $Id: algsimp.ml,v 1.9 2006-02-12 23:34:12 athena Exp $
 
38
 * $Id: fft.ml,v 1.4 2006-01-05 03:04:27 stevenj Exp $
 
39
 * $Id: gen_twidsq.ml,v 1.19 2006-02-12 23:34:12 athena Exp $
 
40
 */
 
41
 
 
42
#include "q.h"
 
43
 
 
44
static const R *q1_2(R *rio, R *iio, const R *W, stride is, stride vs, INT m, INT dist)
 
45
{
 
46
     INT i;
 
47
     for (i = m; i > 0; i = i - 1, rio = rio + dist, iio = iio + dist, W = W + 2, MAKE_VOLATILE_STRIDE(is), MAKE_VOLATILE_STRIDE(vs)) {
 
48
          E T9, T6, T5;
 
49
          {
 
50
               E T1, T2, T7, T8, Tb, T4, Tc, Th, Ti, Te, Tj, Td, Tg;
 
51
               T1 = rio[0];
 
52
               T2 = rio[WS(is, 1)];
 
53
               T7 = iio[0];
 
54
               T8 = iio[WS(is, 1)];
 
55
               Tb = rio[WS(vs, 1)];
 
56
               T4 = T1 - T2;
 
57
               Tc = rio[WS(vs, 1) + WS(is, 1)];
 
58
               T9 = T7 - T8;
 
59
               Th = iio[WS(vs, 1)];
 
60
               Ti = iio[WS(vs, 1) + WS(is, 1)];
 
61
               Te = Tb - Tc;
 
62
               rio[0] = T1 + T2;
 
63
               iio[0] = T7 + T8;
 
64
               Tj = Th - Ti;
 
65
               rio[WS(is, 1)] = Tb + Tc;
 
66
               iio[WS(is, 1)] = Th + Ti;
 
67
               Td = W[0];
 
68
               Tg = W[1];
 
69
               {
 
70
                    E T3, Tk, Tf, Ta;
 
71
                    T3 = W[0];
 
72
                    T6 = W[1];
 
73
                    Tk = Td * Tj;
 
74
                    Tf = Td * Te;
 
75
                    Ta = T3 * T9;
 
76
                    T5 = T3 * T4;
 
77
                    iio[WS(vs, 1) + WS(is, 1)] = FNMS(Tg, Te, Tk);
 
78
                    rio[WS(vs, 1) + WS(is, 1)] = FMA(Tg, Tj, Tf);
 
79
                    iio[WS(vs, 1)] = FNMS(T6, T4, Ta);
 
80
               }
 
81
          }
 
82
          rio[WS(vs, 1)] = FMA(T6, T9, T5);
 
83
     }
 
84
     return W;
 
85
}
 
86
 
 
87
static const tw_instr twinstr[] = {
 
88
     {TW_FULL, 0, 2},
 
89
     {TW_NEXT, 1, 0}
 
90
};
 
91
 
 
92
static const ct_desc desc = { 2, "q1_2", twinstr, &GENUS, {8, 4, 4, 0}, 0, 0, 0 };
 
93
 
 
94
void X(codelet_q1_2) (planner *p) {
 
95
     X(kdft_difsq_register) (p, q1_2, &desc);
 
96
}
 
97
#else                           /* HAVE_FMA */
 
98
 
 
99
/* Generated by: ../../../genfft/gen_twidsq -compact -variables 4 -pipeline-latency 4 -reload-twiddle -dif -n 2 -name q1_2 -include q.h */
 
100
 
 
101
/*
 
102
 * This function contains 12 FP additions, 8 FP multiplications,
 
103
 * (or, 8 additions, 4 multiplications, 4 fused multiply/add),
 
104
 * 17 stack variables, and 16 memory accesses
 
105
 */
 
106
/*
 
107
 * Generator Id's : 
 
108
 * $Id: algsimp.ml,v 1.9 2006-02-12 23:34:12 athena Exp $
 
109
 * $Id: fft.ml,v 1.4 2006-01-05 03:04:27 stevenj Exp $
 
110
 * $Id: gen_twidsq.ml,v 1.19 2006-02-12 23:34:12 athena Exp $
 
111
 */
 
112
 
 
113
#include "q.h"
 
114
 
 
115
static const R *q1_2(R *rio, R *iio, const R *W, stride is, stride vs, INT m, INT dist)
 
116
{
 
117
     INT i;
 
118
     for (i = m; i > 0; i = i - 1, rio = rio + dist, iio = iio + dist, W = W + 2, MAKE_VOLATILE_STRIDE(is), MAKE_VOLATILE_STRIDE(vs)) {
 
119
          E T1, T2, T4, T6, T7, T8, T9, Ta, Tc, Te, Tf, Tg;
 
120
          T1 = rio[0];
 
121
          T2 = rio[WS(is, 1)];
 
122
          T4 = T1 - T2;
 
123
          T6 = iio[0];
 
124
          T7 = iio[WS(is, 1)];
 
125
          T8 = T6 - T7;
 
126
          T9 = rio[WS(vs, 1)];
 
127
          Ta = rio[WS(vs, 1) + WS(is, 1)];
 
128
          Tc = T9 - Ta;
 
129
          Te = iio[WS(vs, 1)];
 
130
          Tf = iio[WS(vs, 1) + WS(is, 1)];
 
131
          Tg = Te - Tf;
 
132
          rio[0] = T1 + T2;
 
133
          iio[0] = T6 + T7;
 
134
          rio[WS(is, 1)] = T9 + Ta;
 
135
          iio[WS(is, 1)] = Te + Tf;
 
136
          {
 
137
               E Tb, Td, T3, T5;
 
138
               Tb = W[0];
 
139
               Td = W[1];
 
140
               rio[WS(vs, 1) + WS(is, 1)] = FMA(Tb, Tc, Td * Tg);
 
141
               iio[WS(vs, 1) + WS(is, 1)] = FNMS(Td, Tc, Tb * Tg);
 
142
               T3 = W[0];
 
143
               T5 = W[1];
 
144
               rio[WS(vs, 1)] = FMA(T3, T4, T5 * T8);
 
145
               iio[WS(vs, 1)] = FNMS(T5, T4, T3 * T8);
 
146
          }
 
147
     }
 
148
     return W;
 
149
}
 
150
 
 
151
static const tw_instr twinstr[] = {
 
152
     {TW_FULL, 0, 2},
 
153
     {TW_NEXT, 1, 0}
 
154
};
 
155
 
 
156
static const ct_desc desc = { 2, "q1_2", twinstr, &GENUS, {8, 4, 4, 0}, 0, 0, 0 };
 
157
 
 
158
void X(codelet_q1_2) (planner *p) {
 
159
     X(kdft_difsq_register) (p, q1_2, &desc);
 
160
}
 
161
#endif                          /* HAVE_FMA */