~ubuntu-branches/ubuntu/maverick/blender/maverick

« back to all changes in this revision

Viewing changes to extern/fftw/dft/k7/codelets/t1k7_10.S

  • Committer: Bazaar Package Importer
  • Author(s): Khashayar Naderehvandi, Khashayar Naderehvandi, Alessio Treglia
  • Date: 2009-01-22 16:53:59 UTC
  • mfrom: (14.1.1 experimental)
  • Revision ID: james.westby@ubuntu.com-20090122165359-v0996tn7fbit64ni
Tags: 2.48a+dfsg-1ubuntu1
[ Khashayar Naderehvandi ]
* Merge from debian experimental (LP: #320045), Ubuntu remaining changes:
  - Add patch correcting header file locations.
  - Add libvorbis-dev and libgsm1-dev to Build-Depends.
  - Use avcodec_decode_audio2() in source/blender/src/hddaudio.c

[ Alessio Treglia ]
* Add missing previous changelog entries.

Show diffs side-by-side

added added

removed removed

Lines of Context:
 
1
/*
 
2
 * Copyright (c) 2003, 2006 Matteo Frigo
 
3
 * Copyright (c) 2003, 2006 Massachusetts Institute of Technology
 
4
 *
 
5
 * This program is free software; you can redistribute it and/or modify
 
6
 * it under the terms of the GNU General Public License as published by
 
7
 * the Free Software Foundation; either version 2 of the License, or
 
8
 * (at your option) any later version.
 
9
 *
 
10
 * This program is distributed in the hope that it will be useful,
 
11
 * but WITHOUT ANY WARRANTY; without even the implied warranty of
 
12
 * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
 
13
 * GNU General Public License for more details.
 
14
 *
 
15
 * You should have received a copy of the GNU General Public License
 
16
 * along with this program; if not, write to the Free Software
 
17
 * Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA  02111-1307  USA
 
18
 *
 
19
 */
 
20
 
 
21
/* This file was automatically generated --- DO NOT EDIT */
 
22
/* Generated on Sat Jul  1 22:46:18 EDT 2006 */
 
23
 
 
24
#include "config.h"
 
25
 
 
26
 
 
27
 
 
28
/* cheap-mode: VECTGRADE_FULL succeeded. (120 steps) */
 
29
/* Generated by: ../../../genfft-k7/gen_twiddle -no-randomized-cse -n 10 -name t1k7_10 */
 
30
 
 
31
/*
 
32
 * Generator Id's : 
 
33
 * $Id: algsimp.ml,v 1.4 2006-01-05 03:04:27 stevenj Exp $
 
34
 * $Id: fft.ml,v 1.4 2006-01-05 03:04:27 stevenj Exp $
 
35
 * $Id: gen_twiddle.ml,v 1.14 2005-12-24 21:08:49 athena Exp $
 
36
 */
 
37
 
 
38
/* CHImovopt_applicable: new! */
 
39
/* The following asm code is Copyright (c) 2000-2001 Stefan Kral */
 
40
.section .rodata
 
41
        .balign 64
 
42
KP559016994KP559016994: .float +0.559016994374947424102293417182819058860154590, +0.559016994374947424102293417182819058860154590
 
43
KP250000000KP250000000: .float +0.250000000000000000000000000000000000000000000, +0.250000000000000000000000000000000000000000000
 
44
KP587785252KP951056516: .float +0.587785252292473129168705954639072768597652438, +0.951056516295153572116439333379382143405698634
 
45
KP951056516KP587785252: .float +0.951056516295153572116439333379382143405698634, +0.587785252292473129168705954639072768597652438
 
46
chs_lo: .long 0x80000000, 0x00000000
 
47
.text
 
48
.text
 
49
        .balign 64
 
50
t1k7_10:
 
51
        subl $84, %esp
 
52
        femms 
 
53
        movl %ebx, 80(%esp)
 
54
        movl 100(%esp), %edx
 
55
        movl 108(%esp), %ebx
 
56
        movl %esi, 76(%esp)
 
57
        movl %edi, 72(%esp)
 
58
        movl 88(%esp), %ecx
 
59
        movl %ebp, 68(%esp)
 
60
        movl 96(%esp), %eax
 
61
        movl 104(%esp), %esi
 
62
        leal (,%edx,4), %edx
 
63
        leal (,%ebx,4), %ebx
 
64
        .p2align 4,,7
 
65
.L0:
 
66
        /* promise simd cell size = 8 */ 
 
67
        leal (%edx,%edx,4), %edi
 
68
        leal (%edx,%edx,2), %ebp
 
69
        movq 32(%eax), %mm0
 
70
        movq (%eax), %mm3
 
71
        movq (%ecx,%edi), %mm1
 
72
        movq (%ecx,%edx), %mm4
 
73
        leal (%ebp,%edx,4), %edi
 
74
        movq 40(%eax), %mm6
 
75
        movq (%ecx,%ebp,2), %mm7
 
76
        leal (%edx,%edx,8), %ebp
 
77
        pswapd %mm1, %mm2
 
78
        pswapd %mm4, %mm5
 
79
        pfmul %mm0, %mm1
 
80
        pfmul %mm3, %mm4
 
81
        pfmul %mm0, %mm2
 
82
        pswapd %mm7, %mm0
 
83
        pfmul %mm6, %mm7
 
84
        pfmul %mm3, %mm5
 
85
        movq 48(%eax), %mm3
 
86
        pfmul %mm6, %mm0
 
87
        movq (%ecx,%edi), %mm6
 
88
        leal (%edx,%edx,2), %edi
 
89
        pfpnacc %mm1, %mm2
 
90
        pfacc %mm4, %mm7
 
91
        movq (%ecx,%edx,2), %mm4
 
92
        pfnacc %mm5, %mm0
 
93
        movq 8(%eax), %mm5
 
94
        pswapd %mm6, %mm1
 
95
        movq %mm2, 0(%esp)
 
96
        pfmul %mm3, %mm6
 
97
        pswapd %mm4, %mm2
 
98
        pfmul %mm3, %mm1
 
99
        movq 24(%eax), %mm3
 
100
        pfmul %mm5, %mm2
 
101
        movq %mm0, 16(%esp)
 
102
        movq (%ecx,%edx,4), %mm0
 
103
        pfmul %mm5, %mm4
 
104
        pfnacc %mm1, %mm2
 
105
        movq (%ecx,%ebp), %mm1
 
106
        pswapd %mm0, %mm5
 
107
        pfacc %mm6, %mm4
 
108
        movq 64(%eax), %mm6
 
109
        pfmul %mm3, %mm0
 
110
        pfmul %mm3, %mm5
 
111
        leal (%edx,%edx,2), %ebp
 
112
        pswapd %mm1, %mm3
 
113
        movq %mm2, 8(%esp)
 
114
        movq 16(%eax), %mm2
 
115
        pfmul %mm6, %mm1
 
116
        pfmul %mm6, %mm3
 
117
        movq (%ecx,%edi), %mm6
 
118
        leal (%edx,%edx,4), %edi
 
119
        pfacc %mm1, %mm0
 
120
        movq 56(%eax), %mm1
 
121
        addl $72, %eax
 
122
        pfnacc %mm3, %mm5
 
123
        pswapd %mm6, %mm3
 
124
        pfmul %mm2, %mm6
 
125
        pfmul %mm2, %mm3
 
126
        movq %mm5, 24(%esp)
 
127
        movq (%ecx,%edx,8), %mm2
 
128
        pswapd %mm2, %mm5
 
129
        pfmul %mm1, %mm2
 
130
        pfmul %mm1, %mm5
 
131
        movq %mm0, %mm1
 
132
        pfnacc %mm7, %mm0
 
133
        pfacc %mm6, %mm2
 
134
        movq %mm4, %mm6
 
135
        pfacc %mm7, %mm1
 
136
        pfnacc %mm3, %mm5
 
137
        pfnacc %mm2, %mm4
 
138
        pfacc %mm2, %mm6
 
139
        movq 24(%esp), %mm2
 
140
        movq %mm1, %mm3
 
141
        movq %mm4, %mm7
 
142
        pfnacc %mm0, %mm4
 
143
        pfnacc %mm6, %mm1
 
144
        pfacc %mm0, %mm7
 
145
        movq 16(%esp), %mm0
 
146
        pfacc %mm3, %mm6
 
147
        movq %mm2, %mm3
 
148
        movq %mm4, 32(%esp)
 
149
        movq 8(%esp), %mm4
 
150
        pfnacc %mm0, %mm2
 
151
        pfacc %mm0, %mm3
 
152
        movq %mm4, %mm0
 
153
        pfnacc %mm5, %mm4
 
154
        pfacc %mm5, %mm0
 
155
        movq %mm3, %mm5
 
156
        pfnacc %mm0, %mm3
 
157
        pfacc %mm5, %mm0
 
158
        movq %mm4, %mm5
 
159
        pfacc %mm2, %mm4
 
160
        pfnacc %mm2, %mm5
 
161
        movq %mm6, %mm2
 
162
        pfnacc %mm0, %mm2
 
163
        pfacc %mm0, %mm6
 
164
        movq %mm4, 48(%esp)
 
165
        movq %mm5, 40(%esp)
 
166
        movq 0(%esp), %mm0
 
167
        movq (%ecx), %mm4
 
168
        /* simd data load/store barrier */ 
 
169
        pfmul KP559016994KP559016994, %mm2
 
170
        pswapd %mm0, %mm0
 
171
        movq %mm4, %mm5
 
172
        pfsub %mm0, %mm4
 
173
        pfadd %mm0, %mm5
 
174
        movq %mm6, %mm0
 
175
        pfmul KP250000000KP250000000, %mm0
 
176
        movq %mm4, 56(%esp)
 
177
        movq %mm5, %mm4
 
178
        pfadd %mm6, %mm5
 
179
        pswapd %mm3, %mm6
 
180
        pfmul KP587785252KP951056516, %mm3
 
181
        pfmul KP587785252KP951056516, %mm6
 
182
        pfsub %mm0, %mm4
 
183
        movq %mm1, %mm0
 
184
        pfmul KP587785252KP951056516, %mm1
 
185
        pfmul KP951056516KP587785252, %mm0
 
186
        movq %mm5, (%ecx)
 
187
        movq %mm4, %mm5
 
188
        pfsub %mm2, %mm4
 
189
        pfacc %mm1, %mm3
 
190
        pfadd %mm2, %mm5
 
191
        pfnacc %mm0, %mm6
 
192
        movq %mm4, %mm1
 
193
        movq 48(%esp), %mm0
 
194
        pxor chs_lo, %mm3
 
195
        movq %mm5, %mm2
 
196
        pfadd %mm6, %mm4
 
197
        pfsub %mm6, %mm1
 
198
        movq %mm7, %mm6
 
199
        pfsub %mm3, %mm5
 
200
        pfacc %mm0, %mm6
 
201
        movq %mm4, (%ecx,%edx,2)
 
202
        movq 56(%esp), %mm4
 
203
        pfnacc %mm0, %mm7
 
204
        pfadd %mm3, %mm2
 
205
        movq 40(%esp), %mm3
 
206
        movq %mm1, (%ecx,%edx,8)
 
207
        movq %mm5, (%ecx,%ebp,2)
 
208
        movq 32(%esp), %mm5
 
209
        leal (%edx,%edx,8), %ebp
 
210
        movq %mm4, %mm0
 
211
        pfadd %mm6, %mm4
 
212
        pfmul KP250000000KP250000000, %mm6
 
213
        pfmul KP559016994KP559016994, %mm7
 
214
        movq %mm2, (%ecx,%edx,4)
 
215
        movq %mm3, %mm1
 
216
        pfmul KP951056516KP587785252, %mm3
 
217
        movq %mm5, %mm2
 
218
        pfmul KP951056516KP587785252, %mm5
 
219
        pswapd %mm2, %mm2
 
220
        pfmul KP587785252KP951056516, %mm1
 
221
        movq %mm4, (%ecx,%edi)
 
222
        pfsub %mm6, %mm0
 
223
        pfmul KP951056516KP587785252, %mm2
 
224
        movq %mm7, %mm4
 
225
        pfacc %mm5, %mm3
 
226
        pfadd %mm0, %mm4
 
227
        pfsubr %mm0, %mm7
 
228
        pfnacc %mm2, %mm1
 
229
        pxor chs_lo, %mm3
 
230
        movq %mm4, %mm5
 
231
        movq %mm7, %mm6
 
232
        pfsub %mm1, %mm7
 
233
        pfadd %mm3, %mm5
 
234
        pfsub %mm3, %mm4
 
235
        pfadd %mm1, %mm6
 
236
        movq %mm5, (%ecx,%ebp)
 
237
        leal (%edi,%edx,2), %ebp
 
238
        leal (%edx,%edx,2), %edi
 
239
        movq %mm4, (%ecx,%edx)
 
240
        movq %mm6, (%ecx,%ebp)
 
241
        movq %mm7, (%ecx,%edi)
 
242
        addl %ebx, %ecx
 
243
        decl %esi
 
244
        jnz .L0
 
245
        femms 
 
246
        movl 80(%esp), %ebx
 
247
        movl 76(%esp), %esi
 
248
        movl 72(%esp), %edi
 
249
        movl 68(%esp), %ebp
 
250
        addl $84, %esp
 
251
        ret 
 
252
 
 
253
.section .rodata
 
254
nam:
 
255
        .string "t1k7_10"
 
256
        .align 4
 
257
twinstr:
 
258
        .byte 4
 
259
        .byte 0
 
260
        .value 10
 
261
        .byte 3
 
262
        .byte 1
 
263
        .value 0
 
264
        .align 4
 
265
desc:
 
266
        .long 10
 
267
        .long nam
 
268
        .long twinstr
 
269
        .long fftwf_kdft_ct_k7_mgenus
 
270
        .double 51
 
271
        .double 30
 
272
        .double 0
 
273
        .double 0
 
274
        .long 0
 
275
        .long 0
 
276
        .long 0
 
277
 
 
278
.text
 
279
        .align 4
 
280
.globl fftwf_codelet_t1k7_10
 
281
fftwf_codelet_t1k7_10:
 
282
        subl $12,%esp
 
283
        movl 16(%esp),%eax
 
284
        addl $-4,%esp
 
285
        pushl $desc
 
286
        pushl $t1k7_10
 
287
        pushl %eax
 
288
        call fftwf_kdft_dit_register
 
289
        addl $16,%esp
 
290
        addl $12,%esp
 
291
        ret
 
292