~diresu/blender/blender-command-port

« back to all changes in this revision

Viewing changes to extern/fftw/dft/k7/codelets/f1k7_8.S

  • Committer: theeth
  • Date: 2008-10-14 16:52:04 UTC
  • Revision ID: vcs-imports@canonical.com-20081014165204-r32w2gm6s0osvdhn
copy back trunk

Show diffs side-by-side

added added

removed removed

Lines of Context:
 
1
/*
 
2
 * Copyright (c) 2003, 2006 Matteo Frigo
 
3
 * Copyright (c) 2003, 2006 Massachusetts Institute of Technology
 
4
 *
 
5
 * This program is free software; you can redistribute it and/or modify
 
6
 * it under the terms of the GNU General Public License as published by
 
7
 * the Free Software Foundation; either version 2 of the License, or
 
8
 * (at your option) any later version.
 
9
 *
 
10
 * This program is distributed in the hope that it will be useful,
 
11
 * but WITHOUT ANY WARRANTY; without even the implied warranty of
 
12
 * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
 
13
 * GNU General Public License for more details.
 
14
 *
 
15
 * You should have received a copy of the GNU General Public License
 
16
 * along with this program; if not, write to the Free Software
 
17
 * Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA  02111-1307  USA
 
18
 *
 
19
 */
 
20
 
 
21
/* This file was automatically generated --- DO NOT EDIT */
 
22
/* Generated on Sat Jul  1 22:50:01 EDT 2006 */
 
23
 
 
24
#include "config.h"
 
25
 
 
26
 
 
27
 
 
28
/* cheap-mode: VECTGRADE_FULL succeeded. (136 steps) */
 
29
/* Generated by: ../../../genfft-k7/gen_twiddle -no-randomized-cse -dif -n 8 -name f1k7_8 */
 
30
 
 
31
/*
 
32
 * Generator Id's : 
 
33
 * $Id: algsimp.ml,v 1.4 2006-01-05 03:04:27 stevenj Exp $
 
34
 * $Id: fft.ml,v 1.4 2006-01-05 03:04:27 stevenj Exp $
 
35
 * $Id: gen_twiddle.ml,v 1.14 2005-12-24 21:08:49 athena Exp $
 
36
 */
 
37
 
 
38
/* The following asm code is Copyright (c) 2000-2001 Stefan Kral */
 
39
.section .rodata
 
40
        .balign 64
 
41
chs_lo: .long 0x80000000, 0x00000000
 
42
KP707106781KP707106781: .float +0.707106781186547524400844362104849039284835938, +0.707106781186547524400844362104849039284835938
 
43
chs_hi: .long 0x00000000, 0x80000000
 
44
.text
 
45
.text
 
46
        .balign 64
 
47
f1k7_8:
 
48
        subl $60, %esp
 
49
        femms 
 
50
        movl %ebx, 56(%esp)
 
51
        movl 76(%esp), %edx
 
52
        movl 84(%esp), %ebx
 
53
        movl 64(%esp), %ecx
 
54
        movl %esi, 52(%esp)
 
55
        movl 72(%esp), %eax
 
56
        movl %edi, 48(%esp)
 
57
        movl 80(%esp), %esi
 
58
        movl %ebp, 44(%esp)
 
59
        leal (,%edx,4), %edx
 
60
        leal (,%ebx,4), %ebx
 
61
        .p2align 4,,7
 
62
.L0:
 
63
        /* promise simd cell size = 8 */ 
 
64
        movq (%ecx,%edx,4), %mm0
 
65
        movq (%ecx), %mm1
 
66
        leal (%edx,%edx,2), %edi
 
67
        movq (%ecx,%edx,2), %mm4
 
68
        movq (%ecx,%edi,2), %mm3
 
69
        leal (%edi,%edx,4), %ebp
 
70
        movq (%ecx,%edi), %mm6
 
71
        movq %mm1, %mm2
 
72
        pfadd %mm0, %mm1
 
73
        leal (%edx,%edx,4), %edi
 
74
        movq %mm4, %mm5
 
75
        movq (%ecx,%ebp), %mm7
 
76
        leal (%edx,%edx,2), %ebp
 
77
        pfsub %mm0, %mm2
 
78
        pfadd %mm3, %mm4
 
79
        pfsub %mm3, %mm5
 
80
        movq %mm1, %mm3
 
81
        movq %mm7, %mm0
 
82
        pfadd %mm6, %mm7
 
83
        movq %mm2, 8(%esp)
 
84
        movq (%ecx,%edi), %mm2
 
85
        leal (%ebp,%edx,4), %edi
 
86
        pfsub %mm4, %mm1
 
87
        pfadd %mm4, %mm3
 
88
        movq (%ecx,%edx), %mm4
 
89
        pswapd %mm5, %mm5
 
90
        pfsub %mm6, %mm0
 
91
        pxor chs_lo, %mm5
 
92
        movq %mm1, 0(%esp)
 
93
        movq %mm4, %mm6
 
94
        pfsub %mm2, %mm4
 
95
        pfadd %mm2, %mm6
 
96
        movq %mm0, %mm2
 
97
        pfpnacc %mm4, %mm2
 
98
        pswapd %mm4, %mm4
 
99
        pfpnacc %mm0, %mm4
 
100
        movq %mm6, %mm1
 
101
        pfadd %mm7, %mm6
 
102
        pfsub %mm7, %mm1
 
103
        movq %mm2, %mm0
 
104
        movq %mm3, %mm7
 
105
        pfacc %mm4, %mm2
 
106
        pfadd %mm6, %mm3
 
107
        pfsub %mm6, %mm7
 
108
        movq 8(%esp), %mm6
 
109
        pswapd %mm1, %mm1
 
110
        pfnacc %mm0, %mm4
 
111
        pfmul KP707106781KP707106781, %mm2
 
112
        pxor chs_hi, %mm1
 
113
        movq %mm3, 24(%esp)
 
114
        movq 0(%esp), %mm3
 
115
        movq %mm6, %mm0
 
116
        pfsub %mm5, %mm6
 
117
        movq %mm7, 16(%esp)
 
118
        pfmul KP707106781KP707106781, %mm4
 
119
        pfadd %mm5, %mm0
 
120
        movq %mm3, %mm7
 
121
        pfsub %mm1, %mm3
 
122
        movq %mm6, %mm5
 
123
        pfsub %mm2, %mm6
 
124
        pfadd %mm1, %mm7
 
125
        movq 32(%eax), %mm1
 
126
        pfadd %mm2, %mm5
 
127
        pswapd %mm6, %mm2
 
128
        pfmul %mm1, %mm6
 
129
        pfmul %mm1, %mm2
 
130
        movq %mm0, %mm1
 
131
        pfsub %mm4, %mm0
 
132
        pfadd %mm4, %mm1
 
133
        movq 48(%eax), %mm4
 
134
        pfpnacc %mm6, %mm2
 
135
        pswapd %mm0, %mm6
 
136
        pfmul %mm4, %mm0
 
137
        pfmul %mm4, %mm6
 
138
        pswapd %mm1, %mm4
 
139
        movq %mm2, 32(%esp)
 
140
        movq 16(%eax), %mm2
 
141
        pfpnacc %mm0, %mm6
 
142
        movq (%eax), %mm0
 
143
        pfmul %mm2, %mm4
 
144
        pfmul %mm2, %mm1
 
145
        pswapd %mm5, %mm2
 
146
        pfmul %mm0, %mm2
 
147
        pswapd %mm6, %mm6
 
148
        pfmul %mm0, %mm5
 
149
        pswapd %mm7, %mm0
 
150
        pfpnacc %mm1, %mm4
 
151
        movq 8(%eax), %mm1
 
152
        pfpnacc %mm5, %mm2
 
153
        movq 40(%eax), %mm5
 
154
        pfmul %mm1, %mm0
 
155
        pswapd %mm4, %mm4
 
156
        pfmul %mm1, %mm7
 
157
        pswapd %mm3, %mm1
 
158
        pfmul %mm5, %mm1
 
159
        pswapd %mm2, %mm2
 
160
        pfmul %mm5, %mm3
 
161
        movq 24(%eax), %mm5
 
162
        /* simd data load/store barrier */ 
 
163
        movq %mm4, (%ecx,%ebp)
 
164
        movq 16(%esp), %mm4
 
165
        pfpnacc %mm7, %mm0
 
166
        movq 24(%esp), %mm7
 
167
        movq %mm6, (%ecx,%edi)
 
168
        addl $56, %eax
 
169
        movq %mm2, (%ecx,%edx)
 
170
        pfpnacc %mm3, %mm1
 
171
        movq 32(%esp), %mm3
 
172
        pswapd %mm4, %mm6
 
173
        pfmul %mm5, %mm4
 
174
        pswapd %mm0, %mm0
 
175
        movq %mm7, (%ecx)
 
176
        pfmul %mm5, %mm6
 
177
        pswapd %mm1, %mm1
 
178
        pswapd %mm3, %mm3
 
179
        movq %mm0, (%ecx,%edx,2)
 
180
        movq %mm1, (%ecx,%ebp,2)
 
181
        leal (%edx,%edx,4), %ebp
 
182
        pfpnacc %mm4, %mm6
 
183
        movq %mm3, (%ecx,%ebp)
 
184
        pswapd %mm6, %mm6
 
185
        movq %mm6, (%ecx,%edx,4)
 
186
        addl %ebx, %ecx
 
187
        decl %esi
 
188
        jnz .L0
 
189
        femms 
 
190
        movl 56(%esp), %ebx
 
191
        movl 52(%esp), %esi
 
192
        movl 48(%esp), %edi
 
193
        movl 44(%esp), %ebp
 
194
        addl $60, %esp
 
195
        ret 
 
196
 
 
197
.section .rodata
 
198
nam:
 
199
        .string "f1k7_8"
 
200
        .align 4
 
201
twinstr:
 
202
        .byte 4
 
203
        .byte 0
 
204
        .value 8
 
205
        .byte 3
 
206
        .byte 1
 
207
        .value 0
 
208
        .align 4
 
209
desc:
 
210
        .long 8
 
211
        .long nam
 
212
        .long twinstr
 
213
        .long fftwf_kdft_ct_k7_mgenus
 
214
        .double 33
 
215
        .double 16
 
216
        .double 0
 
217
        .double 0
 
218
        .long 0
 
219
        .long 0
 
220
        .long 0
 
221
 
 
222
.text
 
223
        .align 4
 
224
.globl fftwf_codelet_f1k7_8
 
225
fftwf_codelet_f1k7_8:
 
226
        subl $12,%esp
 
227
        movl 16(%esp),%eax
 
228
        addl $-4,%esp
 
229
        pushl $desc
 
230
        pushl $f1k7_8
 
231
        pushl %eax
 
232
        call fftwf_kdft_dif_register
 
233
        addl $16,%esp
 
234
        addl $12,%esp
 
235
        ret
 
236