~diresu/blender/blender-command-port

« back to all changes in this revision

Viewing changes to extern/fftw/dft/k7/codelets/n1k7_6.S

  • Committer: theeth
  • Date: 2008-10-14 16:52:04 UTC
  • Revision ID: vcs-imports@canonical.com-20081014165204-r32w2gm6s0osvdhn
copy back trunk

Show diffs side-by-side

added added

removed removed

Lines of Context:
 
1
/*
 
2
 * Copyright (c) 2003, 2006 Matteo Frigo
 
3
 * Copyright (c) 2003, 2006 Massachusetts Institute of Technology
 
4
 *
 
5
 * This program is free software; you can redistribute it and/or modify
 
6
 * it under the terms of the GNU General Public License as published by
 
7
 * the Free Software Foundation; either version 2 of the License, or
 
8
 * (at your option) any later version.
 
9
 *
 
10
 * This program is distributed in the hope that it will be useful,
 
11
 * but WITHOUT ANY WARRANTY; without even the implied warranty of
 
12
 * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
 
13
 * GNU General Public License for more details.
 
14
 *
 
15
 * You should have received a copy of the GNU General Public License
 
16
 * along with this program; if not, write to the Free Software
 
17
 * Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA  02111-1307  USA
 
18
 *
 
19
 */
 
20
 
 
21
/* This file was automatically generated --- DO NOT EDIT */
 
22
/* Generated on Sat Jul  1 22:40:35 EDT 2006 */
 
23
 
 
24
#include "config.h"
 
25
 
 
26
 
 
27
 
 
28
/* cheap-mode: VECTGRADE_FULL succeeded. (56 steps) */
 
29
/* Generated by: ../../../genfft-k7/gen_notw -no-randomized-cse -n 6 -name n1k7_6 */
 
30
 
 
31
/*
 
32
 * Generator Id's : 
 
33
 * $Id: algsimp.ml,v 1.4 2006-01-05 03:04:27 stevenj Exp $
 
34
 * $Id: fft.ml,v 1.4 2006-01-05 03:04:27 stevenj Exp $
 
35
 * $Id: gen_notw.ml,v 1.12 2006-01-05 03:04:27 stevenj Exp $
 
36
 */
 
37
 
 
38
/* The following asm code is Copyright (c) 2000-2001 Stefan Kral */
 
39
.section .rodata
 
40
        .balign 64
 
41
KP500000000KP500000000: .float +0.500000000000000000000000000000000000000000000, +0.500000000000000000000000000000000000000000000
 
42
KP866025403KN866025403: .float +0.866025403784438646763723170752936183471402627, -0.866025403784438646763723170752936183471402627
 
43
.text
 
44
.text
 
45
        .balign 64
 
46
n1k7_6:
 
47
        subl $28, %esp
 
48
        femms 
 
49
        movl %ebx, 24(%esp)
 
50
        movl 48(%esp), %edx
 
51
        movl 52(%esp), %ebx
 
52
        movl %esi, 20(%esp)
 
53
        movl %edi, 16(%esp)
 
54
        movl 32(%esp), %eax
 
55
        movl %ebp, 12(%esp)
 
56
        movl 40(%esp), %ecx
 
57
        sall $2, 60(%esp)
 
58
        leal (,%edx,4), %edx
 
59
        sall $2, 64(%esp)
 
60
        leal (,%ebx,4), %ebx
 
61
        .p2align 4,,7
 
62
.L0:
 
63
        /* promise simd cell size = 8 */ 
 
64
        leal (%edx,%edx,4), %edi
 
65
        leal (%edx,%edx,2), %esi
 
66
        movq (%eax), %mm1
 
67
        movq (%eax,%edx,2), %mm4
 
68
        leal (%ebx,%ebx,2), %ebp
 
69
        movq (%eax,%edi), %mm3
 
70
        movq (%eax,%edx), %mm6
 
71
        movq (%eax,%edx,4), %mm7
 
72
        movq (%eax,%esi), %mm0
 
73
        /* simd data load/store barrier */ 
 
74
        leal (%ebx,%ebx,4), %esi
 
75
        addl 60(%esp), %eax
 
76
        movq %mm1, %mm2
 
77
        movq %mm4, %mm5
 
78
        pfsub %mm3, %mm4
 
79
        pfadd %mm0, %mm2
 
80
        pfsub %mm0, %mm1
 
81
        movq %mm7, %mm0
 
82
        pfsub %mm6, %mm7
 
83
        pfadd %mm6, %mm0
 
84
        movq %mm4, %mm6
 
85
        pfadd %mm3, %mm5
 
86
        pfsub %mm7, %mm6
 
87
        pfadd %mm7, %mm4
 
88
        movq %mm1, %mm7
 
89
        movq %mm5, %mm3
 
90
        pfadd %mm0, %mm5
 
91
        movq %mm6, 0(%esp)
 
92
        pfsub %mm0, %mm3
 
93
        movq %mm2, %mm0
 
94
        pfadd %mm4, %mm1
 
95
        pfmul KP500000000KP500000000, %mm4
 
96
        pfadd %mm5, %mm2
 
97
        pfmul KP500000000KP500000000, %mm5
 
98
        movq 0(%esp), %mm6
 
99
        pswapd %mm3, %mm3
 
100
        pfmul KP866025403KN866025403, %mm3
 
101
        movq %mm1, (%ecx,%ebp)
 
102
        movq %mm2, (%ecx)
 
103
        pfsub %mm4, %mm7
 
104
        pswapd %mm6, %mm6
 
105
        pfsub %mm5, %mm0
 
106
        pfmul KP866025403KN866025403, %mm6
 
107
        movq %mm7, %mm2
 
108
        movq %mm0, %mm1
 
109
        pfsub %mm3, %mm0
 
110
        pfadd %mm3, %mm1
 
111
        pfadd %mm6, %mm2
 
112
        movq %mm0, (%ecx,%ebx,2)
 
113
        pfsub %mm6, %mm7
 
114
        movq %mm1, (%ecx,%ebx,4)
 
115
        movq %mm2, (%ecx,%ebx)
 
116
        movq %mm7, (%ecx,%esi)
 
117
        addl 64(%esp), %ecx
 
118
        decl 56(%esp)
 
119
        jnz .L0
 
120
        femms 
 
121
        movl 24(%esp), %ebx
 
122
        movl 20(%esp), %esi
 
123
        movl 16(%esp), %edi
 
124
        movl 12(%esp), %ebp
 
125
        addl $28, %esp
 
126
        ret 
 
127
 
 
128
.section .rodata
 
129
nam:
 
130
        .string "n1k7_6"
 
131
        .align 4
 
132
desc:
 
133
        .long 6
 
134
        .long nam
 
135
        .double 18
 
136
        .double 4
 
137
        .double 0
 
138
        .double 0
 
139
        .long fftwf_kdft_k7_mgenus
 
140
        .long 0
 
141
        .long 0
 
142
        .long 0
 
143
        .long 0
 
144
 
 
145
.text
 
146
        .align 4
 
147
.globl fftwf_codelet_n1k7_6
 
148
fftwf_codelet_n1k7_6:
 
149
        subl $12,%esp
 
150
        addl $-4,%esp
 
151
        pushl $desc
 
152
        pushl $n1k7_6
 
153
        pushl 28(%esp)
 
154
        call fftwf_kdft_register
 
155
        addl $16,%esp
 
156
        addl $12,%esp
 
157
        ret
 
158