~ubuntu-branches/ubuntu/maverick/blender/maverick

« back to all changes in this revision

Viewing changes to extern/fftw/dft/k7/codelets/n1k7i_8.S

  • Committer: Bazaar Package Importer
  • Author(s): Khashayar Naderehvandi, Khashayar Naderehvandi, Alessio Treglia
  • Date: 2009-01-22 16:53:59 UTC
  • mfrom: (14.1.1 experimental)
  • Revision ID: james.westby@ubuntu.com-20090122165359-v0996tn7fbit64ni
Tags: 2.48a+dfsg-1ubuntu1
[ Khashayar Naderehvandi ]
* Merge from debian experimental (LP: #320045), Ubuntu remaining changes:
  - Add patch correcting header file locations.
  - Add libvorbis-dev and libgsm1-dev to Build-Depends.
  - Use avcodec_decode_audio2() in source/blender/src/hddaudio.c

[ Alessio Treglia ]
* Add missing previous changelog entries.

Show diffs side-by-side

added added

removed removed

Lines of Context:
 
1
/*
 
2
 * Copyright (c) 2003, 2006 Matteo Frigo
 
3
 * Copyright (c) 2003, 2006 Massachusetts Institute of Technology
 
4
 *
 
5
 * This program is free software; you can redistribute it and/or modify
 
6
 * it under the terms of the GNU General Public License as published by
 
7
 * the Free Software Foundation; either version 2 of the License, or
 
8
 * (at your option) any later version.
 
9
 *
 
10
 * This program is distributed in the hope that it will be useful,
 
11
 * but WITHOUT ANY WARRANTY; without even the implied warranty of
 
12
 * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
 
13
 * GNU General Public License for more details.
 
14
 *
 
15
 * You should have received a copy of the GNU General Public License
 
16
 * along with this program; if not, write to the Free Software
 
17
 * Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA  02111-1307  USA
 
18
 *
 
19
 */
 
20
 
 
21
/* This file was automatically generated --- DO NOT EDIT */
 
22
/* Generated on Sat Jul  1 22:42:43 EDT 2006 */
 
23
 
 
24
#include "config.h"
 
25
 
 
26
 
 
27
 
 
28
/* cheap-mode: VECTGRADE_FULL succeeded. (108 steps) */
 
29
/* Generated by: ../../../genfft-k7/gen_notw -no-randomized-cse -n 8 -sign 1 -name n1k7i_8 */
 
30
 
 
31
/*
 
32
 * Generator Id's : 
 
33
 * $Id: algsimp.ml,v 1.4 2006-01-05 03:04:27 stevenj Exp $
 
34
 * $Id: fft.ml,v 1.4 2006-01-05 03:04:27 stevenj Exp $
 
35
 * $Id: gen_notw.ml,v 1.12 2006-01-05 03:04:27 stevenj Exp $
 
36
 */
 
37
 
 
38
/* The following asm code is Copyright (c) 2000-2001 Stefan Kral */
 
39
.section .rodata
 
40
        .balign 64
 
41
chs_lo: .long 0x80000000, 0x00000000
 
42
chs_hi: .long 0x00000000, 0x80000000
 
43
KP707106781KP707106781: .float +0.707106781186547524400844362104849039284835938, +0.707106781186547524400844362104849039284835938
 
44
.text
 
45
.text
 
46
        .balign 64
 
47
n1k7i_8:
 
48
        subl $28, %esp
 
49
        femms 
 
50
        movl %ebx, 24(%esp)
 
51
        movl 48(%esp), %edx
 
52
        movl 52(%esp), %ebx
 
53
        movl 36(%esp), %eax
 
54
        movl %esi, 20(%esp)
 
55
        movl 44(%esp), %ecx
 
56
        movl %edi, 16(%esp)
 
57
        sall $2, 60(%esp)
 
58
        movl %ebp, 12(%esp)
 
59
        sall $2, 64(%esp)
 
60
        leal (,%edx,4), %edx
 
61
        leal (,%ebx,4), %ebx
 
62
        .p2align 4,,7
 
63
.L0:
 
64
        /* promise simd cell size = 8 */ 
 
65
        movq (%eax), %mm1
 
66
        movq (%eax,%edx,4), %mm0
 
67
        leal (%edx,%edx,2), %esi
 
68
        movq (%eax,%edx,2), %mm4
 
69
        leal (%edx,%edx,4), %ebp
 
70
        movq (%eax,%esi,2), %mm3
 
71
        leal (%esi,%edx,4), %edi
 
72
        movq (%eax,%esi), %mm7
 
73
        movq %mm1, %mm2
 
74
        pfsub %mm0, %mm1
 
75
        leal (%ebx,%ebx,2), %esi
 
76
        movq %mm4, %mm5
 
77
        pfadd %mm0, %mm2
 
78
        movq (%eax,%edi), %mm0
 
79
        leal (%ebx,%ebx,4), %edi
 
80
        pfadd %mm3, %mm5
 
81
        movq %mm1, 0(%esp)
 
82
        movq (%eax,%ebp), %mm1
 
83
        pfsub %mm3, %mm4
 
84
        leal (%edi,%ebx,2), %ebp
 
85
        movq %mm2, %mm6
 
86
        movq %mm0, %mm3
 
87
        pfadd %mm7, %mm0
 
88
        pfsub %mm5, %mm2
 
89
        pfadd %mm5, %mm6
 
90
        movq (%eax,%edx), %mm5
 
91
        pswapd %mm4, %mm4
 
92
        pfsub %mm7, %mm3
 
93
        /* simd data load/store barrier */ 
 
94
        addl 60(%esp), %eax
 
95
        pxor chs_lo, %mm4
 
96
        movq %mm5, %mm7
 
97
        pfsub %mm1, %mm5
 
98
        pfadd %mm1, %mm7
 
99
        movq %mm5, %mm1
 
100
        pfpnacc %mm3, %mm1
 
101
        pswapd %mm3, %mm3
 
102
        pfpnacc %mm5, %mm3
 
103
        movq %mm7, %mm5
 
104
        pfadd %mm0, %mm7
 
105
        pfsubr %mm0, %mm5
 
106
        movq %mm6, %mm0
 
107
        pfsub %mm7, %mm6
 
108
        pfadd %mm7, %mm0
 
109
        movq %mm1, %mm7
 
110
        pswapd %mm5, %mm5
 
111
        pfacc %mm3, %mm1
 
112
        pfnacc %mm7, %mm3
 
113
        movq 0(%esp), %mm7
 
114
        pxor chs_hi, %mm5
 
115
        movq %mm6, (%ecx,%ebx,4)
 
116
        movq %mm2, %mm6
 
117
        pfmul KP707106781KP707106781, %mm1
 
118
        movq %mm0, (%ecx)
 
119
        movq %mm7, %mm0
 
120
        pfsub %mm5, %mm2
 
121
        pfmul KP707106781KP707106781, %mm3
 
122
        pfsub %mm4, %mm7
 
123
        pfadd %mm4, %mm0
 
124
        pfadd %mm5, %mm6
 
125
        movq %mm2, (%ecx,%esi,2)
 
126
        movq %mm7, %mm5
 
127
        movq %mm0, %mm2
 
128
        pfsub %mm3, %mm7
 
129
        pfsub %mm1, %mm0
 
130
        movq %mm6, (%ecx,%ebx,2)
 
131
        pfadd %mm3, %mm5
 
132
        pfadd %mm1, %mm2
 
133
        movq %mm7, (%ecx,%ebp)
 
134
        movq %mm0, (%ecx,%edi)
 
135
        movq %mm5, (%ecx,%esi)
 
136
        movq %mm2, (%ecx,%ebx)
 
137
        addl 64(%esp), %ecx
 
138
        decl 56(%esp)
 
139
        jnz .L0
 
140
        femms 
 
141
        movl 24(%esp), %ebx
 
142
        movl 20(%esp), %esi
 
143
        movl 16(%esp), %edi
 
144
        movl 12(%esp), %ebp
 
145
        addl $28, %esp
 
146
        ret 
 
147
 
 
148
.section .rodata
 
149
nam:
 
150
        .string "n1k7i_8"
 
151
        .align 4
 
152
desc:
 
153
        .long 8
 
154
        .long nam
 
155
        .double 26
 
156
        .double 2
 
157
        .double 0
 
158
        .double 0
 
159
        .long fftwf_kdft_k7_pgenus
 
160
        .long 0
 
161
        .long 0
 
162
        .long 0
 
163
        .long 0
 
164
 
 
165
.text
 
166
        .align 4
 
167
.globl fftwf_codelet_n1k7i_8
 
168
fftwf_codelet_n1k7i_8:
 
169
        subl $12,%esp
 
170
        addl $-4,%esp
 
171
        pushl $desc
 
172
        pushl $n1k7i_8
 
173
        pushl 28(%esp)
 
174
        call fftwf_kdft_register
 
175
        addl $16,%esp
 
176
        addl $12,%esp
 
177
        ret
 
178