~ubuntu-branches/ubuntu/raring/fftw3/raring-proposed

« back to all changes in this revision

Viewing changes to dft/k7/codelets/f1k7i_4.S

  • Committer: Bazaar Package Importer
  • Author(s): Paul Brossier
  • Date: 2006-05-31 13:44:05 UTC
  • mfrom: (1.1.1 upstream)
  • Revision ID: james.westby@ubuntu.com-20060531134405-ol9hrbg6bh81sg0c
Tags: 3.1.1-1
* New upstream release (closes: #350327, #338487, #338501)
* Add --enable-portable-binary to use -mtune instead of -march
* Use --with-gcc-arch=G5 / pentium4 on powerpc / i386
* Updated Standards-Version

Show diffs side-by-side

added added

removed removed

Lines of Context:
1
1
/*
2
 
 * Copyright (c) 2003 Matteo Frigo
3
 
 * Copyright (c) 2003 Massachusetts Institute of Technology
 
2
 * Copyright (c) 2003, 2006 Matteo Frigo
 
3
 * Copyright (c) 2003, 2006 Massachusetts Institute of Technology
4
4
 *
5
5
 * This program is free software; you can redistribute it and/or modify
6
6
 * it under the terms of the GNU General Public License as published by
19
19
 */
20
20
 
21
21
/* This file was automatically generated --- DO NOT EDIT */
22
 
/* Generated on Sat Jul  5 21:53:21 EDT 2003 */
 
22
/* Generated on Tue Mar  7 10:49:22 EST 2006 */
23
23
 
24
24
#include "config.h"
25
25
 
26
26
 
27
27
 
28
28
/* cheap-mode: VECTGRADE_FULL succeeded. (48 steps) */
29
 
/* Generated by: /homee/stevenj/cvs/fftw3.0.1/genfft-k7/gen_twiddle -no-randomized-cse -dif -n 4 -sign 1 -name f1k7i_4 */
 
29
/* Generated by: ../../../genfft-k7/gen_twiddle -no-randomized-cse -dif -n 4 -sign 1 -name f1k7i_4 */
30
30
 
31
31
/*
32
32
 * Generator Id's : 
33
 
 * $Id: algsimp.ml,v 1.3 2003/03/15 20:29:42 stevenj Exp $
34
 
 * $Id: fft.ml,v 1.3 2003/03/15 20:29:43 stevenj Exp $
35
 
 * $Id: gen_twiddle.ml,v 1.13 2003/04/18 01:21:45 athena Exp $
 
33
 * $Id: algsimp.ml,v 1.4 2006-01-05 03:04:27 stevenj Exp $
 
34
 * $Id: fft.ml,v 1.4 2006-01-05 03:04:27 stevenj Exp $
 
35
 * $Id: gen_twiddle.ml,v 1.14 2005-12-24 21:08:49 athena Exp $
36
36
 */
37
37
 
38
38
/* The following asm code is Copyright (c) 2000-2001 Stefan Kral */
48
48
        movl %ebx, 16(%esp)
49
49
        movl 36(%esp), %edx
50
50
        movl 44(%esp), %ebx
 
51
        movl %esi, 12(%esp)
 
52
        movl %edi, 8(%esp)
51
53
        movl 28(%esp), %ecx
52
 
        movl %esi, 12(%esp)
 
54
        movl %ebp, 4(%esp)
53
55
        movl 32(%esp), %eax
54
 
        movl %edi, 8(%esp)
55
56
        movl 40(%esp), %esi
56
 
        movl %ebp, 4(%esp)
57
57
        leal (,%edx,4), %edx
58
58
        leal (,%ebx,4), %ebx
59
59
        .p2align 4,,7
61
61
        /* promise simd cell size = 8 */ 
62
62
        leal (%edx,%edx,2), %edi
63
63
        movq (%ecx,%edx), %mm4
 
64
        movq (%ecx,%edx,2), %mm0
64
65
        movq (%ecx), %mm1
65
 
        movq (%ecx,%edx,2), %mm0
66
66
        leal (%edx,%edx,2), %ebp
67
67
        movq (%ecx,%edi), %mm3
68
68
        movq %mm4, %mm5
69
69
        movq %mm1, %mm2
70
70
        pfadd %mm0, %mm1
71
 
        pfsub %mm3, %mm5
72
 
        pfadd %mm3, %mm4
 
71
        pfsub %mm3, %mm4
 
72
        pfadd %mm3, %mm5
73
73
        pfsub %mm0, %mm2
74
74
        movq 8(%eax), %mm0
75
75
        movq %mm1, %mm6
76
 
        pswapd %mm5, %mm5
77
 
        pfsub %mm4, %mm1
78
 
        pxor chs_lo, %mm5
 
76
        pswapd %mm4, %mm4
 
77
        pfsub %mm5, %mm1
 
78
        pxor chs_lo, %mm4
79
79
        movq %mm2, %mm7
80
 
        pfadd %mm4, %mm6
81
 
        movq (%eax), %mm4
 
80
        pfadd %mm5, %mm6
 
81
        movq (%eax), %mm5
82
82
        pswapd %mm1, %mm3
83
83
        pfmul %mm0, %mm1
84
 
        pfadd %mm5, %mm7
85
 
        pfsub %mm5, %mm2
86
 
        movq 16(%eax), %mm5
 
84
        pfadd %mm4, %mm2
 
85
        pfsub %mm4, %mm7
87
86
        pfmul %mm0, %mm3
 
87
        movq 16(%eax), %mm0
88
88
        /* simd data load/store barrier */ 
89
89
        movq %mm6, (%ecx)
90
90
        addl $24, %eax
91
 
        pswapd %mm7, %mm0
92
 
        pfmul %mm4, %mm7
93
 
        pswapd %mm2, %mm6
 
91
        pswapd %mm2, %mm4
94
92
        pfmul %mm5, %mm2
95
 
        pfmul %mm4, %mm0
 
93
        pswapd %mm7, %mm6
 
94
        pfmul %mm0, %mm7
 
95
        pfmul %mm5, %mm4
96
96
        pfpnacc %mm3, %mm1
97
 
        pfmul %mm5, %mm6
98
 
        pfpnacc %mm0, %mm7
 
97
        pfmul %mm0, %mm6
 
98
        pfpnacc %mm4, %mm2
99
99
        movq %mm1, (%ecx,%edx,2)
100
 
        pfpnacc %mm6, %mm2
101
 
        movq %mm7, (%ecx,%edx)
102
 
        movq %mm2, (%ecx,%ebp)
 
100
        pfpnacc %mm6, %mm7
 
101
        movq %mm2, (%ecx,%edx)
 
102
        movq %mm7, (%ecx,%ebp)
103
103
        addl %ebx, %ecx
104
104
        decl %esi
105
105
        jnz .L0
127
127
        .long 4
128
128
        .long nam
129
129
        .long twinstr
130
 
        .zero 4
 
130
        .long fftwf_kdft_ct_k7_pgenus
131
131
        .double 11
132
132
        .double 6
133
133
        .double 0
134
134
        .double 0
135
 
        .long fftwf_kdft_ct_k7_pgenus
136
135
        .long 0
137
136
        .long 0
138
137
        .long 0