~ubuntu-branches/ubuntu/utopic/fftw3/utopic

/* Generated by: ../../../genfft/gen_hc2hc -fma -reorder-insns -schedule-for-pipeline -compact -variables 4 -pipeline-latency 4 -n 3 -dit -name hf_3 -include hf.h */

/* Generated by: ../../../genfft/gen_hc2hc.native -fma -reorder-insns -schedule-for-pipeline -compact -variables 4 -pipeline-latency 4 -n 3 -dit -name hf_3 -include hf.h */

* This function contains 16 FP additions, 14 FP multiplications,

{

DK(KP866025403, +0.866025403784438646763723170752936183471402627);

DK(KP500000000, +0.500000000000000000000000000000000000000000000);

INT m;

for (m = mb, W = W + ((mb - 1) * 4); m < me; m = m + 1, cr = cr + ms, ci = ci - ms, W = W + 4, MAKE_VOLATILE_STRIDE(rs)) {

E T1, Tl, T9, Tc, Tb, Th, T7, Ti, Ta, Tj, Td;

T1 = cr[0];

Tl = ci[0];

{

E T3, T6, T2, T5, Tg, T4, T8;

T3 = cr[WS(rs, 1)];

T6 = ci[WS(rs, 1)];

T2 = W[0];

T5 = W[1];

T9 = cr[WS(rs, 2)];

Tc = ci[WS(rs, 2)];

Tg = T2 * T6;

T4 = T2 * T3;

T8 = W[2];

Tb = W[3];

Th = FNMS(T5, T3, Tg);

T7 = FMA(T5, T6, T4);

Ti = T8 * Tc;

Ta = T8 * T9;

}

Tj = FNMS(Tb, T9, Ti);

Td = FMA(Tb, Tc, Ta);

{

E Tk, Te, To, Tn, Tm, Tf;

Tk = Th - Tj;

Tm = Th + Tj;

Te = T7 + Td;

To = Td - T7;

ci[WS(rs, 2)] = Tm + Tl;

Tn = FNMS(KP500000000, Tm, Tl);

cr[0] = T1 + Te;

Tf = FNMS(KP500000000, Te, T1);

ci[WS(rs, 1)] = FMA(KP866025403, To, Tn);

cr[WS(rs, 2)] = FMS(KP866025403, To, Tn);

cr[WS(rs, 1)] = FMA(KP866025403, Tk, Tf);

ci[0] = FNMS(KP866025403, Tk, Tf);

{

INT m;

for (m = mb, W = W + ((mb - 1) * 4); m < me; m = m + 1, cr = cr + ms, ci = ci - ms, W = W + 4, MAKE_VOLATILE_STRIDE(rs)) {

E T1, Tl, T9, Tc, Tb, Th, T7, Ti, Ta, Tj, Td;

T1 = cr[0];

Tl = ci[0];

{

E T3, T6, T2, T5, Tg, T4, T8;

T3 = cr[WS(rs, 1)];

T6 = ci[WS(rs, 1)];

T2 = W[0];

T5 = W[1];

T9 = cr[WS(rs, 2)];

Tc = ci[WS(rs, 2)];

Tg = T2 * T6;

T4 = T2 * T3;

T8 = W[2];

Tb = W[3];

Th = FNMS(T5, T3, Tg);

T7 = FMA(T5, T6, T4);

Ti = T8 * Tc;

Ta = T8 * T9;

}

Tj = FNMS(Tb, T9, Ti);

Td = FMA(Tb, Tc, Ta);

{

E Tk, Te, To, Tn, Tm, Tf;

Tk = Th - Tj;

Tm = Th + Tj;

Te = T7 + Td;

To = Td - T7;

ci[WS(rs, 2)] = Tm + Tl;

Tn = FNMS(KP500000000, Tm, Tl);

cr[0] = T1 + Te;

Tf = FNMS(KP500000000, Te, T1);

ci[WS(rs, 1)] = FMA(KP866025403, To, Tn);

cr[WS(rs, 2)] = FMS(KP866025403, To, Tn);

cr[WS(rs, 1)] = FMA(KP866025403, Tk, Tf);

ci[0] = FNMS(KP866025403, Tk, Tf);

}

#else /* HAVE_FMA */

/* Generated by: ../../../genfft/gen_hc2hc -compact -variables 4 -pipeline-latency 4 -n 3 -dit -name hf_3 -include hf.h */

/* Generated by: ../../../genfft/gen_hc2hc.native -compact -variables 4 -pipeline-latency 4 -n 3 -dit -name hf_3 -include hf.h */

100

* This function contains 16 FP additions, 12 FP multiplications,

105

107

{

106

108

DK(KP866025403, +0.866025403784438646763723170752936183471402627);

107

109

DK(KP500000000, +0.500000000000000000000000000000000000000000000);

108

INT m;

109

for (m = mb, W = W + ((mb - 1) * 4); m < me; m = m + 1, cr = cr + ms, ci = ci - ms, W = W + 4, MAKE_VOLATILE_STRIDE(rs)) {

110

E T1, Ti, T6, Te, Tb, Tf, Tc, Tj;

111

T1 = cr[0];

112

Ti = ci[0];

113

{

114

E T3, T5, T2, T4;

115

T3 = cr[WS(rs, 1)];

116

T5 = ci[WS(rs, 1)];

117

T2 = W[0];

118

T4 = W[1];

119

T6 = FMA(T2, T3, T4 * T5);

120

Te = FNMS(T4, T3, T2 * T5);

121

}

122

{

123

E T8, Ta, T7, T9;

124

T8 = cr[WS(rs, 2)];

125

Ta = ci[WS(rs, 2)];

126

T7 = W[2];

127

T9 = W[3];

128

Tb = FMA(T7, T8, T9 * Ta);

129

Tf = FNMS(T9, T8, T7 * Ta);

130

}

131

Tc = T6 + Tb;

132

Tj = Te + Tf;

133

{

134

E Td, Tg, Th, Tk;

135

cr[0] = T1 + Tc;

136

Td = FNMS(KP500000000, Tc, T1);

137

Tg = KP866025403 * (Te - Tf);

138

ci[0] = Td - Tg;

139

cr[WS(rs, 1)] = Td + Tg;

140

ci[WS(rs, 2)] = Tj + Ti;

141

Th = KP866025403 * (Tb - T6);

142

Tk = FNMS(KP500000000, Tj, Ti);

143

cr[WS(rs, 2)] = Th - Tk;

144

ci[WS(rs, 1)] = Th + Tk;

110

{

111

INT m;

112

for (m = mb, W = W + ((mb - 1) * 4); m < me; m = m + 1, cr = cr + ms, ci = ci - ms, W = W + 4, MAKE_VOLATILE_STRIDE(rs)) {

113

E T1, Ti, T6, Te, Tb, Tf, Tc, Tj;

114

T1 = cr[0];

115

Ti = ci[0];

116

{

117

E T3, T5, T2, T4;

118

T3 = cr[WS(rs, 1)];

119

T5 = ci[WS(rs, 1)];

120

T2 = W[0];

121

T4 = W[1];

122

T6 = FMA(T2, T3, T4 * T5);

123

Te = FNMS(T4, T3, T2 * T5);

124

}

125

{

126

E T8, Ta, T7, T9;

127

T8 = cr[WS(rs, 2)];

128

Ta = ci[WS(rs, 2)];

129

T7 = W[2];

130

T9 = W[3];

131

Tb = FMA(T7, T8, T9 * Ta);

132

Tf = FNMS(T9, T8, T7 * Ta);

133

}

134

Tc = T6 + Tb;

135

Tj = Te + Tf;

136

{

137

E Td, Tg, Th, Tk;

138

cr[0] = T1 + Tc;

139

Td = FNMS(KP500000000, Tc, T1);

140

Tg = KP866025403 * (Te - Tf);

141

ci[0] = Td - Tg;

142

cr[WS(rs, 1)] = Td + Tg;

143

ci[WS(rs, 2)] = Tj + Ti;

144

Th = KP866025403 * (Tb - T6);

145

Tk = FNMS(KP500000000, Tj, Ti);

146

cr[WS(rs, 2)] = Th - Tk;

147

ci[WS(rs, 1)] = Th + Tk;

148

}

145

149

}

146

150

}

147

151

}

Older »