2
! This Source Code Form is subject to the terms of the Mozilla Public
3
! License, v. 2.0. If a copy of the MPL was not distributed with this
4
! file, You can obtain one at http://mozilla.org/MPL/2.0/.
6
.section ".text",#alloc,#execinstr
9
.section ".rodata",#alloc
29
.type TwoToMinus16,#object
59
.type TwoToMinus32,#object
62
.section ".text",#alloc,#execinstr
63
/* 000000 0 */ .register %g3,#scratch
64
/* 000000 */ .register %g2,#scratch
65
/* 000000 0 */ .align 8
67
! SUBROUTINE conv_d16_to_i32
69
! OFFSET SOURCE LINE LABEL INSTRUCTION
71
.global conv_d16_to_i32
73
/* 000000 */ save %sp,-208,%sp
77
! 2 ! * The contents of this file are subject to the Mozilla Public
78
! 3 ! * License Version 1.1 (the "License"); you may not use this file
79
! 4 ! * except in compliance with the License. You may obtain a copy of
80
! 5 ! * the License at http://www.mozilla.org/MPL/
82
! 7 ! * Software distributed under the License is distributed on an "AS
83
! 8 ! * IS" basis, WITHOUT WARRANTY OF ANY KIND, either express or
84
! 9 ! * implied. See the License for the specific language governing
85
! 10 ! * rights and limitations under the License.
87
! 12 ! * The Original Code is SPARC optimized Montgomery multiply functions.
89
! 14 ! * The Initial Developer of the Original Code is Sun Microsystems Inc.
90
! 15 ! * Portions created by Sun Microsystems Inc. are
91
! 16 ! * Copyright (C) 1999-2000 Sun Microsystems Inc. All Rights Reserved.
93
! 18 ! * Contributor(s):
94
! 19 ! * Netscape Communications Corporation
96
! 21 ! * Alternatively, the contents of this file may be used under the
97
! 22 ! * terms of the GNU General Public License Version 2 or later (the
98
! 23 ! * "GPL"), in which case the provisions of the GPL are applicable
99
! 24 ! * instead of those above. If you wish to allow use of your
100
! 25 ! * version of this file only under the terms of the GPL and not to
101
! 26 ! * allow others to use your version of this file under the MPL,
102
! 27 ! * indicate your decision by deleting the provisions above and
103
! 28 ! * replace them with the notice and other provisions required by
104
! 29 ! * the GPL. If you do not delete the provisions above, a recipient
105
! 30 ! * may use your version of this file under either the MPL or the
108
! 36 !#define RF_INLINE_MACROS
109
! 38 !static const double TwoTo16=65536.0;
110
! 39 !static const double TwoToMinus16=1.0/65536.0;
111
! 40 !static const double Zero=0.0;
112
! 41 !static const double TwoTo32=65536.0*65536.0;
113
! 42 !static const double TwoToMinus32=1.0/(65536.0*65536.0);
114
! 44 !#ifdef RF_INLINE_MACROS
115
! 46 !double upper32(double);
116
! 47 !double lower32(double, double);
117
! 48 !double mod(double, double, double);
118
! 50 !void i16_to_d16_and_d32x4(const double * /*1/(2^16)*/,
119
! 51 ! const double * /* 2^16*/,
120
! 52 ! const double * /* 0 */,
121
! 53 ! double * /*result16*/,
122
! 54 ! double * /* result32 */,
123
! 55 ! float * /*source - should be unsigned int*
124
! 56 ! converted to float* */);
126
! 60 !static double upper32(double x)
128
! 62 ! return floor(x*TwoToMinus32);
130
! 65 !static double lower32(double x, double y)
132
! 67 ! return x-TwoTo32*floor(x*TwoToMinus32);
134
! 70 !static double mod(double x, double oneoverm, double m)
136
! 72 ! return x-m*floor(x*oneoverm);
139
! 78 !static void cleanup(double *dt, int from, int tlen)
142
! 81 ! double tmp,tmp1,x,x1;
143
! 83 ! tmp=tmp1=Zero;
144
! 84 ! /* original code **
145
! 85 ! for(i=2*from;i<2*tlen-2;i++)
148
! 88 ! dt[i]=lower32(x,Zero)+tmp1;
150
! 90 ! tmp=upper32(x);
152
! 92 ! dt[tlen-2]+=tmp1;
153
! 93 ! dt[tlen-1]+=tmp;
154
! 94 ! **end original code ***/
155
! 95 ! /* new code ***/
156
! 96 ! for(i=2*from;i<2*tlen;i+=2)
160
! 100 ! dt[i]=lower32(x,Zero)+tmp;
161
! 101 ! dt[i+1]=lower32(x1,Zero)+tmp1;
162
! 102 ! tmp=upper32(x);
163
! 103 ! tmp1=upper32(x1);
165
! 105 ! /** end new code **/
167
! 109 !void conv_d16_to_i32(unsigned int *i32, double *d16, long long *tmp, int ilen)
170
! 112 !long long t, t1, a, b, c, d;
172
! 115 ! a=(long long)d16[0];
174
/* 0x0004 115 */ ldd [%i1],%f2
176
! 116 ! b=(long long)d16[1];
177
! 117 ! for(i=0; i<ilen-1; i++)
179
/* 0x0008 117 */ sub %i3,1,%o1
180
/* 0x000c 110 */ or %g0,%i0,%g1
181
/* 0x0010 116 */ ldd [%i1+8],%f4
182
/* 0x0014 117 */ cmp %o1,0
183
/* 0x0018 114 */ or %g0,0,%g5
184
/* 0x001c 115 */ fdtox %f2,%f2
185
/* 0x0020 */ std %f2,[%sp+2247]
186
/* 0x0024 117 */ or %g0,0,%o0
187
/* 0x0028 116 */ fdtox %f4,%f2
188
/* 0x002c */ std %f2,[%sp+2239]
189
/* 0x0030 110 */ sub %o1,1,%o7
190
/* 0x0034 */ or %g0,%i1,%o4
191
/* 0x0038 */ sethi %hi(0xfc00),%o3
192
/* 0x003c */ or %g0,-1,%o1
193
/* 0x0040 */ or %g0,2,%i1
194
/* 0x0044 */ srl %o1,0,%g3
195
/* 0x0048 */ or %g0,%o4,%g4
196
/* 0x004c 116 */ ldx [%sp+2239],%i2
197
/* 0x0050 */ add %o3,1023,%o5
198
/* 0x0054 117 */ sub %o7,1,%o2
199
/* 0x0058 115 */ ldx [%sp+2247],%i3
200
/* 0x005c 117 */ ble,pt %icc,.L900000113
201
/* 0x0060 */ sethi %hi(0xfc00),%g2
202
/* 0x0064 */ add %o7,1,%g2
205
! 119 ! c=(long long)d16[2*i+2];
206
! 120 ! t1+=a&0xffffffff;
208
! 122 ! d=(long long)d16[2*i+3];
209
! 123 ! t1+=(b&0xffff)<<16;
211
/* 0x0068 123 */ and %i2,%o5,%i4
212
/* 0x006c */ sllx %i4,16,%o1
213
/* 0x0070 117 */ cmp %g2,6
214
/* 0x0074 */ bl,pn %icc,.L77000134
215
/* 0x0078 */ or %g0,3,%i0
216
/* 0x007c 119 */ ldd [%o4+16],%f0
217
/* 0x0080 120 */ and %i3,%g3,%o3
219
! 124 ! t+=(b>>16)+(t1>>32);
221
/* 0x0084 124 */ srax %i2,16,%i5
222
/* 0x0088 117 */ add %o3,%o1,%i4
223
/* 0x008c 121 */ srax %i3,32,%i3
224
/* 0x0090 119 */ fdtox %f0,%f0
225
/* 0x0094 */ std %f0,[%sp+2231]
227
! 125 ! i32[i]=t1&0xffffffff;
229
/* 0x0098 125 */ and %i4,%g3,%l0
230
/* 0x009c 117 */ or %g0,72,%o3
231
/* 0x00a0 122 */ ldd [%g4+24],%f0
232
/* 0x00a4 117 */ or %g0,64,%o4
233
/* 0x00a8 */ or %g0,4,%o1
239
/* 0x00ac 128 */ or %g0,5,%i0
240
/* 0x00b0 */ or %g0,4,%i1
241
/* 0x00b4 119 */ ldx [%sp+2231],%g2
242
/* 0x00b8 122 */ fdtox %f0,%f0
243
/* 0x00bc 128 */ or %g0,4,%o0
244
/* 0x00c0 122 */ std %f0,[%sp+2223]
245
/* 0x00c4 */ ldd [%g4+40],%f2
246
/* 0x00c8 120 */ and %g2,%g3,%i2
247
/* 0x00cc 119 */ ldd [%g4+32],%f0
248
/* 0x00d0 121 */ srax %g2,32,%g2
249
/* 0x00d4 122 */ ldd [%g4+56],%f4
250
/* 0x00d8 */ fdtox %f2,%f2
251
/* 0x00dc */ ldx [%sp+2223],%g5
252
/* 0x00e0 119 */ fdtox %f0,%f0
253
/* 0x00e4 125 */ st %l0,[%g1]
254
/* 0x00e8 124 */ srax %i4,32,%l0
255
/* 0x00ec 122 */ fdtox %f4,%f4
256
/* 0x00f0 */ std %f2,[%sp+2223]
257
/* 0x00f4 123 */ and %g5,%o5,%i4
258
/* 0x00f8 124 */ add %i5,%l0,%i5
259
/* 0x00fc 119 */ std %f0,[%sp+2231]
260
/* 0x0100 123 */ sllx %i4,16,%i4
261
/* 0x0104 124 */ add %i3,%i5,%i3
262
/* 0x0108 119 */ ldd [%g4+48],%f2
263
/* 0x010c 124 */ srax %g5,16,%g5
264
/* 0x0110 117 */ add %i2,%i4,%i2
265
/* 0x0114 122 */ ldd [%g4+72],%f0
266
/* 0x0118 117 */ add %i2,%i3,%i4
267
/* 0x011c 124 */ srax %i4,32,%i5
268
/* 0x0120 119 */ fdtox %f2,%f2
269
/* 0x0124 125 */ and %i4,%g3,%i4
270
/* 0x0128 122 */ ldx [%sp+2223],%i2
271
/* 0x012c 124 */ add %g5,%i5,%g5
272
/* 0x0130 119 */ ldx [%sp+2231],%i3
273
/* 0x0134 124 */ add %g2,%g5,%g5
274
/* 0x0138 119 */ std %f2,[%sp+2231]
275
/* 0x013c 122 */ std %f4,[%sp+2223]
276
/* 0x0140 119 */ ldd [%g4+64],%f2
277
/* 0x0144 125 */ st %i4,[%g1+4]
279
/* 0x0148 122 */ ldx [%sp+2223],%i4
280
/* 0x014c 128 */ add %o0,2,%o0
281
/* 0x0150 */ add %i0,4,%i0
282
/* 0x0154 119 */ ldx [%sp+2231],%l0
283
/* 0x0158 117 */ add %o3,16,%o3
284
/* 0x015c 123 */ and %i2,%o5,%g2
285
/* 0x0160 */ sllx %g2,16,%i5
286
/* 0x0164 120 */ and %i3,%g3,%g2
287
/* 0x0168 122 */ ldd [%g4+%o3],%f4
288
/* 0x016c */ fdtox %f0,%f0
289
/* 0x0170 */ std %f0,[%sp+2223]
290
/* 0x0174 124 */ srax %i2,16,%i2
291
/* 0x0178 117 */ add %g2,%i5,%g2
292
/* 0x017c 119 */ fdtox %f2,%f0
293
/* 0x0180 117 */ add %o4,16,%o4
294
/* 0x0184 119 */ std %f0,[%sp+2231]
295
/* 0x0188 117 */ add %g2,%g5,%g2
296
/* 0x018c 119 */ ldd [%g4+%o4],%f2
297
/* 0x0190 124 */ srax %g2,32,%i5
298
/* 0x0194 128 */ cmp %o0,%o2
299
/* 0x0198 121 */ srax %i3,32,%g5
300
/* 0x019c 124 */ add %i2,%i5,%i2
301
/* 0x01a0 */ add %g5,%i2,%i5
302
/* 0x01a4 117 */ add %o1,4,%o1
303
/* 0x01a8 125 */ and %g2,%g3,%g2
304
/* 0x01ac 127 */ or %g0,%l0,%g5
305
/* 0x01b0 125 */ st %g2,[%g1+%o1]
306
/* 0x01b4 128 */ add %i1,4,%i1
307
/* 0x01b8 122 */ ldx [%sp+2223],%i2
308
/* 0x01bc 119 */ ldx [%sp+2231],%i3
309
/* 0x01c0 117 */ add %o3,16,%o3
310
/* 0x01c4 123 */ and %i4,%o5,%g2
311
/* 0x01c8 */ sllx %g2,16,%l0
312
/* 0x01cc 120 */ and %g5,%g3,%g2
313
/* 0x01d0 122 */ ldd [%g4+%o3],%f0
314
/* 0x01d4 */ fdtox %f4,%f4
315
/* 0x01d8 */ std %f4,[%sp+2223]
316
/* 0x01dc 124 */ srax %i4,16,%i4
317
/* 0x01e0 117 */ add %g2,%l0,%g2
318
/* 0x01e4 119 */ fdtox %f2,%f2
319
/* 0x01e8 117 */ add %o4,16,%o4
320
/* 0x01ec 119 */ std %f2,[%sp+2231]
321
/* 0x01f0 117 */ add %g2,%i5,%g2
322
/* 0x01f4 119 */ ldd [%g4+%o4],%f2
323
/* 0x01f8 124 */ srax %g2,32,%i5
324
/* 0x01fc 121 */ srax %g5,32,%g5
325
/* 0x0200 124 */ add %i4,%i5,%i4
326
/* 0x0204 */ add %g5,%i4,%g5
327
/* 0x0208 117 */ add %o1,4,%o1
328
/* 0x020c 125 */ and %g2,%g3,%g2
329
/* 0x0210 128 */ ble,pt %icc,.L900000108
330
/* 0x0214 */ st %g2,[%g1+%o1]
332
/* 0x0218 122 */ ldx [%sp+2223],%o2
333
/* 0x021c 123 */ and %i2,%o5,%i4
334
/* 0x0220 120 */ and %i3,%g3,%g2
335
/* 0x0224 123 */ sllx %i4,16,%i4
336
/* 0x0228 119 */ ldx [%sp+2231],%i5
337
/* 0x022c 128 */ cmp %o0,%o7
338
/* 0x0230 124 */ srax %i2,16,%i2
339
/* 0x0234 117 */ add %g2,%i4,%g2
340
/* 0x0238 122 */ fdtox %f0,%f4
341
/* 0x023c */ std %f4,[%sp+2223]
342
/* 0x0240 117 */ add %g2,%g5,%g5
343
/* 0x0244 123 */ and %o2,%o5,%l0
344
/* 0x0248 124 */ srax %g5,32,%l1
345
/* 0x024c 120 */ and %i5,%g3,%i4
346
/* 0x0250 119 */ fdtox %f2,%f0
347
/* 0x0254 121 */ srax %i3,32,%g2
348
/* 0x0258 119 */ std %f0,[%sp+2231]
349
/* 0x025c 124 */ add %i2,%l1,%i2
350
/* 0x0260 123 */ sllx %l0,16,%i3
351
/* 0x0264 124 */ add %g2,%i2,%i2
352
/* 0x0268 */ srax %o2,16,%o2
353
/* 0x026c 117 */ add %o1,4,%g2
354
/* 0x0270 */ add %i4,%i3,%o1
355
/* 0x0274 125 */ and %g5,%g3,%g5
356
/* 0x0278 */ st %g5,[%g1+%g2]
357
/* 0x027c 119 */ ldx [%sp+2231],%i3
358
/* 0x0280 117 */ add %o1,%i2,%o1
359
/* 0x0284 */ add %g2,4,%g2
360
/* 0x0288 124 */ srax %o1,32,%i4
361
/* 0x028c 122 */ ldx [%sp+2223],%i2
362
/* 0x0290 125 */ and %o1,%g3,%g5
363
/* 0x0294 121 */ srax %i5,32,%o1
364
/* 0x0298 124 */ add %o2,%i4,%o2
365
/* 0x029c 125 */ st %g5,[%g1+%g2]
366
/* 0x02a0 128 */ bg,pn %icc,.L77000127
367
/* 0x02a4 */ add %o1,%o2,%g5
368
/* 0x02a8 */ add %i0,6,%i0
369
/* 0x02ac */ add %i1,6,%i1
371
/* 0x02b0 119 */ sra %i1,0,%o2
373
/* 0x02b4 119 */ sllx %o2,3,%o3
374
/* 0x02b8 120 */ and %i3,%g3,%o1
375
/* 0x02bc 119 */ ldd [%g4+%o3],%f0
376
/* 0x02c0 122 */ sra %i0,0,%o3
377
/* 0x02c4 123 */ and %i2,%o5,%o2
378
/* 0x02c8 122 */ sllx %o3,3,%o3
379
/* 0x02cc 120 */ add %g5,%o1,%o1
380
/* 0x02d0 119 */ fdtox %f0,%f0
381
/* 0x02d4 */ std %f0,[%sp+2231]
382
/* 0x02d8 123 */ sllx %o2,16,%o2
383
/* 0x02dc */ add %o1,%o2,%o2
384
/* 0x02e0 128 */ add %i1,2,%i1
385
/* 0x02e4 122 */ ldd [%g4+%o3],%f0
386
/* 0x02e8 124 */ srax %o2,32,%g2
387
/* 0x02ec 125 */ and %o2,%g3,%o3
388
/* 0x02f0 124 */ srax %i2,16,%o1
389
/* 0x02f4 128 */ add %i0,2,%i0
390
/* 0x02f8 122 */ fdtox %f0,%f0
391
/* 0x02fc */ std %f0,[%sp+2223]
392
/* 0x0300 125 */ sra %o0,0,%o2
393
/* 0x0304 */ sllx %o2,2,%o2
394
/* 0x0308 124 */ add %o1,%g2,%g5
395
/* 0x030c 121 */ srax %i3,32,%g2
396
/* 0x0310 128 */ add %o0,1,%o0
397
/* 0x0314 124 */ add %g2,%g5,%g5
398
/* 0x0318 128 */ cmp %o0,%o7
399
/* 0x031c 119 */ ldx [%sp+2231],%o4
400
/* 0x0320 122 */ ldx [%sp+2223],%i2
401
/* 0x0324 125 */ st %o3,[%g1+%o2]
402
/* 0x0328 127 */ or %g0,%o4,%i3
403
/* 0x032c 128 */ ble,pt %icc,.L900000112
404
/* 0x0330 */ sra %i1,0,%o2
408
! 130 ! t1+=a&0xffffffff;
410
! 132 ! t1+=(b&0xffff)<<16;
411
! 133 ! i32[i]=t1&0xffffffff;
413
/* 0x0334 133 */ sethi %hi(0xfc00),%g2
415
/* 0x0338 133 */ or %g0,-1,%g3
416
/* 0x033c */ add %g2,1023,%g2
417
/* 0x0340 */ srl %g3,0,%g3
418
/* 0x0344 */ and %i2,%g2,%g2
419
/* 0x0348 */ and %i3,%g3,%g4
420
/* 0x034c */ sllx %g2,16,%g2
421
/* 0x0350 */ add %g5,%g4,%g4
422
/* 0x0354 */ sra %o0,0,%g5
423
/* 0x0358 */ add %g4,%g2,%g4
424
/* 0x035c */ sllx %g5,2,%g2
425
/* 0x0360 */ and %g4,%g3,%g3
426
/* 0x0364 */ st %g3,[%g1+%g2]
427
/* 0x0368 */ ret ! Result =
428
/* 0x036c */ restore %g0,%g0,%g0
429
/* 0x0370 0 */ .type conv_d16_to_i32,2
430
/* 0x0370 */ .size conv_d16_to_i32,(.-conv_d16_to_i32)
432
.section ".text",#alloc,#execinstr
433
/* 000000 0 */ .align 8
437
.L_const_seg_900000201:
438
/* 000000 0 */ .word 1127219200,0
439
/* 0x0008 0 */ .align 8
440
/* 0x0008 */ .skip 24
442
! SUBROUTINE conv_i32_to_d32
444
! OFFSET SOURCE LINE LABEL INSTRUCTION
446
.global conv_i32_to_d32
448
/* 000000 */ or %g0,%o7,%g3
451
! 137 !void conv_i32_to_d32(double *d32, unsigned int *i32, int len)
454
! 141 !#pragma pipeloop(0)
455
! 142 ! for(i=0;i<len;i++) d32[i]=(double)(i32[i]);
457
/* 0x0004 142 */ cmp %o2,0
459
/* 0x0008 */ call .+8
460
/* 0x000c */ sethi /*X*/%hi(_GLOBAL_OFFSET_TABLE_-(.L900000210-.)),%g4
461
/* 0x0010 142 */ or %g0,0,%o3
462
/* 0x0014 138 */ add %g4,/*X*/%lo(_GLOBAL_OFFSET_TABLE_-(.L900000210-.)),%g4
463
/* 0x0018 142 */ sub %o2,1,%o4
464
/* 0x001c 138 */ add %g4,%o7,%g1
465
/* 0x0020 142 */ ble,pt %icc,.L77000140
466
/* 0x0024 */ or %g0,%g3,%o7
467
/* 0x0028 */ sethi %hi(.L_const_seg_900000201),%g3
468
/* 0x002c */ cmp %o2,12
469
/* 0x0030 */ add %g3,%lo(.L_const_seg_900000201),%g2
470
/* 0x0034 */ or %g0,%o1,%g5
471
/* 0x0038 */ ldx [%g1+%g2],%g4
472
/* 0x003c */ or %g0,0,%g1
473
/* 0x0040 */ or %g0,24,%g2
474
/* 0x0044 */ bl,pn %icc,.L77000144
475
/* 0x0048 */ or %g0,0,%g3
476
/* 0x004c */ ld [%o1],%f13
477
/* 0x0050 */ or %g0,7,%o3
478
/* 0x0054 */ ldd [%g4],%f8
479
/* 0x0058 */ sub %o2,5,%g3
480
/* 0x005c */ or %g0,8,%g1
481
/* 0x0060 */ ld [%o1+4],%f11
482
/* 0x0064 */ ld [%o1+8],%f7
483
/* 0x0068 */ fmovs %f8,%f12
484
/* 0x006c */ ld [%o1+12],%f5
485
/* 0x0070 */ fmovs %f8,%f10
486
/* 0x0074 */ ld [%o1+16],%f3
487
/* 0x0078 */ fmovs %f8,%f6
488
/* 0x007c */ ld [%o1+20],%f1
489
/* 0x0080 */ fsubd %f12,%f8,%f12
490
/* 0x0084 */ std %f12,[%o0]
491
/* 0x0088 */ fsubd %f10,%f8,%f10
492
/* 0x008c */ std %f10,[%o0+8]
494
/* 0x0090 */ ld [%o1+%g2],%f11
495
/* 0x0094 */ add %g1,8,%g1
496
/* 0x0098 */ add %o3,5,%o3
497
/* 0x009c */ fsubd %f6,%f8,%f6
498
/* 0x00a0 */ add %g2,4,%g2
499
/* 0x00a4 */ std %f6,[%o0+%g1]
500
/* 0x00a8 */ cmp %o3,%g3
501
/* 0x00ac */ fmovs %f8,%f4
502
/* 0x00b0 */ ld [%o1+%g2],%f7
503
/* 0x00b4 */ fsubd %f4,%f8,%f12
504
/* 0x00b8 */ add %g1,8,%g1
505
/* 0x00bc */ add %g2,4,%g2
506
/* 0x00c0 */ fmovs %f8,%f2
507
/* 0x00c4 */ std %f12,[%o0+%g1]
508
/* 0x00c8 */ ld [%o1+%g2],%f5
509
/* 0x00cc */ fsubd %f2,%f8,%f12
510
/* 0x00d0 */ add %g1,8,%g1
511
/* 0x00d4 */ add %g2,4,%g2
512
/* 0x00d8 */ fmovs %f8,%f0
513
/* 0x00dc */ std %f12,[%o0+%g1]
514
/* 0x00e0 */ ld [%o1+%g2],%f3
515
/* 0x00e4 */ fsubd %f0,%f8,%f12
516
/* 0x00e8 */ add %g1,8,%g1
517
/* 0x00ec */ add %g2,4,%g2
518
/* 0x00f0 */ fmovs %f8,%f10
519
/* 0x00f4 */ std %f12,[%o0+%g1]
520
/* 0x00f8 */ ld [%o1+%g2],%f1
521
/* 0x00fc */ fsubd %f10,%f8,%f10
522
/* 0x0100 */ add %g1,8,%g1
523
/* 0x0104 */ add %g2,4,%g2
524
/* 0x0108 */ std %f10,[%o0+%g1]
525
/* 0x010c */ ble,pt %icc,.L900000205
526
/* 0x0110 */ fmovs %f8,%f6
528
/* 0x0114 */ fmovs %f8,%f4
529
/* 0x0118 */ ld [%o1+%g2],%f11
530
/* 0x011c */ add %g1,8,%g3
531
/* 0x0120 */ fmovs %f8,%f2
532
/* 0x0124 */ add %g1,16,%g1
533
/* 0x0128 */ cmp %o3,%o4
534
/* 0x012c */ fmovs %f8,%f0
535
/* 0x0130 */ add %g1,8,%o1
536
/* 0x0134 */ add %g1,16,%o2
537
/* 0x0138 */ fmovs %f8,%f10
538
/* 0x013c */ add %g1,24,%g2
539
/* 0x0140 */ fsubd %f6,%f8,%f6
540
/* 0x0144 */ std %f6,[%o0+%g3]
541
/* 0x0148 */ fsubd %f4,%f8,%f4
542
/* 0x014c */ std %f4,[%o0+%g1]
543
/* 0x0150 */ sra %o3,0,%g1
544
/* 0x0154 */ fsubd %f2,%f8,%f2
545
/* 0x0158 */ std %f2,[%o0+%o1]
546
/* 0x015c */ sllx %g1,2,%g3
547
/* 0x0160 */ fsubd %f0,%f8,%f0
548
/* 0x0164 */ std %f0,[%o0+%o2]
549
/* 0x0168 */ fsubd %f10,%f8,%f0
550
/* 0x016c */ bg,pn %icc,.L77000140
551
/* 0x0170 */ std %f0,[%o0+%g2]
553
/* 0x0174 */ ldd [%g4],%f8
555
/* 0x0178 */ ld [%g5+%g3],%f13
556
/* 0x017c */ sllx %g1,3,%g2
557
/* 0x0180 */ add %o3,1,%o3
558
/* 0x0184 */ sra %o3,0,%g1
559
/* 0x0188 */ cmp %o3,%o4
560
/* 0x018c */ fmovs %f8,%f12
561
/* 0x0190 */ sllx %g1,2,%g3
562
/* 0x0194 */ fsubd %f12,%f8,%f0
563
/* 0x0198 */ std %f0,[%o0+%g2]
564
/* 0x019c */ ble,a,pt %icc,.L900000211
565
/* 0x01a0 */ ldd [%g4],%f8
567
/* 0x01a4 */ retl ! Result =
569
/* 0x01ac 0 */ .type conv_i32_to_d32,2
570
/* 0x01ac */ .size conv_i32_to_d32,(.-conv_i32_to_d32)
572
.section ".text",#alloc,#execinstr
573
/* 000000 0 */ .align 8
577
.L_const_seg_900000301:
578
/* 000000 0 */ .word 1127219200,0
579
/* 0x0008 0 */ .align 8
580
/* 0x0008 */ .skip 24
582
! SUBROUTINE conv_i32_to_d16
584
! OFFSET SOURCE LINE LABEL INSTRUCTION
586
.global conv_i32_to_d16
588
/* 000000 */ save %sp,-192,%sp
590
/* 0x0004 */ call .+8
591
/* 0x0008 */ sethi /*X*/%hi(_GLOBAL_OFFSET_TABLE_-(.L900000310-.)),%g3
594
! 146 !void conv_i32_to_d16(double *d16, unsigned int *i32, int len)
597
! 149 !unsigned int a;
598
! 151 !#pragma pipeloop(0)
599
! 152 ! for(i=0;i<len;i++)
601
/* 0x000c 152 */ cmp %i2,0
602
/* 0x0010 147 */ add %g3,/*X*/%lo(_GLOBAL_OFFSET_TABLE_-(.L900000310-.)),%g3
603
/* 0x0014 152 */ ble,pt %icc,.L77000150
604
/* 0x0018 */ add %g3,%o7,%o0
608
! 155 ! d16[2*i]=(double)(a&0xffff);
609
! 156 ! d16[2*i+1]=(double)(a>>16);
611
/* 0x001c 156 */ sethi %hi(.L_const_seg_900000301),%g2
612
/* 0x0020 147 */ or %g0,%i2,%o1
613
/* 0x0024 152 */ sethi %hi(0xfc00),%g3
614
/* 0x0028 156 */ add %g2,%lo(.L_const_seg_900000301),%g2
615
/* 0x002c 152 */ or %g0,%o1,%g4
616
/* 0x0030 156 */ ldx [%o0+%g2],%o5
617
/* 0x0034 152 */ add %g3,1023,%g1
618
/* 0x0038 147 */ or %g0,%i1,%o7
619
/* 0x003c 152 */ or %g0,0,%i2
620
/* 0x0040 */ sub %o1,1,%g5
621
/* 0x0044 */ or %g0,0,%g3
622
/* 0x0048 */ or %g0,1,%g2
623
/* 0x004c 154 */ or %g0,0,%o2
624
/* 0x0050 */ cmp %g4,6
625
/* 0x0054 152 */ bl,pn %icc,.L77000154
626
/* 0x0058 */ ldd [%o5],%f0
627
/* 0x005c */ sub %o1,2,%o3
628
/* 0x0060 */ or %g0,16,%o2
629
/* 0x0064 154 */ ld [%i1],%o4
630
/* 0x0068 156 */ or %g0,3,%g2
631
/* 0x006c */ or %g0,2,%g3
632
/* 0x0070 155 */ fmovs %f0,%f2
633
/* 0x0074 156 */ or %g0,4,%i2
634
/* 0x0078 155 */ and %o4,%g1,%o0
635
/* 0x007c */ st %o0,[%sp+2227]
636
/* 0x0080 */ fmovs %f0,%f4
637
/* 0x0084 156 */ srl %o4,16,%i4
638
/* 0x0088 152 */ or %g0,12,%o4
639
/* 0x008c */ or %g0,24,%o0
640
/* 0x0090 155 */ ld [%sp+2227],%f3
641
/* 0x0094 */ fsubd %f2,%f0,%f2
642
/* 0x0098 */ std %f2,[%i0]
643
/* 0x009c 156 */ st %i4,[%sp+2223]
644
/* 0x00a0 154 */ ld [%o7+4],%o1
645
/* 0x00a4 156 */ fmovs %f0,%f2
646
/* 0x00a8 155 */ and %o1,%g1,%i1
647
/* 0x00ac 156 */ ld [%sp+2223],%f3
648
/* 0x00b0 */ srl %o1,16,%o1
649
/* 0x00b4 */ fsubd %f2,%f0,%f2
650
/* 0x00b8 */ std %f2,[%i0+8]
651
/* 0x00bc */ st %o1,[%sp+2223]
652
/* 0x00c0 155 */ st %i1,[%sp+2227]
653
/* 0x00c4 154 */ ld [%o7+8],%o1
654
/* 0x00c8 156 */ fmovs %f0,%f2
655
/* 0x00cc 155 */ and %o1,%g1,%g4
656
/* 0x00d0 */ ld [%sp+2227],%f5
657
/* 0x00d4 156 */ srl %o1,16,%o1
658
/* 0x00d8 */ ld [%sp+2223],%f3
659
/* 0x00dc */ st %o1,[%sp+2223]
660
/* 0x00e0 155 */ fsubd %f4,%f0,%f4
661
/* 0x00e4 */ st %g4,[%sp+2227]
662
/* 0x00e8 156 */ fsubd %f2,%f0,%f2
663
/* 0x00ec 154 */ ld [%o7+12],%o1
664
/* 0x00f0 155 */ std %f4,[%i0+16]
665
/* 0x00f4 156 */ std %f2,[%i0+24]
667
/* 0x00f8 155 */ ld [%sp+2227],%f5
668
/* 0x00fc 156 */ add %i2,2,%i2
669
/* 0x0100 */ add %g2,4,%g2
670
/* 0x0104 */ ld [%sp+2223],%f3
671
/* 0x0108 */ cmp %i2,%o3
672
/* 0x010c */ add %g3,4,%g3
673
/* 0x0110 155 */ and %o1,%g1,%g4
674
/* 0x0114 156 */ srl %o1,16,%o1
675
/* 0x0118 155 */ st %g4,[%sp+2227]
676
/* 0x011c 156 */ st %o1,[%sp+2223]
677
/* 0x0120 152 */ add %o4,4,%o1
678
/* 0x0124 154 */ ld [%o7+%o1],%o4
679
/* 0x0128 156 */ fmovs %f0,%f2
680
/* 0x012c 155 */ fmovs %f0,%f4
681
/* 0x0130 */ fsubd %f4,%f0,%f4
682
/* 0x0134 152 */ add %o2,16,%o2
683
/* 0x0138 156 */ fsubd %f2,%f0,%f2
684
/* 0x013c 155 */ std %f4,[%i0+%o2]
685
/* 0x0140 152 */ add %o0,16,%o0
686
/* 0x0144 156 */ std %f2,[%i0+%o0]
687
/* 0x0148 155 */ ld [%sp+2227],%f5
688
/* 0x014c 156 */ ld [%sp+2223],%f3
689
/* 0x0150 155 */ and %o4,%g1,%g4
690
/* 0x0154 156 */ srl %o4,16,%o4
691
/* 0x0158 155 */ st %g4,[%sp+2227]
692
/* 0x015c 156 */ st %o4,[%sp+2223]
693
/* 0x0160 152 */ add %o1,4,%o4
694
/* 0x0164 154 */ ld [%o7+%o4],%o1
695
/* 0x0168 156 */ fmovs %f0,%f2
696
/* 0x016c 155 */ fmovs %f0,%f4
697
/* 0x0170 */ fsubd %f4,%f0,%f4
698
/* 0x0174 152 */ add %o2,16,%o2
699
/* 0x0178 156 */ fsubd %f2,%f0,%f2
700
/* 0x017c 155 */ std %f4,[%i0+%o2]
701
/* 0x0180 152 */ add %o0,16,%o0
702
/* 0x0184 156 */ ble,pt %icc,.L900000306
703
/* 0x0188 */ std %f2,[%i0+%o0]
705
/* 0x018c 155 */ ld [%sp+2227],%f5
706
/* 0x0190 156 */ fmovs %f0,%f2
707
/* 0x0194 */ srl %o1,16,%o3
708
/* 0x0198 */ ld [%sp+2223],%f3
709
/* 0x019c 155 */ and %o1,%g1,%i1
710
/* 0x01a0 152 */ add %o2,16,%g4
711
/* 0x01a4 155 */ fmovs %f0,%f4
712
/* 0x01a8 */ st %i1,[%sp+2227]
713
/* 0x01ac 152 */ add %o0,16,%o2
714
/* 0x01b0 156 */ st %o3,[%sp+2223]
715
/* 0x01b4 154 */ sra %i2,0,%o3
716
/* 0x01b8 152 */ add %g4,16,%o1
717
/* 0x01bc 155 */ fsubd %f4,%f0,%f4
718
/* 0x01c0 */ std %f4,[%i0+%g4]
719
/* 0x01c4 152 */ add %o0,32,%o0
720
/* 0x01c8 156 */ fsubd %f2,%f0,%f2
721
/* 0x01cc */ std %f2,[%i0+%o2]
722
/* 0x01d0 */ sllx %o3,2,%o2
723
/* 0x01d4 155 */ ld [%sp+2227],%f5
724
/* 0x01d8 156 */ cmp %i2,%g5
725
/* 0x01dc */ add %g2,6,%g2
726
/* 0x01e0 */ ld [%sp+2223],%f3
727
/* 0x01e4 */ add %g3,6,%g3
728
/* 0x01e8 155 */ fmovs %f0,%f4
729
/* 0x01ec 156 */ fmovs %f0,%f2
730
/* 0x01f0 155 */ fsubd %f4,%f0,%f4
731
/* 0x01f4 */ std %f4,[%i0+%o1]
732
/* 0x01f8 156 */ fsubd %f2,%f0,%f0
733
/* 0x01fc */ bg,pn %icc,.L77000150
734
/* 0x0200 */ std %f0,[%i0+%o0]
736
/* 0x0204 155 */ ldd [%o5],%f0
738
/* 0x0208 154 */ ld [%o7+%o2],%o0
739
/* 0x020c 155 */ sra %g3,0,%o1
740
/* 0x0210 */ fmovs %f0,%f2
741
/* 0x0214 */ sllx %o1,3,%o2
742
/* 0x0218 156 */ add %i2,1,%i2
743
/* 0x021c 155 */ and %o0,%g1,%o1
744
/* 0x0220 */ st %o1,[%sp+2227]
745
/* 0x0224 156 */ add %g3,2,%g3
746
/* 0x0228 */ srl %o0,16,%o1
747
/* 0x022c */ cmp %i2,%g5
748
/* 0x0230 */ sra %g2,0,%o0
749
/* 0x0234 */ add %g2,2,%g2
750
/* 0x0238 */ sllx %o0,3,%o0
751
/* 0x023c 155 */ ld [%sp+2227],%f3
752
/* 0x0240 154 */ sra %i2,0,%o3
753
/* 0x0244 155 */ fsubd %f2,%f0,%f2
754
/* 0x0248 */ std %f2,[%i0+%o2]
755
/* 0x024c */ sllx %o3,2,%o2
756
/* 0x0250 156 */ st %o1,[%sp+2223]
757
/* 0x0254 */ fmovs %f0,%f2
758
/* 0x0258 */ ld [%sp+2223],%f3
759
/* 0x025c */ fsubd %f2,%f0,%f0
760
/* 0x0260 */ std %f0,[%i0+%o0]
761
/* 0x0264 */ ble,a,pt %icc,.L900000311
762
/* 0x0268 */ ldd [%o5],%f0
764
/* 0x026c */ ret ! Result =
765
/* 0x0270 */ restore %g0,%g0,%g0
766
/* 0x0274 0 */ .type conv_i32_to_d16,2
767
/* 0x0274 */ .size conv_i32_to_d16,(.-conv_i32_to_d16)
769
.section ".text",#alloc,#execinstr
770
/* 000000 0 */ .align 8
774
.L_const_seg_900000401:
775
/* 000000 0 */ .word 1127219200,0
776
/* 0x0008 0 */ .align 8
777
/* 0x0008 */ .skip 24
779
! SUBROUTINE conv_i32_to_d32_and_d16
781
! OFFSET SOURCE LINE LABEL INSTRUCTION
783
.global conv_i32_to_d32_and_d16
784
conv_i32_to_d32_and_d16:
785
/* 000000 */ save %sp,-192,%sp
787
/* 0x0004 */ call .+8
788
/* 0x0008 */ sethi /*X*/%hi(_GLOBAL_OFFSET_TABLE_-(.L900000415-.)),%g3
792
! 161 !void conv_i32_to_d32_and_d16(double *d32, double *d16,
793
! 162 ! unsigned int *i32, int len)
796
! 165 !unsigned int a;
797
! 167 !#pragma pipeloop(0)
798
! 168 !#ifdef RF_INLINE_MACROS
799
! 169 ! for(;i<len-3;i+=4)
801
! 171 ! i16_to_d16_and_d32x4(&TwoToMinus16, &TwoTo16, &Zero,
802
! 172 ! &(d16[2*i]), &(d32[i]), (float *)(&(i32[i])));
804
/* 0x000c 172 */ sethi %hi(Zero),%g2
805
/* 0x0010 163 */ add %g3,/*X*/%lo(_GLOBAL_OFFSET_TABLE_-(.L900000415-.)),%g3
806
/* 0x0014 */ or %g0,%i3,%g5
807
/* 0x0018 */ add %g3,%o7,%o3
808
/* 0x001c 172 */ add %g2,%lo(Zero),%g2
809
/* 0x0020 */ ldx [%o3+%g2],%o0
810
/* 0x0024 */ sethi %hi(TwoToMinus16),%g3
811
/* 0x0028 163 */ or %g0,%i0,%i3
812
/* 0x002c 169 */ sub %g5,3,%o1
813
/* 0x0030 172 */ sethi %hi(TwoTo16),%g4
814
/* 0x0034 163 */ or %g0,%i2,%i0
815
/* 0x0038 172 */ add %g3,%lo(TwoToMinus16),%g2
816
/* 0x003c */ ldx [%o3+%g2],%o2
817
/* 0x0040 169 */ cmp %o1,0
818
/* 0x0044 164 */ or %g0,0,%i2
819
/* 0x0048 169 */ ble,pt %icc,.L900000418
820
/* 0x004c */ cmp %i2,%g5
821
/* 0x0050 */ ldd [%o0],%f2
822
/* 0x0054 172 */ add %g4,%lo(TwoTo16),%g3
823
/* 0x0058 */ ldx [%o3+%g3],%o1
824
/* 0x005c 169 */ sub %g5,4,%o4
825
/* 0x0060 */ or %g0,0,%o5
827
/* 0x0064 172 */ sra %i2,0,%g2
828
/* 0x0068 */ fmovd %f2,%f14
829
/* 0x006c */ ldd [%o2],%f0
830
/* 0x0070 */ sllx %g2,2,%g3
831
/* 0x0074 */ fmovd %f2,%f10
832
/* 0x0078 */ ldd [%o1],%f16
833
/* 0x007c */ ld [%g3+%i0],%f15
834
/* 0x0080 */ add %i0,%g3,%g3
835
/* 0x0084 */ fmovd %f2,%f6
836
/* 0x0088 */ ld [%g3+4],%f11
837
/* 0x008c */ sra %o5,0,%g4
838
/* 0x0090 */ add %i2,4,%i2
839
/* 0x0094 */ ld [%g3+8],%f7
840
/* 0x0098 */ fxtod %f14,%f14
841
/* 0x009c */ sllx %g2,3,%g2
842
/* 0x00a0 */ ld [%g3+12],%f3
843
/* 0x00a4 */ fxtod %f10,%f10
844
/* 0x00a8 */ sllx %g4,3,%g3
845
/* 0x00ac */ fxtod %f6,%f6
846
/* 0x00b0 */ std %f14,[%g2+%i3]
847
/* 0x00b4 */ add %i3,%g2,%g4
848
/* 0x00b8 */ fxtod %f2,%f2
849
/* 0x00bc */ fmuld %f0,%f14,%f12
850
/* 0x00c0 */ std %f2,[%g4+24]
851
/* 0x00c4 */ fmuld %f0,%f10,%f8
852
/* 0x00c8 */ std %f10,[%g4+8]
853
/* 0x00cc */ add %i1,%g3,%g2
854
/* 0x00d0 */ fmuld %f0,%f6,%f4
855
/* 0x00d4 */ std %f6,[%g4+16]
856
/* 0x00d8 */ cmp %i2,%o4
857
/* 0x00dc */ fmuld %f0,%f2,%f0
858
/* 0x00e0 */ fdtox %f12,%f12
859
/* 0x00e4 */ add %o5,8,%o5
860
/* 0x00e8 */ fdtox %f8,%f8
861
/* 0x00ec */ fdtox %f4,%f4
862
/* 0x00f0 */ fdtox %f0,%f0
863
/* 0x00f4 */ fxtod %f12,%f12
864
/* 0x00f8 */ std %f12,[%g2+8]
865
/* 0x00fc */ fxtod %f8,%f8
866
/* 0x0100 */ std %f8,[%g2+24]
867
/* 0x0104 */ fxtod %f4,%f4
868
/* 0x0108 */ std %f4,[%g2+40]
869
/* 0x010c */ fxtod %f0,%f0
870
/* 0x0110 */ std %f0,[%g2+56]
871
/* 0x0114 */ fmuld %f12,%f16,%f12
872
/* 0x0118 */ fmuld %f8,%f16,%f8
873
/* 0x011c */ fmuld %f4,%f16,%f4
874
/* 0x0120 */ fsubd %f14,%f12,%f12
875
/* 0x0124 */ std %f12,[%g3+%i1]
876
/* 0x0128 */ fmuld %f0,%f16,%f0
877
/* 0x012c */ fsubd %f10,%f8,%f8
878
/* 0x0130 */ std %f8,[%g2+16]
879
/* 0x0134 */ fsubd %f6,%f4,%f4
880
/* 0x0138 */ std %f4,[%g2+32]
881
/* 0x013c */ fsubd %f2,%f0,%f0
882
/* 0x0140 */ std %f0,[%g2+48]
883
/* 0x0144 */ ble,a,pt %icc,.L900000417
884
/* 0x0148 */ ldd [%o0],%f2
889
! 175 ! for(;i<len;i++)
891
/* 0x014c 175 */ cmp %i2,%g5
893
/* 0x0150 175 */ bge,pt %icc,.L77000164
898
! 178 ! d32[i]=(double)(i32[i]);
899
! 179 ! d16[2*i]=(double)(a&0xffff);
900
! 180 ! d16[2*i+1]=(double)(a>>16);
902
/* 0x0158 180 */ sethi %hi(.L_const_seg_900000401),%g2
903
/* 0x015c */ add %g2,%lo(.L_const_seg_900000401),%g2
904
/* 0x0160 175 */ sethi %hi(0xfc00),%g3
905
/* 0x0164 180 */ ldx [%o3+%g2],%g1
906
/* 0x0168 175 */ sll %i2,1,%i4
907
/* 0x016c */ sub %g5,%i2,%g4
908
/* 0x0170 177 */ sra %i2,0,%o3
909
/* 0x0174 175 */ add %g3,1023,%g3
910
/* 0x0178 178 */ ldd [%g1],%f2
911
/* 0x017c */ sllx %o3,2,%o2
912
/* 0x0180 175 */ add %i4,1,%g2
913
/* 0x0184 177 */ or %g0,%o3,%o1
914
/* 0x0188 */ cmp %g4,6
915
/* 0x018c 175 */ bl,pn %icc,.L77000161
916
/* 0x0190 */ sra %i2,0,%o3
917
/* 0x0194 177 */ or %g0,%o2,%o0
918
/* 0x0198 178 */ ld [%i0+%o2],%f5
919
/* 0x019c 179 */ fmovs %f2,%f8
920
/* 0x01a0 175 */ add %o0,4,%o3
921
/* 0x01a4 177 */ ld [%i0+%o0],%o7
922
/* 0x01a8 180 */ fmovs %f2,%f6
923
/* 0x01ac 178 */ fmovs %f2,%f4
924
/* 0x01b0 */ sllx %o1,3,%o2
925
/* 0x01b4 175 */ add %o3,4,%o5
926
/* 0x01b8 179 */ sra %i4,0,%o0
927
/* 0x01bc 175 */ add %o3,8,%o4
928
/* 0x01c0 178 */ fsubd %f4,%f2,%f4
929
/* 0x01c4 */ std %f4,[%i3+%o2]
930
/* 0x01c8 179 */ sllx %o0,3,%i5
931
/* 0x01cc */ and %o7,%g3,%o0
932
/* 0x01d0 */ st %o0,[%sp+2227]
933
/* 0x01d4 175 */ add %i5,16,%o1
934
/* 0x01d8 180 */ srl %o7,16,%g4
935
/* 0x01dc */ add %i2,1,%i2
936
/* 0x01e0 */ sra %g2,0,%o0
937
/* 0x01e4 175 */ add %o2,8,%o2
938
/* 0x01e8 179 */ fmovs %f2,%f4
939
/* 0x01ec 180 */ sllx %o0,3,%l0
940
/* 0x01f0 */ add %i4,3,%g2
941
/* 0x01f4 179 */ ld [%sp+2227],%f5
942
/* 0x01f8 175 */ add %l0,16,%o0
943
/* 0x01fc 180 */ add %i4,2,%i4
944
/* 0x0200 175 */ sub %g5,1,%o7
945
/* 0x0204 180 */ add %i2,3,%i2
946
/* 0x0208 179 */ fsubd %f4,%f2,%f4
947
/* 0x020c */ std %f4,[%i1+%i5]
948
/* 0x0210 180 */ st %g4,[%sp+2223]
949
/* 0x0214 177 */ ld [%i0+%o3],%i5
950
/* 0x0218 180 */ fmovs %f2,%f4
951
/* 0x021c */ srl %i5,16,%g4
952
/* 0x0220 179 */ and %i5,%g3,%i5
953
/* 0x0224 180 */ ld [%sp+2223],%f5
954
/* 0x0228 */ fsubd %f4,%f2,%f4
955
/* 0x022c */ std %f4,[%i1+%l0]
956
/* 0x0230 */ st %g4,[%sp+2223]
957
/* 0x0234 177 */ ld [%i0+%o5],%g4
958
/* 0x0238 179 */ st %i5,[%sp+2227]
959
/* 0x023c 178 */ fmovs %f2,%f4
960
/* 0x0240 180 */ srl %g4,16,%i5
961
/* 0x0244 179 */ and %g4,%g3,%g4
962
/* 0x0248 180 */ ld [%sp+2223],%f7
963
/* 0x024c */ st %i5,[%sp+2223]
964
/* 0x0250 178 */ ld [%i0+%o3],%f5
965
/* 0x0254 180 */ fsubd %f6,%f2,%f6
966
/* 0x0258 177 */ ld [%i0+%o4],%o3
967
/* 0x025c 178 */ fsubd %f4,%f2,%f4
968
/* 0x0260 179 */ ld [%sp+2227],%f9
969
/* 0x0264 180 */ ld [%sp+2223],%f1
970
/* 0x0268 179 */ st %g4,[%sp+2227]
971
/* 0x026c */ fsubd %f8,%f2,%f8
972
/* 0x0270 */ std %f8,[%i1+%o1]
973
/* 0x0274 180 */ std %f6,[%i1+%o0]
974
/* 0x0278 178 */ std %f4,[%i3+%o2]
976
/* 0x027c 179 */ ld [%sp+2227],%f13
977
/* 0x0280 180 */ srl %o3,16,%g4
978
/* 0x0284 */ add %i2,2,%i2
979
/* 0x0288 */ st %g4,[%sp+2223]
980
/* 0x028c */ cmp %i2,%o7
981
/* 0x0290 */ add %g2,4,%g2
982
/* 0x0294 178 */ ld [%i0+%o5],%f11
983
/* 0x0298 180 */ add %i4,4,%i4
984
/* 0x029c 175 */ add %o4,4,%o5
985
/* 0x02a0 177 */ ld [%i0+%o5],%g4
986
/* 0x02a4 179 */ and %o3,%g3,%o3
987
/* 0x02a8 */ st %o3,[%sp+2227]
988
/* 0x02ac 180 */ fmovs %f2,%f0
989
/* 0x02b0 179 */ fmovs %f2,%f12
990
/* 0x02b4 180 */ fsubd %f0,%f2,%f8
991
/* 0x02b8 179 */ fsubd %f12,%f2,%f4
992
/* 0x02bc 175 */ add %o1,16,%o1
993
/* 0x02c0 180 */ ld [%sp+2223],%f7
994
/* 0x02c4 178 */ fmovs %f2,%f10
995
/* 0x02c8 179 */ std %f4,[%i1+%o1]
996
/* 0x02cc 175 */ add %o0,16,%o0
997
/* 0x02d0 178 */ fsubd %f10,%f2,%f4
998
/* 0x02d4 175 */ add %o2,8,%o2
999
/* 0x02d8 180 */ std %f8,[%i1+%o0]
1000
/* 0x02dc 178 */ std %f4,[%i3+%o2]
1001
/* 0x02e0 179 */ ld [%sp+2227],%f9
1002
/* 0x02e4 180 */ srl %g4,16,%o3
1003
/* 0x02e8 */ st %o3,[%sp+2223]
1004
/* 0x02ec 178 */ ld [%i0+%o4],%f5
1005
/* 0x02f0 175 */ add %o4,8,%o4
1006
/* 0x02f4 177 */ ld [%i0+%o4],%o3
1007
/* 0x02f8 179 */ and %g4,%g3,%g4
1008
/* 0x02fc */ st %g4,[%sp+2227]
1009
/* 0x0300 180 */ fmovs %f2,%f6
1010
/* 0x0304 179 */ fmovs %f2,%f8
1011
/* 0x0308 180 */ fsubd %f6,%f2,%f6
1012
/* 0x030c 179 */ fsubd %f8,%f2,%f8
1013
/* 0x0310 175 */ add %o1,16,%o1
1014
/* 0x0314 180 */ ld [%sp+2223],%f1
1015
/* 0x0318 178 */ fmovs %f2,%f4
1016
/* 0x031c 179 */ std %f8,[%i1+%o1]
1017
/* 0x0320 175 */ add %o0,16,%o0
1018
/* 0x0324 178 */ fsubd %f4,%f2,%f4
1019
/* 0x0328 175 */ add %o2,8,%o2
1020
/* 0x032c 180 */ std %f6,[%i1+%o0]
1021
/* 0x0330 */ bl,pt %icc,.L900000411
1022
/* 0x0334 */ std %f4,[%i3+%o2]
1024
/* 0x0338 180 */ srl %o3,16,%o7
1025
/* 0x033c */ st %o7,[%sp+2223]
1026
/* 0x0340 179 */ fmovs %f2,%f12
1027
/* 0x0344 178 */ ld [%i0+%o5],%f11
1028
/* 0x0348 180 */ fmovs %f2,%f0
1029
/* 0x034c 179 */ and %o3,%g3,%g4
1030
/* 0x0350 180 */ fmovs %f2,%f6
1031
/* 0x0354 175 */ add %o1,16,%o3
1032
/* 0x0358 */ add %o0,16,%o7
1033
/* 0x035c 178 */ fmovs %f2,%f10
1034
/* 0x0360 175 */ add %o2,8,%o2
1035
/* 0x0364 */ add %o1,32,%o5
1036
/* 0x0368 179 */ ld [%sp+2227],%f13
1037
/* 0x036c 178 */ fmovs %f2,%f4
1038
/* 0x0370 175 */ add %o0,32,%o1
1039
/* 0x0374 180 */ ld [%sp+2223],%f7
1040
/* 0x0378 175 */ add %o2,8,%o0
1041
/* 0x037c 180 */ cmp %i2,%g5
1042
/* 0x0380 179 */ st %g4,[%sp+2227]
1043
/* 0x0384 */ fsubd %f12,%f2,%f8
1044
/* 0x0388 180 */ add %g2,6,%g2
1045
/* 0x038c 179 */ std %f8,[%i1+%o3]
1046
/* 0x0390 180 */ fsubd %f0,%f2,%f0
1047
/* 0x0394 177 */ sra %i2,0,%o3
1048
/* 0x0398 180 */ std %f0,[%i1+%o7]
1049
/* 0x039c 178 */ fsubd %f10,%f2,%f0
1050
/* 0x03a0 180 */ add %i4,6,%i4
1051
/* 0x03a4 178 */ std %f0,[%i3+%o2]
1052
/* 0x03a8 */ sllx %o3,2,%o2
1053
/* 0x03ac 179 */ ld [%sp+2227],%f9
1054
/* 0x03b0 178 */ ld [%i0+%o4],%f5
1055
/* 0x03b4 179 */ fmovs %f2,%f8
1056
/* 0x03b8 */ fsubd %f8,%f2,%f0
1057
/* 0x03bc */ std %f0,[%i1+%o5]
1058
/* 0x03c0 180 */ fsubd %f6,%f2,%f0
1059
/* 0x03c4 */ std %f0,[%i1+%o1]
1060
/* 0x03c8 178 */ fsubd %f4,%f2,%f0
1061
/* 0x03cc 180 */ bge,pn %icc,.L77000164
1062
/* 0x03d0 */ std %f0,[%i3+%o0]
1064
/* 0x03d4 178 */ ldd [%g1],%f2
1066
/* 0x03d8 178 */ ld [%i0+%o2],%f5
1067
/* 0x03dc 179 */ sra %i4,0,%o0
1068
/* 0x03e0 180 */ add %i2,1,%i2
1069
/* 0x03e4 177 */ ld [%i0+%o2],%o1
1070
/* 0x03e8 178 */ sllx %o3,3,%o3
1071
/* 0x03ec 180 */ add %i4,2,%i4
1072
/* 0x03f0 178 */ fmovs %f2,%f4
1073
/* 0x03f4 179 */ sllx %o0,3,%o4
1074
/* 0x03f8 180 */ cmp %i2,%g5
1075
/* 0x03fc 179 */ and %o1,%g3,%o0
1076
/* 0x0400 178 */ fsubd %f4,%f2,%f0
1077
/* 0x0404 */ std %f0,[%i3+%o3]
1078
/* 0x0408 180 */ srl %o1,16,%o1
1079
/* 0x040c 179 */ st %o0,[%sp+2227]
1080
/* 0x0410 180 */ sra %g2,0,%o0
1081
/* 0x0414 */ add %g2,2,%g2
1082
/* 0x0418 177 */ sra %i2,0,%o3
1083
/* 0x041c 180 */ sllx %o0,3,%o0
1084
/* 0x0420 179 */ fmovs %f2,%f4
1085
/* 0x0424 */ sllx %o3,2,%o2
1086
/* 0x0428 */ ld [%sp+2227],%f5
1087
/* 0x042c */ fsubd %f4,%f2,%f0
1088
/* 0x0430 */ std %f0,[%i1+%o4]
1089
/* 0x0434 180 */ st %o1,[%sp+2223]
1090
/* 0x0438 */ fmovs %f2,%f4
1091
/* 0x043c */ ld [%sp+2223],%f5
1092
/* 0x0440 */ fsubd %f4,%f2,%f0
1093
/* 0x0444 */ std %f0,[%i1+%o0]
1094
/* 0x0448 */ bl,a,pt %icc,.L900000416
1095
/* 0x044c */ ldd [%g1],%f2
1097
/* 0x0450 */ ret ! Result =
1098
/* 0x0454 */ restore %g0,%g0,%g0
1099
/* 0x0458 0 */ .type conv_i32_to_d32_and_d16,2
1100
/* 0x0458 */ .size conv_i32_to_d32_and_d16,(.-conv_i32_to_d32_and_d16)
1102
.section ".text",#alloc,#execinstr
1103
/* 000000 0 */ .align 8
1105
! SUBROUTINE adjust_montf_result
1107
! OFFSET SOURCE LINE LABEL INSTRUCTION
1109
.global adjust_montf_result
1110
adjust_montf_result:
1111
/* 000000 */ save %sp,-176,%sp
1112
/* 0x0004 */ or %g0,%i2,%o1
1113
/* 0x0008 */ or %g0,%i0,%i2
1117
! 185 !void adjust_montf_result(unsigned int *i32, unsigned int *nint, int len)
1119
! 187 !long long acc;
1121
! 190 ! if(i32[len]>0) i=-1;
1123
/* 0x000c 190 */ sra %o1,0,%g2
1124
/* 0x0010 */ or %g0,-1,%o2
1125
/* 0x0014 */ sllx %g2,2,%g2
1126
/* 0x0018 */ ld [%i2+%g2],%g2
1127
/* 0x001c */ cmp %g2,0
1128
/* 0x0020 */ bleu,pn %icc,.L77000175
1129
/* 0x0024 */ or %g0,%i1,%i0
1130
/* 0x0028 */ ba .L900000511
1131
/* 0x002c */ cmp %o2,0
1136
! 193 ! for(i=len-1; i>=0; i--)
1138
/* 0x0030 193 */ sub %o1,1,%o2
1139
/* 0x0034 */ cmp %o2,0
1140
/* 0x0038 */ bl,pn %icc,.L77000182
1141
/* 0x003c */ sra %o2,0,%g2
1145
! 195 ! if(i32[i]!=nint[i]) break;
1147
/* 0x0040 195 */ sllx %g2,2,%g2
1148
/* 0x0044 */ sub %o2,1,%o0
1149
/* 0x0048 */ ld [%i1+%g2],%g3
1150
/* 0x004c */ ld [%i2+%g2],%g2
1151
/* 0x0050 */ cmp %g2,%g3
1152
/* 0x0054 */ bne,pn %icc,.L77000182
1154
/* 0x005c 0 */ or %g0,%o0,%o2
1155
/* 0x0060 195 */ cmp %o0,0
1156
/* 0x0064 */ bge,pt %icc,.L900000510
1157
/* 0x0068 */ sra %o2,0,%g2
1162
! 198 ! if((i<0)||(i32[i]>nint[i]))
1164
/* 0x006c 198 */ cmp %o2,0
1166
/* 0x0070 198 */ bl,pn %icc,.L77000198
1167
/* 0x0074 */ sra %o2,0,%g2
1168
/* 0x0078 */ sllx %g2,2,%g2
1169
/* 0x007c */ ld [%i1+%g2],%g3
1170
/* 0x0080 */ ld [%i2+%g2],%g2
1171
/* 0x0084 */ cmp %g2,%g3
1172
/* 0x0088 */ bleu,pt %icc,.L77000191
1178
! 201 ! for(i=0;i<len;i++)
1180
/* 0x0090 201 */ cmp %o1,0
1181
/* 0x0094 */ ble,pt %icc,.L77000191
1183
/* 0x009c 198 */ or %g0,-1,%g2
1184
/* 0x00a0 201 */ or %g0,%o1,%g3
1185
/* 0x00a4 198 */ srl %g2,0,%g2
1186
/* 0x00a8 */ sub %o1,1,%g4
1187
/* 0x00ac */ cmp %o1,9
1188
/* 0x00b0 201 */ or %g0,0,%i1
1189
/* 0x00b4 200 */ or %g0,0,%g5
1192
! 203 ! acc=acc+(unsigned long long)(i32[i])-(unsigned long long)(nint[i]);
1194
/* 0x00b8 203 */ or %g0,0,%o1
1195
/* 0x00bc 201 */ bl,pn %icc,.L77000199
1196
/* 0x00c0 */ sub %g3,4,%o7
1197
/* 0x00c4 203 */ ld [%i2],%o1
1199
! 204 ! i32[i]=acc&0xffffffff;
1200
! 205 ! acc=acc>>32;
1202
/* 0x00c8 205 */ or %g0,5,%i1
1203
/* 0x00cc 203 */ ld [%i0],%o2
1204
/* 0x00d0 201 */ or %g0,8,%o5
1205
/* 0x00d4 */ or %g0,12,%o4
1206
/* 0x00d8 203 */ ld [%i0+4],%o3
1207
/* 0x00dc 201 */ or %g0,16,%g1
1208
/* 0x00e0 203 */ ld [%i2+4],%o0
1209
/* 0x00e4 201 */ sub %o1,%o2,%o1
1210
/* 0x00e8 203 */ ld [%i0+8],%i3
1211
/* 0x00ec 204 */ and %o1,%g2,%g5
1212
/* 0x00f0 */ st %g5,[%i2]
1213
/* 0x00f4 205 */ srax %o1,32,%g5
1214
/* 0x00f8 201 */ sub %o0,%o3,%o0
1215
/* 0x00fc 203 */ ld [%i0+12],%o2
1216
/* 0x0100 201 */ add %o0,%g5,%o0
1217
/* 0x0104 204 */ and %o0,%g2,%g5
1218
/* 0x0108 */ st %g5,[%i2+4]
1219
/* 0x010c 205 */ srax %o0,32,%o0
1220
/* 0x0110 203 */ ld [%i2+8],%o1
1221
/* 0x0114 */ ld [%i2+12],%o3
1222
/* 0x0118 201 */ sub %o1,%i3,%o1
1224
/* 0x011c */ add %g1,4,%g3
1225
/* 0x0120 203 */ ld [%g1+%i2],%g5
1226
/* 0x0124 201 */ add %o1,%o0,%o0
1227
/* 0x0128 203 */ ld [%i0+%g1],%i3
1228
/* 0x012c 201 */ sub %o3,%o2,%o1
1229
/* 0x0130 204 */ and %o0,%g2,%o2
1230
/* 0x0134 */ st %o2,[%o5+%i2]
1231
/* 0x0138 205 */ srax %o0,32,%o2
1232
/* 0x013c */ add %i1,4,%i1
1233
/* 0x0140 201 */ add %g1,8,%o5
1234
/* 0x0144 203 */ ld [%g3+%i2],%o0
1235
/* 0x0148 201 */ add %o1,%o2,%o1
1236
/* 0x014c 203 */ ld [%i0+%g3],%o3
1237
/* 0x0150 201 */ sub %g5,%i3,%o2
1238
/* 0x0154 204 */ and %o1,%g2,%g5
1239
/* 0x0158 */ st %g5,[%o4+%i2]
1240
/* 0x015c 205 */ srax %o1,32,%g5
1241
/* 0x0160 */ cmp %i1,%o7
1242
/* 0x0164 201 */ add %g1,12,%o4
1243
/* 0x0168 203 */ ld [%o5+%i2],%o1
1244
/* 0x016c 201 */ add %o2,%g5,%o2
1245
/* 0x0170 203 */ ld [%i0+%o5],%i3
1246
/* 0x0174 201 */ sub %o0,%o3,%o0
1247
/* 0x0178 204 */ and %o2,%g2,%o3
1248
/* 0x017c */ st %o3,[%g1+%i2]
1249
/* 0x0180 205 */ srax %o2,32,%g5
1250
/* 0x0184 203 */ ld [%o4+%i2],%o3
1251
/* 0x0188 201 */ add %g1,16,%g1
1252
/* 0x018c */ add %o0,%g5,%o0
1253
/* 0x0190 203 */ ld [%i0+%o4],%o2
1254
/* 0x0194 201 */ sub %o1,%i3,%o1
1255
/* 0x0198 204 */ and %o0,%g2,%g5
1256
/* 0x019c */ st %g5,[%g3+%i2]
1257
/* 0x01a0 205 */ ble,pt %icc,.L900000505
1258
/* 0x01a4 */ srax %o0,32,%o0
1260
/* 0x01a8 */ add %o1,%o0,%g3
1261
/* 0x01ac */ sub %o3,%o2,%o1
1262
/* 0x01b0 203 */ ld [%g1+%i2],%o0
1263
/* 0x01b4 */ ld [%i0+%g1],%o2
1264
/* 0x01b8 205 */ srax %g3,32,%o7
1265
/* 0x01bc 204 */ and %g3,%g2,%o3
1266
/* 0x01c0 201 */ add %o1,%o7,%o1
1267
/* 0x01c4 204 */ st %o3,[%o5+%i2]
1268
/* 0x01c8 205 */ cmp %i1,%g4
1269
/* 0x01cc 201 */ sub %o0,%o2,%o0
1270
/* 0x01d0 204 */ and %o1,%g2,%o2
1271
/* 0x01d4 */ st %o2,[%o4+%i2]
1272
/* 0x01d8 205 */ srax %o1,32,%o1
1273
/* 0x01dc 203 */ sra %i1,0,%o2
1274
/* 0x01e0 201 */ add %o0,%o1,%o0
1275
/* 0x01e4 205 */ srax %o0,32,%g5
1276
/* 0x01e8 204 */ and %o0,%g2,%o1
1277
/* 0x01ec */ st %o1,[%g1+%i2]
1278
/* 0x01f0 205 */ bg,pn %icc,.L77000191
1279
/* 0x01f4 */ sllx %o2,2,%o1
1281
/* 0x01f8 0 */ or %g0,%o1,%g1
1283
/* 0x01fc 203 */ ld [%o1+%i2],%o0
1284
/* 0x0200 205 */ add %i1,1,%i1
1285
/* 0x0204 203 */ ld [%i0+%o1],%o1
1286
/* 0x0208 */ sra %i1,0,%o2
1287
/* 0x020c 205 */ cmp %i1,%g4
1288
/* 0x0210 203 */ add %g5,%o0,%o0
1289
/* 0x0214 */ sub %o0,%o1,%o0
1290
/* 0x0218 205 */ srax %o0,32,%g5
1291
/* 0x021c 204 */ and %o0,%g2,%o1
1292
/* 0x0220 */ st %o1,[%g1+%i2]
1293
/* 0x0224 */ sllx %o2,2,%o1
1294
/* 0x0228 205 */ ble,pt %icc,.L900000509
1295
/* 0x022c */ or %g0,%o1,%g1
1297
/* 0x0230 */ ret ! Result =
1298
/* 0x0234 */ restore %g0,%g0,%g0
1299
/* 0x0238 0 */ .type adjust_montf_result,2
1300
/* 0x0238 */ .size adjust_montf_result,(.-adjust_montf_result)
1302
.section ".text",#alloc,#execinstr
1303
/* 000000 0 */ .align 8
1304
/* 000000 */ .skip 24
1306
! SUBROUTINE mont_mulf_noconv
1308
! OFFSET SOURCE LINE LABEL INSTRUCTION
1310
.global mont_mulf_noconv
1312
/* 000000 */ save %sp,-224,%sp
1314
/* 0x0004 */ call .+8
1315
/* 0x0008 */ sethi /*X*/%hi(_GLOBAL_OFFSET_TABLE_-(.L900000643-.)),%g5
1316
/* 0x000c */ ldx [%fp+2223],%l0
1322
! 214 !** the lengths of the input arrays should be at least the following:
1323
! 215 !** result[nlen+1], dm1[nlen], dm2[2*nlen+1], dt[4*nlen+2], dn[nlen], nint[nlen]
1324
! 216 !** all of them should be different from one another
1327
! 219 !void mont_mulf_noconv(unsigned int *result,
1328
! 220 ! double *dm1, double *dm2, double *dt,
1329
! 221 ! double *dn, unsigned int *nint,
1330
! 222 ! int nlen, double dn0)
1332
! 224 ! int i, j, jj;
1334
! 226 ! double digit, m2j, nextm2j, a, b;
1335
! 227 ! double *dptmp, *pdm1, *pdm2, *pdn, *pdtj, pdn_0, pdm1_0;
1336
! 229 ! pdm1=&(dm1[0]);
1337
! 230 ! pdm2=&(dm2[0]);
1338
! 231 ! pdn=&(dn[0]);
1339
! 232 ! pdm2[2*nlen]=Zero;
1341
/* 0x0010 232 */ sethi %hi(Zero),%g2
1342
/* 0x0014 223 */ fmovd %f14,%f30
1343
/* 0x0018 */ add %g5,/*X*/%lo(_GLOBAL_OFFSET_TABLE_-(.L900000643-.)),%g5
1344
/* 0x001c 232 */ add %g2,%lo(Zero),%g2
1345
/* 0x0020 */ sll %l0,1,%o3
1346
/* 0x0024 223 */ add %g5,%o7,%o4
1347
/* 0x0028 232 */ sra %o3,0,%g5
1348
/* 0x002c */ ldx [%o4+%g2],%o7
1350
! 234 ! if (nlen!=16)
1352
! 236 ! for(i=0;i<4*nlen+2;i++) dt[i]=Zero;
1353
! 238 ! a=dt[0]=pdm1[0]*pdm2[0];
1354
! 239 ! digit=mod(lower32(a,Zero)*dn0,TwoToMinus16,TwoTo16);
1356
/* 0x0030 239 */ sethi %hi(TwoToMinus16),%g3
1357
/* 0x0034 */ sethi %hi(TwoTo16),%g4
1358
/* 0x0038 */ add %g3,%lo(TwoToMinus16),%g2
1359
/* 0x003c 232 */ ldd [%o7],%f0
1360
/* 0x0040 239 */ add %g4,%lo(TwoTo16),%g3
1361
/* 0x0044 223 */ or %g0,%i4,%o0
1362
/* 0x0048 232 */ sllx %g5,3,%g4
1363
/* 0x004c 239 */ ldx [%o4+%g2],%o5
1364
/* 0x0050 223 */ or %g0,%i5,%l3
1365
/* 0x0054 */ or %g0,%i0,%l2
1366
/* 0x0058 239 */ ldx [%o4+%g3],%o4
1367
/* 0x005c 234 */ cmp %l0,16
1368
/* 0x0060 232 */ std %f0,[%i2+%g4]
1369
/* 0x0064 234 */ be,pn %icc,.L77000279
1370
/* 0x0068 */ or %g0,%i3,%l4
1371
/* 0x006c 236 */ sll %l0,2,%g2
1372
/* 0x0070 223 */ or %g0,%o0,%i5
1373
/* 0x0074 236 */ add %g2,2,%o0
1374
/* 0x0078 223 */ or %g0,%i1,%i4
1375
/* 0x007c 236 */ cmp %o0,0
1376
/* 0x0080 223 */ or %g0,%i2,%l1
1377
/* 0x0084 236 */ ble,a,pt %icc,.L900000657
1378
/* 0x0088 */ ldd [%i1],%f6
1380
! 241 ! pdtj=&(dt[0]);
1381
! 242 ! for(j=jj=0;j<2*nlen;j++,jj++,pdtj++)
1383
! 244 ! m2j=pdm2[j];
1384
! 245 ! a=pdtj[0]+pdn[0]*digit;
1385
! 246 ! b=pdtj[1]+pdm1[0]*pdm2[j+1]+a*TwoToMinus16;
1387
! 249 !#pragma pipeloop(0)
1388
! 250 ! for(i=1;i<nlen;i++)
1390
! 252 ! pdtj[2*i]+=pdm1[i]*m2j+pdn[i]*digit;
1392
! 254 ! if((jj==30)) {cleanup(dt,j/2+1,2*nlen+1); jj=0;}
1394
! 256 ! digit=mod(lower32(b,Zero)*dn0,TwoToMinus16,TwoTo16);
1399
! 261 ! a=dt[0]=pdm1[0]*pdm2[0];
1400
! 263 ! dt[65]= dt[64]= dt[63]= dt[62]= dt[61]= dt[60]=
1401
! 264 ! dt[59]= dt[58]= dt[57]= dt[56]= dt[55]= dt[54]=
1402
! 265 ! dt[53]= dt[52]= dt[51]= dt[50]= dt[49]= dt[48]=
1403
! 266 ! dt[47]= dt[46]= dt[45]= dt[44]= dt[43]= dt[42]=
1404
! 267 ! dt[41]= dt[40]= dt[39]= dt[38]= dt[37]= dt[36]=
1405
! 268 ! dt[35]= dt[34]= dt[33]= dt[32]= dt[31]= dt[30]=
1406
! 269 ! dt[29]= dt[28]= dt[27]= dt[26]= dt[25]= dt[24]=
1407
! 270 ! dt[23]= dt[22]= dt[21]= dt[20]= dt[19]= dt[18]=
1408
! 271 ! dt[17]= dt[16]= dt[15]= dt[14]= dt[13]= dt[12]=
1409
! 272 ! dt[11]= dt[10]= dt[ 9]= dt[ 8]= dt[ 7]= dt[ 6]=
1410
! 273 ! dt[ 5]= dt[ 4]= dt[ 3]= dt[ 2]= dt[ 1]=Zero;
1411
! 275 ! pdn_0=pdn[0];
1412
! 276 ! pdm1_0=pdm1[0];
1413
! 278 ! digit=mod(lower32(a,Zero)*dn0,TwoToMinus16,TwoTo16);
1414
! 279 ! pdtj=&(dt[0]);
1415
! 281 ! for(j=0;j<32;j++,pdtj++)
1417
/* 0x008c 281 */ or %g0,%o0,%o1
1418
/* 0x0090 236 */ sub %o0,1,%g1
1419
/* 0x0094 */ or %g0,0,%g2
1420
/* 0x0098 281 */ cmp %o1,5
1421
/* 0x009c */ bl,pn %icc,.L77000280
1422
/* 0x00a0 */ or %g0,8,%o0
1423
/* 0x00a4 */ std %f0,[%i3]
1424
/* 0x00a8 */ or %g0,2,%g2
1425
/* 0x00ac */ sub %g1,2,%o1
1427
/* 0x00b0 */ add %o0,8,%g3
1428
/* 0x00b4 */ std %f0,[%i3+%o0]
1429
/* 0x00b8 */ add %g2,3,%g2
1430
/* 0x00bc */ add %o0,16,%o2
1431
/* 0x00c0 */ std %f0,[%i3+%g3]
1432
/* 0x00c4 */ cmp %g2,%o1
1433
/* 0x00c8 */ add %o0,24,%o0
1434
/* 0x00cc */ ble,pt %icc,.L900000627
1435
/* 0x00d0 */ std %f0,[%i3+%o2]
1437
/* 0x00d4 */ cmp %g2,%g1
1438
/* 0x00d8 */ bg,pn %icc,.L77000285
1439
/* 0x00dc */ std %f0,[%i3+%o0]
1441
/* 0x00e0 */ ldd [%o7],%f0
1443
/* 0x00e4 */ sra %g2,0,%o0
1444
/* 0x00e8 */ add %g2,1,%g2
1445
/* 0x00ec */ sllx %o0,3,%o0
1446
/* 0x00f0 */ cmp %g2,%g1
1447
/* 0x00f4 */ std %f0,[%i3+%o0]
1448
/* 0x00f8 */ ble,a,pt %icc,.L900000656
1449
/* 0x00fc */ ldd [%o7],%f0
1451
/* 0x0100 238 */ ldd [%i1],%f6
1453
/* 0x0104 238 */ ldd [%i2],%f8
1454
/* 0x0108 242 */ cmp %o3,0
1455
/* 0x010c */ sub %o3,1,%o1
1456
/* 0x0110 239 */ ldd [%o7],%f10
1457
/* 0x0114 */ add %o3,1,%o2
1458
/* 0x0118 0 */ or %g0,0,%i2
1459
/* 0x011c 238 */ fmuld %f6,%f8,%f6
1460
/* 0x0120 */ std %f6,[%i3]
1461
/* 0x0124 0 */ or %g0,0,%g3
1462
/* 0x0128 239 */ ldd [%o5],%f8
1463
/* 0x012c 0 */ or %g0,%o2,%g1
1464
/* 0x0130 236 */ sub %l0,1,%i1
1465
/* 0x0134 239 */ ldd [%o4],%f12
1466
/* 0x0138 236 */ or %g0,1,%g4
1467
/* 0x013c */ fdtox %f6,%f0
1468
/* 0x0140 */ fmovs %f10,%f0
1469
/* 0x0144 */ fxtod %f0,%f6
1470
/* 0x0148 239 */ fmuld %f6,%f14,%f6
1471
/* 0x014c */ fmuld %f6,%f8,%f8
1472
/* 0x0150 */ fdtox %f8,%f8
1473
/* 0x0154 */ fxtod %f8,%f8
1474
/* 0x0158 */ fmuld %f8,%f12,%f8
1475
/* 0x015c */ fsubd %f6,%f8,%f20
1476
/* 0x0160 242 */ ble,pt %icc,.L900000650
1477
/* 0x0164 */ sllx %g5,3,%g2
1478
/* 0x0168 0 */ st %o1,[%sp+2223]
1479
/* 0x016c 246 */ ldd [%i5],%f6
1481
/* 0x0170 246 */ sra %g4,0,%g2
1482
/* 0x0174 */ fmuld %f6,%f20,%f6
1483
/* 0x0178 */ ldd [%i3],%f12
1484
/* 0x017c */ sllx %g2,3,%g2
1485
/* 0x0180 */ ldd [%i4],%f8
1486
/* 0x0184 250 */ cmp %l0,1
1487
/* 0x0188 246 */ ldd [%l1+%g2],%f10
1488
/* 0x018c 244 */ sra %i2,0,%g2
1489
/* 0x0190 */ add %i2,1,%i0
1490
/* 0x0194 246 */ faddd %f12,%f6,%f6
1491
/* 0x0198 */ ldd [%o5],%f12
1492
/* 0x019c 244 */ sllx %g2,3,%g2
1493
/* 0x01a0 246 */ fmuld %f8,%f10,%f8
1494
/* 0x01a4 */ ldd [%i3+8],%f10
1495
/* 0x01a8 */ srl %i2,31,%o3
1496
/* 0x01ac 244 */ ldd [%l1+%g2],%f18
1497
/* 0x01b0 0 */ or %g0,1,%l5
1498
/* 0x01b4 236 */ or %g0,2,%g2
1499
/* 0x01b8 246 */ fmuld %f6,%f12,%f6
1500
/* 0x01bc 250 */ or %g0,32,%o1
1501
/* 0x01c0 */ or %g0,48,%o2
1502
/* 0x01c4 246 */ faddd %f10,%f8,%f8
1503
/* 0x01c8 */ faddd %f8,%f6,%f16
1504
/* 0x01cc 250 */ ble,pn %icc,.L77000213
1505
/* 0x01d0 */ std %f16,[%i3+8]
1506
/* 0x01d4 */ cmp %i1,8
1507
/* 0x01d8 */ sub %l0,3,%o3
1508
/* 0x01dc */ bl,pn %icc,.L77000284
1509
/* 0x01e0 */ or %g0,8,%o0
1510
/* 0x01e4 252 */ ldd [%i5+8],%f0
1511
/* 0x01e8 */ or %g0,6,%l5
1512
/* 0x01ec */ ldd [%i4+8],%f2
1513
/* 0x01f0 */ or %g0,4,%g2
1514
/* 0x01f4 250 */ or %g0,40,%o0
1515
/* 0x01f8 252 */ ldd [%i5+16],%f8
1516
/* 0x01fc */ fmuld %f0,%f20,%f10
1517
/* 0x0200 */ ldd [%i4+16],%f4
1518
/* 0x0204 */ fmuld %f2,%f18,%f2
1519
/* 0x0208 */ ldd [%i3+16],%f0
1520
/* 0x020c */ fmuld %f8,%f20,%f12
1521
/* 0x0210 */ ldd [%i4+24],%f6
1522
/* 0x0214 */ fmuld %f4,%f18,%f4
1523
/* 0x0218 */ ldd [%i5+24],%f8
1524
/* 0x021c */ faddd %f2,%f10,%f2
1525
/* 0x0220 */ ldd [%i4+32],%f14
1526
/* 0x0224 */ fmuld %f6,%f18,%f10
1527
/* 0x0228 */ ldd [%i5+32],%f6
1528
/* 0x022c */ faddd %f4,%f12,%f4
1529
/* 0x0230 */ ldd [%i4+40],%f12
1530
/* 0x0234 */ faddd %f0,%f2,%f0
1531
/* 0x0238 */ std %f0,[%i3+16]
1532
/* 0x023c */ ldd [%i3+32],%f0
1533
/* 0x0240 */ ldd [%i3+48],%f2
1535
/* 0x0244 */ add %o2,16,%l6
1536
/* 0x0248 252 */ ldd [%i5+%o0],%f22
1537
/* 0x024c */ add %l5,3,%l5
1538
/* 0x0250 */ fmuld %f8,%f20,%f8
1539
/* 0x0254 250 */ add %o0,8,%o0
1540
/* 0x0258 252 */ ldd [%l6+%i3],%f26
1541
/* 0x025c */ cmp %l5,%o3
1542
/* 0x0260 */ ldd [%i4+%o0],%f24
1543
/* 0x0264 */ faddd %f0,%f4,%f0
1544
/* 0x0268 */ add %g2,6,%g2
1545
/* 0x026c */ faddd %f10,%f8,%f10
1546
/* 0x0270 */ fmuld %f14,%f18,%f4
1547
/* 0x0274 */ std %f0,[%o1+%i3]
1548
/* 0x0278 250 */ add %o2,32,%o1
1549
/* 0x027c 252 */ ldd [%i5+%o0],%f8
1550
/* 0x0280 */ fmuld %f6,%f20,%f6
1551
/* 0x0284 250 */ add %o0,8,%o0
1552
/* 0x0288 252 */ ldd [%o1+%i3],%f0
1553
/* 0x028c */ ldd [%i4+%o0],%f14
1554
/* 0x0290 */ faddd %f2,%f10,%f2
1555
/* 0x0294 */ faddd %f4,%f6,%f10
1556
/* 0x0298 */ fmuld %f12,%f18,%f4
1557
/* 0x029c */ std %f2,[%o2+%i3]
1558
/* 0x02a0 250 */ add %o2,48,%o2
1559
/* 0x02a4 252 */ ldd [%i5+%o0],%f6
1560
/* 0x02a8 */ fmuld %f22,%f20,%f22
1561
/* 0x02ac 250 */ add %o0,8,%o0
1562
/* 0x02b0 252 */ ldd [%o2+%i3],%f2
1563
/* 0x02b4 */ ldd [%i4+%o0],%f12
1564
/* 0x02b8 */ faddd %f26,%f10,%f10
1565
/* 0x02bc */ std %f10,[%l6+%i3]
1566
/* 0x02c0 */ fmuld %f24,%f18,%f10
1567
/* 0x02c4 */ ble,pt %icc,.L900000639
1568
/* 0x02c8 */ faddd %f4,%f22,%f4
1570
/* 0x02cc 252 */ fmuld %f8,%f20,%f24
1571
/* 0x02d0 */ faddd %f0,%f4,%f8
1572
/* 0x02d4 250 */ add %o2,16,%o3
1573
/* 0x02d8 252 */ ldd [%o3+%i3],%f4
1574
/* 0x02dc */ fmuld %f14,%f18,%f0
1575
/* 0x02e0 */ cmp %l5,%i1
1576
/* 0x02e4 */ std %f8,[%o1+%i3]
1577
/* 0x02e8 */ fmuld %f12,%f18,%f8
1578
/* 0x02ec 250 */ add %o2,32,%o1
1579
/* 0x02f0 252 */ faddd %f10,%f24,%f12
1580
/* 0x02f4 */ ldd [%i5+%o0],%f22
1581
/* 0x02f8 */ fmuld %f6,%f20,%f6
1582
/* 0x02fc */ add %g2,8,%g2
1583
/* 0x0300 */ fmuld %f22,%f20,%f10
1584
/* 0x0304 */ faddd %f2,%f12,%f2
1585
/* 0x0308 */ faddd %f0,%f6,%f6
1586
/* 0x030c */ ldd [%o1+%i3],%f0
1587
/* 0x0310 */ std %f2,[%o2+%i3]
1588
/* 0x0314 */ faddd %f8,%f10,%f2
1589
/* 0x0318 */ sra %l5,0,%o2
1590
/* 0x031c */ sllx %o2,3,%o0
1591
/* 0x0320 */ faddd %f4,%f6,%f4
1592
/* 0x0324 */ std %f4,[%o3+%i3]
1593
/* 0x0328 */ faddd %f0,%f2,%f0
1594
/* 0x032c */ std %f0,[%o1+%i3]
1595
/* 0x0330 */ bg,a,pn %icc,.L77000213
1596
/* 0x0334 */ srl %i2,31,%o3
1598
/* 0x0338 252 */ ldd [%i4+%o0],%f2
1600
/* 0x033c 252 */ ldd [%i5+%o0],%f0
1601
/* 0x0340 */ fmuld %f2,%f18,%f2
1602
/* 0x0344 */ sra %g2,0,%o0
1603
/* 0x0348 */ sllx %o0,3,%o1
1604
/* 0x034c */ add %l5,1,%l5
1605
/* 0x0350 */ fmuld %f0,%f20,%f4
1606
/* 0x0354 */ ldd [%o1+%i3],%f0
1607
/* 0x0358 */ sra %l5,0,%o2
1608
/* 0x035c */ sllx %o2,3,%o0
1609
/* 0x0360 */ add %g2,2,%g2
1610
/* 0x0364 */ cmp %l5,%i1
1611
/* 0x0368 */ faddd %f2,%f4,%f2
1612
/* 0x036c */ faddd %f0,%f2,%f0
1613
/* 0x0370 */ std %f0,[%o1+%i3]
1614
/* 0x0374 */ ble,a,pt %icc,.L900000655
1615
/* 0x0378 */ ldd [%i4+%o0],%f2
1617
/* 0x037c */ srl %i2,31,%o3
1618
/* 0x0380 252 */ ba .L900000654
1619
/* 0x0384 */ cmp %g3,30
1621
/* 0x0388 254 */ cmp %g3,30
1623
/* 0x038c */ add %i2,%o3,%o0
1624
/* 0x0390 254 */ bne,a,pt %icc,.L900000653
1625
/* 0x0394 */ fdtox %f16,%f0
1626
/* 0x0398 281 */ sra %o0,1,%g2
1627
/* 0x039c */ add %g2,1,%g2
1628
/* 0x03a0 */ ldd [%o7],%f0
1629
/* 0x03a4 */ sll %g2,1,%o1
1630
/* 0x03a8 */ sll %g1,1,%g2
1631
/* 0x03ac */ or %g0,%o1,%o2
1632
/* 0x03b0 */ fmovd %f0,%f2
1633
/* 0x03b4 */ or %g0,%g2,%o0
1634
/* 0x03b8 */ cmp %o1,%o0
1635
/* 0x03bc */ sub %g2,1,%o0
1636
/* 0x03c0 */ bge,pt %icc,.L77000215
1637
/* 0x03c4 */ or %g0,0,%g3
1638
/* 0x03c8 254 */ add %o1,1,%o1
1639
/* 0x03cc 281 */ sra %o2,0,%g2
1641
/* 0x03d0 */ sllx %g2,3,%g2
1642
/* 0x03d4 */ ldd [%o7],%f6
1643
/* 0x03d8 */ add %o2,2,%o2
1644
/* 0x03dc */ sra %o1,0,%g3
1645
/* 0x03e0 */ ldd [%g2+%l4],%f8
1646
/* 0x03e4 */ cmp %o2,%o0
1647
/* 0x03e8 */ sllx %g3,3,%g3
1648
/* 0x03ec */ add %o1,2,%o1
1649
/* 0x03f0 */ ldd [%l4+%g3],%f10
1650
/* 0x03f4 */ fdtox %f8,%f12
1651
/* 0x03f8 */ fdtox %f10,%f4
1652
/* 0x03fc */ fmovd %f12,%f8
1653
/* 0x0400 */ fmovs %f6,%f12
1654
/* 0x0404 */ fmovs %f6,%f4
1655
/* 0x0408 */ fxtod %f12,%f6
1656
/* 0x040c */ fxtod %f4,%f12
1657
/* 0x0410 */ fdtox %f10,%f4
1658
/* 0x0414 */ faddd %f6,%f2,%f6
1659
/* 0x0418 */ std %f6,[%g2+%l4]
1660
/* 0x041c */ faddd %f12,%f0,%f6
1661
/* 0x0420 */ std %f6,[%l4+%g3]
1662
/* 0x0424 */ fitod %f8,%f2
1663
/* 0x0428 */ fitod %f4,%f0
1664
/* 0x042c */ ble,pt %icc,.L900000652
1665
/* 0x0430 */ sra %o2,0,%g2
1667
/* 0x0434 */ or %g0,0,%g3
1669
/* 0x0438 */ fdtox %f16,%f0
1671
/* 0x043c 256 */ ldd [%o7],%f6
1672
/* 0x0440 */ add %g4,1,%g4
1673
/* 0x0444 */ or %g0,%i0,%i2
1674
/* 0x0448 */ ldd [%o5],%f8
1675
/* 0x044c */ add %g3,1,%g3
1676
/* 0x0450 */ add %i3,8,%i3
1677
/* 0x0454 */ fmovs %f6,%f0
1678
/* 0x0458 */ ldd [%o4],%f10
1679
/* 0x045c */ ld [%sp+2223],%o0
1680
/* 0x0460 */ fxtod %f0,%f6
1681
/* 0x0464 */ cmp %i0,%o0
1682
/* 0x0468 */ fmuld %f6,%f30,%f6
1683
/* 0x046c */ fmuld %f6,%f8,%f8
1684
/* 0x0470 */ fdtox %f8,%f8
1685
/* 0x0474 */ fxtod %f8,%f8
1686
/* 0x0478 */ fmuld %f8,%f10,%f8
1687
/* 0x047c */ fsubd %f6,%f8,%f20
1688
/* 0x0480 */ ble,a,pt %icc,.L900000651
1689
/* 0x0484 */ ldd [%i5],%f6
1691
/* 0x0488 256 */ ba .L900000650
1692
/* 0x048c */ sllx %g5,3,%g2
1694
/* 0x0490 261 */ ldd [%i1],%f4
1695
/* 0x0494 */ ldd [%i2],%f6
1696
/* 0x0498 273 */ std %f0,[%i3+8]
1697
/* 0x049c */ std %f0,[%i3+16]
1698
/* 0x04a0 261 */ fmuld %f4,%f6,%f6
1699
/* 0x04a4 */ std %f6,[%i3]
1700
/* 0x04a8 273 */ std %f0,[%i3+24]
1701
/* 0x04ac */ std %f0,[%i3+32]
1702
/* 0x04b0 */ fdtox %f6,%f2
1703
/* 0x04b4 */ std %f0,[%i3+40]
1704
/* 0x04b8 */ std %f0,[%i3+48]
1705
/* 0x04bc */ std %f0,[%i3+56]
1706
/* 0x04c0 */ std %f0,[%i3+64]
1707
/* 0x04c4 */ fmovs %f0,%f2
1708
/* 0x04c8 */ std %f0,[%i3+72]
1709
/* 0x04cc */ std %f0,[%i3+80]
1710
/* 0x04d0 */ std %f0,[%i3+88]
1711
/* 0x04d4 */ std %f0,[%i3+96]
1712
/* 0x04d8 */ std %f0,[%i3+104]
1713
/* 0x04dc */ std %f0,[%i3+112]
1714
/* 0x04e0 */ std %f0,[%i3+120]
1715
/* 0x04e4 */ std %f0,[%i3+128]
1716
/* 0x04e8 */ std %f0,[%i3+136]
1717
/* 0x04ec */ std %f0,[%i3+144]
1718
/* 0x04f0 */ std %f0,[%i3+152]
1719
/* 0x04f4 */ std %f0,[%i3+160]
1720
/* 0x04f8 */ std %f0,[%i3+168]
1721
/* 0x04fc */ fxtod %f2,%f6
1722
/* 0x0500 */ std %f0,[%i3+176]
1723
/* 0x0504 281 */ or %g0,1,%o2
1724
/* 0x0508 273 */ std %f0,[%i3+184]
1727
! 284 ! m2j=pdm2[j];
1728
! 285 ! a=pdtj[0]+pdn_0*digit;
1729
! 286 ! b=pdtj[1]+pdm1_0*pdm2[j+1]+a*TwoToMinus16;
1731
/* 0x050c 286 */ sra %o2,0,%g2
1732
/* 0x0510 279 */ or %g0,%i3,%o3
1733
/* 0x0514 273 */ std %f0,[%i3+192]
1734
/* 0x0518 278 */ fmuld %f6,%f14,%f6
1735
/* 0x051c 281 */ or %g0,0,%g1
1736
/* 0x0520 273 */ std %f0,[%i3+200]
1737
/* 0x0524 */ std %f0,[%i3+208]
1738
/* 0x0528 */ std %f0,[%i3+216]
1739
/* 0x052c */ std %f0,[%i3+224]
1740
/* 0x0530 */ std %f0,[%i3+232]
1741
/* 0x0534 */ std %f0,[%i3+240]
1742
/* 0x0538 */ std %f0,[%i3+248]
1743
/* 0x053c */ std %f0,[%i3+256]
1744
/* 0x0540 */ std %f0,[%i3+264]
1745
/* 0x0544 */ std %f0,[%i3+272]
1746
/* 0x0548 */ std %f0,[%i3+280]
1747
/* 0x054c */ std %f0,[%i3+288]
1748
/* 0x0550 */ std %f0,[%i3+296]
1749
/* 0x0554 */ std %f0,[%i3+304]
1750
/* 0x0558 */ std %f0,[%i3+312]
1751
/* 0x055c */ std %f0,[%i3+320]
1752
/* 0x0560 */ std %f0,[%i3+328]
1753
/* 0x0564 */ std %f0,[%i3+336]
1754
/* 0x0568 */ std %f0,[%i3+344]
1755
/* 0x056c */ std %f0,[%i3+352]
1756
/* 0x0570 */ std %f0,[%i3+360]
1757
/* 0x0574 */ std %f0,[%i3+368]
1758
/* 0x0578 */ std %f0,[%i3+376]
1759
/* 0x057c */ std %f0,[%i3+384]
1760
/* 0x0580 */ std %f0,[%i3+392]
1761
/* 0x0584 */ std %f0,[%i3+400]
1762
/* 0x0588 */ std %f0,[%i3+408]
1763
/* 0x058c */ std %f0,[%i3+416]
1764
/* 0x0590 */ std %f0,[%i3+424]
1765
/* 0x0594 */ std %f0,[%i3+432]
1766
/* 0x0598 */ std %f0,[%i3+440]
1767
/* 0x059c */ std %f0,[%i3+448]
1768
/* 0x05a0 */ std %f0,[%i3+456]
1769
/* 0x05a4 */ std %f0,[%i3+464]
1770
/* 0x05a8 */ std %f0,[%i3+472]
1771
/* 0x05ac */ std %f0,[%i3+480]
1772
/* 0x05b0 */ std %f0,[%i3+488]
1773
/* 0x05b4 */ std %f0,[%i3+496]
1774
/* 0x05b8 278 */ ldd [%o5],%f8
1775
/* 0x05bc */ ldd [%o4],%f10
1776
/* 0x05c0 */ fmuld %f6,%f8,%f8
1777
/* 0x05c4 273 */ std %f0,[%i3+504]
1778
/* 0x05c8 */ std %f0,[%i3+512]
1779
/* 0x05cc */ std %f0,[%i3+520]
1780
/* 0x05d0 */ fdtox %f8,%f8
1781
/* 0x05d4 275 */ ldd [%o0],%f0
1782
/* 0x05d8 */ fxtod %f8,%f8
1783
/* 0x05dc */ fmuld %f8,%f10,%f8
1784
/* 0x05e0 */ fsubd %f6,%f8,%f2
1787
! 289 ! /**** this loop will be fully unrolled:
1788
! 290 ! for(i=1;i<16;i++)
1790
! 292 ! pdtj[2*i]+=pdm1[i]*m2j+pdn[i]*digit;
1792
! 294 ! *************************************/
1793
! 295 ! pdtj[2]+=pdm1[1]*m2j+pdn[1]*digit;
1794
! 296 ! pdtj[4]+=pdm1[2]*m2j+pdn[2]*digit;
1795
! 297 ! pdtj[6]+=pdm1[3]*m2j+pdn[3]*digit;
1796
! 298 ! pdtj[8]+=pdm1[4]*m2j+pdn[4]*digit;
1797
! 299 ! pdtj[10]+=pdm1[5]*m2j+pdn[5]*digit;
1798
! 300 ! pdtj[12]+=pdm1[6]*m2j+pdn[6]*digit;
1799
! 301 ! pdtj[14]+=pdm1[7]*m2j+pdn[7]*digit;
1800
! 302 ! pdtj[16]+=pdm1[8]*m2j+pdn[8]*digit;
1801
! 303 ! pdtj[18]+=pdm1[9]*m2j+pdn[9]*digit;
1802
! 304 ! pdtj[20]+=pdm1[10]*m2j+pdn[10]*digit;
1803
! 305 ! pdtj[22]+=pdm1[11]*m2j+pdn[11]*digit;
1804
! 306 ! pdtj[24]+=pdm1[12]*m2j+pdn[12]*digit;
1805
! 307 ! pdtj[26]+=pdm1[13]*m2j+pdn[13]*digit;
1806
! 308 ! pdtj[28]+=pdm1[14]*m2j+pdn[14]*digit;
1807
! 309 ! pdtj[30]+=pdm1[15]*m2j+pdn[15]*digit;
1808
! 310 ! /* no need for cleenup, cannot overflow */
1809
! 311 ! digit=mod(lower32(b,Zero)*dn0,TwoToMinus16,TwoTo16);
1812
fmovd %f2,%f0 ! hand modified
1813
fmovd %f30,%f18 ! hand modified
1817
ldd [%o5],%f14 ! hand modified
1818
ldd [%o4],%f16 ! hand modified
1835
fmuld %f0,%f2,%f4 !2
1837
fmuld %f26,%f24,%f20 !3
1839
fmuld %f28,%f0,%f22 !4
1841
fmuld %f32,%f24,%f32 !5
1844
fmuld %f36,%f0,%f36 !6
1847
fmuld %f42,%f24,%f42 !7
1849
faddd %f20,%f22,%f20
1850
fmuld %f44,%f0,%f44 !8
1852
fmuld %f10,%f6,%f12 !9
1854
faddd %f32,%f36,%f32
1855
fmuld %f14,%f4,%f4 !10
1857
fmuld %f30,%f24,%f48 !11
1859
faddd %f20,%f22,%f20
1860
fmuld %f50,%f0,%f50 !12
1862
faddd %f42,%f44,%f42
1863
fmuld %f52,%f24,%f52 !13
1866
fmuld %f56,%f0,%f56 !14
1868
faddd %f32,%f36,%f32 !15
1870
faddd %f48,%f50,%f48 !16
1872
faddd %f52,%f56,%f52 !17
1875
fmuld %f20,%f24,%f20 !18
1877
faddd %f42,%f44,%f42
1878
fmuld %f22,%f0,%f22 !19
1880
faddd %f48,%f50,%f48
1881
fmuld %f34,%f24,%f32 !20
1883
faddd %f52,%f56,%f52
1884
fmuld %f38,%f0,%f36 !21
1888
faddd %f20,%f22,%f20 !23
1889
ldd [%o0+120],%f44 !24
1891
faddd %f32,%f36,%f32
1892
fmuld %f42,%f24,%f42 !25
1896
fmuld %f44,%f0,%f44 !27
1898
fmuld %f40,%f24,%f48 !28
1900
faddd %f20,%f22,%f20
1901
fmuld %f50,%f0,%f50 !29
1904
fmuld %f52,%f24,%f52 !30
1906
faddd %f42,%f44,%f42
1907
fmuld %f56,%f0,%f56 !31
1909
faddd %f32,%f36,%f32 !32
1911
faddd %f48,%f50,%f48
1912
fmuld %f46,%f24,%f20 !33
1914
fmuld %f4,%f18,%f12 !34
1916
faddd %f52,%f56,%f52
1917
fmuld %f22,%f0,%f22 !35
1919
faddd %f42,%f44,%f42 !36
1921
faddd %f48,%f50,%f48
1922
fmuld %f54,%f24,%f32 !37
1924
fmuld %f12,%f14,%f4 !38
1926
faddd %f52,%f56,%f56 ! yes, tmp52!
1927
fmuld %f36,%f0,%f36 !39
1929
faddd %f20,%f22,%f20 !40
1931
fmuld %f58,%f24,%f52 !41
1934
fmuld %f42,%f24,%f42 !42
1935
std %f56,[%o3+64] ! yes, tmp52!
1936
faddd %f32,%f36,%f32
1937
fmuld %f44,%f0,%f44 !43
1939
fmuld %f48,%f24,%f48 !44
1942
fmuld %f50,%f0,%f50 !45
1944
fmuld %f60,%f0,%f56 !46
1946
faddd %f42,%f44,%f42 !47
1947
ldd [%o3+160-8],%f44
1948
faddd %f20,%f22,%f20 !48
1950
faddd %f48,%f50,%f48 !49
1951
ldd [%o3+192-8],%f50
1952
faddd %f52,%f56,%f52
1953
fmuld %f4,%f16,%f4 !50
1954
ldd [%o3+224-8],%f56
1955
faddd %f32,%f36,%f32 !51
1956
std %f32,[%o3+128-8]
1957
faddd %f42,%f44,%f42 !52
1959
std %f42,[%o3+160-8]
1960
faddd %f48,%f50,%f48 !53
1962
std %f48,[%o3+192-8]
1963
fsubd %f12,%f4,%f0 !54
1964
faddd %f52,%f56,%f52
1965
ble,pt %icc,.L99999999
1966
std %f52,[%o3+224-8] !55
1970
! 315 ! conv_d16_to_i32(result,dt+2*nlen,(long long *)dt,nlen+1);
1972
/* 0x0844 315 */ sllx %g5,3,%g2
1974
/* 0x0848 315 */ ldd [%g2+%l4],%f2
1975
/* 0x084c */ add %l4,%g2,%o0
1976
/* 0x0850 */ or %g0,0,%g1
1977
/* 0x0854 */ ldd [%o0+8],%f4
1978
/* 0x0858 */ or %g0,0,%i2
1979
/* 0x085c */ cmp %l0,0
1980
/* 0x0860 */ fdtox %f2,%f2
1981
/* 0x0864 */ std %f2,[%sp+2255]
1982
/* 0x0868 311 */ sethi %hi(0xfc00),%o3
1983
/* 0x086c 315 */ fdtox %f4,%f2
1984
/* 0x0870 */ std %f2,[%sp+2247]
1985
/* 0x0874 311 */ or %g0,-1,%o2
1986
/* 0x0878 */ srl %o2,0,%o5
1987
/* 0x087c */ or %g0,2,%g5
1988
/* 0x0880 */ sub %l0,1,%g3
1989
/* 0x0884 */ or %g0,%o0,%o7
1990
/* 0x0888 */ add %o3,1023,%o4
1991
/* 0x088c 315 */ or %g0,64,%o3
1992
/* 0x0890 */ ldx [%sp+2255],%i0
1993
/* 0x0894 */ sub %l0,2,%o1
1994
/* 0x0898 */ ldx [%sp+2247],%i1
1995
/* 0x089c */ ble,pt %icc,.L900000648
1996
/* 0x08a0 */ sethi %hi(0xfc00),%g2
1997
/* 0x08a4 */ cmp %l0,6
1998
/* 0x08a8 */ and %i0,%o5,%o2
1999
/* 0x08ac */ bl,pn %icc,.L77000287
2000
/* 0x08b0 */ or %g0,3,%g4
2001
/* 0x08b4 */ ldd [%o7+16],%f0
2002
/* 0x08b8 */ and %i1,%o4,%i3
2003
/* 0x08bc */ sllx %i3,16,%o0
2004
/* 0x08c0 */ or %g0,5,%g4
2005
/* 0x08c4 */ srax %i1,16,%i4
2006
/* 0x08c8 */ fdtox %f0,%f0
2007
/* 0x08cc */ std %f0,[%sp+2239]
2008
/* 0x08d0 */ srax %i0,32,%i1
2009
/* 0x08d4 */ add %o2,%o0,%i5
2010
/* 0x08d8 */ ldd [%o7+24],%f0
2011
/* 0x08dc */ and %i5,%o5,%l1
2012
/* 0x08e0 */ or %g0,72,%o2
2013
/* 0x08e4 */ or %g0,4,%o0
2014
/* 0x08e8 */ or %g0,4,%g5
2015
/* 0x08ec */ ldx [%sp+2239],%g1
2016
/* 0x08f0 */ fdtox %f0,%f0
2017
/* 0x08f4 */ or %g0,4,%i2
2018
/* 0x08f8 */ std %f0,[%sp+2231]
2019
/* 0x08fc */ ldd [%o7+40],%f2
2020
/* 0x0900 */ and %g1,%o5,%i3
2021
/* 0x0904 */ ldd [%o7+32],%f0
2022
/* 0x0908 */ srax %g1,32,%g1
2023
/* 0x090c */ ldd [%o7+56],%f4
2024
/* 0x0910 */ fdtox %f2,%f2
2025
/* 0x0914 */ ldx [%sp+2231],%g2
2026
/* 0x0918 */ fdtox %f0,%f0
2027
/* 0x091c */ st %l1,[%l2]
2028
/* 0x0920 */ srax %i5,32,%l1
2029
/* 0x0924 */ fdtox %f4,%f4
2030
/* 0x0928 */ std %f2,[%sp+2231]
2031
/* 0x092c */ and %g2,%o4,%i5
2032
/* 0x0930 */ add %i4,%l1,%i4
2033
/* 0x0934 */ std %f0,[%sp+2239]
2034
/* 0x0938 */ sllx %i5,16,%i0
2035
/* 0x093c */ add %i1,%i4,%i1
2036
/* 0x0940 */ ldd [%o7+48],%f2
2037
/* 0x0944 */ srax %g2,16,%g2
2038
/* 0x0948 */ add %i3,%i0,%i0
2039
/* 0x094c */ ldd [%o7+72],%f0
2040
/* 0x0950 */ add %i0,%i1,%i3
2041
/* 0x0954 */ srax %i3,32,%i4
2042
/* 0x0958 */ fdtox %f2,%f2
2043
/* 0x095c */ and %i3,%o5,%i3
2044
/* 0x0960 */ ldx [%sp+2231],%i1
2045
/* 0x0964 */ add %g2,%i4,%g2
2046
/* 0x0968 */ ldx [%sp+2239],%i0
2047
/* 0x096c */ add %g1,%g2,%g1
2048
/* 0x0970 */ std %f2,[%sp+2239]
2049
/* 0x0974 */ std %f4,[%sp+2231]
2050
/* 0x0978 */ ldd [%o7+64],%f2
2051
/* 0x097c */ st %i3,[%l2+4]
2053
/* 0x0980 */ ldx [%sp+2231],%i3
2054
/* 0x0984 */ add %i2,2,%i2
2055
/* 0x0988 */ add %g4,4,%g4
2056
/* 0x098c */ ldx [%sp+2239],%i5
2057
/* 0x0990 */ add %o2,16,%o2
2058
/* 0x0994 */ and %i1,%o4,%g2
2059
/* 0x0998 */ sllx %g2,16,%i4
2060
/* 0x099c */ and %i0,%o5,%g2
2061
/* 0x09a0 */ ldd [%o7+%o2],%f4
2062
/* 0x09a4 */ fdtox %f0,%f0
2063
/* 0x09a8 */ std %f0,[%sp+2231]
2064
/* 0x09ac */ srax %i1,16,%i1
2065
/* 0x09b0 */ add %g2,%i4,%g2
2066
/* 0x09b4 */ fdtox %f2,%f0
2067
/* 0x09b8 */ add %o3,16,%o3
2068
/* 0x09bc */ std %f0,[%sp+2239]
2069
/* 0x09c0 */ add %g2,%g1,%g1
2070
/* 0x09c4 */ ldd [%o7+%o3],%f2
2071
/* 0x09c8 */ srax %g1,32,%i4
2072
/* 0x09cc */ cmp %i2,%o1
2073
/* 0x09d0 */ srax %i0,32,%g2
2074
/* 0x09d4 */ add %i1,%i4,%i0
2075
/* 0x09d8 */ add %g2,%i0,%i4
2076
/* 0x09dc */ add %o0,4,%o0
2077
/* 0x09e0 */ and %g1,%o5,%g2
2078
/* 0x09e4 */ or %g0,%i5,%g1
2079
/* 0x09e8 */ st %g2,[%l2+%o0]
2080
/* 0x09ec */ add %g5,4,%g5
2081
/* 0x09f0 */ ldx [%sp+2231],%i1
2082
/* 0x09f4 */ ldx [%sp+2239],%i0
2083
/* 0x09f8 */ add %o2,16,%o2
2084
/* 0x09fc */ and %i3,%o4,%g2
2085
/* 0x0a00 */ sllx %g2,16,%i5
2086
/* 0x0a04 */ and %g1,%o5,%g2
2087
/* 0x0a08 */ ldd [%o7+%o2],%f0
2088
/* 0x0a0c */ fdtox %f4,%f4
2089
/* 0x0a10 */ std %f4,[%sp+2231]
2090
/* 0x0a14 */ srax %i3,16,%i3
2091
/* 0x0a18 */ add %g2,%i5,%g2
2092
/* 0x0a1c */ fdtox %f2,%f2
2093
/* 0x0a20 */ add %o3,16,%o3
2094
/* 0x0a24 */ std %f2,[%sp+2239]
2095
/* 0x0a28 */ add %g2,%i4,%g2
2096
/* 0x0a2c */ ldd [%o7+%o3],%f2
2097
/* 0x0a30 */ srax %g2,32,%i4
2098
/* 0x0a34 */ srax %g1,32,%g1
2099
/* 0x0a38 */ add %i3,%i4,%i3
2100
/* 0x0a3c */ add %g1,%i3,%g1
2101
/* 0x0a40 */ add %o0,4,%o0
2102
/* 0x0a44 */ and %g2,%o5,%g2
2103
/* 0x0a48 */ ble,pt %icc,.L900000631
2104
/* 0x0a4c */ st %g2,[%l2+%o0]
2106
/* 0x0a50 */ srax %i1,16,%i5
2107
/* 0x0a54 */ ldx [%sp+2231],%o1
2108
/* 0x0a58 */ and %i1,%o4,%i3
2109
/* 0x0a5c */ sllx %i3,16,%i3
2110
/* 0x0a60 */ ldx [%sp+2239],%i4
2111
/* 0x0a64 */ and %i0,%o5,%g2
2112
/* 0x0a68 */ add %g2,%i3,%g2
2113
/* 0x0a6c */ and %o1,%o4,%i3
2114
/* 0x0a70 */ fdtox %f0,%f4
2115
/* 0x0a74 */ sllx %i3,16,%i3
2116
/* 0x0a78 */ std %f4,[%sp+2231]
2117
/* 0x0a7c */ add %g2,%g1,%g2
2118
/* 0x0a80 */ srax %g2,32,%l1
2119
/* 0x0a84 */ and %i4,%o5,%i1
2120
/* 0x0a88 */ fdtox %f2,%f0
2121
/* 0x0a8c */ srax %i0,32,%g1
2122
/* 0x0a90 */ std %f0,[%sp+2239]
2123
/* 0x0a94 */ add %i5,%l1,%i0
2124
/* 0x0a98 */ srax %o1,16,%o1
2125
/* 0x0a9c */ add %g1,%i0,%i0
2126
/* 0x0aa0 */ add %o0,4,%g1
2127
/* 0x0aa4 */ add %i1,%i3,%o0
2128
/* 0x0aa8 */ and %g2,%o5,%g2
2129
/* 0x0aac */ st %g2,[%l2+%g1]
2130
/* 0x0ab0 */ add %o0,%i0,%o0
2131
/* 0x0ab4 */ srax %o0,32,%i3
2132
/* 0x0ab8 */ ldx [%sp+2231],%i1
2133
/* 0x0abc */ add %g1,4,%g1
2134
/* 0x0ac0 */ ldx [%sp+2239],%i0
2135
/* 0x0ac4 */ and %o0,%o5,%g2
2136
/* 0x0ac8 */ add %o1,%i3,%o1
2137
/* 0x0acc */ srax %i4,32,%o0
2138
/* 0x0ad0 */ cmp %i2,%g3
2139
/* 0x0ad4 */ st %g2,[%l2+%g1]
2140
/* 0x0ad8 */ bg,pn %icc,.L77000236
2141
/* 0x0adc */ add %o0,%o1,%g1
2142
/* 0x0ae0 */ add %g4,6,%g4
2143
/* 0x0ae4 */ add %g5,6,%g5
2145
/* 0x0ae8 */ sra %g5,0,%o1
2147
/* 0x0aec */ sllx %o1,3,%o2
2148
/* 0x0af0 */ and %i0,%o5,%o0
2149
/* 0x0af4 */ ldd [%o7+%o2],%f0
2150
/* 0x0af8 */ sra %g4,0,%o2
2151
/* 0x0afc */ and %i1,%o4,%o1
2152
/* 0x0b00 */ sllx %o2,3,%o2
2153
/* 0x0b04 */ add %g1,%o0,%o0
2154
/* 0x0b08 */ fdtox %f0,%f0
2155
/* 0x0b0c */ std %f0,[%sp+2239]
2156
/* 0x0b10 */ sllx %o1,16,%o1
2157
/* 0x0b14 */ add %o0,%o1,%o1
2158
/* 0x0b18 */ add %g5,2,%g5
2159
/* 0x0b1c */ ldd [%o7+%o2],%f0
2160
/* 0x0b20 */ srax %o1,32,%g1
2161
/* 0x0b24 */ and %o1,%o5,%o2
2162
/* 0x0b28 */ srax %i1,16,%o0
2163
/* 0x0b2c */ add %g4,2,%g4
2164
/* 0x0b30 */ fdtox %f0,%f0
2165
/* 0x0b34 */ std %f0,[%sp+2231]
2166
/* 0x0b38 */ sra %i2,0,%o1
2167
/* 0x0b3c */ sllx %o1,2,%o1
2168
/* 0x0b40 */ add %o0,%g1,%g2
2169
/* 0x0b44 */ srax %i0,32,%g1
2170
/* 0x0b48 */ add %i2,1,%i2
2171
/* 0x0b4c */ add %g1,%g2,%g1
2172
/* 0x0b50 */ cmp %i2,%g3
2173
/* 0x0b54 */ ldx [%sp+2239],%o3
2174
/* 0x0b58 */ ldx [%sp+2231],%i1
2175
/* 0x0b5c */ st %o2,[%l2+%o1]
2176
/* 0x0b60 */ or %g0,%o3,%i0
2177
/* 0x0b64 */ ble,pt %icc,.L900000647
2178
/* 0x0b68 */ sra %g5,0,%o1
2180
/* 0x0b6c */ sethi %hi(0xfc00),%g2
2182
/* 0x0b70 */ or %g0,-1,%o0
2183
/* 0x0b74 */ add %g2,1023,%g2
2184
/* 0x0b78 */ srl %o0,0,%g3
2185
/* 0x0b7c */ and %i1,%g2,%g2
2186
/* 0x0b80 */ and %i0,%g3,%g4
2187
/* 0x0b84 */ sllx %g2,16,%g2
2188
/* 0x0b88 */ add %g1,%g4,%g4
2189
/* 0x0b8c */ sra %i2,0,%g5
2190
/* 0x0b90 */ add %g4,%g2,%g4
2191
/* 0x0b94 */ sllx %g5,2,%g2
2192
/* 0x0b98 */ and %g4,%g3,%g3
2193
/* 0x0b9c */ st %g3,[%l2+%g2]
2195
! 317 ! adjust_montf_result(result,nint,nlen);
2197
/* 0x0ba0 317 */ sra %l0,0,%g4
2198
/* 0x0ba4 */ sllx %g4,2,%g2
2199
/* 0x0ba8 */ ld [%l2+%g2],%g2
2200
/* 0x0bac */ cmp %g2,0
2201
/* 0x0bb0 */ bleu,pn %icc,.L77000241
2202
/* 0x0bb4 */ or %g0,-1,%o1
2203
/* 0x0bb8 */ ba .L900000646
2204
/* 0x0bbc */ cmp %o1,0
2206
/* 0x0bc0 */ sub %l0,1,%o1
2207
/* 0x0bc4 */ cmp %o1,0
2208
/* 0x0bc8 */ bl,pn %icc,.L77000244
2209
/* 0x0bcc */ sra %o1,0,%g2
2211
/* 0x0bd0 */ sllx %g2,2,%g2
2212
/* 0x0bd4 */ sub %o1,1,%o0
2213
/* 0x0bd8 */ ld [%l3+%g2],%g3
2214
/* 0x0bdc */ ld [%l2+%g2],%g2
2215
/* 0x0be0 */ cmp %g2,%g3
2216
/* 0x0be4 */ bne,pn %icc,.L77000244
2218
/* 0x0bec 0 */ or %g0,%o0,%o1
2219
/* 0x0bf0 317 */ cmp %o0,0
2220
/* 0x0bf4 */ bge,pt %icc,.L900000645
2221
/* 0x0bf8 */ sra %o1,0,%g2
2223
/* 0x0bfc */ cmp %o1,0
2225
/* 0x0c00 */ bl,pn %icc,.L77000288
2226
/* 0x0c04 */ sra %o1,0,%g2
2227
/* 0x0c08 */ sllx %g2,2,%g2
2228
/* 0x0c0c */ ld [%l3+%g2],%g3
2229
/* 0x0c10 */ ld [%l2+%g2],%g2
2230
/* 0x0c14 */ cmp %g2,%g3
2231
/* 0x0c18 */ bleu,pt %icc,.L77000224
2234
/* 0x0c20 */ cmp %l0,0
2235
/* 0x0c24 */ ble,pt %icc,.L77000224
2237
/* 0x0c2c 317 */ or %g0,-1,%g2
2238
/* 0x0c30 315 */ or %g0,0,%i0
2239
/* 0x0c34 317 */ srl %g2,0,%g2
2240
/* 0x0c38 315 */ or %g0,0,%g4
2241
/* 0x0c3c */ or %g0,0,%o1
2242
/* 0x0c40 317 */ sub %l0,1,%g5
2243
/* 0x0c44 */ cmp %l0,9
2244
/* 0x0c48 315 */ or %g0,8,%o5
2245
/* 0x0c4c */ bl,pn %icc,.L77000289
2246
/* 0x0c50 */ sub %l0,4,%o7
2247
/* 0x0c54 */ ld [%l2],%o1
2248
/* 0x0c58 */ or %g0,5,%i0
2249
/* 0x0c5c */ ld [%l3],%o2
2250
/* 0x0c60 */ or %g0,12,%o4
2251
/* 0x0c64 */ or %g0,16,%g1
2252
/* 0x0c68 */ ld [%l3+4],%o3
2253
/* 0x0c6c */ ld [%l2+4],%o0
2254
/* 0x0c70 */ sub %o1,%o2,%o1
2255
/* 0x0c74 */ ld [%l3+8],%i1
2256
/* 0x0c78 */ and %o1,%g2,%g4
2257
/* 0x0c7c */ st %g4,[%l2]
2258
/* 0x0c80 */ srax %o1,32,%g4
2259
/* 0x0c84 */ sub %o0,%o3,%o0
2260
/* 0x0c88 */ ld [%l3+12],%o2
2261
/* 0x0c8c */ add %o0,%g4,%o0
2262
/* 0x0c90 */ and %o0,%g2,%g4
2263
/* 0x0c94 */ st %g4,[%l2+4]
2264
/* 0x0c98 */ srax %o0,32,%o0
2265
/* 0x0c9c */ ld [%l2+8],%o1
2266
/* 0x0ca0 */ ld [%l2+12],%o3
2267
/* 0x0ca4 */ sub %o1,%i1,%o1
2269
/* 0x0ca8 */ add %g1,4,%g3
2270
/* 0x0cac */ ld [%g1+%l2],%g4
2271
/* 0x0cb0 */ add %o1,%o0,%o0
2272
/* 0x0cb4 */ ld [%l3+%g1],%i1
2273
/* 0x0cb8 */ sub %o3,%o2,%o1
2274
/* 0x0cbc */ and %o0,%g2,%o2
2275
/* 0x0cc0 */ st %o2,[%o5+%l2]
2276
/* 0x0cc4 */ srax %o0,32,%o2
2277
/* 0x0cc8 */ add %i0,4,%i0
2278
/* 0x0ccc */ add %g1,8,%o5
2279
/* 0x0cd0 */ ld [%g3+%l2],%o0
2280
/* 0x0cd4 */ add %o1,%o2,%o1
2281
/* 0x0cd8 */ ld [%l3+%g3],%o3
2282
/* 0x0cdc */ sub %g4,%i1,%o2
2283
/* 0x0ce0 */ and %o1,%g2,%g4
2284
/* 0x0ce4 */ st %g4,[%o4+%l2]
2285
/* 0x0ce8 */ srax %o1,32,%g4
2286
/* 0x0cec */ cmp %i0,%o7
2287
/* 0x0cf0 */ add %g1,12,%o4
2288
/* 0x0cf4 */ ld [%o5+%l2],%o1
2289
/* 0x0cf8 */ add %o2,%g4,%o2
2290
/* 0x0cfc */ ld [%l3+%o5],%i1
2291
/* 0x0d00 */ sub %o0,%o3,%o0
2292
/* 0x0d04 */ and %o2,%g2,%o3
2293
/* 0x0d08 */ st %o3,[%g1+%l2]
2294
/* 0x0d0c */ srax %o2,32,%g4
2295
/* 0x0d10 */ ld [%o4+%l2],%o3
2296
/* 0x0d14 */ add %g1,16,%g1
2297
/* 0x0d18 */ add %o0,%g4,%o0
2298
/* 0x0d1c */ ld [%l3+%o4],%o2
2299
/* 0x0d20 */ sub %o1,%i1,%o1
2300
/* 0x0d24 */ and %o0,%g2,%g4
2301
/* 0x0d28 */ st %g4,[%g3+%l2]
2302
/* 0x0d2c */ ble,pt %icc,.L900000635
2303
/* 0x0d30 */ srax %o0,32,%o0
2305
/* 0x0d34 */ add %o1,%o0,%g3
2306
/* 0x0d38 */ sub %o3,%o2,%o1
2307
/* 0x0d3c */ ld [%g1+%l2],%o0
2308
/* 0x0d40 */ ld [%l3+%g1],%o2
2309
/* 0x0d44 */ srax %g3,32,%o7
2310
/* 0x0d48 */ and %g3,%g2,%o3
2311
/* 0x0d4c */ add %o1,%o7,%o1
2312
/* 0x0d50 */ st %o3,[%o5+%l2]
2313
/* 0x0d54 */ cmp %i0,%g5
2314
/* 0x0d58 */ sub %o0,%o2,%o0
2315
/* 0x0d5c */ and %o1,%g2,%o2
2316
/* 0x0d60 */ st %o2,[%o4+%l2]
2317
/* 0x0d64 */ srax %o1,32,%o1
2318
/* 0x0d68 */ sra %i0,0,%o2
2319
/* 0x0d6c */ add %o0,%o1,%o0
2320
/* 0x0d70 */ srax %o0,32,%g4
2321
/* 0x0d74 */ and %o0,%g2,%o1
2322
/* 0x0d78 */ st %o1,[%g1+%l2]
2323
/* 0x0d7c */ bg,pn %icc,.L77000224
2324
/* 0x0d80 */ sllx %o2,2,%o1
2326
/* 0x0d84 0 */ or %g0,%o1,%g1
2328
/* 0x0d88 */ ld [%o1+%l2],%o0
2329
/* 0x0d8c */ add %i0,1,%i0
2330
/* 0x0d90 */ ld [%l3+%o1],%o1
2331
/* 0x0d94 */ sra %i0,0,%o2
2332
/* 0x0d98 */ cmp %i0,%g5
2333
/* 0x0d9c */ add %g4,%o0,%o0
2334
/* 0x0da0 */ sub %o0,%o1,%o0
2335
/* 0x0da4 */ srax %o0,32,%g4
2336
/* 0x0da8 */ and %o0,%g2,%o1
2337
/* 0x0dac */ st %o1,[%g1+%l2]
2338
/* 0x0db0 */ sllx %o2,2,%o1
2339
/* 0x0db4 */ ble,pt %icc,.L900000644
2340
/* 0x0db8 */ or %g0,%o1,%g1
2342
/* 0x0dbc */ ret ! Result =
2343
/* 0x0dc0 */ restore %g0,%g0,%g0
2344
/* 0x0dc4 0 */ .type mont_mulf_noconv,2
2345
/* 0x0dc4 */ .size mont_mulf_noconv,(.-mont_mulf_noconv)