~ubuntu-branches/ubuntu/vivid/atlas/vivid

« back to all changes in this revision

Viewing changes to src/pthreads/blas/level3/ATL_Ssyrk.c

  • Committer: Package Import Robot
  • Author(s): Sébastien Villemot
  • Date: 2013-06-11 15:58:16 UTC
  • mfrom: (1.1.3 upstream)
  • mto: (2.2.21 experimental)
  • mto: This revision was merged to the branch mainline in revision 26.
  • Revision ID: package-import@ubuntu.com-20130611155816-b72z8f621tuhbzn0
Tags: upstream-3.10.1
Import upstream version 3.10.1

Show diffs side-by-side

added added

removed removed

Lines of Context:
1
 
 
2
 
/* ---------------------------------------------------------------------
3
 
 *
4
 
 * -- Automatically Tuned Linear Algebra Software (ATLAS)
5
 
 *    (C) Copyright 2000 All Rights Reserved
6
 
 *
7
 
 * -- ATLAS routine -- Version 3.2 -- December 25, 2000
8
 
 *
9
 
 * Author         : Antoine P. Petitet
10
 
 * Originally developed at the University of Tennessee,
11
 
 * Innovative Computing Laboratory, Knoxville TN, 37996-1301, USA.
12
 
 *
13
 
 * ---------------------------------------------------------------------
14
 
 *
15
 
 * -- Copyright notice and Licensing terms:
16
 
 *
17
 
 *  Redistribution  and  use in  source and binary forms, with or without
18
 
 *  modification, are  permitted provided  that the following  conditions
19
 
 *  are met:
20
 
 *
21
 
 * 1. Redistributions  of  source  code  must retain the above copyright
22
 
 *    notice, this list of conditions and the following disclaimer.
23
 
 * 2. Redistributions in binary form must reproduce  the above copyright
24
 
 *    notice,  this list of conditions, and the  following disclaimer in
25
 
 *    the documentation and/or other materials provided with the distri-
26
 
 *    bution.
27
 
 * 3. The name of the University,  the ATLAS group,  or the names of its
28
 
 *    contributors  may not be used to endorse or promote products deri-
29
 
 *    ved from this software without specific written permission.
30
 
 *
31
 
 * -- Disclaimer:
32
 
 *
33
 
 * THIS  SOFTWARE  IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS
34
 
 * ``AS IS'' AND ANY EXPRESS OR IMPLIED WARRANTIES,  INCLUDING,  BUT NOT
35
 
 * LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR
36
 
 * A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL THE UNIVERSITY
37
 
 * OR CONTRIBUTORS BE LIABLE FOR ANY DIRECT,  INDIRECT, INCIDENTAL, SPE-
38
 
 * CIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING, BUT NOT LIMITED
39
 
 * TO,  PROCUREMENT  OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA,
40
 
 * OR PROFITS; OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEO-
41
 
 * RY OF LIABILITY, WHETHER IN CONTRACT, STRICT LIABILITY, OR TORT  (IN-
42
 
 * CLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE OF
43
 
 * THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
44
 
 *
45
 
 * ---------------------------------------------------------------------
46
 
 */
47
 
 
48
 
/*
49
 
 * Include files
50
 
 */
51
 
#include "atlas_ptmisc.h"
52
 
#include "atlas_ptlvl3.h"
53
 
#include "atlas_ptlevel3.h"
54
 
 
55
 
PT_TREE_T ATL_Ssyrk
56
 
(
57
 
   const PT_LVL3_TYPE_T       * PLVL3,
58
 
   const unsigned int         NODE,
59
 
   const unsigned int         NTHREADS,
60
 
   pthread_attr_t             * ATTR,
61
 
   const int                  NB,
62
 
   const enum ATLAS_UPLO      UPLO,
63
 
   const enum ATLAS_TRANS     TRANS,
64
 
   const enum ATLAS_TRANS     TGEMM,
65
 
   const int                  M,
66
 
   const int                  N,
67
 
   const int                  K,
68
 
   const int                  L,
69
 
   const void                 * ALPHA,
70
 
   const void                 * A,
71
 
   const int                  LDA,
72
 
   const void                 * BETA,
73
 
   void                       * C,
74
 
   const int                  LDC
75
 
)
76
 
{
77
 
/*
78
 
 * .. Local Variables ..
79
 
 */
80
 
   PT_TREE_T                  left, right, tree = NULL;
81
 
   PT_SYRK_ARGS_T             * a_syrk  = NULL;
82
 
   size_t                     size;
83
 
   DIM_TZSPLIT_T              split = AtlasTzNoSplit;
84
 
   unsigned int               next = ( NODE << 1 ), nt1=0, nt2=0;
85
 
   int                        incA, incC, mnk1=0, mnk2=0;
86
 
/* ..
87
 
 * .. Executable Statements ..
88
 
 *
89
 
 */
90
 
   if( NTHREADS < 1 ) return( tree );
91
 
 
92
 
   size  = PLVL3->size;
93
 
   split = ATL_tzsplit( UPLO, NTHREADS, M, N, K, NB, &nt1, &nt2,
94
 
                        &mnk1, &mnk2 );
95
 
 
96
 
   if(      split == AtlasTzSplitMrow )
97
 
   {
98
 
      if( UPLO == AtlasLower )
99
 
      {
100
 
         if( TRANS == AtlasNoTrans )
101
 
         {
102
 
            left  = ATL_Ssyrk( PLVL3, next+1, nt1, ATTR, NB, UPLO, TRANS,
103
 
                               TGEMM, mnk1, N, K, L, ALPHA, A, LDA, BETA,
104
 
                               C, LDC );
105
 
            right = ATL_Sgemm( PLVL3, next+2, nt2, ATTR, NB, AtlasNoTrans,
106
 
                               TGEMM, mnk2, N+K, L, ALPHA,
107
 
                               Mvpt3( A, K + mnk1, size ), LDA,
108
 
                               Mvpt3( A,   - N,    size ), LDA, BETA,
109
 
                               Mvpt3( C, K + mnk1, size ), LDC );
110
 
         }
111
 
         else
112
 
         {
113
 
            left  = ATL_Ssyrk( PLVL3, next+1, nt1, ATTR, NB, UPLO, TRANS,
114
 
                               TGEMM, mnk1, N, K, L, ALPHA, A, LDA, BETA,
115
 
                               C, LDC );
116
 
            right = ATL_Sgemm( PLVL3, next+2, nt2, ATTR, NB, TGEMM,
117
 
                               AtlasNoTrans, mnk2, N+K, L, ALPHA,
118
 
                               Mvpt3( A, ( N + K + mnk1 ) * LDA,
119
 
                               size ), LDA, A, LDA, BETA,
120
 
                               Mvpt3( C, K + mnk1, size ), LDC );
121
 
         }
122
 
      }
123
 
      else
124
 
      {
125
 
         if( TRANS == AtlasNoTrans )
126
 
         {
127
 
            left  = ATL_Sgemm( PLVL3, next+1, nt1, ATTR, NB, AtlasNoTrans,
128
 
                               TGEMM, mnk1, N+K, L, ALPHA, A, LDA,
129
 
                               Mvpt3( A, M, size ), LDA, BETA,
130
 
                               C, LDC );
131
 
            right = ATL_Ssyrk( PLVL3, next+2, nt2, ATTR, NB, UPLO, TRANS,
132
 
                               TGEMM, mnk2, N, K, L,  ALPHA,
133
 
                               Mvpt3( A, mnk1, size ), LDA, BETA,
134
 
                               Mvpt3( C, mnk1, size ), LDC );
135
 
         }
136
 
         else
137
 
         {
138
 
            left  = ATL_Sgemm( PLVL3, next+1, nt1, ATTR, NB, TGEMM,
139
 
                               AtlasNoTrans, mnk1, N+K, L, ALPHA,
140
 
                               Mvpt3( A, - M * LDA, size ), LDA,
141
 
                               A, LDA, BETA, C, LDC );
142
 
            right = ATL_Ssyrk( PLVL3, next+2, nt2, ATTR, NB, UPLO, TRANS,
143
 
                               TGEMM, mnk2, N, K, L,  ALPHA, A, LDA, BETA,
144
 
                               Mvpt3( C, mnk1, size ), LDC );
145
 
         }
146
 
      }
147
 
 
148
 
      tree = ATL_init_node( NODE, left, right, NULL, NULL, NULL, NULL );
149
 
   }
150
 
   else if( split == AtlasTzSplitKrow )
151
 
   {
152
 
      if( UPLO == AtlasLower )
153
 
      {
154
 
         left  = ATL_Ssyrk( PLVL3, next+1, nt1, ATTR, NB, UPLO, TRANS, TGEMM,
155
 
                            0, N, mnk1, L, ALPHA, A, LDA, BETA, C, LDC );
156
 
         incA  = ( TRANS == AtlasNoTrans ? mnk1 : 0 );
157
 
         incC  = mnk1;
158
 
         right = ATL_Ssyrk( PLVL3, next+2, nt2, ATTR, NB, UPLO, TRANS, TGEMM,
159
 
                            M, N + mnk1, mnk2, L, ALPHA, Mvpt3( A, incA, size ),
160
 
                            LDA,  BETA, Mvpt3( C, incC, size ), LDC );
161
 
      }
162
 
      else
163
 
      {
164
 
         left  = ATL_Ssyrk( PLVL3, next+1, nt1, ATTR, NB, UPLO, TRANS, TGEMM, M,
165
 
                            N + mnk2, mnk1, L, ALPHA, A, LDA, BETA, C, LDC );
166
 
         incA  = ( TRANS == AtlasNoTrans ? mnk1 : mnk1 * LDA );
167
 
         incC  = mnk1 * ( LDC + 1 );
168
 
         right = ATL_Ssyrk( PLVL3, next+2, nt2, ATTR, NB, UPLO, TRANS, TGEMM, 0,
169
 
                            N, mnk2, L, ALPHA, Mvpt3( A, incA, size ),
170
 
                            LDA, BETA, Mvpt3( C, incC, size ), LDC );
171
 
      }
172
 
      tree = ATL_init_node( NODE, left, right, NULL, NULL, NULL, NULL );
173
 
   }
174
 
   else if( split == AtlasTzSplitKcol )
175
 
   {
176
 
      if( UPLO == AtlasLower )
177
 
      {
178
 
         left  = ATL_Ssyrk( PLVL3, next+1, nt1, ATTR, NB, UPLO, TRANS, TGEMM,
179
 
                            M + mnk2, N, mnk1, L, ALPHA, A, LDA, BETA,
180
 
                            C, LDC );
181
 
         incA  = ( TRANS == AtlasNoTrans ? mnk1 : ( N + mnk1 ) * LDA );
182
 
         incC  = mnk1 + ( N + mnk1 ) * LDC;
183
 
         right = ATL_Ssyrk( PLVL3, next+2, nt2, ATTR, NB, UPLO, TRANS, TGEMM,
184
 
                            M, 0, mnk2, L, ALPHA, Mvpt3( A, incA,
185
 
                            size ), LDA, BETA, Mvpt3( C, incC,
186
 
                            size ), LDC );
187
 
      }
188
 
      else
189
 
      {
190
 
         left  = ATL_Ssyrk( PLVL3, next+1, nt1, ATTR, NB, UPLO, TRANS, TGEMM,
191
 
                            M, 0, mnk1, L, ALPHA, A, LDA, BETA, C, LDC );
192
 
         incA  = ( TRANS == AtlasNoTrans ? 0 : mnk1 * LDA );
193
 
         incC  = mnk1 * LDC;
194
 
         right = ATL_Ssyrk( PLVL3, next+2, nt2, ATTR, NB, UPLO, TRANS, TGEMM,
195
 
                            M + mnk1, N, mnk2, L, ALPHA, Mvpt3( A,
196
 
                            incA, size ), LDA, BETA, Mvpt3( C, incC,
197
 
                            size ), LDC );
198
 
      }
199
 
      tree = ATL_init_node( NODE, left, right, NULL, NULL, NULL, NULL );
200
 
   }
201
 
   else if( split == AtlasTzSplitNcol )
202
 
   {
203
 
      if( UPLO == AtlasLower )
204
 
      {
205
 
         if( TRANS == AtlasNoTrans )
206
 
         {
207
 
            incA  = -N;
208
 
            left  = ATL_Sgemm( PLVL3, next+1, nt1, ATTR, NB, AtlasNoTrans,
209
 
                               TGEMM, M + K, mnk1, L, ALPHA, A, LDA,
210
 
                               Mvpt3( A, incA, size ), LDA, BETA,
211
 
                               C, LDC );
212
 
            incC  = mnk1 * LDC;
213
 
            right = ATL_Ssyrk( PLVL3, next+2, nt2, ATTR, NB, UPLO, TRANS,
214
 
                               TGEMM, M, mnk2, K, L, ALPHA, A, LDA, BETA,
215
 
                               Mvpt3( C, incC, size ), LDC );
216
 
         }
217
 
         else
218
 
         {
219
 
            incA  = ( N + K ) * LDA;
220
 
            left  = ATL_Sgemm( PLVL3, next+1, nt1, ATTR, NB, TGEMM,
221
 
                               AtlasNoTrans, M + K, mnk1, L, ALPHA,
222
 
                               Mvpt3( A, incA, size ), LDA,
223
 
                               A, LDA, BETA, C, LDC );
224
 
            incA  = mnk1 * LDA;
225
 
            incC  = mnk1 * LDC;
226
 
            right = ATL_Ssyrk( PLVL3, next+2, nt2, ATTR, NB, UPLO, TRANS,
227
 
                               TGEMM, M, mnk2, K, L, ALPHA,
228
 
                               Mvpt3( A, incA, size ), LDA, BETA,
229
 
                               Mvpt3( C, incC, size ), LDC );
230
 
         }
231
 
      }
232
 
      else
233
 
      {
234
 
         left  = ATL_Ssyrk( PLVL3, next+1, nt1, ATTR, NB, UPLO, TRANS, TGEMM,
235
 
                            M, mnk1, K, L, ALPHA, A, LDA, BETA, C, LDC );
236
 
         incC  = ( K + mnk1 ) * LDC;
237
 
 
238
 
         if( TRANS == AtlasNoTrans )
239
 
         {
240
 
            incA  = M + K + mnk1;
241
 
            right = ATL_Sgemm( PLVL3, next+2, nt2, ATTR, NB, AtlasNoTrans,
242
 
                               TGEMM, M + K, mnk2, L, ALPHA, A, LDA,
243
 
                               Mvpt3( A, incA, size ), LDA, BETA,
244
 
                               Mvpt3( C, incC, size ), LDC );
245
 
         }
246
 
         else
247
 
         {
248
 
            incA  = ( K + mnk1 ) * LDA;
249
 
            right = ATL_Sgemm( PLVL3, next+2, nt2, ATTR, NB, TGEMM,
250
 
                               AtlasNoTrans, M + K, mnk2, L, ALPHA,
251
 
                               Mvpt3( A, -M * LDA, size ), LDA,
252
 
                               Mvpt3( A,     incA, size ), LDA, BETA,
253
 
                               Mvpt3( C,     incC, size ), LDC );
254
 
         }
255
 
      }
256
 
      tree = ATL_init_node( NODE, left, right, NULL, NULL, NULL, NULL );
257
 
   }
258
 
   else
259
 
   {
260
 
      a_syrk = (PT_SYRK_ARGS_T *)malloc( sizeof( PT_SYRK_ARGS_T ) );
261
 
      ATL_assert( a_syrk != NULL );
262
 
      a_syrk->up = UPLO;  a_syrk->tr = TRANS; a_syrk->m  = M;
263
 
      a_syrk->n  = N;     a_syrk->k  = K;     a_syrk->l  = L;
264
 
      a_syrk->al = ALPHA; a_syrk->a  = A;     a_syrk->la = LDA;
265
 
      a_syrk->be = BETA;  a_syrk->c  = C;     a_syrk->lc = LDC;
266
 
 
267
 
      tree = ATL_init_node( NODE, NULL, NULL, NULL, NULL,
268
 
                            ( TGEMM == AtlasTrans ? PLVL3->syrk0 :
269
 
                            PLVL3->herk0 ), (void *)(a_syrk) );
270
 
   }
271
 
 
272
 
   return( tree );
273
 
/*
274
 
 * End of ATL_Ssyrk
275
 
 */
276
 
}