~ubuntu-branches/ubuntu/vivid/atlas/vivid

« back to all changes in this revision

Viewing changes to src/pthreads/misc/ATL_1dsplit.c

  • Committer: Bazaar Package Importer
  • Author(s): Camm Maguire
  • Date: 2002-04-13 10:07:52 UTC
  • Revision ID: james.westby@ubuntu.com-20020413100752-va9zm0rd4gpurdkq
Tags: upstream-3.2.1ln
ImportĀ upstreamĀ versionĀ 3.2.1ln

Show diffs side-by-side

added added

removed removed

Lines of Context:
 
1
/* ---------------------------------------------------------------------
 
2
 *
 
3
 * -- Automatically Tuned Linear Algebra Software (ATLAS)
 
4
 *    (C) Copyright 2000 All Rights Reserved
 
5
 *
 
6
 * -- ATLAS routine -- Version 3.2 -- December 25, 2000
 
7
 *
 
8
 * -- Suggestions,  comments,  bugs reports should be sent to the follo-
 
9
 *    wing e-mail address: atlas@cs.utk.edu
 
10
 *
 
11
 * Author         : Antoine P. Petitet
 
12
 * University of Tennessee - Innovative Computing Laboratory
 
13
 * Knoxville TN, 37996-1301, USA.
 
14
 *
 
15
 * ---------------------------------------------------------------------
 
16
 *
 
17
 * -- Copyright notice and Licensing terms:
 
18
 *
 
19
 *  Redistribution  and  use in  source and binary forms, with or without
 
20
 *  modification, are  permitted provided  that the following  conditions
 
21
 *  are met:
 
22
 *
 
23
 * 1. Redistributions  of  source  code  must retain the above copyright
 
24
 *    notice, this list of conditions and the following disclaimer.
 
25
 * 2. Redistributions in binary form must reproduce  the above copyright
 
26
 *    notice,  this list of conditions, and the  following disclaimer in
 
27
 *    the documentation and/or other materials provided with the distri-
 
28
 *    bution.
 
29
 * 3. The name of the University,  the ATLAS group,  or the names of its
 
30
 *    contributors  may not be used to endorse or promote products deri-
 
31
 *    ved from this software without specific written permission.
 
32
 *
 
33
 * -- Disclaimer:
 
34
 *
 
35
 * THIS  SOFTWARE  IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS
 
36
 * ``AS IS'' AND ANY EXPRESS OR IMPLIED WARRANTIES,  INCLUDING,  BUT NOT
 
37
 * LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR
 
38
 * A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL THE UNIVERSITY
 
39
 * OR CONTRIBUTORS BE LIABLE FOR ANY DIRECT,  INDIRECT, INCIDENTAL, SPE-
 
40
 * CIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING, BUT NOT LIMITED
 
41
 * TO,  PROCUREMENT  OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA,
 
42
 * OR PROFITS; OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEO-
 
43
 * RY OF LIABILITY, WHETHER IN CONTRACT, STRICT LIABILITY, OR TORT  (IN-
 
44
 * CLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE OF
 
45
 * THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
 
46
 *
 
47
 * ---------------------------------------------------------------------
 
48
 */
 
49
/*
 
50
 * Include files
 
51
 */
 
52
#include "atlas_ptmisc.h"
 
53
 
 
54
DIM_1DSPLIT_T ATL_1dsplit
 
55
(
 
56
   const unsigned int         NT,
 
57
   const int                  N,
 
58
   const int                  NB,
 
59
   unsigned int               * NT1,
 
60
   unsigned int               * NT2,
 
61
   int                        * N1,
 
62
   int                        * N2,
 
63
   double                     * RATIO
 
64
)
 
65
{
 
66
/*
 
67
 * Purpose
 
68
 * =======
 
69
 *
 
70
 * ATL_1dsplit splits  a  problem  dimension  N  within NT threads. This
 
71
 * function returns whether or not the problem size N should be split.
 
72
 *
 
73
 * Arguments
 
74
 * =========
 
75
 *
 
76
 * NT      (input)                       const unsigned int
 
77
 *         On entry, NT specifies the initial total number of threads.
 
78
 *
 
79
 * N       (input)                       const int
 
80
 *         On entry, N specifies the problem dimension to be split.
 
81
 *
 
82
 * NB      (input)                       const int
 
83
 *         On entry,  NB  specifies the blocking factor to be used along
 
84
 *         this dimension N.
 
85
 *
 
86
 * NT1     (output)                      unsigned int *
 
87
 *         On exit,  NT1  specifies the number of threads to be used for
 
88
 *         the first part of the problem size N1.
 
89
 *
 
90
 * NT2     (output)                      unsigned int *
 
91
 *         On exit,  NT2  specifies the number of threads to be used for
 
92
 *         the second part of the problem size N2.
 
93
 *
 
94
 * N1      (output)                      int *
 
95
 *         On exit,  N1  specifies  the length of the problem size to be
 
96
 *         run on the NT1 threads.
 
97
 *
 
98
 * N2      (output)                      int *
 
99
 *         On exit,  N2  specifies  the length of the problem size to be
 
100
 *         run on the NT2 threads.
 
101
 *
 
102
 * RATIO   (output)                      double *
 
103
 *         On exit, RATIO specifies the relative work distribution ratio
 
104
 *         namely | ( N1 / NT1 ) - ( N2 / NT2 ) | / ( N / NT ).
 
105
 *
 
106
 * ---------------------------------------------------------------------
 
107
 */
 
108
/*
 
109
 * .. Local Variables ..
 
110
 */
 
111
   double                     n, nt;
 
112
   DIM_1DSPLIT_T              split = Atlas1dNoSplit;
 
113
   unsigned int               nt1, nt2, ntm1;
 
114
   int                        n1, n2, nblks, nbm1;
 
115
/* ..
 
116
 * .. Executable Statements ..
 
117
 *
 
118
 */
 
119
   nblks = ( N + ( nbm1 = NB - 1 ) ) / NB;
 
120
   if( ( nblks < 2 ) || ( NT < 2 ) ) return( split );
 
121
 
 
122
   n1 = ( ( ( ( N + ( ntm1 = NT - 1 ) ) / NT ) + nbm1 ) / NB ) * NB;
 
123
   n1 = Mmin( n1, N );
 
124
   n1 = Mmax( n1, 1 );
 
125
   n2 = N - n1;
 
126
 
 
127
   n  = (double)(N);
 
128
   nt = (double)(NT);
 
129
 
 
130
   nt1 = (int)floor( ( (double)(n1) / n ) * nt + 0.5 );
 
131
   nt2 = NT - ( nt1 = Mmin( nt1, ntm1 ) );
 
132
 
 
133
   *N1    = n1;
 
134
   *N2    = n2;
 
135
   *NT1   = nt1;
 
136
   *NT2   = nt2;
 
137
   *RATIO = ( (double)(n1) / (double)(nt1) ) - ( (double)(n2) / (double)(nt2) );
 
138
   *RATIO = Mabs( *RATIO ) / ( n / nt );
 
139
 
 
140
   return( Atlas1dSplit );
 
141
/*
 
142
 * End of ATL_1dsplit
 
143
 */
 
144
}