~vcs-imports/escript-finley/trunk

« back to all changes in this revision

Viewing changes to dudley/src/ElementFile_distributeByRankOfDOF.c

Committer: jfenwick
Date: 2010-10-11 01:48:14 UTC
Revision ID: svn-v4:77569008-7704-0410-b7a0-a92fef0b09fd:trunk:3259

Merging dudley and scons updates from branches

files added:
dudley

dudley/benchmarks

dudley/benchmarks/dudleybench.py

dudley/benchmarks/runbenchmark.py

dudley/inc

dudley/lib

dudley/lib/.keep

dudley/lib/py_src

dudley/lib/py_src/.keep

dudley/py_src

dudley/py_src/SConscript

dudley/py_src/__init__.py

dudley/py_src/dudley.py

dudley/py_src/readers.py

dudley/src

dudley/src/Assemble.h

dudley/src/Assemble_AverageElementData.c

dudley/src/Assemble_CopyElementData.c

dudley/src/Assemble_CopyNodalData.c

dudley/src/Assemble_LumpedSystem.c

dudley/src/Assemble_NodeCoordinates.c

dudley/src/Assemble_PDE.c

dudley/src/Assemble_PDE_Single2_1D.c

dudley/src/Assemble_PDE_Single2_2D.c

dudley/src/Assemble_PDE_Single2_3D.c

dudley/src/Assemble_PDE_System2_1D.c

dudley/src/Assemble_PDE_System2_2D.c

dudley/src/Assemble_PDE_System2_3D.c

dudley/src/Assemble_addToSystemMatrix.c

dudley/src/Assemble_getAssembleParameters.c

dudley/src/Assemble_getSize.c

dudley/src/Assemble_gradient.c

dudley/src/Assemble_integrate.c

dudley/src/Assemble_interpolate.c

dudley/src/Assemble_jacobeans.c

dudley/src/Assemble_setNormal.c

dudley/src/CPPAdapter

dudley/src/CPPAdapter/DudleyAdapterException.cpp

dudley/src/CPPAdapter/DudleyAdapterException.h

dudley/src/CPPAdapter/DudleyError.cpp

dudley/src/CPPAdapter/DudleyError.h

dudley/src/CPPAdapter/MeshAdapter.cpp

dudley/src/CPPAdapter/MeshAdapter.h

dudley/src/CPPAdapter/MeshAdapterFactory.cpp

dudley/src/CPPAdapter/MeshAdapterFactory.h

dudley/src/CPPAdapter/SystemMatrixAdapter.cpp

dudley/src/CPPAdapter/SystemMatrixAdapter.h

dudley/src/CPPAdapter/TransportProblemAdapter.cpp

dudley/src/CPPAdapter/TransportProblemAdapter.h

dudley/src/CPPAdapter/dudleycpp.cpp

dudley/src/CPPAdapter/system_dep.h

dudley/src/Dudley.c

dudley/src/Dudley.h

dudley/src/DudleyVersion.h

dudley/src/ElementFile.c

dudley/src/ElementFile.h

dudley/src/ElementFile_allocTable.c

dudley/src/ElementFile_copyTable.c

dudley/src/ElementFile_createColoring.c

dudley/src/ElementFile_distributeByRankOfDOF.c

dudley/src/ElementFile_gather.c

dudley/src/ElementFile_jacobeans.c

dudley/src/ElementFile_markNodes.c

dudley/src/ElementFile_optimizeOrdering.c

dudley/src/ElementFile_relableNodes.c

dudley/src/ElementFile_scatter.c

dudley/src/ElementFile_setCoordinates.c

dudley/src/ElementFile_setNodeRange.c

dudley/src/ElementFile_setTags.c

dudley/src/ElementType.c

dudley/src/ElementType.h

dudley/src/IndexList.c

dudley/src/IndexList.h

dudley/src/Mesh.c

dudley/src/Mesh.h

dudley/src/Mesh_createNodeFileMappings.c

dudley/src/Mesh_distributeByRankOfDOF.c

dudley/src/Mesh_findMatchingFaces.c

dudley/src/Mesh_getPattern.c

dudley/src/Mesh_markNodes.c

dudley/src/Mesh_optimizeDOFDistribution.c

dudley/src/Mesh_optimizeDOFLabeling.c

dudley/src/Mesh_prepare.c

dudley/src/Mesh_print.c

dudley/src/Mesh_read.c

dudley/src/Mesh_readGmsh.c

dudley/src/Mesh_relableElementNodes.c

dudley/src/Mesh_resolveNodeIds.c

dudley/src/Mesh_saveDX.c

dudley/src/Mesh_saveVTK.c

dudley/src/Mesh_setCoordinates.c

dudley/src/Mesh_tagmaps.c

dudley/src/Mesh_tet4.c

dudley/src/Mesh_tri3.c

dudley/src/Mesh_write.c

dudley/src/NodeFile.c

dudley/src/NodeFile.h

dudley/src/NodeFile_allocTable.c

dudley/src/NodeFile_copyTable.c

dudley/src/NodeFile_createDenseLabelings.c

dudley/src/NodeFile_gather.c

dudley/src/NodeFile_scatter.c

dudley/src/NodeFile_setCoordinates.c

dudley/src/NodeFile_setIdRange.c

dudley/src/NodeFile_setTags.c

dudley/src/NodeMapping.c

dudley/src/NodeMapping.h

dudley/src/SConscript

dudley/src/ShapeTable.c

dudley/src/ShapeTable.h

dudley/src/TagMap.c

dudley/src/TagMap.h

dudley/src/TriangularMesh.h

dudley/src/Util.c

dudley/src/Util.h

dudley/src/generateReferenceElementList.py

dudley/src/vtkCellType.h

dudley/test

dudley/test/MeshAdapterTestCase.cpp

dudley/test/MeshAdapterTestCase.h

dudley/test/SConscript

dudley/test/dudley_UnitTests.cpp

dudley/test/python

dudley/test/python/FCT_benchmark.py

dudley/test/python/FCT_test1.py

dudley/test/python/FCT_test2.py

dudley/test/python/OutTest.py

dudley/test/python/PoissonSolverTest.py

dudley/test/python/RT2D.py

dudley/test/python/RecTest.py

dudley/test/python/SConscript

dudley/test/python/axisymm-movie.py

dudley/test/python/axisymm-splitB.py

dudley/test/python/blocktest.py

dudley/test/python/brick.py

dudley/test/python/convection.py

dudley/test/python/convection_viz.py

dudley/test/python/data_meshes

dudley/test/python/data_meshes/brick_8x10x12.fly

dudley/test/python/data_meshes/rectangle_8x10.fly

dudley/test/python/data_meshes/tet10.fly

dudley/test/python/data_meshes/tet10_gmsh.msh

dudley/test/python/data_meshes/tet4.fly

dudley/test/python/data_meshes/tet4_gmsh.msh

dudley/test/python/data_meshes/tet_2D_o1_boundary_s.xml

dudley/test/python/data_meshes/tet_2D_o1_boundary_t.xml

dudley/test/python/data_meshes/tet_2D_o1_boundary_v.xml

dudley/test/python/data_meshes/tet_2D_o1_cell_s.xml

dudley/test/python/data_meshes/tet_2D_o1_cell_t.xml

dudley/test/python/data_meshes/tet_2D_o1_cell_v.xml

dudley/test/python/data_meshes/tet_2D_o1_node_3xs.xml

dudley/test/python/data_meshes/tet_2D_o1_node_s.xml

dudley/test/python/data_meshes/tet_2D_o1_node_t.xml

dudley/test/python/data_meshes/tet_2D_o1_node_v.xml

dudley/test/python/data_meshes/tet_2D_order1.fly

dudley/test/python/data_meshes/tet_3D_o1_boundary_s.xml

dudley/test/python/data_meshes/tet_3D_o1_boundary_t.xml

dudley/test/python/data_meshes/tet_3D_o1_boundary_v.xml

dudley/test/python/data_meshes/tet_3D_o1_cell_s.xml

dudley/test/python/data_meshes/tet_3D_o1_cell_t.xml

dudley/test/python/data_meshes/tet_3D_o1_cell_v.xml

dudley/test/python/data_meshes/tet_3D_o1_node_s.xml

dudley/test/python/data_meshes/tet_3D_o1_node_t.xml

dudley/test/python/data_meshes/tet_3D_o1_node_v.xml

dudley/test/python/data_meshes/tet_3D_order1.fly

dudley/test/python/data_meshes/tri3.fly

dudley/test/python/data_meshes/tri3_gmsh.msh

dudley/test/python/fixme_run_generators.py

dudley/test/python/generate_dumps.py

dudley/test/python/generate_meshes.py

dudley/test/python/linearElastic.py

dudley/test/python/rayleigh_taylor_instabilty.py

dudley/test/python/rectangle.py

dudley/test/python/run_escriptOnDudley.py

dudley/test/python/run_inputOutput.py

dudley/test/python/run_linearPDEsOnDudley1.py

dudley/test/python/run_linearPDEsOnDudley2.py

dudley/test/python/run_models.py

dudley/test/python/run_simplesolve.py

dudley/test/python/run_utilOnDudley.py

dudley/test/python/run_visualization_interface.py

dudley/test/python/seismic_wave.py

dudley/test/python/slip_stress.py

dudley/test/python/slip_stress_mesh_old.py

dudley/test/python/slip_stress_old.py

dudley/test/python/stokes_problems.py

dudley/test/python/subduction1.py

dudley/test/python/subduction1_gen.py

dudley/test/python/time_chunks.py

dudley/test/python/tp.py

esysUtils/src/Esys_MPI.c

esysUtils/src/Esys_MPI.h

esysUtils/src/error.c

esysUtils/src/error.h

esysUtils/src/index.h

esysUtils/src/maths.h

esysUtils/src/mem.h

esysUtils/src/mpi_C.h

esysUtils/src/types.h

scons/TEMPLATE_linux.py

scons/TEMPLATE_windows.py

site_scons

site_scons/grouptest.py

site_scons/site_init.py

files modified:
SConstruct

bin/run-escript

doc/SConscript

doc/cookbook/SConscript

doc/doxygen/SConscript

doc/epydoc/SConscript

doc/examples/SConscript

doc/examples/cookbook/example01a.py

doc/examples/cookbook/example01b.py

doc/examples/cookbook/example01c.py

doc/examples/cookbook/example02.py

doc/examples/cookbook/example03a.py

doc/examples/cookbook/example03b.py

doc/examples/cookbook/example04a.py

doc/examples/cookbook/example04b.py

doc/examples/cookbook/example09m.py

doc/examples/cookbook/example09n.py

doc/examples/geotutorial/backward_euler.py

doc/examples/geotutorial/forward_euler.py

doc/examples/geotutorial/myfirstscript.py

doc/examples/geotutorial/steadystate.py

doc/examples/geotutorial/steadystate_variablek.py

doc/examples/usersguide/wave.py

doc/install/SConscript

doc/user/SConscript

escript/py_src/SConscript

escript/py_src/levelset.py

escript/py_src/linearPDEs.py

escript/py_src/mountains.py

escript/src/AbstractContinuousDomain.cpp

escript/src/AbstractContinuousDomain.h

escript/src/AbstractDomain.cpp

escript/src/AbstractDomain.h

escript/src/AbstractSystemMatrix.h

escript/src/AbstractTransportProblem.h

escript/src/Data.cpp

escript/src/Data.h

escript/src/DataConstant.cpp

escript/src/DataExpanded.cpp

escript/src/DataFactory.cpp

escript/src/DataLazy.cpp

escript/src/DataTagged.cpp

escript/src/NullDomain.cpp

escript/src/NullDomain.h

escript/src/SConscript

escript/src/TestDomain.cpp

escript/src/Utils.cpp

escript/src/escriptcpp.cpp

escript/test/DataTaggedTestCase.cpp

escript/test/SConscript

escript/test/escript_UnitTest.cpp

escript/test/python/SConscript

escript/test/python/test_assemblage.py

escript/test/python/test_linearPDEs.py

escript/test/python/test_objects.py

escript/test/python/test_pdetools.py

esysUtils/src/SConscript

esysUtils/src/blocktimer.c

esysUtils/test/EsysExceptionTest.cpp

esysUtils/test/SConscript

finley/py_src/SConscript

finley/src/Assemble.h

finley/src/Assemble_CopyNodalData.c

finley/src/Assemble_LumpedSystem.c

finley/src/Assemble_PDE.c

finley/src/Assemble_PDE_Single2_1D.c

finley/src/Assemble_PDE_Single2_2D.c

finley/src/Assemble_PDE_Single2_3D.c

finley/src/Assemble_PDE_Single2_C.c

finley/src/Assemble_PDE_System2_1D.c

finley/src/Assemble_PDE_System2_2D.c

finley/src/Assemble_PDE_System2_3D.c

finley/src/Assemble_PDE_System2_C.c

finley/src/Assemble_getAssembleParameters.c

finley/src/Assemble_integrate.c

finley/src/Assemble_jacobeans.c

finley/src/CPPAdapter/FinleyError.cpp

finley/src/CPPAdapter/MeshAdapter.cpp

finley/src/CPPAdapter/MeshAdapter.h

finley/src/CPPAdapter/MeshAdapterFactory.cpp

finley/src/CPPAdapter/SystemMatrixAdapter.cpp

finley/src/CPPAdapter/TransportProblemAdapter.cpp

finley/src/CPPAdapter/finleycpp.cpp

finley/src/ElementFile.c

finley/src/ElementFile.h

finley/src/ElementFile_allocTable.c

finley/src/ElementFile_distributeByRankOfDOF.c

finley/src/ElementFile_jacobeans.c

finley/src/Finley.c

finley/src/Finley.h

finley/src/Mesh.c

finley/src/Mesh.h

finley/src/Mesh_createNodeFileMappings.c

finley/src/Mesh_distributeByRankOfDOF.c

finley/src/Mesh_getPattern.c

finley/src/Mesh_hex20.c

finley/src/Mesh_hex8.c

finley/src/Mesh_merge.c

finley/src/Mesh_optimizeDOFDistribution.c

finley/src/Mesh_optimizeDOFLabeling.c

finley/src/Mesh_prepare.c

finley/src/Mesh_read.c

finley/src/Mesh_readGmsh.c

finley/src/Mesh_rec4.c

finley/src/Mesh_rec8.c

finley/src/Mesh_resolveNodeIds.c

finley/src/Mesh_saveDX.c

finley/src/Mesh_saveVTK.c

finley/src/NodeFile.c

finley/src/NodeFile.h

finley/src/NodeFile_createDenseLabelings.c

finley/src/NodeFile_gather.c

finley/src/NodeFile_setIdRange.c

finley/src/NodeMapping.c

finley/src/NodeMapping.h

finley/src/Quadrature.c

finley/src/ReferenceElementSets.c

finley/src/ReferenceElementSets.h

finley/src/ReferenceElements.c

finley/src/ReferenceElements.h

finley/src/SConscript

finley/src/ShapeFunctions.c

finley/src/TagMap.c

finley/src/Util.c

finley/src/Util.h

finley/test/SConscript

finley/test/finley_UnitTests.cpp

finley/test/python/SConscript

finley/test/python/run_escriptOnFinley.py

finley/test/python/run_linearPDEsOnFinley1.py

modellib/py_src/SConscript

modellib/py_src/geometry.py

modellib/test/python/SConscript

modellib/test/python/run_convection.py

paso/profiling/SConscript

paso/src/AMG.c

paso/src/AMLI.c

paso/src/BiCGStab.c

paso/src/BlockOps.h

paso/src/Coarsening.c

paso/src/Common.h

paso/src/Coupler.c

paso/src/Coupler.h

paso/src/Distribution.c

paso/src/Distribution.h

paso/src/FCTSolver.c

paso/src/FCTSolver_Function.c

paso/src/FCTSolver_util.c

paso/src/Functions.c

paso/src/Functions.h

paso/src/GMRES.c

paso/src/ILU.c

paso/src/MINRES.c

paso/src/MKL.c

paso/src/Options.h

paso/src/Options_getPackage.c

paso/src/Options_getSolver.c

paso/src/PCG.c

paso/src/Paso.h

paso/src/PasoUtil.c

paso/src/PasoUtil.h

paso/src/Pattern.c

paso/src/Pattern_getSubpattern.c

paso/src/Pattern_mis.c

paso/src/Pattern_reduceBandwidth.c

paso/src/Pattern_unrollBlocks.c

paso/src/Preconditioner.c

paso/src/RILU.c

paso/src/ReactiveSolver.c

paso/src/SConscript

paso/src/SharedComponents.c

paso/src/SharedComponents.h

paso/src/Smoother.c

paso/src/Solver.c

paso/src/Solver_Function.c

paso/src/SparseMatrix.c

paso/src/SparseMatrix_AMGcomponents.c

paso/src/SparseMatrix_getSubmatrix.c

paso/src/SparseMatrix_invMain.c

paso/src/SparseMatrix_saveHB.c

paso/src/SystemMatrix.c

paso/src/SystemMatrix.h

paso/src/SystemMatrixPattern.c

paso/src/SystemMatrixPattern.h

paso/src/SystemMatrixPattern_unrollBlocks.c

paso/src/SystemMatrix_MIS.c

paso/src/SystemMatrix_MatrixVector.c

paso/src/SystemMatrix_borrowNormalization.c

paso/src/SystemMatrix_getSystemMatrixTypeId.c

paso/src/SystemMatrix_loadMM.c

paso/src/SystemMatrix_nullifyRows.c

paso/src/SystemMatrix_nullifyRowsAndCols.c

paso/src/SystemMatrix_rowSum.c

paso/src/SystemMatrix_saveHB.c

paso/src/SystemMatrix_saveMM.c

paso/src/TFQMR.c

paso/src/Transport.c

paso/src/Transport.h

paso/src/Transport_solve.c

paso/src/UMFPACK.c

paso/src/performance.c

paso/src/solve.c

pycad/py_src/SConscript

pycad/py_src/transformations.py

pycad/test/python/SConscript

pycad/test/python/run_pycad_test.py

pythonMPI/src/SConscript

pythonMPI/src/ScriptMPI.cpp

pythonMPI/src/ScriptMPIredirect.cpp

pyvisi/py_src/SConscript

pyvisi/test/python/SConscript

scons/badger_options.py

scons/cgisrv3_options.py

scons/guineapig_options.py

scons/savanna_options.py

scons/shake24_options.py

scons/shake34_options.py

scons/shake59_options.py

scons/shake75_options.py

scons/sunzi_options.py

scons/windows_intelc_options.py

scons/windows_mscv90_options.py

tools/CppUnitTest/src/SConscript

tools/escriptconvert/SConscript

tools/escriptconvert/escriptconvert.cpp

weipa/py_src/SConscript

weipa/src/DataVar.cpp

weipa/src/EscriptDataset.cpp

weipa/src/FinleyDomain.cpp

weipa/src/FinleyDomain.h

weipa/src/FinleyElements.cpp

weipa/src/FinleyElements.h

weipa/src/FinleyNodes.cpp

weipa/src/FinleyNodes.h

weipa/src/SConscript

weipa/src/VisItControl.cpp

weipa/src/weipa.h

weipa/test/SConscript

weipa/test/weipa_UnitTest.cpp

Show diffs side-by-side

added added

removed removed

dudley/src/ElementFile_distributeByRankOfDOF.c

/*******************************************************

* Earth Systems Science Computational Center (ESSCC)

* http://www.uq.edu.au/esscc

* Primary Business: Queensland, Australia

* Licensed under the Open Software License version 3.0

* http://www.opensource.org/licenses/osl-3.0.php

*******************************************************/

/**************************************************************/

/* Dudley: ElementFile: this will redistribute the Elements including overlap by */

/**************************************************************/

#include "ElementFile.h"

#ifdef _OPENMP

#include <omp.h>

#endif

/**************************************************************/

void Dudley_ElementFile_distributeByRankOfDOF(Dudley_ElementFile * self, Esys_MPI_rank * mpiRankOfDOF, index_t * Id)

{

size_t size_size;

Esys_MPI_rank myRank, p, *Owner_buffer = NULL, loc_proc_mask_max;

dim_t e, j, i, size, *send_count = NULL, *recv_count = NULL, *newOwner = NULL, *loc_proc_mask =

NULL, *loc_send_count = NULL, newNumElements, numElementsInBuffer, numNodes, numRequests, NN;

index_t *send_offset = NULL, *recv_offset = NULL, *Id_buffer = NULL, *Tag_buffer = NULL, *Nodes_buffer = NULL, k;

bool_t *proc_mask = NULL;

#ifdef ESYS_MPI

MPI_Request *mpi_requests = NULL;

MPI_Status *mpi_stati = NULL;

#endif

if (self == NULL)

return;

myRank = self->MPIInfo->rank;

size = self->MPIInfo->size;

size_size = size * sizeof(dim_t);

numNodes = self->numNodes;

NN = self->numNodes;

if (size > 1)

{

#ifdef ESYS_MPI

mpi_requests = TMPMEMALLOC(8 * size, MPI_Request);

mpi_stati = TMPMEMALLOC(8 * size, MPI_Status);

Dudley_checkPtr(mpi_requests);

Dudley_checkPtr(mpi_stati);

#endif

/* count the number elements that have to be send to each processor (send_count)

and define a new element owner as the processor with the largest number of DOFs and the smallest id */

send_count = TMPMEMALLOC(size, dim_t);

recv_count = TMPMEMALLOC(size, dim_t);

newOwner = TMPMEMALLOC(self->numElements, Esys_MPI_rank);

if (!(Dudley_checkPtr(send_count) || Dudley_checkPtr(recv_count) || Dudley_checkPtr(newOwner)))

{

memset(send_count, 0, size_size);

#pragma omp parallel private(p,loc_proc_mask,loc_send_count)

{

loc_proc_mask = THREAD_MEMALLOC(size, dim_t);

loc_send_count = THREAD_MEMALLOC(size, dim_t);

memset(loc_send_count, 0, size_size);

#pragma omp for private(e,j,loc_proc_mask_max) schedule(static)

for (e = 0; e < self->numElements; e++)

{

if (self->Owner[e] == myRank)

{

newOwner[e] = myRank;

memset(loc_proc_mask, 0, size_size);

for (j = 0; j < numNodes; j++)

{

p = mpiRankOfDOF[self->Nodes[INDEX2(j, e, NN)]];

loc_proc_mask[p]++;

}

loc_proc_mask_max = 0;

for (p = 0; p < size; ++p)

{

if (loc_proc_mask[p] > 0)

loc_send_count[p]++;

if (loc_proc_mask[p] > loc_proc_mask_max)

{

newOwner[e] = p;

loc_proc_mask_max = loc_proc_mask[p];

}

else

{

newOwner[e] = -1;

}

#pragma omp critical

{

for (p = 0; p < size; ++p)

100

send_count[p] += loc_send_count[p];

101

}

102

THREAD_MEMFREE(loc_proc_mask);

103

THREAD_MEMFREE(loc_send_count);

104

}

105

#ifdef ESYS_MPI

106

MPI_Alltoall(send_count, 1, MPI_INT, recv_count, 1, MPI_INT, self->MPIInfo->comm);

107

#else

108

for (p = 0; p < size; ++p)

109

recv_count[p] = send_count[p];

110

#endif

111

/* get the new number of elements for this processor */

112

newNumElements = 0;

113

for (p = 0; p < size; ++p)

114

newNumElements += recv_count[p];

115

116

/* get the new number of elements for this processor */

117

numElementsInBuffer = 0;

118

for (p = 0; p < size; ++p)

119

numElementsInBuffer += send_count[p];

120

/* allocate buffers */

121

Id_buffer = TMPMEMALLOC(numElementsInBuffer, index_t);

122

Tag_buffer = TMPMEMALLOC(numElementsInBuffer, index_t);

123

Owner_buffer = TMPMEMALLOC(numElementsInBuffer, Esys_MPI_rank);

124

Nodes_buffer = TMPMEMALLOC(numElementsInBuffer * NN, index_t);

125

send_offset = TMPMEMALLOC(size, index_t);

126

recv_offset = TMPMEMALLOC(size, index_t);

127

proc_mask = TMPMEMALLOC(size, bool_t);

128

if (!(Dudley_checkPtr(Id_buffer) || Dudley_checkPtr(Tag_buffer) || Dudley_checkPtr(Owner_buffer) ||

129

Dudley_checkPtr(Nodes_buffer) || Dudley_checkPtr(send_offset) || Dudley_checkPtr(recv_offset) ||

130

Dudley_checkPtr(proc_mask)))

131

{

132

133

/* callculate the offsets for the processor buffers */

134

recv_offset[0] = 0;

135

for (p = 0; p < size - 1; ++p)

136

recv_offset[p + 1] = recv_offset[p] + recv_count[p];

137

send_offset[0] = 0;

138

for (p = 0; p < size - 1; ++p)

139

send_offset[p + 1] = send_offset[p] + send_count[p];

140

141

memset(send_count, 0, size_size);

142

/* copy element into buffers. proc_mask makes sure that an element is copied once only for each processor */

143

for (e = 0; e < self->numElements; e++)

144

{

145

if (self->Owner[e] == myRank)

146

{

147

memset(proc_mask, TRUE, size_size);

148

for (j = 0; j < numNodes; j++)

149

{

150

p = mpiRankOfDOF[self->Nodes[INDEX2(j, e, NN)]];

151

if (proc_mask[p])

152

{

153

k = send_offset[p] + send_count[p];

154

Id_buffer[k] = self->Id[e];

155

Tag_buffer[k] = self->Tag[e];

156

Owner_buffer[k] = newOwner[e];

157

for (i = 0; i < numNodes; i++)

158

Nodes_buffer[INDEX2(i, k, NN)] = Id[self->Nodes[INDEX2(i, e, NN)]];

159

send_count[p]++;

160

proc_mask[p] = FALSE;

161

}

162

}

163

}

164

}

165

/* allocate new tables */

166

Dudley_ElementFile_allocTable(self, newNumElements);

167

168

/* start to receive new elements */

169

numRequests = 0;

170

for (p = 0; p < size; ++p)

171

{

172

if (recv_count[p] > 0)

173

{

174

#ifdef ESYS_MPI

175

MPI_Irecv(&(self->Id[recv_offset[p]]), recv_count[p],

176

MPI_INT, p, self->MPIInfo->msg_tag_counter + myRank,

177

self->MPIInfo->comm, &mpi_requests[numRequests]);

178

numRequests++;

179

MPI_Irecv(&(self->Tag[recv_offset[p]]), recv_count[p],

180

MPI_INT, p, self->MPIInfo->msg_tag_counter + size + myRank,

181

self->MPIInfo->comm, &mpi_requests[numRequests]);

182

numRequests++;

183

MPI_Irecv(&(self->Owner[recv_offset[p]]), recv_count[p],

184

MPI_INT, p, self->MPIInfo->msg_tag_counter + 2 * size + myRank,

185

self->MPIInfo->comm, &mpi_requests[numRequests]);

186

numRequests++;

187

MPI_Irecv(&(self->Nodes[recv_offset[p] * NN]), recv_count[p] * NN,

188

MPI_INT, p, self->MPIInfo->msg_tag_counter + 3 * size + myRank,

189

self->MPIInfo->comm, &mpi_requests[numRequests]);

190

numRequests++;

191

#endif

192

}

193

}

194

/* now the buffers can be send away */

195

for (p = 0; p < size; ++p)

196

{

197

if (send_count[p] > 0)

198

{

199

#ifdef ESYS_MPI

200

MPI_Issend(&(Id_buffer[send_offset[p]]), send_count[p],

201

MPI_INT, p, self->MPIInfo->msg_tag_counter + p,

202

self->MPIInfo->comm, &mpi_requests[numRequests]);

203

numRequests++;

204

MPI_Issend(&(Tag_buffer[send_offset[p]]), send_count[p],

205

MPI_INT, p, self->MPIInfo->msg_tag_counter + size + p,

206

self->MPIInfo->comm, &mpi_requests[numRequests]);

207

numRequests++;

208

MPI_Issend(&(Owner_buffer[send_offset[p]]), send_count[p],

209

MPI_INT, p, self->MPIInfo->msg_tag_counter + 2 * size + p,

210

self->MPIInfo->comm, &mpi_requests[numRequests]);

211

numRequests++;

212

MPI_Issend(&(Nodes_buffer[send_offset[p] * NN]), send_count[p] * NN,

213

MPI_INT, p, self->MPIInfo->msg_tag_counter + 3 * size + p,

214

self->MPIInfo->comm, &mpi_requests[numRequests]);

215

numRequests++;

216

#endif

217

218

}

219

}

220

self->MPIInfo->msg_tag_counter += 4 * size;

221

/* wait for the requests to be finalized */

222

#ifdef ESYS_MPI

223

MPI_Waitall(numRequests, mpi_requests, mpi_stati);

224

#endif

225

}

226

/* clear buffer */

227

TMPMEMFREE(Id_buffer);

228

TMPMEMFREE(Tag_buffer);

229

TMPMEMFREE(Owner_buffer);

230

TMPMEMFREE(Nodes_buffer);

231

TMPMEMFREE(send_offset);

232

TMPMEMFREE(recv_offset);

233

TMPMEMFREE(proc_mask);

234

}

235

#ifdef ESYS_MPI

236

TMPMEMFREE(mpi_requests);

237

TMPMEMFREE(mpi_stati);

238

#endif

239

TMPMEMFREE(send_count);

240

TMPMEMFREE(recv_count);

241

TMPMEMFREE(newOwner);

242

}

243

else

244

{

245

#pragma omp for private(e,i) schedule(static)

246

for (e = 0; e < self->numElements; e++)

247

{

248

self->Owner[e] = myRank;

249

for (i = 0; i < numNodes; i++)

250

self->Nodes[INDEX2(i, e, NN)] = Id[self->Nodes[INDEX2(i, e, NN)]];

251

}

252

}

253

return;

254

}

Older »