Salome HOME
allow using mpich for mpi2 coupling in Salome
[modules/kernel.git] / src / MPIContainer / MPIObject_i.cxx
1 // Copyright (C) 2007-2011  CEA/DEN, EDF R&D, OPEN CASCADE
2 //
3 // Copyright (C) 2003-2007  OPEN CASCADE, EADS/CCR, LIP6, CEA/DEN,
4 // CEDRAT, EDF R&D, LEG, PRINCIPIA R&D, BUREAU VERITAS
5 //
6 // This library is free software; you can redistribute it and/or
7 // modify it under the terms of the GNU Lesser General Public
8 // License as published by the Free Software Foundation; either
9 // version 2.1 of the License.
10 //
11 // This library is distributed in the hope that it will be useful,
12 // but WITHOUT ANY WARRANTY; without even the implied warranty of
13 // MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
14 // Lesser General Public License for more details.
15 //
16 // You should have received a copy of the GNU Lesser General Public
17 // License along with this library; if not, write to the Free Software
18 // Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA  02111-1307 USA
19 //
20 // See http://www.salome-platform.org/ or email : webmaster.salome@opencascade.com
21 //
22
23 //  SALOME MPIContainer : implemenation of container based on MPI libraries
24 //  File   : MPIObject_i.cxx
25 //  Module : SALOME
26 //
27 #include "MPIObject_i.hxx"
28 #include "utilities.h"
29 #include "Utils_SALOME_Exception.hxx"
30
31 #define TIMEOUT 5
32
33 MPIObject_i::MPIObject_i()
34 {
35   MPI_Comm_size( MPI_COMM_WORLD, &_nbproc );
36   MPI_Comm_rank( MPI_COMM_WORLD, &_numproc );
37   _tior=NULL;
38 }
39
40 MPIObject_i::~MPIObject_i()
41 {
42   if(_tior) delete _tior;
43 }
44
45 Engines::IORTab* MPIObject_i::tior()
46 {
47   Engines::IORTab_var tior = new Engines::IORTab;
48   tior->length(_tior->length());
49   for(unsigned int ip=0;ip<tior->length();ip++)
50     tior[ip] = (*_tior)[ip];
51   return tior._retn(); 
52 };
53
54 void MPIObject_i::tior(const Engines::IORTab& ior)
55 {
56   _tior = new Engines::IORTab;
57   _tior->length(ior.length());
58   for(unsigned int ip=0;ip<ior.length();ip++)
59     (*_tior)[ip] = ior[ip];
60 }
61
62 void MPIObject_i::BCastIOR(CORBA::ORB_ptr orb, Engines::MPIObject_ptr pobj, bool amiCont)
63 {
64   int err, ip, n;
65   char *ior;
66   MPI_Status status; /* status de reception de message MPI */
67   std::ostringstream msg;
68
69   if( _numproc == 0 )
70     {
71
72       //Allocation du tableau des IOR
73       Engines::IORTab_var iort = new Engines::IORTab;
74       iort->length(_nbproc);
75       
76       iort[0] = pobj;
77
78       // Process 0 recupere les ior de l'object sur les autres process
79       for(ip=1;ip<_nbproc;ip++)
80         {
81           err = MPI_Recv(&n,1,MPI_INT,ip,ip,MPI_COMM_WORLD,&status);
82           if(err)
83             {
84               msg << "[" << _numproc << "] MPI_RECV error";
85               throw SALOME_Exception(msg.str().c_str());
86             }
87           // Allocation de la chaine de longueur n
88           ior = new char[n];
89           err = MPI_Recv(ior,n,MPI_CHAR,ip,2*ip,MPI_COMM_WORLD,&status);
90           if(err)
91             {
92               msg << "[" << _numproc << "] MPI_RECV error";
93               throw SALOME_Exception(msg.str().c_str());
94             }
95           iort[ip] = orb->string_to_object(ior);
96           delete [] ior;
97           if(CORBA::is_nil(iort[ip]))
98             {
99               msg << "[" << ip << "] MPI Component not loaded";
100               throw SALOME_Exception(msg.str().c_str());
101             }
102         }
103       // On donne le tableau des ior a l'objet Corba du process 0
104       if( amiCont )
105         tior(*(iort._retn()));
106       else
107         pobj->tior(*(iort._retn()));
108     }
109   else
110     {
111       // Conversion IOR vers string
112       ior = orb->object_to_string(pobj);
113       n = strlen(ior) + 1;
114       // On envoie l'IOR au process 0
115       err = MPI_Send(&n,1,MPI_INT,0,_numproc,MPI_COMM_WORLD);
116       if(err)
117         {
118           msg << "[" << _numproc << "] MPI_SEND error";
119           throw SALOME_Exception(msg.str().c_str());
120         }
121       err = MPI_Send(ior,n,MPI_CHAR,0,2*_numproc,MPI_COMM_WORLD);
122       if(err)
123         {
124           msg << "[" << _numproc << "] MPI_SEND error";
125           throw SALOME_Exception(msg.str().c_str());
126         }
127       CORBA::string_free(ior);
128     }
129  
130 }
131
132 #ifdef HAVE_MPI2
133 void MPIObject_i::remoteMPI2Connect(std::string service)
134 {
135   int i;
136   char port_name[MPI_MAX_PORT_NAME];
137   char port_name_clt[MPI_MAX_PORT_NAME];
138   std::ostringstream msg;
139
140   if( service.size() == 0 )
141     {
142       msg << "[" << _numproc << "] You have to give a service name !";
143       throw SALOME_Exception(msg.str().c_str());
144     }
145
146   if( _srv.find(service) != _srv.end() )
147     {
148       msg << "[" << _numproc << "] service " << service << " already exist !";
149       throw SALOME_Exception(msg.str().c_str());
150     }
151
152   _srv[service] = false;
153
154   MPI_Barrier(MPI_COMM_WORLD);
155
156   MPI_Errhandler_set(MPI_COMM_WORLD, MPI_ERRORS_RETURN);
157   if( _numproc == 0 )
158     { 
159       /* rank 0 try to be a server. If service is already published, try to be a cient */
160       MPI_Open_port(MPI_INFO_NULL, port_name); 
161       if ( MPI_Lookup_name((char*)service.c_str(), MPI_INFO_NULL, port_name_clt) == MPI_SUCCESS )
162         {
163           MESSAGE("[" << _numproc << "] I get the connection with " << service << " at " << port_name_clt << std::endl);
164           MPI_Close_port( port_name );
165         }
166       else if ( MPI_Publish_name((char*)service.c_str(), MPI_INFO_NULL, port_name) == MPI_SUCCESS )
167         {
168           _srv[service] = true;
169           _port_name[service] = port_name;
170           MESSAGE("[" << _numproc << "] service " << service << " available at " << port_name << std::endl);
171         }      
172       else if ( MPI_Lookup_name((char*)service.c_str(), MPI_INFO_NULL, port_name_clt) == MPI_SUCCESS )
173         {
174           MESSAGE("[" << _numproc << "] I get the connection with " << service << " at " << port_name_clt << std::endl);
175           MPI_Close_port( port_name );
176         }
177       else
178         {
179           msg << "[" << _numproc << "] Error on connection with " << service << " at " << port_name_clt;
180           throw SALOME_Exception(msg.str().c_str());
181         }
182     }
183   else
184     {
185       i=0;
186       /* Waiting rank 0 publish name and try to be a client */
187       while ( i != TIMEOUT  ) 
188         {
189           sleep(1);
190           if ( MPI_Lookup_name((char*)service.c_str(), MPI_INFO_NULL, port_name_clt) == MPI_SUCCESS )
191             {
192               MESSAGE("[" << _numproc << "] I get the connection with " << service << " at " << port_name_clt << std::endl);
193               break;
194             }
195           i++;
196         }
197       if(i==TIMEOUT)
198         {
199           msg << "[" << _numproc << "] Error on connection with " << service << " at " << port_name_clt;
200           throw SALOME_Exception(msg.str().c_str());
201         }
202     }
203   MPI_Errhandler_set(MPI_COMM_WORLD, MPI_ERRORS_ARE_FATAL);
204   
205   /* If rank 0 is server, all processes call MPI_Comm_accept */
206   /* If rank 0 is not server, all processes call MPI_Comm_connect */
207   int srv = (int)_srv[service];
208   MPI_Bcast(&srv,1,MPI_INT,0,MPI_COMM_WORLD);
209   _srv[service] = (bool)srv;
210   if ( _srv[service] )
211     MPI_Comm_accept( port_name, MPI_INFO_NULL, 0, MPI_COMM_WORLD, &(_icom[service]) );
212   else
213     MPI_Comm_connect(port_name_clt, MPI_INFO_NULL, 0, MPI_COMM_WORLD, &(_icom[service]) );
214
215   /* create global communicator: servers have low index in global communicator*/
216   MPI_Intercomm_merge(_icom[service],!_srv[service],&(_gcom[service]));
217
218   /* only rank 0 can be server for unpublish name */
219   if(_numproc != 0) _srv[service] = false;
220
221 }
222
223 void MPIObject_i::remoteMPI2Disconnect(std::string service)
224 {
225   std::ostringstream msg;
226
227   if( service.size() == 0 )
228     {
229       msg << "[" << _numproc << "] You have to give a service name !";
230       throw SALOME_Exception(msg.str().c_str());
231     }
232
233   if( _srv.find(service) == _srv.end() )
234     {
235       msg << "[" << _numproc << "] service " << service << " don't exist !";
236       throw SALOME_Exception(msg.str().c_str());
237     }
238   
239   MPI_Comm_disconnect( &(_gcom[service]) ); 
240   if ( _srv[service] )
241     {
242
243       char port_name[MPI_MAX_PORT_NAME];
244       strcpy(port_name,_port_name[service].c_str());
245
246       MPI_Unpublish_name((char*)service.c_str(), MPI_INFO_NULL, port_name); 
247       MESSAGE("[" << _numproc << "] " << service << ": close port " << _port_name[service] << std::endl);
248       MPI_Close_port( port_name ); 
249       _port_name.erase(service);
250     }
251   
252   _gcom.erase(service);
253   _icom.erase(service);
254   _srv.erase(service);
255
256 }
257 #endif
258