Salome HOME
Merge from V6_main_20120808 08Aug12
[modules/kernel.git] / src / Launcher / Launcher_Job.cxx
1 // Copyright (C) 2009-2012  CEA/DEN, EDF R&D, OPEN CASCADE
2 //
3 // This library is free software; you can redistribute it and/or
4 // modify it under the terms of the GNU Lesser General Public
5 // License as published by the Free Software Foundation; either
6 // version 2.1 of the License.
7 //
8 // This library is distributed in the hope that it will be useful,
9 // but WITHOUT ANY WARRANTY; without even the implied warranty of
10 // MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
11 // Lesser General Public License for more details.
12 //
13 // You should have received a copy of the GNU Lesser General Public
14 // License along with this library; if not, write to the Free Software
15 // Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA  02111-1307 USA
16 //
17 // See http://www.salome-platform.org/ or email : webmaster.salome@opencascade.com
18 //
19
20 // Author: AndrĂ© RIBES - EDF R&D
21 //
22 #include "Launcher_Job.hxx"
23 #include "Launcher.hxx"
24
25 #ifdef WITH_LIBBATCH
26 #include <Batch/Batch_Constants.hxx>
27 #endif
28
29 Launcher::Job::Job()
30 {
31   _number = -1;
32   _state = "CREATED";
33   _launch_date = getLaunchDate();
34
35   _env_file = "";
36   _job_name = "";
37   _job_file = "";
38   _job_file_name = "";
39   _job_file_name_complete = "";
40   _work_directory = "";
41   _local_directory = "";
42   _result_directory = "";
43   _maximum_duration = "";
44   _maximum_duration_in_second = -1;
45   _resource_required_params.name = "";
46   _resource_required_params.hostname = "";
47   _resource_required_params.OS = "";
48   _resource_required_params.nb_proc = -1;
49   _resource_required_params.nb_node = -1;
50   _resource_required_params.nb_proc_per_node = -1;
51   _resource_required_params.cpu_clock = -1;
52   _resource_required_params.mem_mb = -1;
53   _queue = "";
54   _job_type = "";
55
56 #ifdef WITH_LIBBATCH
57   _batch_job = new Batch::Job();
58 #endif
59 }
60
61 Launcher::Job::~Job() 
62 {
63   LAUNCHER_MESSAGE("Deleting job number: " << _number);
64 #ifdef WITH_LIBBATCH
65   if (_batch_job)
66     delete _batch_job;
67 #endif
68 }
69
70 void
71 Launcher::Job::stopJob()
72 {
73   LAUNCHER_MESSAGE("Stop resquested for job number: " << _number);
74   setState("FAILED");
75 #ifdef WITH_LIBBATCH
76   if (_batch_job_id.getReference() != "undefined")
77   {
78     try 
79     {
80       _batch_job_id.deleteJob();
81     }
82     catch (const Batch::EmulationException &ex)
83     {
84       LAUNCHER_INFOS("WARNING: exception when stopping the job: " << ex.message);
85     }
86   }
87 #endif
88 }
89
90
91 void
92 Launcher::Job::removeJob()
93 {
94   LAUNCHER_MESSAGE("Removing job number: " << _number);
95 #ifdef WITH_LIBBATCH
96   if (_batch_job_id.getReference() != "undefined")
97   {
98     try 
99     {
100       _batch_job_id.deleteJob();
101     }
102     catch (const Batch::EmulationException &ex)
103     {
104       LAUNCHER_INFOS("WARNING: exception when removing the job: " << ex.message);
105     }
106   }
107 #endif
108 }
109
110 std::string
111 Launcher::Job::getJobType()
112 {
113   return _job_type;
114 }
115
116 void
117 Launcher::Job::setJobName(const std::string & job_name)
118 {
119   _job_name = job_name;
120 }
121
122 std::string
123 Launcher::Job::getJobName()
124 {
125   return _job_name;
126 }
127
128 void 
129 Launcher::Job::setState(const std::string & state)
130 {
131   // State of a Job: CREATED, QUEUED, RUNNING, FINISHED, FAILED
132   if (state != "CREATED" &&
133       state != "IN_PROCESS" &&
134       state != "QUEUED" &&
135       state != "RUNNING" &&
136       state != "PAUSED" &&
137       state != "FINISHED" &&
138       state != "FAILED" &&
139       state != "ERROR")
140   {
141     throw LauncherException("Bad state, this state does not exist: " + state);
142   }
143   _state = state;
144 }
145
146 std::string 
147 Launcher::Job::getState()
148 {
149   return _state;
150 }
151
152 void 
153 Launcher::Job::setNumber(const int & number)
154 {
155   if (_number != -1)
156     std::cerr << "Launcher::Job::setNumber -- Job number was already defined, before: " << _number << " now: " << number << std::endl;
157   _number = number;
158 }
159
160 int
161 Launcher::Job::getNumber()
162 {
163   return _number;
164 }
165
166 void 
167 Launcher::Job::setResourceDefinition(const ParserResourcesType & resource_definition)
168 {
169   // Check machine_definition
170   std::string user_name = "";
171   if (resource_definition.UserName == "")
172   {
173     user_name = getenv("USER");
174     if (user_name == "")
175     {
176       std::string mess = "You must define a user name: into your resource description or with env variable USER";
177       throw LauncherException(mess);
178     }
179   }
180   else
181     user_name = resource_definition.UserName;
182
183   _resource_definition = resource_definition;
184   _resource_definition.UserName = user_name;
185 }
186
187 ParserResourcesType 
188 Launcher::Job::getResourceDefinition()
189 {
190   return _resource_definition;
191 }
192
193 void 
194 Launcher::Job::setJobFile(const std::string & job_file)
195 {
196   // Check job file
197   if (job_file == "")
198   {
199     std::string mess = "Empty Job File is forbidden !";
200     throw LauncherException(mess);
201   }
202
203   _job_file = job_file;
204   std::string::size_type p1 = _job_file.find_last_of("/");
205   std::string::size_type p2 = _job_file.find_last_of(".");
206   _job_file_name_complete = _job_file.substr(p1+1);
207   _job_file_name = _job_file.substr(p1+1,p2-p1-1);
208 }
209
210 std::string
211 Launcher::Job::getJobFile()
212 {
213   return _job_file;
214 }
215 void 
216 Launcher::Job::setEnvFile(const std::string & env_file)
217 {
218   _env_file = env_file;
219 }
220
221 std::string
222 Launcher::Job::getEnvFile()
223 {
224   return _env_file;
225 }
226
227 void 
228 Launcher::Job::setWorkDirectory(const std::string & work_directory)
229 {
230   _work_directory = work_directory;
231 }
232
233 void 
234 Launcher::Job::setLocalDirectory(const std::string & local_directory)
235 {
236   _local_directory = local_directory;
237 }
238
239 void 
240 Launcher::Job::setResultDirectory(const std::string & result_directory)
241 {
242   _result_directory = result_directory;
243 }
244
245 void 
246 Launcher::Job::add_in_file(const std::string & file)
247 {
248   std::list<std::string>::iterator it = std::find(_in_files.begin(), _in_files.end(), file);
249   if (it == _in_files.end())
250     _in_files.push_back(file);
251   else
252     std::cerr << "Launcher::Job::add_in_file -- Warning file was already entered in in_files: " << file << std::endl;
253 }
254
255 void 
256 Launcher::Job::add_out_file(const std::string & file)
257 {
258   std::list<std::string>::iterator it = std::find(_out_files.begin(), _out_files.end(), file);
259   if (it == _out_files.end())
260     _out_files.push_back(file);
261   else
262     std::cerr << "Launcher::Job::add_out_file -- Warning file was already entered in out_files: " << file << std::endl;
263 }
264
265 void 
266 Launcher::Job::setMaximumDuration(const std::string & maximum_duration)
267 {
268   checkMaximumDuration(maximum_duration);
269   _maximum_duration_in_second = convertMaximumDuration(maximum_duration);
270   _maximum_duration = maximum_duration;
271 }
272
273 void 
274 Launcher::Job::setResourceRequiredParams(const resourceParams & resource_required_params)
275 {
276   checkResourceRequiredParams(resource_required_params);
277   _resource_required_params = resource_required_params;
278 }
279
280 void 
281 Launcher::Job::setQueue(const std::string & queue)
282 {
283   _queue = queue;
284 }
285
286 std::string 
287 Launcher::Job::getWorkDirectory()
288 {
289   return _work_directory;
290 }
291
292 std::string 
293 Launcher::Job::getLocalDirectory()
294 {
295   return _local_directory;
296 }
297
298 std::string
299 Launcher::Job::getResultDirectory()
300 {
301   return _result_directory;
302 }
303
304 const std::list<std::string> & 
305 Launcher::Job::get_in_files()
306 {
307   return _in_files;
308 }
309
310 const std::list<std::string> & 
311 Launcher::Job::get_out_files()
312 {
313   return _out_files;
314 }
315
316 std::string 
317 Launcher::Job::getMaximumDuration()
318 {
319   return _maximum_duration;
320 }
321
322 resourceParams 
323 Launcher::Job::getResourceRequiredParams()
324 {
325   return _resource_required_params;
326 }
327
328 std::string 
329 Launcher::Job::getQueue()
330 {
331   return _queue;
332 }
333
334 void 
335 Launcher::Job::checkMaximumDuration(const std::string & maximum_duration)
336 {
337   std::string result("");
338   std::string edt_value = maximum_duration;
339   std::size_t pos = edt_value.find(":");
340
341   if (edt_value != "") {
342     if (pos == edt_value.npos) {
343       throw LauncherException("[Launcher::Job::checkMaximumDuration] Error on definition: " + edt_value);
344     }
345     std::string begin_edt_value = edt_value.substr(0, pos);
346     std::string mid_edt_value = edt_value.substr(pos, 1);
347     std::string end_edt_value = edt_value.substr(pos + 1, edt_value.npos);
348   
349     long value;
350     std::istringstream iss(begin_edt_value);
351     if (!(iss >> value)) {
352       result = "[Launcher::Job::checkExpectedDuration] Error on definition ! : " + edt_value;
353     }
354     else if (value < 0) {
355       result = "[Launcher::Job::checkExpectedDuration] Error on definition time is negative ! : " + value;
356     }
357     std::istringstream iss_2(end_edt_value);
358     if (!(iss_2 >> value)) {
359       result = "[Launcher::Job::checkExpectedDuration] Error on definition ! : " + edt_value;
360     }
361     else if (value < 0) {
362       result = "[Launcher::Job::checkExpectedDuration] Error on definition time is negative ! : " + value;
363     }
364     if (mid_edt_value != ":") {
365       result = "[Launcher::Job::checkExpectedDuration] Error on definition ! :" + edt_value;
366     }
367   }
368   if (result != "")
369     throw LauncherException(result);
370 }
371
372 void 
373 Launcher::Job::checkResourceRequiredParams(const resourceParams & resource_required_params)
374 {
375   // nb_proc has be to > 0
376   if (resource_required_params.nb_proc <= 0)
377   {
378     std::string message("[Launcher::Job::checkResourceRequiredParams] proc number is not > 0 ! ");
379     throw LauncherException(message);
380   }
381 }
382
383 long 
384 Launcher::Job::convertMaximumDuration(const std::string & edt)
385 {
386   long hh, mm, ret;
387
388   if( edt.size() == 0 )
389     return -1;
390
391   std::string::size_type pos = edt.find(":");
392   std::string h = edt.substr(0,pos);
393   std::string m = edt.substr(pos+1,edt.size()-pos+1);
394   std::istringstream issh(h);
395   issh >> hh;
396   std::istringstream issm(m);
397   issm >> mm;
398   ret = hh*60 + mm;
399   ret = ret * 60;
400
401   return ret;
402 }
403
404 std::string 
405 Launcher::Job::getLaunchDate()
406 {
407   time_t rawtime;
408   time(&rawtime);
409   std::string launch_date = ctime(&rawtime);
410   int i = 0 ;
411   for (;i < launch_date.size(); i++) 
412     if (launch_date[i] == '/' ||
413         launch_date[i] == '-' ||
414         launch_date[i] == ':' ||
415         launch_date[i] == ' ') 
416       launch_date[i] = '_';
417   launch_date.erase(--launch_date.end()); // Last caracter is a \n
418
419   return launch_date;
420 }
421
422 std::string
423 Launcher::Job::updateJobState()
424 {
425
426   if (_state != "FINISHED" &&
427       _state != "ERROR"    &&
428       _state != "FAILED")
429   {
430 #ifdef WITH_LIBBATCH
431     if (_batch_job_id.getReference() != "undefined")
432     {
433       // A batch manager has been affected to the job
434       Batch::JobInfo job_info = _batch_job_id.queryJob();
435       Batch::Parametre par = job_info.getParametre();
436       _state = par[Batch::STATE].str();
437       LAUNCHER_MESSAGE("State received is: " << par[Batch::STATE].str());
438     }
439 #endif
440   }
441   return _state;
442 }
443
444 #ifdef WITH_LIBBATCH
445 Batch::Job * 
446 Launcher::Job::getBatchJob()
447 {
448   update_job();
449   return _batch_job;
450 }
451
452 Batch::Parametre
453 Launcher::Job::common_job_params()
454 {
455   Batch::Parametre params;
456
457   params[Batch::NAME] = getJobName();
458   params[Batch::USER] = _resource_definition.UserName;
459   params[Batch::NBPROC] = _resource_required_params.nb_proc;
460
461   // Memory in megabytes
462   if (_resource_required_params.mem_mb > 0)
463   {
464     params[Batch::MAXRAMSIZE] = _resource_required_params.mem_mb;
465   }
466
467   // We define a default directory based on user time
468   if (_work_directory == "")
469   {
470     std::string thedate;
471     Batch::Date date = Batch::Date(time(0));
472     thedate = date.str();
473     int lend = thedate.size() ;
474     int i = 0 ;
475     while ( i < lend ) {
476       if ( thedate[i] == '/' || thedate[i] == '-' || thedate[i] == ':' ) {
477         thedate[i] = '_' ;
478       }
479       i++ ;
480     }
481     _work_directory = std::string("$HOME/Batch/");
482     _work_directory += thedate;
483   }
484   params[Batch::WORKDIR] = _work_directory;
485   params[Batch::TMPDIR] = _work_directory; // To Compatibility -- remove ??? TODO
486
487   // If result_directory is not defined, we use HOME environnement
488   if (_result_directory == "")
489     _result_directory = getenv("HOME");
490
491   // _in_files
492   std::list<std::string> in_files(_in_files);
493   in_files.push_back(_job_file);
494   if (_env_file != "")
495           in_files.push_back(_env_file);
496   for(std::list<std::string>::iterator it = in_files.begin(); it != in_files.end(); it++)
497   {
498     std::string file = *it;
499
500     // local file -> If file is not an absolute path, we apply _local_directory
501     std::string local_file;
502     if (file.substr(0, 1) == std::string("/"))
503       local_file = file;
504     else
505 #ifndef WIN32
506       local_file = _local_directory + "/" + file;
507 #else
508           local_file = file;
509 #endif
510     
511     // remote file -> get only file name from in_files
512     size_t found = file.find_last_of("/");
513     std::string remote_file = _work_directory + "/" + file.substr(found+1);
514
515     params[Batch::INFILE] += Batch::Couple(local_file, remote_file);
516   }
517    
518   // _out_files
519   for(std::list<std::string>::iterator it = _out_files.begin(); it != _out_files.end(); it++)
520   {
521     std::string file = *it;
522
523     // local file 
524     size_t found = file.find_last_of("/");
525     std::string local_file = _result_directory +  "/" + file.substr(found+1);
526
527     // remote file -> If file is not an absolute path, we apply _work_directory
528     std::string remote_file;
529     if (file.substr(0, 1) == std::string("/"))
530       remote_file = file;
531     else
532       remote_file = _work_directory + "/" + file;
533
534     params[Batch::OUTFILE] += Batch::Couple(local_file, remote_file);
535   }
536
537   // Time
538   if (_maximum_duration_in_second != -1)
539     params[Batch::MAXWALLTIME] = _maximum_duration_in_second / 60;
540
541   // Queue
542   if (_queue != "")
543     params[Batch::QUEUE] = _queue;
544
545   // Specific parameters
546   std::map<std::string, std::string>::iterator it = _specific_parameters.find("LoalLevelerJobType");
547   if (it != _specific_parameters.end())
548     params["LL_JOBTYPE"] = it->second;
549   return params;
550 }
551
552 void 
553 Launcher::Job::setBatchManagerJobId(Batch::JobId batch_manager_job_id)
554 {
555   _batch_job_id = batch_manager_job_id;
556 }
557
558 Batch::JobId 
559 Launcher::Job::getBatchManagerJobId()
560 {
561   return _batch_job_id;
562 }
563 #endif
564
565 void
566 Launcher::Job::addToXmlDocument(xmlNodePtr root_node)
567 {
568   // Begin job
569   xmlNodePtr job_node = xmlNewChild(root_node, NULL, xmlCharStrdup("job"), NULL);
570   xmlNewProp(job_node, xmlCharStrdup("type"), xmlCharStrdup(getJobType().c_str()));
571   xmlNewProp(job_node, xmlCharStrdup("name"), xmlCharStrdup(getJobName().c_str()));
572
573   // Add user part
574   xmlNodePtr node = xmlNewChild(job_node, NULL, xmlCharStrdup("user_part"), NULL);
575
576   xmlNewChild(node, NULL, xmlCharStrdup("job_file"),         xmlCharStrdup(getJobFile().c_str()));
577   xmlNewChild(node, NULL, xmlCharStrdup("env_file"),         xmlCharStrdup(getEnvFile().c_str()));
578   xmlNewChild(node, NULL, xmlCharStrdup("work_directory"),   xmlCharStrdup(getWorkDirectory().c_str()));
579   xmlNewChild(node, NULL, xmlCharStrdup("local_directory"),  xmlCharStrdup(getLocalDirectory().c_str()));
580   xmlNewChild(node, NULL, xmlCharStrdup("result_directory"), xmlCharStrdup(getResultDirectory().c_str()));
581
582   // Files
583   xmlNodePtr files_node = xmlNewChild(node, NULL, xmlCharStrdup("files"), NULL);
584   std::list<std::string> in_files  = get_in_files();
585   std::list<std::string> out_files = get_out_files();
586   for(std::list<std::string>::iterator it = in_files.begin(); it != in_files.end(); it++)
587     xmlNewChild(files_node, NULL, xmlCharStrdup("in_file"), xmlCharStrdup((*it).c_str()));
588   for(std::list<std::string>::iterator it = out_files.begin(); it != out_files.end(); it++)
589     xmlNewChild(files_node, NULL, xmlCharStrdup("out_file"), xmlCharStrdup((*it).c_str()));
590
591   // Resource part
592   resourceParams resource_params = getResourceRequiredParams();
593   xmlNodePtr res_node = xmlNewChild(node, NULL, xmlCharStrdup("resource_params"), NULL);
594   xmlNewChild(res_node, NULL, xmlCharStrdup("name"),   xmlCharStrdup(resource_params.name.c_str()));
595   xmlNewChild(res_node, NULL, xmlCharStrdup("hostname"),   xmlCharStrdup(resource_params.hostname.c_str()));
596   xmlNewChild(res_node, NULL, xmlCharStrdup("OS"),   xmlCharStrdup(resource_params.OS.c_str()));
597   std::ostringstream nb_proc_stream;
598   std::ostringstream nb_node_stream;
599   std::ostringstream nb_proc_per_node_stream;
600   std::ostringstream cpu_clock_stream;
601   std::ostringstream mem_mb_stream;
602   nb_proc_stream << resource_params.nb_proc;
603   nb_node_stream << resource_params.nb_node;
604   nb_proc_per_node_stream << resource_params.nb_proc_per_node;
605   cpu_clock_stream << resource_params.cpu_clock;
606   mem_mb_stream << resource_params.mem_mb;
607   xmlNewChild(res_node, NULL, xmlCharStrdup("nb_proc"),            xmlCharStrdup(nb_proc_stream.str().c_str()));
608   xmlNewChild(res_node, NULL, xmlCharStrdup("nb_node"),            xmlCharStrdup(nb_node_stream.str().c_str()));
609   xmlNewChild(res_node, NULL, xmlCharStrdup("nb_proc_per_node"),   xmlCharStrdup(nb_proc_per_node_stream.str().c_str()));
610   xmlNewChild(res_node, NULL, xmlCharStrdup("cpu_clock"),          xmlCharStrdup(cpu_clock_stream.str().c_str()));
611   xmlNewChild(res_node, NULL, xmlCharStrdup("mem_mb"),             xmlCharStrdup(mem_mb_stream.str().c_str()));
612
613   xmlNewChild(node, NULL, xmlCharStrdup("maximum_duration"), xmlCharStrdup(getMaximumDuration().c_str()));
614   xmlNewChild(node, NULL, xmlCharStrdup("queue"),            xmlCharStrdup(getQueue().c_str()));
615
616   // Specific parameters part
617   xmlNodePtr specific_parameters_node = xmlNewChild(node, NULL, xmlCharStrdup("specific_parameters"), NULL);
618   std::map<std::string, std::string> specific_parameters = getSpecificParameters();
619   for(std::map<std::string, std::string>::iterator it = specific_parameters.begin(); it != specific_parameters.end(); it++)
620   {
621     xmlNodePtr specific_parameter_node = xmlNewChild(specific_parameters_node, NULL, xmlCharStrdup("specific_parameter"), NULL);
622     xmlNewChild(specific_parameter_node, NULL, xmlCharStrdup("name"), xmlCharStrdup((it->first).c_str()));
623     xmlNewChild(specific_parameter_node, NULL, xmlCharStrdup("value"), xmlCharStrdup((it->second).c_str()));
624   }
625
626   // Run part
627   xmlNodePtr run_node = xmlNewChild(job_node, NULL, xmlCharStrdup("run_part"), NULL);
628   xmlNewChild(run_node, NULL, xmlCharStrdup("job_state"), xmlCharStrdup(getState().c_str()));
629   ParserResourcesType resource_definition = getResourceDefinition();
630   xmlNewChild(run_node, NULL, xmlCharStrdup("resource_choosed_name"), xmlCharStrdup(resource_definition.Name.c_str()));
631
632 #ifdef WITH_LIBBATCH
633   Batch::JobId job_id = getBatchManagerJobId();
634   xmlNewChild(run_node, NULL, xmlCharStrdup("job_reference"), xmlCharStrdup(job_id.getReference().c_str()));
635 #endif
636 }
637
638 void 
639 Launcher::Job::addSpecificParameter(const std::string & name,
640                                       const std::string & value)
641 {
642   _specific_parameters[name] = value;
643 }
644
645 const std::map<std::string, std::string> &
646 Launcher::Job::getSpecificParameters()
647 {
648   return _specific_parameters;
649 }
650
651 void
652 Launcher::Job::checkSpecificParameters()
653 {
654 }