Hi all,<br><br>We have an infiniband cluster:<br>Node: 2xQuad Core Intel Xeon 2.33 GHz<br>O/S: RHEL4.5<br>File System: GPFS<br>We are using MVAPICH2-1.0.2p1 with BLCR-0.6.5.<br>At this moment we have no problems with C/R(everything works fine).<br>
<br>I wonder could the MPI job be restarted after a checkpointing on another subset of nodes,<br>i.e. could the migration for MPI processes be realized from a node on another one?<br>If not so, will you support this capability in the future? Thanks.<br>
<br>Maya<br><br>