<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.0 Transitional//EN">
<HTML><HEAD>
<META http-equiv=Content-Type content="text/html; charset=iso-8859-1">
<META content="MSHTML 6.00.2800.1589" name=GENERATOR>
<STYLE></STYLE>
</HEAD>
<BODY bgColor=#ffffff>
<DIV><FONT face=Arial size=2>Hello,</FONT></DIV>
<DIV><FONT face=Arial size=2></FONT>&nbsp;</DIV>
<DIV><FONT face=Arial size=2>I'm running the MVAPICH2-0.9.8 using the IB Gold 
Release.&nbsp;I've got 2 16 processor nodes (each has 8 dual-core AMD 
Opterons)&nbsp;hooked up through infiniband. I started off running this parallel 
Fortran code on just one node with MPICH2 and had no problems. It scaled 
decently to 8 processors but didn't see much improvement with&nbsp;the jump to 
16 (possibly due to cache coherency or something). Now, when trying to get it 
running across the infiniband connect I get this error:</FONT></DIV>
<DIV><FONT face=Arial size=2></FONT>&nbsp;</DIV>
<DIV><FONT face=Arial size=2>current bytes 4, total bytes 28, remote id 
1</FONT></DIV>
<DIV><FONT face=Arial size=2>nfa_opt: ch3_smp_progress.c:2075: 
MPIDI_CH3I_SMP_pull_header: Assertion </FONT><FONT face=Arial 
size=2>'current_bytes[vc-&gt;smp.local_nodes] == 0' failed.</FONT></DIV>
<DIV><FONT face=Arial size=2>rank 0 in job 1 nessie_32906&nbsp; caused 
collective abort of all ranks</FONT></DIV>
<DIV><FONT face=Arial size=2>&nbsp;exit status of rank 0: killed by signal 
9</FONT></DIV>
<DIV><FONT face=Arial size=2></FONT>&nbsp;</DIV>
<DIV><FONT face=Arial size=2>This happens right after a one sided communication 
(MPI_GET) but before the MPI_WIN_UNLOCK call that&nbsp;follows. Also this is 
only with&nbsp;a process that is on the same node as the calling 
process,&nbsp;&nbsp; The MPI_GET call exits with no errors also.</FONT></DIV>
<DIV><FONT face=Arial size=2></FONT>&nbsp;</DIV>
<DIV><FONT face=Arial size=2>All the osu_benchmarks run with no 
problems.&nbsp;There were also no problems if I&nbsp;make a local mpd (mpd 
&amp;) ring on a single node and run the code&nbsp;with 
MVAPICH2&nbsp;with&nbsp;2,4,8,or 16 processors.&nbsp;&nbsp;If I compile with the 
MPICH2 libraries there are no problems on a single node or running processes 
spread out on both nodes. </FONT><FONT face=Arial size=2></FONT></DIV>
<DIV><FONT face=Arial size=2></FONT>&nbsp;</DIV>
<DIV><FONT face=Arial size=2>Ever seen this before? Any help would be greatly 
appreciated.</FONT></DIV>
<DIV><FONT face=Arial size=2></FONT>&nbsp;</DIV>
<DIV><FONT face=Arial size=2>Thanks,</FONT></DIV>
<DIV><FONT face=Arial size=2>Thomas O'Shea</FONT></DIV>
<DIV><FONT face=Arial size=2>SAIC</FONT></DIV></BODY></HTML>