宇文坤德推上开关。
机柜的电源指示灯闪了一下,亮了。
总线空闲灯闪了两下,也稳了。
三块运算板的指示灯全部亮起来,绿色的光在昏暗的车间里格外醒目。
吴国华把逻辑分析仪的探头夹在总线上,盯着屏幕看了十几秒。
“总线竞争比之前频繁了。”
他的声音有些紧,“三块板卡同时访问的时候,仲裁冲突的概率大了很多。刚才十几秒就出现了两次。”
他调出波形图,指着屏幕上重叠在一起的两条线。
“你看,这里,板卡a和板卡c同时起了请求。仲裁器把优先级给了a,c应该等a结束再。但c没有等,直接了。数据冲突。”
宇文坤德蹲在机柜后面,用手指点着背板上的总线连接器。
“仲裁器的逻辑没问题,还是时序的问题。”
他的声音有些疲惫,“板卡多了,信号在总线上走的时间不一样。远的板卡信号晚到,近的早到。仲裁器看到的‘总线空闲’,可能不是真正的空闲。”
吕辰在本子上写了一大段,然后把本子合上。
“先这样跑着。把问题暴露充分了,下一版一并改。”
他看了看表,已经快中午了。
“吃饭。下午接着跑,跑24小时。”
下午的测试,加了第四块运算板。
机柜里已经插了十块板卡,散热风扇的声音明显变大了,呼呼地响。
吴国华把温度计贴在运算板的芯片表面,看着温度读数慢慢往上爬。
“45度……5o度……55度……”
到了58度,稳住了。
“比之前高了8度。”
他把温度计拿下来,看了看,“还在芯片的工作温度范围内,但余量不大了。要是夏天,机柜里塞满了板卡,温度肯定。”
吕辰在本子上记了一笔:四块运算板满载时机柜内部温度58度,建议加强风冷或重新评估散热方案。
万人敌下午三点多又来了,手里拿着另一份检测报告。
“电阻没问题,晶体没问题,连接器没问题。”
他把报告递给吕辰,“电容那批是唯一的问题批次,其他的元器件全部合格。”
吕辰接过报告翻了翻,递回去。
“万工,辛苦了,我看也没必要全部检测。通知仓库,从今天起,所有元器件入检比例从2o%提高到3o%。”
他压低声音道:“其他的等驻厂质量员就位,闹得凶的重点关照,连续三批合格,才能降回2o%。”
傍晚的时候,机柜已经连续跑了六个小时。
没有死机,没有数据错误,一切正常。
但这只是“能跑”
,离“能稳定跑”
“能可靠跑”
,还有很长的路要走。
电源余量不足,总线时序冲突,散热需要加强,有些元器件批次不稳定,每一块板卡上都有飞线。
吕辰把本子合上,放进帆布包里。
“宇文工,晚上我会替你盯着,你回去睡一觉。”