You are on page 1of 11

BHB83601 运算板维修指导

文件编号 拟编 王彭华

BHB83601 运算
维修指导
维修项目 审核

文件版本 V1.0 世纪云芯 日期:2019/7/9 批准

第 1册

共 11 页

文件类别:维修方案

本册内容:主要讲述对 BHB83601 运算板各种故障进行排查,怎么利用单板测试治具进行准确定位。

范围:适用于所有 BHB83601 生产、售后、外协维修现场

一、 维修平台要求:

1、恒温烙铁(350 度-400 度),尖头烙铁头用于焊贴片电阻电容等小贴片。

2、热风筒用于芯片拆卸焊接,注意不要长时间加热以免 PCB 起泡。

3、APW3++电源(输出 12V、133A Max),用于运算板测试量测使用。

4、万用表、摄子、V9 测试冶具(有条件的可配置示波器)。

5、助焊剂、洗板水加无水酒精;洗板水用于清理维修后助焊残留物及外观。

6、植锡治具,植锡钢网,锡膏;更换新的芯片时,必须要给芯片植锡。

7、导热黑胶,用于维修后重新粘上散热片。

二、 作业要求事项:
1、 维修人员必须具备一定的电子知识,一年以上的维修经验,对 QFN 封装焊接技术掌握娴熟。

2、 维修后运算板必须测试两遍以上都为 OK,方可通过!

3、 更换芯片时注意作业手法,更换任何配件后 PCB 板无明显变形,检查更换零件和周边有无少件开路短路问题。

4、 确定维修工位对象与相应测试软件参数、测试冶具。

5、 检查工具,治具是否能正常工作。
(电源输出是否与治具 config 文件设置一致,不同的 BIN 等级、芯片封装方式需对应单板测试治具程序的 config 及 single-board-
test 文件)
三、原理与结构:

●原理概述
1. BHB83601 由 6 个电压域串联而成,每个电压域有 10 颗 BM1393 芯片,全板共有 60 颗 BM1393 芯片。
2. BM1393 单芯片 208 个 core,域电压 1.6V,全板 6 个域总电压为 9.6V-9.9V
3. BHB83601 时钟为 2 个 25M 有源晶振(Y1、Y2),Y1 以串联的方式由第 1 颗芯片向第 30 颗芯片传递,Y2 以串联的方式由第 31 颗芯片向第 60
颗芯片传递
4. BHB83601 每个芯片正反面都有独立小散热片,正面小散热片是 SMT 贴片,背面小散热片是在板初测过后在 IC 背面通过导热胶固定。维修更换
芯片测试通过后,需要在 IC 面均匀涂抹黑色导热胶,并加热固定。

需要注意的是:
在维修过程中,在对电路板元件、或者芯片进行更换时,为了减少风枪高温对 PCB 板与芯片的伤害,必需先将故障元件附近的小散热片,及 PCB 板
背面的小散热片取下来后,再进行更换。
PCB 板芯片面都有测试点,生产维修时,在 PCB 芯片面未贴散热片时,可使用芯片面测试点;成品维修(售后维修),由于 PCB 正面、反面都
布满散热片,需通过 PCB 的芯片面测试点进行故障定位,可用特制细长表笔探进散热片空隙进行测量,但由于 SMT 小散热片接的是各电压域的地,
所以测量时,要注意表笔的绝缘,以免表笔造成短路。

1
BHB83601 运算板维修指导
●关键点分析:
1、下图为 BHB83601 信号板的芯片域分布、信号走向示意图及电路分布

DC 输入口

DC-DC 钳位电路

域1
IO 座 J4
域电压信号
电平转换 IC

EEPROM 芯片

域6

域5
TMP45
1 温感

域4

TMP45
1 温感
域3

域2

域1

钳位电路输出端
EC39 为 3.5V

2
BHB83601 运算板维修指导
CLKO 信号流向,由 Y1 25M 晶振产生,从 U1 号芯片至 U30 号芯片传输;由 Y2 25M 晶振产生,从 U31 号芯片至 U60 号芯片传输,待机与运算时,
电压都为 0.9V。
CO(CI、C0)信号流向,从 IO(J4)口 7 脚进,再由 U1 芯片至 U60 芯片传输;没插 IO 线时电压为 0,运算时电压为 1.8V。
RI(R1、RO)信号流向,由 U60 芯片往 U1 芯片返回,再从 IO 口(J4)8 脚返回控制板;没插 IO 信号时电压为 1.8V,运算时电压也为 1.8V。
BO(BI、BO)信号流向,由 U1 号芯片往 U60 号拉低电平;没插 IO 线、待机时为 0V,运算时为 0.3 左右的脉冲信号,一般测量不到电压即正常。
NRSTO(NRSTO、NRSTI)信号流向,从 IO 口(J4)
)3 脚进,再由 U1 号芯片至 U60 号芯片传输;没插 IO 信号、待机时为 0V,运算时为 1.8V。
2、BHB83601 运算板各关键电路
1)、U122 电源管理原理图

2)、DC 转 DC 电路原理图

3)、EEPROM IC 原理路(单板测试会更改 EEPROM 里面的 magic number、温感信息、CRC 信息)

3
BHB83601 运算板维修指导
4)、嵌位电路原理图

5)、PIC U102 原理图

4
BHB83601 运算板维修指导

6)、各芯片信号测试点(放大后如下图):

域 1、3、5
信号测试点

域 2、4、6
信号测试点

7)、域 1、3、5 各芯片引脚电路图

5
BHB83601 运算板维修指导
8)、域 2、4、6 各芯片引脚电路图

9)、IO 口 J4 线路图

10)、0.8V、1.8V 电路原理图

6
BHB83601 运算板维修指导

11)、电平信号转换原理图

12)、Y1、Y2 晶振原理图

7
BHB83601 运算板维修指导
13)、LDO 0.8V、1.8V 及晶振量测

● BHB83601 检修思路
检修时,主要测试芯片前后的 10 个测试(芯片前后各五个:CLKO、CO、RI、BO、NRSTO);DC-DC 输出及 PIC 电压
CORE 电压;LDO(0.8V 1.8V)、PLL-0.8V。
检测方法:
1) 不插 IO 线,只插 12V 时:DC-DC 输出为 0V 左右,升压输出为 0V 左右。PIC 供电 3.3V 必须上电。其他各测试电压都
为 0;
2)插上 IO 线,不按测试键时,DC-DC 与升压都无电压输出,按制具测试键后,PIC 开始工作,此时 DC-DC 输出 PIC 制具
测试程序设置好的电压,升压随着工作。随之制具输出 WORK,运算后返回 noce。此时各测试点正常电压应该是:
CLKO:0.9V
CO:1.6-1.8V,制具在刚发送 WORK 时,CO 因为是负极性,所以直流电平会被拉低的情况,瞬间电压为 1.5V 左右。
RI:1.6-1.8V,运算时,此电压异常或过低都会导致运算板异常或者算力为 0 的情况。
BO:没运算时为 0V,运算时,会有 0.1-0.3V 之间的脉冲跳动。
NRSTO:1.8V。每按下一次制具的测试键都会重新输出一次复位信号。
上述测试点状态、电压异常时,请根据测试点的前后电路推测故障点。

8
BHB83601 运算板维修指导
BHB83601 芯片配置文件明细及区分

四、常规维修流程:

● 参考步骤:
观察外观

制具 检测各测试点 根据检测信息 定位到芯片,先重


测量阻抗
测试 电压及供电 定位故障 焊,重焊无效更换

测量电压

作好故障 测试 两 遍 以上Ok
Ok 后进行相关老化
类型记录 方可算修好

1、 常规检测:首先先对待修运算板进行目测,观察是否有小散热片移位,变形,烧焦的现象?若有必须先行处理;小散热片移位的,先拆下来
后清除黑胶,维修通过后再重新粘胶。
其次,目测没问题后,可先各电压域的阻抗进行检测,检测是否有短路、或开路情况。如有发现,必先行处理好。
再次,检测各电压域电压是否都达到 1.6v,各电压域电压差异不得超过 0.3V。某电压域电压过高或者过低的,其相邻电压域的电路一般都存
在异常现象需先排查原因。
2、 常规检测没问题后(一般常规检测的短路检测是必须的,以免通电时因短路而烧坏芯片或其他材料)
,可用测试盒子进行芯片检测,并根据
测试盒子检测结果进行判断定位。
3、 根据测试盒子检测的显示结果,从故障芯片附近开始,检测芯片测试点(CLK IN OUT/RI IN OUT/CO IN OUT/BO IN OUT/NRST IN OUT) 及 LDO
0V8 1V8 等电压。
4、 再根据信号流向除 RI 信号反向传递(U60 到 U1 号芯片),其中几个信号 CLK CO BO NRST 为正向传递(U1-U60)
,通过供电次序找到异常的
故障点。
5、 定位至故障芯片时,需将芯片重新溶焊。方法是在芯片周围加上助焊剂后(最好是免洗助焊剂)
,将芯片引脚各焊点加热至溶解状态下,上
下左右轻轻的移动,按压芯片;促使芯片引脚与焊盘重新魔合,收锡。以达到重新着锡的效果。 假如重新上焊之后,故障还是同样,可直接
更换芯片。

9
BHB83601 运算板维修指导
6、 修复之后的运算板,测试盒子检测时,必需两次以上。前后两次测试时间:第一次,在更换配件完成后,需要运算板冷却下来后,通过测试
通过后,先放一边。第二次,隔几钟等运算板完全冷却后,再进行测试。虽然两次测试的时间有几钟时间,但这样并不影响到工作。将修好
的板子放一边,继续修第二块板,等第二块板修好放置一边冷却,再对第一块进行测试。这样时间只是错开,并没有耽误总时长。
7、 修好的板子。需要将故障分类,并做好更换元件型号、位置、原因等方面的记录。以备反馈回生产、售后、研发。
8、 记录好后,再装成整机进行正常老化。

五 故障类型:
BHB83601 常见故障类型有:
1、 掉散热片、散热片移位、变型; 通电前不允许运算板芯片背面的 PCB 板上的散热片移位,相碰,特别是不同电压的散热片。不同电压域
的散热片接触到就意味有不同电压点短路的可能。而且确定运算板上的每一块散热片导热良好,固定牢固。
更换或重新上散热片时,需将散热片、芯片上的残留胶清理干净后再重新上胶,残留的导热胶可以用无水酒精清理。
2、 各电压域阻抗不平衡; 当某些电压域的阻抗偏离正常值时,说明了异常电压域有零件存在开路、短路现象。一般芯片导致的可能性最大。
但每个电压域的芯片有三个,往往故障时,出问题的只一个。把问题芯片找出来的方法可以检测对比通过各芯片的测试点对地阻抗找到异常点。
如若碰到短路现象,可先同一电压哉芯片上的散热片先行拆下,然后观察芯片引脚有无连锡现象。
如果外观找不到短路点,可以根据电阻法或者电流截流法找短路点。
3、电压域电压不平衡;
当某些电压域电压过高或过低时,一般是其异常电压域或者相邻电压域存在 IO 信号异常的情况,导致一下个或者下一个电压域工作状态异常
而电压失衡。只要通过检测各测试点的信号及电压即可找出异常点,个别的需要通过各测试点阻抗对比找出来异常点。
特别要注意,CLK 信号与 NRST 信号,这两个异常最容易导致电压失衡。
4、缺少芯片; 缺少芯片是测试盒子在检测时,检测不到全部的 60 颗芯片,往往只检测不到实际那么多个芯片。而实际丢失的(检测不到)
的异常芯片却不在显示的位置上,此时就需要通过测试对异常芯片进行准确定位。
定位方法可以用 RI 截止下发的方式,找着异常芯片的位置。就是将某芯片的 RI 信号对地,例如:将第 50 个芯片的 RI 输出对该电压域的地
之后,理论上如果前面所有芯片正常的话,测试盒子里应该显示检测到 50 个芯片?如果检测不到 50 个芯片,说明异常在第 50 个芯片之前;
如果检测到 50 个芯片,说明异常芯片在第 50 个芯片之后。以此类推用二分法找出异常芯片所在位置。
5、断链;
断链跟缺少芯片类似,但断链并不是找不着芯的芯片都异常,而是因为某一个芯片异常而导致异常芯片后面的所有芯片失效。比如某个芯片本
身是能工作的,但它不会转发其他芯片信息;这时,整个信号链到此处就会戛然而止,失去很大一部分,就是断链。
断链串口信息是可以显示出来的,比如:测试盒子在检测芯片的时候,只检测到 30 个芯片,测试盒子里如果检测不到预设的芯片数量时是运
行不起来的,所以只会显示检测到多少芯片,此时只要根据显示的数字“30”,在第 30 个芯片前后检测各测试点的电压及阻抗就能找到问题所在。

6、不运行;
不运行是指测试盒子检测不到运算板的芯片信息,而显示 NO hash board;此现象情最为常见,涉及的故障范围也较广。
1) 某个电压域电压异常引起的不运行;可通过测量各电压域的电压找出问题。
2)某个芯片异常引起可通过测量各测试点信号找到异常。
CLK 信号:0.9V;信号由 U1 号芯片输出到 U60 号芯片,目前版本是只有两颗晶振,Y1 是由第 1 颗芯片向第 30 颗芯片传递,Y2 是由第 31 颗
芯片向第 60 颗芯片传递,CLKO 信号异常的根据信号传递方向顺序查找。
CO 信号:1.8V;此信号是由 U1、U2、、、、
、、U60 颗芯片的,当二分法某个点异常时向前检测即可。
RI 信号:1.8V;此信号是由 U60、、
、、、
、U2、U1 颗芯片返回的,通过芯片信号走向确认故障原因,
BHB83601 运算板不运行该信号为最优先级,优先查找该信号。
BO 信号:0V,该信号是在芯片检测到 RI 返回信号正常时,才能被拉低为高电平,否则为高电平。
NRST 信号:1.8V;在运算板通电并插上 IO 信号后,此信号就会从 U1、U2、、、
、、、U60 的方向传输至最后一个芯片。
3)LDO 0.8V、1.8V 异常检修
LDO 0.8V IC 输出端的对地阻抗正常值 50-100 Ώ,LDO 1.8V IC 输出端的对地阻抗正常值 0.9KΏ,
单片运算板 LDO 1.8V 共 6 个,LDO 0.8V 共 12 个(例如 域 1 U1-U10 是 U61 LDO 1.8V 供电,U1-U5 是 0.8V U117 供电,U6-U10 是 0.8V U79
供电),由于 LDO 是串联工作的,LDO 对地短路可使用二五分法维修,先取中间的芯片,一一排除,找到出问题芯片将其更换良品;
4)单板 Patter NG 维修
串口打印日志(logo 信息),单芯片及整片运算板 none 回复率需要达到 98%,noce 回复率低于 98%报 Patter NG;根据串口打印日志优先更换
单芯片 noce 回复率最低的那颗芯片;
5)整机 J:4 不良检修
1:J:4 是没有存储温感芯片位置,需要用测试治具测试一遍,把温感信息通过单板测试治具写到 EEPROM 芯片 IC 里面;
2:单板治具配置文件用错(运算板的芯片、BIN 等级与治具配置文件不相符),造成整机报 J:4;
●维修须知:
1、维修时,维修员必须熟悉每个测试点的作用及流向、正常的电压值及对地阻抗值。
2、必须熟悉芯片焊接,以免导致 PCB 起泡变形或引脚损坏。
3、BM1393 芯片封装,芯片两边 16 脚。焊接时必须对准极性与坐标,不能错位。
4、更换芯片时,必须将芯片周围的导热固定胶清洗干净,以免 IC 焊接时悬空或散热不好导致芯片二次损坏。

● 注意事项:
1.由于芯片背面散热片与芯片地相连,检测测试点信号时必须用特制细长的表笔,而且表笔除了接触端头露出金属以外,其他地方必须用
热缩管封掉绝缘,以免在测试点,表笔同时接触到散热片与测试点。特别上下两排电路压的电压差较大,同时接触到不同电压域的地(散
热片)与测试点会造人为损坏芯片,特别注意。

10
BHB83601 运算板维修指导
2.焊接,由于芯片背面有紧贴着 PCB 板的小散热片,导热较快。所以在焊接的必需要用底部辅助加热(200 度左右),可提高效率又降低对
PCB 板的损害。如果没有底部加热装置,更换芯片时,必须先将芯片背面 PCB 板上的小散热片取下来后再进行更换。


有新的故障类型请及时联系我公司工程部,我们将陆续分析并更新本内容!

11

You might also like