DistributedControl Secondary Station
Error(A, B, C, D,E, F, G, H)[A, B, C, D,
E]
:分布式控制子站错误;
MotorController
Error(A,B,C,D,E,F,G,H)[A,B,C,D,E]
:电机控制器错误。
AU5800
还有如下代码
:
CommunicationError(A,B,C,D,E,F,G,H)[A,B,C,D,E]
:进样器通讯错误;
UnitCommunication
Error(A,B,C,D,E,F,G,H)[A,B,C,D,E]
:模块单元通讯错误。
以上都是常见的通讯故障报警,AU480/680/5800机型不同主代码不同,所以这里
就不再罗列。小括号内的内容是子码,根据子码判断问题具体指向,有助于快速分析。方括号内的内容是辅助码,作为子码的辅助。
出现上述故障时,一般都是刚开机自检时。特别是控制电脑DPR与分析仪单元连接时。还有的是在待机状态下转为样品处理或光度计检查或其它操作时报错。这些错误的出现,系统都不能继续进行测试及其它大部分操作。
出现故障后,首先尝试重启整个系统。有时光度计子单元错误、分布式控制主/子站错误会在重启后恢复。
重启系统无法恢复,接下来就要溯源之前正常是什么时候?换句话说故障发生之前做了什么。
DPR
通讯错误一般是指控制电脑与分析仪或系统的通讯网线或网卡/主板出现故障,一般不考虑通讯参数问题,因为没有可以调整设置的地方。还有就是网口连接错误,或控制电脑IP地址错误。
分布式控制主/子站错误一般是指CAN总线下的板卡出现故障,或者连接引线没有连接。经常见到的情况就是拆卸部件维护。而这些分布式子站一般都安装在部件内,例如针臂侧面的控制板就是一块分布式控制子站。拆卸针臂、注射器等维护后装回时,忘记了连接引线或没有完全连接引线,或者插错了引线,就会出现这种故障。要注意的是,一旦开机上电后发现遗漏的插头,不要带电插入,等待报警后停机,关闭电源插回插头,然后再开机。我们的工作是分析报警,解决故障,而不是不让出现报警。
很多人说我多次带电插拔,也没发生什么,快些没事儿吧?!……上帝,你好!
电流的速度与光速相同,你能快过它?运气罢了,不要把运气偶然当作必然,你会死的很惨。带电插拔损坏线路板,导致与用户纠缠不清的事情太多了。好说话的还行,不好说话的你得修多少机器,卖多少试剂才能赚回来。
分布式控制主/子站错误可能不会单独出现,一般连续出现很多,子码稍微不同。
3.1 Photometry Subunit
Error(A,B,C,D,E,F,G,H)[A,B,C,D,E]
:光度计子单元错误
。
这是分析仪单元的控制主板(也就是分布式控制主站)采用ARCNET令牌总线与光度计控制板连接的通讯错误。两块线路板和连接线都有发生问题的可能。
A表示硬件编码,这里只有光度计一个单元,所以固定显示80;
B表示事件处理编号,这是厂家内部的编号,与维修帮助意义不大;
C表示事件处理的参数1;
D表示事件处理的参数2;
E表示事件处理的参数3;
F表示错误消息;这是英文文本,由于是内部信息,所以一般情况下不清楚说了些什么;
G表示文件名称;这也是内部文件,是控制板内的嵌入式处理器内的,不是控制电脑的文件;
H表示行号,也就是故障指示的文件内的哪一行消息或程序。
A表示出现从启动到出现故障时的时间;
B表示分析仪号码,单机固定为0,模块机则指出是哪一个模块;
C表示表种类,这是内部程序指定,是哪种程序表;
D表示表编号;
E表示相序号;这些都是内部程序的编码,与维修人员关系不大。
Serial
:串行网络,使用串口和串口线与条码阅读器模块进行通讯,一个模块或单机中,需要多个条码阅读器。例如进样器上的架条码阅读器、样品条码阅读器,试剂仓的试剂瓶条码阅读器,急诊仓的样品条码阅读器等,这些条码阅读器是通过串行通讯的。
ARCNET
:这是一种令牌总线网络,AU将其专门用来进行光度计控制板和主板间的通讯。
CAN
:CAN总线,控制器局域网络。源自汽车行业,兴盛于自动化领域,属于应用较为广泛的现场总线。也是串行通讯的一种应用。这里采用的是CAN
2.0 A/B协议。
这种CAN总线分为A和B两路,分别传送不同的内容。每路只需要两根线就可以进行通讯。实际上AU准备了三路,留有一路的冗余,所以CAN引线都是四根或六根线。
每块控制子站板上,都有COM1和COM2两个串行接口(每个串行接口3路),COM1接收上位板数据,COM2发送到下位板。而且控制子站还有电源插头,以便给控制子站板和执行元件(电机、加热器、泵、阀等)供电。
而控制主板(主站)是两套CAN总线,也称为CAN(A)和CAN(B),所以不要混淆。这两套总线系统分别控制不同的控制子站板。
CAN
总线的自检流程大致如下:系统上电后,主板(主站)和控制子站板各自进行程序和电路自检。然后主板开始点名,依次与各控制子站进行通讯,核实各自的状态。CAN总线的各子站板是串行方式连接的,最后的终端板的COM2接口需要接一个短接器(含有两个电阻),这样CAN网络就算形成回路。如果应答失败,或状态失败,或者短接电阻损坏/丢失,或引线脱落,都会报告控制子站错误。而主板本身出现故障,直接就报告控制主站错误。
由于是串行方式连接,所以主站在查询子站时,一旦发现某个子站出错,后续的子站板将不再查询。不仅会报告这个子站错误,还将其后续的子站一同报告出错。例如CAN总线有8个子站,第五个子站出错后,将报告四个子站错误。而第一个错误才是真正的故障板。这也就是AU的8系列机型为什么报告子站错误时,要检查STOP之后的第一个错误子码A,或者开机报错后的第一个错误子码A的原因。如果第一个子站板就报错,将出现8个控制子站错误,很是吓人。这种宁可错杀一千也不漏网一个的报警方式真的让人无语。
不仅如此,如果主站报错,则所有子站也会报错。
如果电机控制器错误出现,可能会伴有分布式控制主/子站错误出现,因为一块子站或主站可以控制多个电机。电机控制器报错是指向具体的驱动电机,而后面的主/子站报错是指向控制板。反过来,分布式控制主/子站错误出现不一定伴随电机控制器错误出现。二者是主从关系。
如果二者同时出现报错,则是控制板故障。如果单独出现电机控制器错误,没有分布式主/子站错误,说明故障还可能在电机本身。
下面是几个报警的图片:
而MV3983/MV3982表示线路板板号,可以发现相同板号的线路板有多块。相同的线路板通过旋转编码开关进行区分,也就是括号内的ID3、ID39等字符的来历。这些字符表示线路板编号,也就是分布式控制主/子站错误中的子码A的来历。
这些控制板中,除了旋转编码开关外,还有DIP开关,用于设置不同的功能。无论是那种开关更换线路板都要设置成与原板一样才能使用,否则换上去还是会报错不能用。
这些控制板中,还有一个Reset复位按钮,出现报错可以尝试复位,然后重试。不过几乎没什么作用。
ID15
和ID30这两块板由于是终端板,所以带有电阻短接线。
AU5800
是模块机,所有每个模块单元都是独立的,仅通过各自单元主板的以太网线与HUB连接,单元之间和DPR控制电脑之间进行通讯。为了将各单元区分,使用单元号(Unit
ID)进行识别。
进样器单元的单元号是Unit
0,样品装载卸载单元和ISE及ANL分析仪后面的轨道都属于进样器单元;
ISE
单元的单元号是Unit
5,由于ISE单元是选配单元,所以是最后一个单元号;
分析仪ANL单元的单元号是Unit1/2/3/4。
ISE
单元的数据控制板(一块或两块)直接通过以太网线与HUB相连。
分析仪单元的光度计控制板是两块(内外圈)。
要注意的是,AU机型的系统开关有三个,绿色启动按钮、红色急停按钮、白色复位按钮。正常的关机应该是在DPR控制电脑上执行。如果按下急停按钮,整机也会断电。但要重启时,单纯按启动按钮就无法启动系统,必须启动按钮和复位按钮同时按下才行。
有过三个案例,按下急停按钮关机后,按启动按钮无法开机,以为系统故障。设备科的人开始排查电源电路。有的竟然拆到了变压器,认为是变压器损坏,打电话到处求购。幸亏有个工程师多问了一句为什么要换变压器?这才了解了全过程。让其两个按钮按下后,正常启动,这才避免了尴尬。
6.2
回顾溯源
:一般情况下实验室自行操作时突然出现这些故障,或者前一天正常使用,第二天开机出现问题,而且重启无效的情况下,几乎可以认为是线路板问题。而在工程师维护过后出现这类问题,需要考虑维护的手法和过程,可能遗漏了引线插头、插错线缆等。甚至是维护用液体(次氯酸钠溶液、酸碱液等)泄漏喷溅导致线路板损坏。还有的实验室供水管道破裂,导致水进入机内损坏线路板甚至主板。
有人说纯水不导电,为什么纯水溅到线路板上会损坏?唉……买正品为什么要到天猫呢?!
在重装了操作软件或更换了线路板后,出现这些故障,可能是版本不正确,需要进行固件检查升级。
6.3
固件升级
:AU的8系列机型中,光度计板、ISE数据板以及CAN总线上的各板都是嵌入式处理板,带有CPLD可编程芯片和MCU。DPR
控制电脑上的操作软件版本和各板中的CPLD(固件
Firmware
)中的程序版本是呈匹配关系的,不同的版本之间会导致故障。
每台设备都有操作软件光盘,光盘内就有固件检查升级程序。启动这个程序就会检查操作软件和所有固件之间的版本信息,如果出现不匹配会红色标识,提示用户升级。
AU的8系列机型通讯故障还是很多的,更换总线各板也是常见的。至于故障产生的原因,也是多种多样的。有液体溅落,有带电插拔,有金属触碰。还有的发现老鼠和蟑螂的痕迹,可见实验室环境是个什么样子。但更多的情况是无法找到原因的,于是子不语怪力乱神,静电接地这俩口锅就扣了下来,反正谁也查不清楚,用它们背锅没错。
其实还是那句话,关键是找到问题解决问题。至于原因能分析则罢,不能分析也不要强求。
不过,实验室的使用和管理有很大的问题。大多数实验室直到把机器报废也没出现过这些问题。当然,运气也是一个原因。有家实验室竟然四年换了9块总线板。唉……自己没问题的话,找个神拜拜吧。