01 | 您所在的位置:网站首页 › 中国铁路bim联盟 › 01 |
H3C GPON OLT交换机 故障处理手册
资料版本:6W100-20230220
Copyright © 2023 新华三技术有限公司 版权所有,保留一切权利。 非经本公司书面许可,任何单位和个人不得擅自摘抄、复制本文档内容的部分或全部,并不得以任何形式传播。 除新华三技术有限公司的商标外,本手册中出现的其它公司的商标、产品标识及商品名称,由各自权利人拥有。 本文档中的信息可能变动,恕不另行通知。 目 录 1 硬件类故障处理 1.1 配置系统故障 1.1.1 终端无显示故障处理 1.1.2 终端显示乱码故障处理 1.2 运行过程中OLT重启故障处理 1.2.1 故障描述 1.2.2 故障处理流程 1.2.3 故障处理步骤 1.3 电源运行中上报告警问题处理方法 1.3.1 故障描述 1.3.2 故障处理流程 1.3.3 故障处理步骤 2 系统类故障处理 2.1 CPU利用率过高问题处理方法 2.1.1 故障描述 2.1.2 故障处理流程 2.1.3 故障处理步骤 2.2 内存占用率过高问题处理方法 2.2.1 故障描述 2.2.2 故障处理流程 2.2.3 故障处理步骤 2.3 系统温度告警问题处理方法 2.3.1 故障描述 2.3.2 故障处理流程 2.3.3 故障处理步骤 3 端口类故障处理 3.1 10/100/1000Base-T千兆以太网电口不UP故障处理 3.1.1 故障描述 3.1.2 故障处理流程 3.1.3 故障处理步骤 3.2 千兆SFP光口不UP故障处理 3.2.1 故障描述 3.2.2 故障处理流程 3.2.3 故障处理步骤 3.3 万兆SFP+/XFP光口不UP故障处理 3.3.1 故障描述 3.3.2 故障处理流程 3.3.3 故障处理步骤 3.4 端口由UP变DOWN 3.4.1 故障描述 3.4.2 故障处理步骤 3.5 端口频繁UP/DOWN 3.5.1 故障描述 3.5.2 故障处理步骤 3.6 光模块故障 3.6.1 故障描述 3.6.2 故障处理步骤 3.7 端口存在FCS等错误统计故障处理 3.7.1 故障描述 3.7.2 故障处理步骤 4 业务类故障处理 4.1 业务流量不通 4.1.1 故障描述 4.1.2 故障处理流程 4.1.3 故障处理步骤 5 ONU常见故障处理 5.1 ONU的LOS灯闪烁 5.1.1 故障描述 5.1.2 故障处理流程 5.1.3 故障处理步骤 5.2 ONU无法上线 5.2.1 故障描述 5.2.2 故障处理流程 5.2.3 故障处理步骤 5.3 PON网络卡顿 5.3.1 故障描述 5.3.2 故障处理流程 5.3.3 故障处理步骤 5.4 未注册的ONU设备查询不到 5.4.1 故障描述 5.4.2 故障处理流程 5.4.3 故障处理步骤 5.5 ONU 不能被自动发现或注册失败 5.6 ONU频繁上下线 5.7 系统其它告警 5.8 配置不生效 5.9 丢包查询 1 硬件类故障处理 本章节主要讲述单板、电源、风扇、机框等部件故障的处理方法。其它部件如光模块、端口、温度告警故障等问题请参见“硬件类故障处理,系统类故障处理,端口类故障处理”。 1.1 配置系统故障 设备上电后,如果系统正常,将在串口终端上显示启动信息;如果配置系统出现故障,配置终端可能无显示或者显示乱码。 1.1.1 终端无显示故障处理如果上电后配置终端无显示信息,首先要做以下检查: 电源系统是否正常工作。 控制交换板是否正常工作。 是否已将配置电缆接到控制交换板的配置口(CONSOLE口)。 如果以上检查未发现问题,很可能有如下原因: 配置电缆连接的串口错误(实际选择的串口线与终端设置的串口不符)。 配置终端参数设置错误(参数要求:设置波特率为115200,数据位为8,奇偶校验为无,停止位为1,流量控制为无)。 配置电缆本身有问题,可以尝试更换配置电缆。 1.1.2 终端显示乱码故障处理如果配置终端上显示乱码,很可能是配置终端参数设置错误(设置波特率为115200,数据位为8,奇偶校验为无,停止位为1,流量控制为无),请进行相应检查。 1.2 运行过程中OLT重启故障处理 1.2.1 故障描述OLT使用中发生重启,无法正常启动。 1.2.2 故障处理流程
图1-1 运行过程中OLT重启故障处理流程 1.2.3 故障处理步骤 系统发生故障后,可执行以下步骤重新建立与FTP服务器的连接,并升级OLT固件和映像文件。 当系统发生了故障或启动进程中断,Console端口是OLT上唯一可以访问的端口。以下例子中将建立与OLT的带外连接。然后配置系统boot参数并重启OLT。此时可使用连接到带外管理端口的FTP服务器boot image启动系统。下面分别介绍P3500和P3100在系统发生故障时,如何升级OLT固件和映像文件,都采用如下方式连接拓扑: 图1-2 升级连接拓扑
下表中列出系统文件,设备文件保存在目录/tftpboot/下: 表1-1 系统文件 文件名称 说明 目录 csm1g.ipe OLT映像文件 /tftpboot/ sys_version_file 系统版本文件 /tftpboot/ csm1g-kernel.bin MXCA 内核文件 /tftpboot/ csm1g-rootfs.bin MXCA 根文件系统 /tftpboot/ csm1g-p1021.dtb MXCA CPU支持文件 /tftpboot/ csm1g-uboot.bin MXCA启动文件 /tftpboot/ csm1g-userfs.jffs2 MXCA用户文件系统 /tftpboot/ gpn2.ipe GPFA映像文件 /tftpboot/ sysconfig.gz 系统配置文件 /tftpboot/ bcm68620_appl.bin PON应用文件 /tftpboot/ bcm68620_boot.bin PON启动文件 /tftpboot/ 1. 重新烧写系统文件 P3500通过重新烧写系统文件以升级软件版本。 按照以下步骤烧写系统文件,操作时请确保只有一块控制交换板在位,如果有两块控制交换板,拔出其中一块,每次操作一块控制交换板。 电脑串口设置波特率“115200”, date bits 8, Parity N, Stop bits 1,连接MXCA串口。 电脑连接控制交换板带外管理端口(默认出厂IP地址为10.20.30.1),开启TFTP服务,设置正确的文件目录,本例中电脑IP地址为“10.20.30.5”。 重启系统,并查看串口打印信息,按照提示输入“Ctrl+c”进入uboot。 a) 串口打印 图1-3 串口打印信息
修改启动参数,设置TFTP服务器地址。 =>printenv 查看 serverip地址, 如果不同于前面配置的电脑TFTP服务器地址10.20.30.5, 则修改: =>setenv serverip 10.20.30.5 b) 启动参数 图1-4 启动参数信息
# 顺序升级系统文件。 =>update kernel csm1g-kernel.bin =>update rootfs csm1g-rootfs.bin =>update dtb csm1g-p1021.dtb =>update uboot csm1g-uboot.bin =>update userfs csm1g-userfs.jffs2 # 升级成功后,重启。 =>reset # 启动完成查看软件版本信息。 P3500#show version # 启动完成后Telnet 登录控制交换板,用户名/密码 admin/admin。 P3500#show version 2. 设置FTP服务器P3100通过FTP服务器进行软件版本升级。设置FTP服务器步骤如下: 在PC机上安装FTP服务器软件。该例中使用3CDaemon程序。 从窗口开始菜单选择[程序/3CDaemon /3CDaemon]启动FTP服务器。弹出3CDaemon窗口,如下图所示。 图1-5 3CDaemon主窗口
(1) 单击3CDaemon窗口左侧的按钮。 (2) 单击Configure FTP Server图标,打开3CDaemon Configuration窗口,如图1-6所示。 图1-6 3CDaemon配置
(3) 选择FTP Profile页签,然后设置以下参数创建新的profile: a. Profile Name:admin b. User's password:gpon c. User Directory:保存固件映像文件的目录。例如,d:\gpon\ (4) 选择Login、Download和Upload复选框。 (5) 单击和保存profile。 (6) 如果FTP服务器不自动启动,单击(FTP Server is stopped. Click here to start it)图标启动FTP服务器。窗口会显示启动时间,如图1-7所示。 图1-7 3CDaemon:FTP服务器启动 3. 设置系统从FTP启动 此处以P3108为例,设置系统从FTP启动。首先建立串口与P3108的连接,输入 “ll” 查看flash中的image文件gponcard.ipe大小是否正确。 图1-8 异常状态下通过串口查看文件系统
如果文件不存在或者文件大小不正确,需要通过带外管理口, FTP重新加载image。 ->bsp_load_image_byftp "192.168.2.251","gponcard.ipe","/ramdisk:0","ftpusername","ftppassword" 系统启动完成后,上传正确的映像文件到/tffs/。 使用ftp命令从FTP服务器下载新的映像文件到P3108 Flash。 # 以下命令中第一个参数为FTP主机IP地址,"get"表示FTP 下载动作。 telnet@P3108(config-mgmt)# ftp 192.168.2.251 get admin gpon /tffs/gponcard.img gponcard.ipe # 验证新下载的映像文件已经拷贝到P3108 /tffs/目录。 telnet@P3108(config-mgmt)# file-system list /tffs/ # 检查系统的boot启动目录和文件名称。 telnet@P3108(config-mgmt)# show boot attributes System boot attributes:
ip address : 192.168.0.66 ip mask : 255.255.255.0 host ip address : 172.18.36.106 next hop : 0.0.0.0 ftp user name : admin ftp user password : gpon boot file name : gponcard.ipe boot device : flash # 如果Boot文件名称与telnet@P3108 Flash中的新映像文件不同,则运行以下命令: telnet@P3108(config-mgmt)# boot system flash gponcard.ipe # 重启系统使映像升级生效。 telnet@P3108(config-mgmt)# reboot # 验证升级的版本信息,特别是第一行。 telnet@P3108# show version 4. 寻求技术支持如果上述检查完成后故障仍无法排除,请联系技术支持工程师。 1.3 电源运行中上报告警问题处理方法 1.3.1 故障描述电源运行中上报告警,Power灯灭。 1.3.2 故障处理流程图1-9 电源告警处理流程 1.3.3 故障处理步骤 1. 检查是否存在Fault的电源模块 # P3500使用brief-show alarm命令查看电源模块告警信息。 P3500#brief-show alarm Num Seq Alarm Name Severity Ocurred Time Entity Type Entity Ins ---+--------+--------------------------+--------+--------------------+------------+---------- 1 5 Power Abnormal Major 2020/12/28, 08:49:37 CSM Port 1-A-Trunk 1 # P3100使用show alarm命令查看电源模块告警信息。 telnet@P3108> show alarm Total Active Alarm Number: 4 Num seqNUM Alarm Name Severity Ocurred Time Repeated filterMask Location 1 1 Power-Abnormal critical 2021-12-10,15:35:20,+0:0 1 0-0 Power sys 2 如果存在告警状态的电源模块,请执行下一步骤。 2. 检查Fault状态电源模块如果存在Abnormal状态电源模块,表示该电源模块异常,无法供电。 电源处于Abnormal状态可能有以下原因: 电源线可能没接稳而脱落。如果电源线脱落,那么电源的电流和电压都会显示为0,电源状态显示为Abnormal。请检查电源是否接线,接线后使用brief-show alarm/show alarm命令查看对应告警是否清除。 可能是电源模块本身温度过高导致。如果电源模块上积灰较多可能引起电源模块温度升高。请查看电源模块积灰情况,如果灰尘较多,请清理灰尘,并将电源模块拆卸后重新安装。然后使用brief-show alarm/show alarm命令查看对应告警是否清除。 3. 收集信息并寻求技术支持如果上述检查完成后故障仍无法排除,请收集设备运行信息,并联系技术支持工程师。 2 系统类故障处理 2.1 CPU利用率过高问题处理方法 2.1.1 故障描述连续使用命令“show cpu 5”查看CPU利用率,如果CPU占用率持续在80%以上(IDLE剩余20%以下),说明有某个任务长时间占用CPU,需要确认CPU高的具体原因。 2.1.2 故障处理流程图2-1 CPU利用率过高处理流程 2.1.3 故障处理步骤 CPU占用率高的原因通常有报文攻击、链路环路等。 1. 报文攻击排查抓包确认攻击源。在设备端口抓包,使用报文捕获工具(如Sniffer、Wireshark、WinNetCap等)分析报文特征,确认攻击源。然后针对攻击源配置报文防攻击。 2. 链路环路排查链路存在环路时,可能出现广播风暴和网络振荡,大量的协议报文上送CPU处理可能导致CPU占用率升高,设备很多端口的流量会变得很大,端口使用率达到90%以上: 如链路出现环路: 排查链路连接、端口配置是否正确。 是否使能STP协议,配置是否正确。 邻接设备STP状态是否正常。 如以上配置均正确,可能为STP协议计算错误或协议计算正确但端口驱动层没有正常Block阻塞,可以shutdown环路上端口、拔插端口让STP重新计算来快速恢复业务。 3. 收集信息并寻求技术支持请收集设备的运行信息、日志信息等。将所有信息反馈给技术人员寻求技术支持。 2.2 内存占用率过高问题处理方法 2.2.1 故障描述使用show memory命令查看内存信息。如果内存占用率在持续的一段时间内(一般为30分钟)高于60%,那么可能存在内存异常问题,需要关注。 2.2.2 故障处理流程图2-2 内存占用率过高处理流程 2.2.3 故障处理步骤 1. 查看当前内存分配状态 P3500使用命令“show cpu-memory”查看内存分配状态。 P3500#show cpu-memory Active CSM CPU usage : 11% Active CSM Memory usage : 32%
Standby CSM CPU usage : 8% Standby CSM Memory usage : 32% P3100使用命令“show memory”查看内存分配状态。 telnet@P3108> show memory status bytes blocks avg block max block -------- -------------- ---------- ---------- ---------- current free 326726592 7 46675227 326625152 alloc 393929424 8924 44142 - internal 624 3 208 - cumulative alloc 3574337996512 435695115 8203 - peak alloc 415891536 - - - 需要注意的是: 有些内存块使用率的增加是正常的,比如增加配置, 所以需要判断该块内存是否真正的异常。判断内存使用率是否正常可能需要持续观察内存增长速度和内存使用的多少综合分析判断。 有些内存的泄漏过程比较缓慢,所以需要比较长的时间(甚至是几周的时间)来对比观察。 2. 收集信息并寻求技术支持通过上述步骤只是确定了问题的范围,但还需继续收集信息以确定具体的故障。由于后续信息收集要求较高,不建议用户操作,请与H3C的技术支持工程师联系。 需要注意的是,请不要重启设备,否则会将故障信息破坏,给故障定位带来困难。 2.3 系统温度告警问题处理方法 2.3.1 故障描述系统出现温度告警。 2.3.2 故障处理流程图2-3 系统温度过高处理流程 2.3.3 故障处理步骤 1. 确认是设备自身温度过高还是环境温度过高。 P3500使用命令“show alarm”查看告警状态。 P3500#brief-show alarm Num Seq Alarm Name Severity Ocurred Time Entity Type Entity Ins ---+--------+--------------------------+--------+--------------------+------------+---------- 4 13 CSM Temperature High Major 2020/12/29, 11:22:54 Node N/A P3100使用命令“show alarm”查看告警状态。 telnet@P3108> show alarm Total Active Alarm Number: 5 Num seqNUM Alarm Name Severity Ocurred Time Repeated filterMask Location 5 23 Temp-Too-High-warning warning 2021-12-29,11:30:39,+0:0 1 0-0 Temp NOTE: The Ocurred Time is retrieved from sntp server! 需要注意的是: 若是环境温度过高,如超过45°C,请增加空调或者采取其他散热措施降低环境温度。 若是设备温度过高,如超过68°C,请执行步骤2。 2. 重设温度告警门限使用“temperature ceiling”命令重新设置高温告警单板的温度告警门限值。通过“show temperature”命令可以查看温度告警门限是否设置成功。 如果设置不成功,则表明单板温度器件异常,请更换单板。 如果设置成功,但高温告警仍未消除,请执行步骤3。 3. 收集信息并寻求技术支持如果上述检查完成后故障仍无法排除,请收集设备运行信息,并联系技术支持工程师。 3 端口类故障处理端口类故障处理针对P3500进行描述,对于P3100也支持的端口也有指导作用。使用的命令请参考对应产品的配置命令手册。 3.1 10/100/1000Base-T千兆以太网电口不UP故障处理 3.1.1 故障描述 10/100/1000Base-T千兆以太网电口不UP故障。 3.1.2 故障处理流程图3-1 千兆电口故障处理流程 3.1.3 故障处理步骤 1. 检查两端端口的速率,双工模式是否匹配 通过“show port”命令查看Admin端口状态是否为UP,如果不是,请使用“enable”命令激活相应的端口。 P3500(CONFIG/L2/PORT)#enable xge 1 P3500(CONFIG/L2/PORT)#show port Port Admin Oper CfgSpeed CfgDup CfgFlow ActSpeed ActDup ActFlow Orient IU 1/1 Unlock Down Auto Auto Auto Unknown Full Off Network IU 1/2 Unlock Down Auto Auto Auto Unknown Full Off Network IU 2/1 Unlock Down Auto Auto Auto Unknown Full Off Network IU 2/2 Unlock Down Auto Auto Auto Unknown Full Off Network IU 2/3 Unlock Down Auto Auto Auto Unknown Full Off Network IU 2/4 Unlock Down Auto Auto Auto Unknown Full Off Network IU 3/1 Unlock Down Auto Auto Auto Unknown Full Off Network IU 3/2 Unlock Down Auto Auto Auto Unknown Full Off Network IU 3/3 Unlock Down Auto Auto Auto Unknown Full Off Network IU 3/4 Unlock Down Auto Auto Auto Unknown Full Off Network XGE 1 Lock Down 1000M Full On Unknown Full Off Network XGE 2 Unlock Up Auto Auto Auto 1000M Full On Network XGE 3 Unlock Up 1000M Full On 1000M Full On Network XGE 4 Unlock Up 1000M Full On 1000M Full On Network P3500(CONFIG/L2/PORT)#show transceiver interface xge 3 XGE3: Transceiver Type : SFP Wave Length(nm) : 0 Vendor Name : H3C Vendor Part Number : MXP-24RJSD Vendor Serial Number : HA13440370022 Manufacturing Date : 20131029 Digital Diagnostic Monitor : NO 2. 检查链路情况,网线是否正常可通过更换网线来检查故障是否排除。 3. 检查本端端口是否正常可通过更换本端设备端口或者更换电模块来检查故障是否排除。 4. 检查对端端口是否正常可通过更换对端设备端口来检查故障是否排除。 5. 收集信息并寻求技术支持如果上述检查完成后故障仍无法排除,请收集设备运行信息,并联系H3C的技术支持工程师。 3.2 千兆SFP光口不UP故障处理 3.2.1 故障描述千兆SFP光口不UP故障。 3.2.2 故障处理流程图3-2 千兆光口故障处理流程 3.2.3 故障处理步骤 1. 检查两端端口的速率,双工模式是否匹配 通过“show port”命令查看Admin端口状态是否为Enable,如果不是,请使用“enable”命令激活相应的端口。 P3500(CONFIG/L2/PORT)#enable xge 1 P3500(CONFIG/L2/PORT)#show port Port Admin Oper CfgSpeed CfgDup CfgFlow ActSpeed ActDup ActFlow Orient IU 1/1 Unlock Down Auto Auto Auto Unknown Full Off Network IU 1/2 Unlock Down Auto Auto Auto Unknown Full Off Network IU 2/1 Unlock Down Auto Auto Auto Unknown Full Off Network IU 2/2 Unlock Down Auto Auto Auto Unknown Full Off Network IU 2/3 Unlock Down Auto Auto Auto Unknown Full Off Network IU 2/4 Unlock Down Auto Auto Auto Unknown Full Off Network IU 3/1 Unlock Down Auto Auto Auto Unknown Full Off Network IU 3/2 Unlock Down Auto Auto Auto Unknown Full Off Network IU 3/3 Unlock Down Auto Auto Auto Unknown Full Off Network IU 3/4 Unlock Down Auto Auto Auto Unknown Full Off Network XGE 1 Lock Down 1000M Full On Unknown Full Off Network XGE 2 Unlock Up Auto Auto Auto 1000M Full On Network XGE 3 Unlock Up 1000M Full On 1000M Full On Network XGE 4 Unlock Up 1000M Full On 1000M Full On Network 2. 检查端口与光模块的速率及其双工模式是否匹配执行“show port”命令查看端口与光模块的速率和双工配置是否匹配。若不匹配请通过命令配置端口速率和双工模式。 3. 检查光模块是否正常可通过show interface giga-ethernet 2/4 optical-info命令,查看当前端口上的光模块的信息。 P3500(CONFIG/L2/PORT)#show transceiver interface xge 2 XGE2: Transceiver Type : unknow Wave Length(nm) : 1310 Vendor Name : H3C Vendor Part Number : MXPD-243S Vendor Serial Number : MA12360160841 Manufacturing Date : 20120905 Digital Diagnostic Monitor : YES Power Feed Voltage(V) : 3.27 Optical Launch Power(dBm) : -5.9739 Laser Bias Current(mA) : 12.888 Temperature(Centigrade) : 52.47 可使用光功率计测试端口收发光功率是否在正常范围内,是否稳定。 检查两端的光模块波长、距离等参数是否一致。 4. 检查光纤是否正常检查光纤收发是否连接正确, 若收发连接正确,可通过更换光纤来检查故障是否排除。 检查光纤模式是否和光模块匹配(多模/单模)。若不匹配,可通过更换光纤来检查故障是否排除。 5. 检查本端端口是否正常可通过更换本端设备端口来检查故障是否排除。 6. 检查对端端口是否正常可通过更换对端设备端口来检查故障是否排除。 7. 收集信息并寻求技术支持如果上述检查完成后故障仍无法排除,请收集设备运行信息,并联系技术支持工程师。 3.3 万兆SFP+/XFP光口不UP故障处理 3.3.1 故障描述万兆SFP+/XFP光口不UP故障。 3.3.2 故障处理流程图3-3 万兆光口故障处理流程 3.3.3 故障处理步骤 1. 检查两端端口的速率,双工模式是否匹配 P3500仅 GE2/1-2支持万兆光口配置,万兆光模块切勿插入GE2/3-4端口,以免发生器件损坏。
通过“show port”命令查看Admin端口状态是否为Enable,如果不是,请使用“enable”命令激活相应的端口。 P3500(CONFIG/L2/PORT)#enable xge 1 P3500(CONFIG/L2/PORT)#show port Port Admin Oper CfgSpeed CfgDup CfgFlow ActSpeed ActDup ActFlow Orient IU 1/1 Unlock Down Auto Auto Auto Unknown Full Off Network IU 1/2 Unlock Down Auto Auto Auto Unknown Full Off Network IU 2/1 Unlock Down Auto Auto Auto Unknown Full Off Network IU 2/2 Unlock Down Auto Auto Auto Unknown Full Off Network IU 2/3 Unlock Down Auto Auto Auto Unknown Full Off Network IU 2/4 Unlock Down Auto Auto Auto Unknown Full Off Network IU 3/1 Unlock Down Auto Auto Auto Unknown Full Off Network IU 3/2 Unlock Down Auto Auto Auto Unknown Full Off Network IU 3/3 Unlock Down Auto Auto Auto Unknown Full Off Network IU 3/4 Unlock Down Auto Auto Auto Unknown Full Off Network XGE 1 Lock Down 1000M Full On Unknown Full Off Network XGE 2 Unlock Up Auto Auto Auto 1000M Full On Network XGE 3 Unlock Up 1000M Full On 1000M Full On Network XGE 4 Unlock Up 1000M Full On 1000M Full On Network 2. 检查端口与光模块的速率和 双工模式是否匹配执行“show port”命令查看端口与光模块的速率和双工配置是否匹配。若不匹配请通过命令配置端口速率和双工模式。 3. 检查光模块是否正常可通过show interface giga-ethernet 2/2 optical-info命令,查看当前端口上的光模块的信息。 P3500(CONFIG/L2/PORT)#show transceiver interface xge 2 XGE2: Transceiver Type : unknow Wave Length(nm) : 1310 Vendor Name : H3C Vendor Part Number : MXPD-243S Vendor Serial Number : MA12360160841 Manufacturing Date : 20120905 Digital Diagnostic Monitor : YES Power Feed Voltage(V) : 3.27 Optical Launch Power(dBm) : -5.9739 Laser Bias Current(mA) : 12.888 Temperature(Centigrade) : 52.47 可使用光功率计测试端口收发光功率是否在正常范围内,是否稳定。 检查两端的光模块波长、距离等参数是否一致。 4. 检查光纤是否正常检查光纤收发是否连接正确, 若收发连接正确,可通过更换光纤来检查故障是否排除。 检查光纤模式是否和光模块匹配(多模/单模)。若不匹配,可通过更换光纤来检查故障是否排除。 5. 检查本端端口是否正常可通过更换本端设备端口来检查故障是否排除。 6. 检查对端端口是否正常可通过更换对端设备端口来检查故障是否排除。 7. 收集信息并寻求技术支持如果上述检查完成后故障仍无法排除,请收集设备运行信息,并联系技术支持工程师。 3.4 端口由UP变DOWN 3.4.1 故障描述端口状态由UP变为DOWN。 3.4.2 故障处理步骤查看本设备及对端设备日志,确认有无端口disable操作。 查看两端端口状态,确认是否为协议异常或在线诊断模块检测到异常将端口disable。请将故障信息发送技术支持人员分析。 参照端口无法UP故障处理,排查两端端口配置,网线、光模块、光纤等链路是否正常。 如仍无法确认,请搜集本端、对端设备信息,并将信息发送技术支持人员分析。 3.5 端口频繁UP/DOWN 3.5.1 故障描述端口状态频繁UP/DOWN。 3.5.2 故障处理步骤对于光口,请确认光模块是否异常。查看光模块alarm信息来排查两端光模块以及中间光纤问题;对于支持诊断功能的光模块可以通过查看diagnosis信息确认光模块的光功率是否处于上下门限临界值。如发送光功率处于临界值,请更换光纤、光模块做交叉验证;如接收光功率处于临界值,请排查对端光模块及中间光纤链路。 对于电口,一般在自协商情况下容易出现协商不稳定,这种情况请尝试设置强制速率双工。 如果故障依然存在,请排查链路、对端设备、中间设备。 如仍无法确认,请将故障信息发送技术支持人员分析。 3.6 光模块故障 3.6.1 故障描述安装光模块的接口不能正常工作。 3.6.2 故障处理步骤检查光模块的温度、电压、偏置电流、接收、发送光功率是否正常(即在该光模块的光功率上下门限值之内)。 P3500(CONFIG/L2/PORT)#show transceiver interface xge 2 XGE2: Transceiver Type : unknow Wave Length(nm) : 1310 Vendor Name : H3C Vendor Part Number : MXPD-243S Vendor Serial Number : MA12360160841 Manufacturing Date : 20120905 Digital Diagnostic Monitor : YES Power Feed Voltage(V) : 3.27 Optical Launch Power(dBm) : -5.9739 Laser Bias Current(mA) : 12.888 Temperature(Centigrade) : 52.47 对怀疑故障的光模块进行交叉验证,如更换端口、与正常的光模块互换,确认是光模块本身故障还是相邻设备或中间链路故障。 如仍无法确认,请将故障信息发送技术支持人员分析。 3.7 端口存在FCS等错误统计故障处理 3.7.1 故障描述通过show statistics查看到端口存在FCS等错误统计故障。 P3500(CONFIG/L2/BRIDGE)#show statistics xge 1 Port :XGE 1 Rx total octets :0 Rx total frames :0 Rx multicast frames :0 Rx broadcast frames :0 Rx discards :0 Rx puase frames :0 Rx control frames :0 Tx total octets :420 Tx total frames :6 Tx multicast frames :0 Tx broadcast frames :0 Tx discards :0 Tx puase frames :0 Tx control frames :0 Rx 64 octets :0 Rx 65 to127 octets :0 Rx 128 to255 octets :0 Rx 256 to 511 octets :0 Rx 512 to 1023 octets :0 Rx 1024 to 1518 octets :0 Rx 1519 to 1522 octets :0 Rx Jumbo frames :0 Tx 64 octets :3 Tx 65 to127 octets :3 Tx 128 to255 octets :0 Tx 256 to 511 octets :0 Tx 512 to 1023 octets :0 Tx 1024 to 1518 octets :0 Tx 1519 to 1522 octets :0 Tx Jumbo frames :0 Rx undersize frames :0 Rx Fragments :0 Rx FCS Error Frames :0 Rx Alignment Error Frames :0 Rx Oversize Frames :0 Rx Jabber Frames :0 Rx Code Errors :0 Tx Deferrals :0 Tx Excessive Deferrals :0 Tx Single Collisions :0 Tx Multiple Collisions :0 Tx Late Collisions :0 3.7.2 故障处理步骤 1. 查看错误报文统计信息从而判断故障问题通过show counter命令,查看端口出入方向的错包统计具体是哪项在增长,从而判断故障问题。为方便查看,也可以在用户视图下使用clear counters 清空端口统计报文再观察。 (1) 端口入方向出现FCS错包且计数持续增加。 a. 使用仪器测试链路,链路质量差或者线路光信号衰减过大会导致报文在传输过程中出错。如链路故障请更换网线或光纤。 b. 与别的正常的端口更换网线或光纤光模块,如端口更换后错包消失,端口更换回来错包又再次出现,应为单板端口故障,请更换端口并将故障信息发送技术支持人员分析;如更换到其他正常端口仍会出现错包,则对端设备、中间传输链路故障的可能性较大,请排查。 (2) 排查对端设备或者中间的传输设备。检查端口入方向是否出现Overrun等错包且计数持续增加。Overrun计数是由于端口输入速率超出本端口处理能力,导致丢包。如果只有某一个端口收发包异常,或者某一个端口下挂设备的业务不通,同时这个单板上的其他端口都是正常的,可以多次查询show counter命令,如果Receiver errors有增加,且等于overruns的增加,那么可以怀疑是单板内部拥塞或堵死,请将故障信息发送技术支持人员分析。 (3) 检查端口入方向是否出现giants错包且计数持续增加。 检查两端的jumbo配置是否一致,如jumbo是否使能,端口默认的最大报文长度是否一致,允许最大报文长度是否一致。如果仍然无法确认,请将故障信息发送技术支持人员分析。 2. 若是光口请检查光模块的光功率是否正常通过show transceiver命令查看光口所插光模块的数字诊断参数的当前测量值。若该光模块的光功率不正常,请更换同一型号的正常光模块。 4 业务类故障处理 4.1 业务流量不通 4.1.1 故障描述OLT上出现业务不通的问题。 4.1.2 故障处理流程4.1.3 故障处理步骤 1. 确认物理链路正常 1) 确认设备硬件运行正常。 2) 确认物理链路正常。 2. 检查mac表项学习如果确认版本没有问题且配置已经下发,此时业务流量不通,请先确认设备是否已经学到对应表项。 # 查询P3500的mac学习表项。 P3500#brief-show mac-address Agingtimer :300 Total MAC Count :4 S-VID MAC Address Forward Port Type Virtual Port Gem Port --------------------------------------------------------------------------------------- 31 01:00:94:00:00:01 Slot 1 Dynamic 1/1/1/1 289 31 02:02:94:00:00:02 TRUNK 1 Dynamic 4094 a0:c0:a8:d2:fe:02 Slot 1 Management 1 00:1c:82:0b:60:4b Local Management 4094 00:1c:82:0b:60:4b Local Management TOTAL Count: 3
可以看到设备从1号槽位olt1接口关联的ont1接口的vport1端口接收到vlan tag为31的报文,学到的Mac地址为01:00:94:00:00:01;聚合口1接收的vlan tag为31的报文,学习到的Mac地址为02:02:94:00:00:02。 # 查询P3116的mac学习表项。 telnet@P3116(config-t)# show mac-address-table Total Mac Addresses: 0 Interface Vlan Type LAG-Group GroupID MAC address ONU-ID GEM-Port Cvid --------------------------------------------------------------------------------------- telnet@P3116(config-t)# 3. 检查设备配置如果发现mac表项都没有学习到,请检查如下的配置。 4. 检查链路聚合配置如果配置了链路聚合,首先检查链路是否UP。 # 查询聚合口1信息。 P3500#configure l2 port show trunk 1 Trunk group :1 Trunk name :1 Port list :XGE 1,XGE 2 Load balance scheme :dstMAC Administrative Status :UP Operational Status :UP CfgSpeed :Auto CfgDup :Auto CfgFlow :Auto Actual speed :10000M ActDup :Full ActFlow :Off Orient :Network
telnet@P3116(config-t-if-lg-1)# show link-aggregation summary Group Name Ports Load balance --------+------------------+-----------------------+------------------ 1 NA ge2/1-2 dst-mac # 查询聚合口1链路状态。 P3500#configure l2 port show port trunk 1 Port Admin Oper CfgSpeed CfgDup CfgFlow ActSpeed ActDup ActFlow Orient XGE 1 (trunk 1) Unlock UP Auto Auto Auto 10000M Full Off Network XGE 2 (trunk 1) Unlock UP Auto Auto Auto 10000M Full Off Network telnet@P3116(config-t)# show interface link-aggregation 1 switchport Link Aggregation Group: 1 Switchport: Enabled AdminStatus: Enable Member list: ge2/1-2 Load balance method: dst-mac Maximum receive frame: 1532 Ingress vlan filter: Enabled Flow Control receive configured: Enabled Flow Control transmit configured: Enabled Storm-control multicast: disable Storm-control broadcast 131 Storm-control unicast 131 Link Status: Up Speed:10000Mbps, BW 0 Mbps PVID: 1 telnet@P3116(config-t)# 5. 检查gpon模板配置# 模板id 为1的是默认配置。 GPFA-1-1(config-t)# show configuration running gpon-profile enable configure terminal gpon profile dba id 1 name newprof_dba_1 type4 max 1244160 gpon profile flow id 1 1 name newprof_flow_1 uni-type veip uni-bitmap 0xff upmap-type vlanId 101 101 pri-bitmap 0xff vport 1 gpon profile flow id 2 1 name flow_2 uni-type ethernet-uni uni-bitmap 0xff upmap-type vlanId 31 31 pri-bitmap 0xff vport 1 gpon profile flow id 2 2 name flow_2 uni-type ethernet-uni uni-bitmap 0xff upmap-type vlanId 32 32 pri-bitmap 0xff vport 2 gpon profile flow id 2 3 name flow_2 uni-type ethernet-uni uni-bitmap 0xff upmap-type vlanId 33 33 pri-bitmap 0xff vport 3 gpon profile flow id 2 4 name flow_2 uni-type ethernet-uni uni-bitmap 0xff upmap-type vlanId 34 34 pri-bitmap 0xff vport 4 gpon profile rate-ctrl id 1 name newprof_rate_1 sir 102400 pir 102400 gpon profile tcont-svc id 1 name newprof_tcontsvc_1 dba-id 1 gpon profile vportsvc id 1 name newprof_vportsvc_1 us-pri 0 usratectrl-id 0 dsratectrl-id 0 gpon profile tcont-bind id 1 v-port 1 name newprof_tcontbind_1 vportsvc-id 1 tcont-id 1 tcontsvc-id 1 gpon profile tcont-bind id 2 v-port 1 name tcontbind_1 vportsvc-id 1 tcont-id 1 tcontsvc-id 1 gpon profile tcont-bind id 2 v-port 2 name tcontbind_1 vportsvc-id 1 tcont-id 1 tcontsvc-id 1 gpon profile tcont-bind id 2 v-port 3 name tcontbind_1 vportsvc-id 1 tcont-id 1 tcontsvc-id 1 gpon profile tcont-bind id 2 v-port 4 name tcontbind_1 vportsvc-id 1 tcont-id 1 tcontsvc-id 1 gpon ont-authentication snonly
exit all GPFA-1-1(config-t)# 6. 检查ont接口配置查看ont接口配置(Ont接口下涉及业务模板应用,uni端口vlan配置以及vport端口创建) # 查询命令如下: GPFA-1-1(config-t)# show configuration running interface-gpon-olt 1/ telnet@P3116(config-t)# show configuration running interface-gpon-olt 1/ 查看不同olt口,不同ont接口,只需要修改olt id和ont id即可: # 查看16口下 ont16的配置,以3500设备举例: GPFA-1-1(config-if-gpon-ont-1/8/1)# show configuration running interface-gpon-olt 1/16 16 ont 1 description "ONT-1" virtual-port 1 encrypt disabled virtual-port 2 encrypt disabled virtual-port 3 encrypt disabled virtual-port 4 encrypt disabled service flow-profile 2 tcont-bind-profile 2 ont-vlan eth-uni 1 up-mode add-vid down-mode delete-vid up-pri 0 up-vid 31 eth-uni 1 poe enable ont-vlan eth-uni 2 up-mode add-vid down-mode delete-vid up-pri 0 up-vid 31 eth-uni 2 poe enable ont-vlan eth-uni 3 up-mode add-vid down-mode delete-vid up-pri 0 up-vid 31 eth-uni 3 poe enable ont-vlan eth-uni 4 up-mode add-vid down-mode delete-vid up-pri 0 up-vid 31 eth-uni 4 poe enable ont-vlan eth-uni 5 up-mode add-vid down-mode delete-vid up-pri 0 up-vid 31 eth-uni 5 poe enable ont-vlan eth-uni 6 up-mode add-vid down-mode delete-vid up-pri 0 up-vid 32 eth-uni 6 poe enable ont-vlan eth-uni 7 up-mode add-vid down-mode delete-vid up-pri 0 up-vid 33 eth-uni 7 poe enable eth-uni 8 poe enable exit GPFA-1-1(config-if-gpon-ont-1/8/1)# 7. 检查全局VLAN配置# 查看全局VLAN配置,可以看到IS1/2口和聚合口1加入到vlan31,32,33,34。 P3500#brief-show vlan vlan ingress check : Enable vlan user-isolation : Enable S-Vlan TPID : 0x8100 C-Vlan TPID : 0x8100 VID Name Ports Untag ports Mode ----+-------------------+----------------------------------+------------------------+------- 1 DEFAULT_VLAN IS 1/1-5/8,IU 1/1-3/4,XGE 1-4 IU 1/1-3/4,XGE 1-4 Full 31 31 IS 1/2,TRUNK 1 Full 32 32 IS 1/2,TRUNK 1 Full 33 33 IS 1/2,TRUNK 1 Full 34 34 IS 1/2,TRUNK 1 Full 4094 MNG_VLAN Full # 查看全局VLAN配置:telnet@P3116(config-t)# show configuration running vlan。 P3116(config-t)# show configuration running vlan enable configure terminal vlan 31 member ge1/16,ge2/1 tagged exit 8. 检查vlan-translate配置# 查看全局vlan-translate。 P3500#brief-show vlan-translate VLAN Translation Entry: slot port ont vport cvid new-svid new-cvid cos new-cos -------------------------------------------------------------------------- 1 16 1 1 31 31 4095 copy 8
# P3500的查看指定槽位/ont接口的vlan-translate。 P3500#brief-show vlan-translate slot 1 port 16 ont 1 VLAN Translation Entry: slot port ont vport cvid new-svid new-cvid cos new-cos -------------------------------------------------------------------------- 1 16 1 1 31 31 4095 copy 8 # P3116的vlan translate配置需要在olt接口下查询。 telnet@P3116(config-t)# show configuration running interface-gpon-olt 1/ 9. 收集信息并寻求技术支持如果上述检查完成后故障仍无法排除,请收集设备运行信息,并联系技术支持工程师。 业务不通的时候也可以通过镜像功能观察受监控端口上的业务,具体参见“H3C GPON OLT交换机用户FAQ”中的“端口镜像”。 5 ONU常见故障处理 5.1 ONU的LOS灯闪烁 5.1.1 故障描述ONU注册不上,los灯一直在闪烁。 5.1.2 故障处理流程图5-1 ONU的LOS灯闪烁处理流程 5.1.3 故障处理步骤 (1) ONU上光纤是否连接正确,光纤是否有弯折等。 (2) olt上是否开启ONU自动绑定,进入olt的ftth视图,display this查看是否有ONU bind auto命令。 sys System View: return to User View with Ctrl+Z. [H3C]ftth [H3C-ftth]onu bind auto [H3C-ftth]onu bind auto chassis 1 slot 5 [H3C-ftth]onu bind auto chassis 1 slot 6 [H3C-ftth]display this # ftth onu bind auto onu bind auto chassis 1 slot 5 bind auto chassis 1 slot 6 # return。 (3) 还可以通过登录web页面查询ONU的接收光功率,ip地址也是192.168.0.240, 如下图所示,用户名密码也是admin/admin: 图5-2 ONU的接收光功率查询页面
登陆成功后点击左侧的PON连接信息,查询结果如下: 图5-3 PON连接信息和光模块信息
如果OLT上能查到ONU已经注册上,但ONU的LOS灯还一直在闪。则有可能是光功率太低导致的。 5.2 ONU无法上线 5.2.1 故障描述ONU无法上线。 5.2.2 故障处理流程图5-4 ONU无法上线处理流程 5.2.3 故障处理步骤 (1) 确保ONU上光纤是插好的,光纤没有弯折,光纤头没有松动。 (2) 查询ONU的接收光功率,方法同上一节,确保ONU有收光。 (3) 输入gponmgr get info命令查看ONU注册状态。 # gponmgr get info ^@ONU Info: ONU ID: 6 ONU State: O5 SN: FHTT12345678 PASSWD: ASCII: ' HEX: 27000064000000060000 REGID: ASCII: HEX: 000000000000000000000000000000000000000000000000000000000000000000000000 Key Idx: 0 Key: 00000000000000000000000000000000 O1 Timer: 0 ms O2 Timer: 0 ms OMCC ID: 0 # 正常注册时ONU State的值为O5,未注册时ONU State的值为O2,可以通过ONU State的值来判断ONU注册的阶段。 (4) 如果软件中注册进程异常挂掉,也可能造成ONU注册不上。
请在ONU接入现网之前先完成业务配置。否则,可能存在未知单播数据流或者协议报文太多冲击CPU,导致ONU无法及时处理与olt的交互报文,ONU与olt的链接断开,ONU无法上线。
(5) 收集信息并寻求技术支持 如果上述检查完成后故障仍无法排除,请收集设备运行信息,并联系技术支持工程师。 5.3 PON网络卡顿 5.3.1 故障描述 PON网络流量不通,业务卡顿。 5.3.2 故障处理流程图5-5 PON网络卡顿故障处理流程 5.3.3 故障处理步骤 (1) 确认现场组网环境。对业务功能配置划分明确,相互业务不要有干扰,配置干净。 (2) 查询ONU的上行带宽是否配置,除了最大带宽,还可以配上最小带宽和保证带宽等。 5.4 未注册的ONU设备查询不到 5.4.1 故障描述当show ont-unbound 查询不到未注册ONU的信息,可以按照下面步骤进行基础检查。 5.4.2 故障处理流程图5-6 未注册的ONU设备查询不到故障处理流程 5.4.3 故障处理步骤 1. 检查物理链路 (1) 检测ONU指示灯状态 当ONU设备的PON指示灯为绿灯闪烁,代表当前OLT口到ONU的物理链路正常,ONU处在注册或被OLT发现的状态,这个时候ONU是可以被发现的。 当ONU设备的LOS指示灯为红灯闪烁,代表当前OLT口到ONU的物理链路断开,ONU处于收不到光的状态,此时可以查看检查光模块类型。 (2) 检测OLT口发光状态 # 基于第1步,可以通过命令行查询OLT口查询状态,下面以P3116设备举例,3500类似 telnet@P3116(config-t)# show interface gpon-olt 1/8 optical-info Transceiver Type : SFP Connector Type : SC Wave Length(nm) : 1490 Vendor Name : H3C Vendor Part Number : 9801A3HG Vendor Serial Number : I9661220800806 Vendor Specific SN : 219801A3HG5222F000V1 Manufacturing Date : 20220223 Digital Diagnostic Monitor : YES Power Feed Voltage(V) : 3.34 Optical Launch Power(dBm) : 3.1704 Laser Bias Current(mA) : 17.218 Temperature(Centigrade) : 39.85 telnet@P3116(config-t)# 2. 检查光模块类型# 查询OLT口光模块类型,如果检查OLT口发光正常,但是ONU依旧闪LOS灯,请查询OLT口光模块类型是否适配。 telnet@P3116(config-t)# show interface gpon-olt 1/8 transceiver type port transceiver type ----------------------------------------------------------------------------------- 8 sog4321-psgb telnet@P3116(config-t)# # 如果光模块类型不是上面的sog4321-psgb,请用下面命令修改。 telnet@P3116(config-t-if-gpon-olt-1/8)# transceiver type sog4321-psgb 3. 下发all-ont enable如果查询不到ONU,可以在OLT口下发命令,让OLT口重新发光,等待10s左右,再查询ONU是否能被发现。 # 下发命令行如下: telnet@P3116(config-t-if-gpon-olt-1/8)# all-ont enable 4. 收集信息并寻求技术支持如果上述检查完成后故障仍无法排除,请收集设备运行信息,并联系技术支持工程师。 5.5 ONU 不能被自动发现或注册失败查看下面的检查方法: 表5-1 光路故障 Fault Scope 可能原因 判断依据 恢复方法 OLT SN没有配置正确 "show configure running" 重新配置SN. GPFA-1-2(config-t)# show ont-unbound ONU光模块发光被关闭 ONU不发光 @1310nm ”show interface gpon-olt 1/1 ont-unbound” 没有发现ONU
1.基于PON口enable所有ONU: GPFA-1-2(config-t-if-gpon-olt-1/1)#all-ont enable 2. Enable 单个ONU: GPFA-1-2(config-if-gpon-ont-1/1/1)# enable 3. 重启 ONU ONU被deactive "show configure running" GPFA-1-2(config-if-gpon-ont-1/1/1)# deactive GPFA-1-2(config-if-gpon-ont-1/1/1)# active PON口被shutdown "show configure running" GPFA-1-2(config-t-if-gpon-olt-1/1)# no shutdown 光模块故障 "show interface gpon-olt 1/1 optical-info" 更换光模块或者切换到其他PON口 ONU ONU没有上电 "show alarm" to check if "DGi" alarm is raised 检查ONU电源 PON口下存在流氓ONU (流氓ONU持续长发光导致其他ONU不能注册.) 1.开启长发光检测: GPFA-1-2(config-t)# anti-rogueont enable 2. "OPTICAL-TF" 告警上报 1. 移除流氓ONU 2. 完成后关闭流氓ONU检测 GPFA-1-2(config-t)#anti-rogueont disable ONU硬件故障 1. ONU LED不正常 2. ONU发送光功率过低 3. ONU接收灵敏度过低 更换故障ONU或者掉电重启ONU ODN 光纤接头不干净(衰减和反射增大)
清洁光纤接头 光纤过度弯折(衰减和反射增大)
整理光纤 光纤没有紧密连接
重新连接光纤 不同类型光纤接头连接在一起比如APC 和 UPC
更换分光器/光纤
查看光功率是否正常(P3500和P3100命令一致): # OLT 光模块信息。 GPFA-1-2(config-t)# show interface gpon-olt 1/1 optical-info # OLT光模块发送光功率范围: Class B+: 1.5~ 5 dBm Class C+: 3~7 dBm # OLT 接收到ONU1发送的光功率。 GPFA-1-2(config-t)# show interface gpon-olt 1/1 optical-info ont 1 received-power # OLT光模块接收灵敏度。 Class B+: -28 dBm Class C+: -32 dBm # ONU光模块信息。 GPFA-1-2(config-t)# show interface gpon-olt 1/1 ont 1 optical-info # ONU光模块灵敏度。 -28dBm @ 1490nm 5.6 ONU频繁上下线ONU频繁上下线、频繁产生光路告警、光路质量差导致或光路存在较大反射或衰减会导致交互报文存在较多误码而交互失败。查看告警并检查光路(P3500和P3100命令一致)。 GPFA-1-2(config-t)# show alarm GPFA-1-2(config-t)# show alarm detail GPFA-1-2(config-t)# show alarm-history 表5-2 光路告警 Alarm Description Cause Actions LOSi Loss of signal for ONUi Fiber of ONUi break occurs Reconnect the fiber LOS Loss of Signal Backbone fiber break occurs Reconnect the fiber LOFi Loss of Frame of ONUi ODN failure Optimize the ODN DOWi Drift of window of ONUi ODN failure Optimize the ODN SFi Signal Fail of ONUi, when upstream BER of ONUi becomes >=10-4 ODN failure Optimize the ODN SDi Signal degraded of ONUi, when upstream BER of ONUi becomes >=10-5 ODN failure Optimize the ODN LCDGi Loss of GEM channel delineation ODN failure Optimize the ODN SUFi Start-up failure of ONUi The ranging of ONUi has failed n times (n=2) ODN failure Optimize the ODN LOAMi Loss of PLOAM for ONUi ODN failure Optimize the ODN DGi Dying-Gasp of ONUi ONUi is powered off Restore power supply 5.7 系统其它告警 可以通过如下命令查看系统告警信息,并参考表5-3分析告警原因和解决方法。 P3500#alarm show alarm 告警列表说明如下表: 表5-3 告警列表 Alarm Description(English) 告警描述 级别 产生原因 解决方法 Module Type Mismatch 模块类型不匹配 Major 当前插入的模块类型和虚支配的模块类型不匹配 虚模块被解支配或当前插入模块被拔除或复位后清除 Module unrecognized 模块无法识别 Major 由于模块失败导致插入的模块无法被识别 模块以后被识别或模块被拔出或复位后清除 Module failed to come up 模块无法正常启动 Major 由于模块故障,尽管模块被节点识别,但是模块无法正常启动提供业务 模块以后启动业务或模块被拔出或复位后清除 Assigned module removal 模块被拔出 Major 正常匹配的模块被拔出 模块被重新插入或虚模块被解除支配后清除 Standby CSM removal 备用CSM模块被拔出 Major 备用的CSM模块被拔出 备用CSM模块插回后清除 Standby CSM is running a higher version image 备用CSM上正运行一个更高的版本软件 Minor 备用CSM上正运行一个更高的版本软件 CSM切换或备用CSM被拔出或复位后清除 Standby CSM is running a lower version image 备用CSM上正运行一个更低的版本软件 Major 备用CSM上正运行一个更低的版本软件 CSM切换或备用CSM被拔出或复位后清除 Module image version mismatch 模块软件版本不匹配 Minor 模块中正在运行的软件版本和节点版本文件中的不同 模块被拔出或复位后清除 Hearbeat signal failed between two redundancy CSM modules 主备用CSM之间的心跳信号失败 Major 主备用CSM之间的心跳信号失败 备用CSM被拔出或心跳信号恢复后清除 Protection uplink on active CSM is down 主用CSM的上行保护链路断开 Critical 主用CSM的上行保护链路断开 CSM切换,主用CSM被拔出或复位,主用CSM的上行保护链路恢复后清除 Protection uplink on standby CSM is down 备用CSM的上行保护链路断开 Major 备用CSM的上行保护链路断开 CSM切换,备用CSM被拔出或复位,备用CSM的上行保护链路恢复后清除 Image file failed to be downloaded into module 模块下载软件失败 Minor 模块下载软件失败 模块被拔出或后续的成功下载后清除 Version file is missing 版本文件未找到 Major 机框中没有版本文件 版本软件重新获取后清除 Module ambient temperature exceeds the warning threshold 模块周围温度超过了告警温度阀值 Minor 模块周围温度等于或高于告警温度阀值(T1) 模块复位,拔出或模块周围温度低于告警温度,或模块周围温度等于或高于短时容忍温度阀值 Module ambient temperature exceeds the short-time tolerance threshold 模块周围温度超过了短时容忍温度阀值 Major 模块周围温度等于或高于短时容忍温度阀值(T2) 模块复位,拔出或模块周围温度低于短时容忍温度阀值,或模块周围温度高于停工温度阀值 Environmental temperature cross the high-temperature threshold 模块周围温度超过了停工温度阀值 Major 模块周围温度等于或高于停工温度阀值(T3) 模块复位或拔出后清除 Environmental temperature cross the high-temperature threshold 环境温度超过高温阀值 Critical 检测到的环境温度超过高温阀值 节点复位,下次检测到的环境温度低于高温阀值3 °C后清除 Environmental temperature cross the low-temperature threshold 环境温度超过低温阀值 Warning 检测到的环境温度超过低温阀值 节点复位,下次检测到的环境温度高于低温阀值3 °C后清除 Fan Tray absent 风扇盘不在位 Major 风扇盘不在位 风扇盘插入后清除 One or two FANs fails working 一个或两个风扇停止工作 Minor 一个或两个风扇停止工作 风扇盘拔出,所有的风扇工作正常或超过两个风扇停止工作后清除 More than two FANs fail working 超过两个风扇停止工作 Major 超过两个风扇停止工作 风扇盘拔出,所有的风扇工作正常或只有一个或两个风扇停止工作后清除 Time server is down 时间服务器断开 Minor 在轮询周期内没有收到所有的配置的SNTP服务器的响应 在下一个轮询周期内收到任何一个SNTP服务器的响应后清除 External alarm raised 外部告警产生 Configurable 外部告警产生 外部告警清除,或外部告警输入去能后清除 The threshold of CPU occupancy in CSM is crossed 主用CSM的CPU占有率超过阀值 Minor 主用CSM的CPU占有率超过阀值 在下面的轮询中CPU占有率低于过负荷阀值后清除 The threshold of Memory occupancy in CSM is crossed 主用CSM的内存占有率超过阀值 Minor 主用CSM的内存占有率超过阀值 在下面的轮询中内存占有率低于过负荷阀值后清除 The threshold of 15min CPU occupancy is crossed 15分钟的CPU占有率超过阀值 Minor 模块15分钟的CPU占有率超过阀值 模块复位,或在下面的轮询中CPU占有率低于过负荷阀值后清除 -48VDC input is abnormal -48V直流电源输入异常 Major -48V直流电源输入过压,欠压或过流 -48V直流电源输入恢复正常 3.3VDC power output is abnormal 3.3V直流电源输出异常 Major 3.3V直流电源输出过压,欠压或过流 3.3V直流电源输出恢复正常 Ringer power output is abnormal 铃流电源输出异常 Major 铃流电源输出欠压或过流 铃流电源输出恢复正常 Power output is abnormal 电源输出异常 Critical 直流电源输出过压,欠压或过流 直流电源输出恢复正常 CSM uplink down CSM上行链路断开 Major CSM上行链路端口的运行状态是“断开” CSM上行链路的工作状态变成“正常”或上行链路端口的管理状态变为“锁定” CSM uplink locked CSM上行链路“锁定” Warning CSM链路端口的管理状态为“锁定” CSM链路端口的管理状态为“锁定” Trunk work abnormal Trunk工作异常 Major 1、该链路聚合对端的交换机路由器端口可能工作异常。 2、本设备与对端交换机路由器之间用于该链路聚合的线缆可能受损。 激活的trunk成员端口的实际速度、双工方式、或者流控一致 Trunk down Trunk状态down Major CSM trunk的运行状态是“断开” CSM trunk的工作状态变成“正常”或trunk的管理状态变为“锁定” GE optical transceiver TX power high alarm GE光模块发送光功率高告警 Major OLT光模块发送光功率高于设置的阈值 OLT光模块发送光功率低于设置的阈值的5% GE optical transceiver TX power low alarm GE光模块发送光功率低告警 Major OLT光模块发送光功率低于设置的阈值 OLT光模块发送光功率高于设置的阈值的5% GE optical transceiver supply voltage high alarm GE光模块收发器电压高告警 Major GE光模块收发器电压高于设置的阈值 GE光模块收发器电压低于设置的阈值的5% GE optical transceiver supply voltage low alarm GE光模块收发器电压低告警 Major GE光模块收发器电压低于设置的阈值 GE光模块收发器电压高于设置的阈值的5% GE optical transceiver bias current high alarm GE光模块收发器偏流高告警 Major GE光模块收发器偏流高于设置的阈值 GE光模块收发器偏流低于设置的阈值的5% GE optical transceiver bias current low alarm GE光模块收发器偏流低告警 Major GE光模块收发器偏流低于设置的阈值 GE光模块收发器偏流高于设置的阈值的5% GE optical transceiver temperature high alarm GE光模块收发器温度高告警 Major GE光模块收发器温度高于设置的阈值 GE光模块收发器温度低于设置的阈值的5% GE optical transceiver temperature low alarm GE光模块收发器温度低告警 Major GE光模块收发器温度低于设置的阈值 GE光模块收发器温度高于设置的阈值的5% GE optical transceiver TX power high warning GE光模块发送光功率高警告 Major OLT光模块发送光功率高于设置的阈值 OLT光模块发送光功率低于设置的阈值的5% GE optical transceiver TX power low warning GE光模块发送光功率低警告 Major OLT光模块发送光功率低于设置的阈值 OLT光模块发送光功率高于设置的阈值的5% GE optical transceiver supply voltage high warning GE光模块收发器电压高警告 Major GE光模块收发器电压高于设置的阈值 GE光模块收发器电压低于设置的阈值的5% GE optical transceiver supply voltage low warning GE光模块收发器电压低警告 Warning GE光模块收发器电压低于设置的阈值 GE光模块收发器电压高于设置的阈值的5% GE optical transceiver bias current high warning GE光模块收发器偏流高警告 Warning GE光模块收发器偏流高于设置的阈值 GE光模块收发器偏流低于设置的阈值的5% GE optical transceiver bias current low warning GE光模块收发器偏流低警告 Warning GE光模块收发器偏流低于设置的阈值 GE光模块收发器偏流高于设置的阈值的5% GE optical transceiver temperature high warning GE光模块收发器温度高警告 Warning GE光模块收发器温度高于设置的阈值 GE光模块收发器温度低于设置的阈值的5% GE optical transceiver temperature low warning GE光模块收发器温度低警告 Warning GE光模块收发器温度低于设置的阈值 GE光模块收发器温度高于设置的阈值的5% GE optical transceiver Rx power high alarm GE光模块收发器接收功率高告警 Major GE光模块接收光功率高于设置的阈值 OLT光模块接收光功率低于设置的阈值的5% GE optical transceiver Rx power low alarm GE光模块收发器接收功率低告警 Major GE光模块接收光功率低于设置的阈值 OLT光模块接收光功率高于设置的阈值的5% GE optical transceiver Rx power high warning GE光模块收发器接收功率高警告 Warning GE光模块接收光功率高于设置的阈值 OLT光模块接收光功率低于设置的阈值的5% GE optical transceiver Rx power low warning GE光模块收发器接收功率低警告 Warning GE光模块接收光功率低于设置的阈值 OLT光模块接收光功率高于设置的阈值的5% LOS PON 光口失效 Critical PON光模块报告失败 PON端口的发送光功率恢复到最大最小阈值之间或端口去能后清除 LOSi ONT LOSi Alarm Critical OLT收不到指定ONU的发光 OLT 探测到正常的ONU发光 SFi ONUi信号失效 Critical 每个间隔T计算BER(ONU误码率)。T是应用程序设置的参数。 如果BER≥BER SF阈值,则SFi警报将发送到主机应用程序。 BER SF阈值定义为10-x,其中x为可在3到8范围内配置。 警报必须由主机清除成功激活ONU之后的应用程序. SDi ONUi信号降级 Major 每个间隔T计算BER(ONU误码率)。T是主机应用程序设置的参数。 如果BER≥BER SD阈值,则SDi警报将发送到主机应用程序。BER SD阈值为10-x,其中x可在4到9的范围内配置 SD阈值必须高于SF阈值。 当BER |
CopyRight 2018-2019 实验室设备网 版权所有 |