01 您所在的位置:网站首页 中国铁路bim联盟 01

01

2023-11-27 19:17| 来源: 网络整理| 查看: 265

H3C GPON OLT交换机

故障处理手册

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

资料版本:6W100-20230220

 

 

Copyright © 2023 新华三技术有限公司 版权所有,保留一切权利。

非经本公司书面许可,任何单位和个人不得擅自摘抄、复制本文档内容的部分或全部,并不得以任何形式传播。

除新华三技术有限公司的商标外,本手册中出现的其它公司的商标、产品标识及商品名称,由各自权利人拥有。

本文档中的信息可能变动,恕不另行通知。

目  录

1 硬件类故障处理

1.1 配置系统故障

1.1.1 终端无显示故障处理

1.1.2 终端显示乱码故障处理

1.2 运行过程中OLT重启故障处理

1.2.1 故障描述

1.2.2 故障处理流程

1.2.3 故障处理步骤

1.3 电源运行中上报告警问题处理方法

1.3.1 故障描述

1.3.2 故障处理流程

1.3.3 故障处理步骤

2 系统类故障处理

2.1 CPU利用率过高问题处理方法

2.1.1 故障描述

2.1.2 故障处理流程

2.1.3 故障处理步骤

2.2 内存占用率过高问题处理方法

2.2.1 故障描述

2.2.2 故障处理流程

2.2.3 故障处理步骤

2.3 系统温度告警问题处理方法

2.3.1 故障描述

2.3.2 故障处理流程

2.3.3 故障处理步骤

3 端口类故障处理

3.1 10/100/1000Base-T千兆以太网电口不UP故障处理

3.1.1 故障描述

3.1.2 故障处理流程

3.1.3 故障处理步骤

3.2 千兆SFP光口不UP故障处理

3.2.1 故障描述

3.2.2 故障处理流程

3.2.3 故障处理步骤

3.3 万兆SFP+/XFP光口不UP故障处理

3.3.1 故障描述

3.3.2 故障处理流程

3.3.3 故障处理步骤

3.4 端口由UP变DOWN

3.4.1 故障描述

3.4.2 故障处理步骤

3.5 端口频繁UP/DOWN

3.5.1 故障描述

3.5.2 故障处理步骤

3.6 光模块故障

3.6.1 故障描述

3.6.2 故障处理步骤

3.7 端口存在FCS等错误统计故障处理

3.7.1 故障描述

3.7.2 故障处理步骤

4 业务类故障处理

4.1 业务流量不通

4.1.1 故障描述

4.1.2 故障处理流程

4.1.3 故障处理步骤

5 ONU常见故障处理

5.1 ONU的LOS灯闪烁

5.1.1 故障描述

5.1.2 故障处理流程

5.1.3 故障处理步骤

5.2 ONU无法上线

5.2.1 故障描述

5.2.2 故障处理流程

5.2.3 故障处理步骤

5.3 PON网络卡顿

5.3.1 故障描述

5.3.2 故障处理流程

5.3.3 故障处理步骤

5.4 未注册的ONU设备查询不到

5.4.1 故障描述

5.4.2 故障处理流程

5.4.3 故障处理步骤

5.5 ONU 不能被自动发现或注册失败

5.6 ONU频繁上下线

5.7 系统其它告警

5.8 配置不生效

5.9 丢包查询

 

1 硬件类故障处理

说明

本章节主要讲述单板、电源、风扇、机框等部件故障的处理方法。其它部件如光模块、端口、温度告警故障等问题请参见“硬件类故障处理,系统类故障处理,端口类故障处理”。

 

1.1  配置系统故障

设备上电后,如果系统正常,将在串口终端上显示启动信息;如果配置系统出现故障,配置终端可能无显示或者显示乱码。

1.1.1  终端无显示故障处理

如果上电后配置终端无显示信息,首先要做以下检查:

电源系统是否正常工作。

控制交换板是否正常工作。

是否已将配置电缆接到控制交换板的配置口(CONSOLE口)。

如果以上检查未发现问题,很可能有如下原因:

配置电缆连接的串口错误(实际选择的串口线与终端设置的串口不符)。

配置终端参数设置错误(参数要求:设置波特率为115200,数据位为8,奇偶校验为无,停止位为1,流量控制为无)。

配置电缆本身有问题,可以尝试更换配置电缆。

1.1.2  终端显示乱码故障处理

如果配置终端上显示乱码,很可能是配置终端参数设置错误(设置波特率为115200,数据位为8,奇偶校验为无,停止位为1,流量控制为无),请进行相应检查。

1.2  运行过程中OLT重启故障处理 1.2.1  故障描述

OLT使用中发生重启,无法正常启动。

1.2.2  故障处理流程

 

图1-1 运行过程中OLT重启故障处理流程

1640742735(1)

 

1.2.3  故障处理步骤

系统发生故障后,可执行以下步骤重新建立与FTP服务器的连接,并升级OLT固件和映像文件。

当系统发生了故障或启动进程中断,Console端口是OLT上唯一可以访问的端口。以下例子中将建立与OLT的带外连接。然后配置系统boot参数并重启OLT。此时可使用连接到带外管理端口的FTP服务器boot image启动系统。下面分别介绍P3500和P3100在系统发生故障时,如何升级OLT固件和映像文件,都采用如下方式连接拓扑:

图1-2 升级连接拓扑

1640743525(1)

 

下表中列出系统文件,设备文件保存在目录/tftpboot/下:

表1-1 系统文件

文件名称

说明

目录

csm1g.ipe

OLT映像文件

/tftpboot/

sys_version_file

系统版本文件

/tftpboot/

csm1g-kernel.bin

MXCA 内核文件

/tftpboot/

csm1g-rootfs.bin

MXCA 根文件系统

/tftpboot/

csm1g-p1021.dtb

MXCA CPU支持文件

/tftpboot/

csm1g-uboot.bin

MXCA启动文件

/tftpboot/

csm1g-userfs.jffs2

MXCA用户文件系统

/tftpboot/

gpn2.ipe

GPFA映像文件

/tftpboot/

sysconfig.gz

系统配置文件

/tftpboot/

bcm68620_appl.bin

PON应用文件

/tftpboot/

bcm68620_boot.bin

PON启动文件

/tftpboot/

 

1. 重新烧写系统文件

P3500通过重新烧写系统文件以升级软件版本。

按照以下步骤烧写系统文件,操作时请确保只有一块控制交换板在位,如果有两块控制交换板,拔出其中一块,每次操作一块控制交换板。

电脑串口设置波特率“115200”, date bits 8, Parity N, Stop bits 1,连接MXCA串口。

电脑连接控制交换板带外管理端口(默认出厂IP地址为10.20.30.1),开启TFTP服务,设置正确的文件目录,本例中电脑IP地址为“10.20.30.5”。

重启系统,并查看串口打印信息,按照提示输入“Ctrl+c”进入uboot。

a)     串口打印

图1-3 串口打印信息

 

修改启动参数,设置TFTP服务器地址。

=>printenv

查看 serverip地址, 如果不同于前面配置的电脑TFTP服务器地址10.20.30.5,

则修改:

=>setenv serverip 10.20.30.5

b)     启动参数

图1-4 启动参数信息

 

# 顺序升级系统文件。

=>update kernel csm1g-kernel.bin

=>update rootfs csm1g-rootfs.bin

=>update dtb csm1g-p1021.dtb

=>update uboot csm1g-uboot.bin

=>update userfs csm1g-userfs.jffs2

# 升级成功后,重启。

=>reset

# 启动完成查看软件版本信息。

P3500#show version

# 启动完成后Telnet 登录控制交换板,用户名/密码 admin/admin。

P3500#show version

2. 设置FTP服务器

P3100通过FTP服务器进行软件版本升级。设置FTP服务器步骤如下:

在PC机上安装FTP服务器软件。该例中使用3CDaemon程序。

从窗口开始菜单选择[程序/3CDaemon /3CDaemon]启动FTP服务器。弹出3CDaemon窗口,如下图所示。

图1-5 3CDaemon主窗口

 

(1)     单击3CDaemon窗口左侧的按钮。

(2)     单击Configure FTP Server图标,打开3CDaemon Configuration窗口,如图1-6所示。

图1-6 3CDaemon配置

 

(3)     选择FTP Profile页签,然后设置以下参数创建新的profile:

a.     Profile Name:admin

b.     User's password:gpon

c.     User Directory:保存固件映像文件的目录。例如,d:\gpon\

(4)     选择Login、Download和Upload复选框。

(5)     单击和保存profile。

(6)     如果FTP服务器不自动启动,单击(FTP Server is stopped. Click here to start it)图标启动FTP服务器。窗口会显示启动时间,如图1-7所示。

图1-7 3CDaemon:FTP服务器启动

 

3. 设置系统从FTP启动

此处以P3108为例,设置系统从FTP启动。首先建立串口与P3108的连接,输入 “ll” 查看flash中的image文件gponcard.ipe大小是否正确。

图1-8 异常状态下通过串口查看文件系统

 

如果文件不存在或者文件大小不正确,需要通过带外管理口, FTP重新加载image。

->bsp_load_image_byftp "192.168.2.251","gponcard.ipe","/ramdisk:0","ftpusername","ftppassword"

系统启动完成后,上传正确的映像文件到/tffs/。

使用ftp命令从FTP服务器下载新的映像文件到P3108 Flash。

# 以下命令中第一个参数为FTP主机IP地址,"get"表示FTP 下载动作。

telnet@P3108(config-mgmt)# ftp 192.168.2.251 get admin gpon /tffs/gponcard.img gponcard.ipe

# 验证新下载的映像文件已经拷贝到P3108 /tffs/目录。

telnet@P3108(config-mgmt)# file-system list /tffs/

# 检查系统的boot启动目录和文件名称。

telnet@P3108(config-mgmt)# show boot attributes

System boot attributes:

 

ip address        : 192.168.0.66

ip mask           : 255.255.255.0

host ip address   : 172.18.36.106

next hop          : 0.0.0.0

ftp user name     : admin

ftp user password : gpon

boot file name    : gponcard.ipe

boot device       : flash

# 如果Boot文件名称与telnet@P3108 Flash中的新映像文件不同,则运行以下命令:

telnet@P3108(config-mgmt)# boot system flash gponcard.ipe

# 重启系统使映像升级生效。

telnet@P3108(config-mgmt)# reboot

# 验证升级的版本信息,特别是第一行。

telnet@P3108# show version

4. 寻求技术支持

如果上述检查完成后故障仍无法排除,请联系技术支持工程师。

1.3  电源运行中上报告警问题处理方法 1.3.1  故障描述

电源运行中上报告警,Power灯灭。

1.3.2  故障处理流程

图1-9 电源告警处理流程

1640750961(1)

 

1.3.3  故障处理步骤 1. 检查是否存在Fault的电源模块

# P3500使用brief-show alarm命令查看电源模块告警信息。

P3500#brief-show alarm

Num Seq  Alarm Name                Severity Ocurred Time         Entity Type  Entity Ins

---+--------+--------------------------+--------+--------------------+------------+----------

1    5   Power Abnormal         Major    2020/12/28, 08:49:37 CSM Port    1-A-Trunk 1

# P3100使用show alarm命令查看电源模块告警信息。

telnet@P3108> show alarm

Total Active Alarm Number: 4

Num  seqNUM    Alarm Name                         Severity  Ocurred Time             Repeated  filterMask     Location

1    1         Power-Abnormal                     critical  2021-12-10,15:35:20,+0:0 1         0-0            Power sys 2

如果存在告警状态的电源模块,请执行下一步骤。

2. 检查Fault状态电源模块

如果存在Abnormal状态电源模块,表示该电源模块异常,无法供电。

电源处于Abnormal状态可能有以下原因:

电源线可能没接稳而脱落。如果电源线脱落,那么电源的电流和电压都会显示为0,电源状态显示为Abnormal。请检查电源是否接线,接线后使用brief-show alarm/show alarm命令查看对应告警是否清除。

可能是电源模块本身温度过高导致。如果电源模块上积灰较多可能引起电源模块温度升高。请查看电源模块积灰情况,如果灰尘较多,请清理灰尘,并将电源模块拆卸后重新安装。然后使用brief-show alarm/show alarm命令查看对应告警是否清除。

3. 收集信息并寻求技术支持

如果上述检查完成后故障仍无法排除,请收集设备运行信息,并联系技术支持工程师。

2 系统类故障处理 2.1  CPU利用率过高问题处理方法 2.1.1  故障描述

连续使用命令“show cpu 5”查看CPU利用率,如果CPU占用率持续在80%以上(IDLE剩余20%以下),说明有某个任务长时间占用CPU,需要确认CPU高的具体原因。

2.1.2  故障处理流程

图2-1 CPU利用率过高处理流程

 

2.1.3  故障处理步骤

CPU占用率高的原因通常有报文攻击、链路环路等。

1. 报文攻击排查

抓包确认攻击源。在设备端口抓包,使用报文捕获工具(如Sniffer、Wireshark、WinNetCap等)分析报文特征,确认攻击源。然后针对攻击源配置报文防攻击。

2. 链路环路排查

链路存在环路时,可能出现广播风暴和网络振荡,大量的协议报文上送CPU处理可能导致CPU占用率升高,设备很多端口的流量会变得很大,端口使用率达到90%以上:

如链路出现环路:

排查链路连接、端口配置是否正确。

是否使能STP协议,配置是否正确。

邻接设备STP状态是否正常。

如以上配置均正确,可能为STP协议计算错误或协议计算正确但端口驱动层没有正常Block阻塞,可以shutdown环路上端口、拔插端口让STP重新计算来快速恢复业务。

3. 收集信息并寻求技术支持

请收集设备的运行信息、日志信息等。将所有信息反馈给技术人员寻求技术支持。

2.2  内存占用率过高问题处理方法 2.2.1  故障描述

使用show memory命令查看内存信息。如果内存占用率在持续的一段时间内(一般为30分钟)高于60%,那么可能存在内存异常问题,需要关注。

2.2.2  故障处理流程

图2-2 内存占用率过高处理流程

 

2.2.3  故障处理步骤 1. 查看当前内存分配状态

P3500使用命令“show cpu-memory”查看内存分配状态。

P3500#show cpu-memory

Active CSM CPU usage  :  11%

Active CSM Memory usage  :  32%

 

Standby CSM CPU usage  :  8%

Standby CSM Memory usage  :  32%

P3100使用命令“show memory”查看内存分配状态。

telnet@P3108> show memory

  status       bytes       blocks    avg block  max block

 -------- -------------- ---------- ---------- ----------

current

 free          326726592          7   46675227  326625152

 alloc         393929424       8924      44142          -

 internal            624          3        208          -

cumulative

 alloc     3574337996512  435695115       8203          -

peak

 alloc         415891536          -          -          -

需要注意的是:

有些内存块使用率的增加是正常的,比如增加配置, 所以需要判断该块内存是否真正的异常。判断内存使用率是否正常可能需要持续观察内存增长速度和内存使用的多少综合分析判断。

有些内存的泄漏过程比较缓慢,所以需要比较长的时间(甚至是几周的时间)来对比观察。

2. 收集信息并寻求技术支持

通过上述步骤只是确定了问题的范围,但还需继续收集信息以确定具体的故障。由于后续信息收集要求较高,不建议用户操作,请与H3C的技术支持工程师联系。

需要注意的是,请不要重启设备,否则会将故障信息破坏,给故障定位带来困难。

2.3  系统温度告警问题处理方法 2.3.1  故障描述

系统出现温度告警。

2.3.2  故障处理流程

图2-3 系统温度过高处理流程

 

2.3.3  故障处理步骤 1. 确认是设备自身温度过高还是环境温度过高。

P3500使用命令“show alarm”查看告警状态。

P3500#brief-show alarm

Num Seq      Alarm Name                 Severity Ocurred Time         Entity Type  Entity Ins

---+--------+--------------------------+--------+--------------------+------------+----------

4   13       CSM Temperature High           Major    2020/12/29, 11:22:54 Node         N/A

P3100使用命令“show alarm”查看告警状态。

telnet@P3108> show alarm

Total Active Alarm Number: 5

Num  seqNUM    Alarm Name                         Severity  Ocurred Time             Repeated  filterMask     Location

5    23        Temp-Too-High-warning              warning   2021-12-29,11:30:39,+0:0 1         0-0            Temp

NOTE: The Ocurred Time is retrieved from sntp server!

需要注意的是:

若是环境温度过高,如超过45°C,请增加空调或者采取其他散热措施降低环境温度。

若是设备温度过高,如超过68°C,请执行步骤2。

2. 重设温度告警门限

使用“temperature ceiling”命令重新设置高温告警单板的温度告警门限值。通过“show temperature”命令可以查看温度告警门限是否设置成功。

如果设置不成功,则表明单板温度器件异常,请更换单板。

如果设置成功,但高温告警仍未消除,请执行步骤3。

3. 收集信息并寻求技术支持

如果上述检查完成后故障仍无法排除,请收集设备运行信息,并联系技术支持工程师。

3 端口类故障处理

说明

端口类故障处理针对P3500进行描述,对于P3100也支持的端口也有指导作用。使用的命令请参考对应产品的配置命令手册。

 

3.1  10/100/1000Base-T千兆以太网电口不UP故障处理 3.1.1  故障描述

10/100/1000Base-T千兆以太网电口不UP故障。

3.1.2  故障处理流程

图3-1 千兆电口故障处理流程

1640758297(1)

 

3.1.3  故障处理步骤 1. 检查两端端口的速率,双工模式是否匹配

通过“show port”命令查看Admin端口状态是否为UP,如果不是,请使用“enable”命令激活相应的端口。

P3500(CONFIG/L2/PORT)#enable xge 1

P3500(CONFIG/L2/PORT)#show port

Port                Admin  Oper CfgSpeed CfgDup CfgFlow ActSpeed ActDup  ActFlow Orient

IU 1/1              Unlock Down Auto     Auto   Auto    Unknown  Full    Off     Network

IU 1/2              Unlock Down Auto     Auto   Auto    Unknown  Full    Off     Network

IU 2/1              Unlock Down Auto     Auto   Auto    Unknown  Full    Off     Network

IU 2/2              Unlock Down Auto     Auto   Auto    Unknown  Full    Off     Network

IU 2/3              Unlock Down Auto     Auto   Auto    Unknown  Full    Off     Network

IU 2/4              Unlock Down Auto     Auto   Auto    Unknown  Full    Off     Network

IU 3/1              Unlock Down Auto     Auto   Auto    Unknown  Full    Off     Network

IU 3/2              Unlock Down Auto     Auto   Auto    Unknown  Full    Off     Network

IU 3/3              Unlock Down Auto     Auto   Auto    Unknown  Full    Off     Network

IU 3/4              Unlock Down Auto     Auto   Auto    Unknown  Full    Off     Network

XGE 1               Lock   Down 1000M    Full   On      Unknown  Full    Off     Network

XGE 2               Unlock Up   Auto     Auto   Auto    1000M    Full    On      Network

XGE 3               Unlock Up   1000M    Full   On      1000M    Full    On      Network

XGE 4               Unlock Up   1000M    Full   On      1000M    Full    On      Network

P3500(CONFIG/L2/PORT)#show transceiver interface xge 3

XGE3:

Transceiver Type              : SFP

Wave Length(nm)               : 0

Vendor Name                   : H3C

Vendor Part Number            : MXP-24RJSD

Vendor Serial Number          : HA13440370022

Manufacturing Date            : 20131029

Digital Diagnostic Monitor    : NO

2. 检查链路情况,网线是否正常

可通过更换网线来检查故障是否排除。

3. 检查本端端口是否正常

可通过更换本端设备端口或者更换电模块来检查故障是否排除。

4. 检查对端端口是否正常

可通过更换对端设备端口来检查故障是否排除。

5. 收集信息并寻求技术支持

如果上述检查完成后故障仍无法排除,请收集设备运行信息,并联系H3C的技术支持工程师。

3.2  千兆SFP光口不UP故障处理 3.2.1  故障描述

千兆SFP光口不UP故障。

3.2.2  故障处理流程

图3-2 千兆光口故障处理流程

1640759232(1)

 

3.2.3  故障处理步骤 1. 检查两端端口的速率,双工模式是否匹配

通过“show port”命令查看Admin端口状态是否为Enable,如果不是,请使用“enable”命令激活相应的端口。

P3500(CONFIG/L2/PORT)#enable xge 1

P3500(CONFIG/L2/PORT)#show port

Port                Admin  Oper CfgSpeed CfgDup CfgFlow ActSpeed ActDup  ActFlow Orient

IU 1/1              Unlock Down Auto     Auto   Auto    Unknown  Full    Off     Network

IU 1/2              Unlock Down Auto     Auto   Auto    Unknown  Full    Off     Network

IU 2/1              Unlock Down Auto     Auto   Auto    Unknown  Full    Off     Network

IU 2/2              Unlock Down Auto     Auto   Auto    Unknown  Full    Off     Network

IU 2/3              Unlock Down Auto     Auto   Auto    Unknown  Full    Off     Network

IU 2/4              Unlock Down Auto     Auto   Auto    Unknown  Full    Off     Network

IU 3/1              Unlock Down Auto     Auto   Auto    Unknown  Full    Off     Network

IU 3/2              Unlock Down Auto     Auto   Auto    Unknown  Full    Off     Network

IU 3/3              Unlock Down Auto     Auto   Auto    Unknown  Full    Off     Network

IU 3/4              Unlock Down Auto     Auto   Auto    Unknown  Full    Off     Network

XGE 1               Lock   Down 1000M    Full   On      Unknown  Full    Off     Network

XGE 2               Unlock Up   Auto     Auto   Auto    1000M    Full    On      Network

XGE 3               Unlock Up   1000M    Full   On      1000M    Full    On      Network

XGE 4               Unlock Up   1000M    Full   On      1000M    Full    On      Network

2. 检查端口与光模块的速率及其双工模式是否匹配

执行“show port”命令查看端口与光模块的速率和双工配置是否匹配。若不匹配请通过命令配置端口速率和双工模式。

3. 检查光模块是否正常

可通过show interface giga-ethernet 2/4 optical-info命令,查看当前端口上的光模块的信息。

P3500(CONFIG/L2/PORT)#show transceiver interface xge 2

XGE2:

Transceiver Type              : unknow

Wave Length(nm)               : 1310

Vendor Name                   : H3C

Vendor Part Number            : MXPD-243S

Vendor Serial Number          : MA12360160841

Manufacturing Date            : 20120905

Digital Diagnostic Monitor    : YES

Power Feed Voltage(V)         : 3.27

Optical Launch Power(dBm)     : -5.9739

Laser Bias Current(mA)        : 12.888

Temperature(Centigrade)       : 52.47

可使用光功率计测试端口收发光功率是否在正常范围内,是否稳定。

检查两端的光模块波长、距离等参数是否一致。

4. 检查光纤是否正常

检查光纤收发是否连接正确, 若收发连接正确,可通过更换光纤来检查故障是否排除。

检查光纤模式是否和光模块匹配(多模/单模)。若不匹配,可通过更换光纤来检查故障是否排除。

5. 检查本端端口是否正常

可通过更换本端设备端口来检查故障是否排除。

6. 检查对端端口是否正常

可通过更换对端设备端口来检查故障是否排除。

7. 收集信息并寻求技术支持

如果上述检查完成后故障仍无法排除,请收集设备运行信息,并联系技术支持工程师。

3.3  万兆SFP+/XFP光口不UP故障处理 3.3.1  故障描述

万兆SFP+/XFP光口不UP故障。

3.3.2  故障处理流程

图3-3 万兆光口故障处理流程

1640761180(1)

 

3.3.3  故障处理步骤 1. 检查两端端口的速率,双工模式是否匹配

注意

P3500仅 GE2/1-2支持万兆光口配置,万兆光模块切勿插入GE2/3-4端口,以免发生器件损坏。

 

通过“show port”命令查看Admin端口状态是否为Enable,如果不是,请使用“enable”命令激活相应的端口。

P3500(CONFIG/L2/PORT)#enable xge 1

P3500(CONFIG/L2/PORT)#show port

Port                Admin  Oper CfgSpeed CfgDup CfgFlow ActSpeed ActDup  ActFlow Orient

IU 1/1              Unlock Down Auto     Auto   Auto    Unknown  Full    Off     Network

IU 1/2              Unlock Down Auto     Auto   Auto    Unknown  Full    Off     Network

IU 2/1              Unlock Down Auto     Auto   Auto    Unknown  Full    Off     Network

IU 2/2              Unlock Down Auto     Auto   Auto    Unknown  Full    Off     Network

IU 2/3              Unlock Down Auto     Auto   Auto    Unknown  Full    Off     Network

IU 2/4              Unlock Down Auto     Auto   Auto    Unknown  Full    Off     Network

IU 3/1              Unlock Down Auto     Auto   Auto    Unknown  Full    Off     Network

IU 3/2              Unlock Down Auto     Auto   Auto    Unknown  Full    Off     Network

IU 3/3              Unlock Down Auto     Auto   Auto    Unknown  Full    Off     Network

IU 3/4              Unlock Down Auto     Auto   Auto    Unknown  Full    Off     Network

XGE 1               Lock   Down 1000M    Full   On      Unknown  Full    Off     Network

XGE 2               Unlock Up   Auto     Auto   Auto    1000M    Full    On      Network

XGE 3               Unlock Up   1000M    Full   On      1000M    Full    On      Network

XGE 4               Unlock Up   1000M    Full   On      1000M    Full    On      Network

2. 检查端口与光模块的速率和 双工模式是否匹配

执行“show port”命令查看端口与光模块的速率和双工配置是否匹配。若不匹配请通过命令配置端口速率和双工模式。

3. 检查光模块是否正常

可通过show interface giga-ethernet 2/2 optical-info命令,查看当前端口上的光模块的信息。

P3500(CONFIG/L2/PORT)#show transceiver interface xge 2

XGE2:

Transceiver Type              : unknow

Wave Length(nm)               : 1310

Vendor Name                   : H3C

Vendor Part Number            : MXPD-243S

Vendor Serial Number          : MA12360160841

Manufacturing Date            : 20120905

Digital Diagnostic Monitor    : YES

Power Feed Voltage(V)         : 3.27

Optical Launch Power(dBm)     : -5.9739

Laser Bias Current(mA)        : 12.888

Temperature(Centigrade)       : 52.47

可使用光功率计测试端口收发光功率是否在正常范围内,是否稳定。

检查两端的光模块波长、距离等参数是否一致。

4. 检查光纤是否正常

检查光纤收发是否连接正确, 若收发连接正确,可通过更换光纤来检查故障是否排除。

检查光纤模式是否和光模块匹配(多模/单模)。若不匹配,可通过更换光纤来检查故障是否排除。

5. 检查本端端口是否正常

可通过更换本端设备端口来检查故障是否排除。

6. 检查对端端口是否正常

可通过更换对端设备端口来检查故障是否排除。

7. 收集信息并寻求技术支持

如果上述检查完成后故障仍无法排除,请收集设备运行信息,并联系技术支持工程师。

3.4  端口由UP变DOWN 3.4.1  故障描述

端口状态由UP变为DOWN。

3.4.2  故障处理步骤

查看本设备及对端设备日志,确认有无端口disable操作。

查看两端端口状态,确认是否为协议异常或在线诊断模块检测到异常将端口disable。请将故障信息发送技术支持人员分析。

参照端口无法UP故障处理,排查两端端口配置,网线、光模块、光纤等链路是否正常。

如仍无法确认,请搜集本端、对端设备信息,并将信息发送技术支持人员分析。

3.5  端口频繁UP/DOWN 3.5.1  故障描述

端口状态频繁UP/DOWN。

3.5.2  故障处理步骤

对于光口,请确认光模块是否异常。查看光模块alarm信息来排查两端光模块以及中间光纤问题;对于支持诊断功能的光模块可以通过查看diagnosis信息确认光模块的光功率是否处于上下门限临界值。如发送光功率处于临界值,请更换光纤、光模块做交叉验证;如接收光功率处于临界值,请排查对端光模块及中间光纤链路。

对于电口,一般在自协商情况下容易出现协商不稳定,这种情况请尝试设置强制速率双工。

如果故障依然存在,请排查链路、对端设备、中间设备。

如仍无法确认,请将故障信息发送技术支持人员分析。

3.6  光模块故障 3.6.1  故障描述

安装光模块的接口不能正常工作。

3.6.2  故障处理步骤

检查光模块的温度、电压、偏置电流、接收、发送光功率是否正常(即在该光模块的光功率上下门限值之内)。

P3500(CONFIG/L2/PORT)#show transceiver interface xge 2

XGE2:

Transceiver Type              : unknow

Wave Length(nm)               : 1310

Vendor Name                   : H3C

Vendor Part Number            : MXPD-243S

Vendor Serial Number          : MA12360160841

Manufacturing Date            : 20120905

Digital Diagnostic Monitor    : YES

Power Feed Voltage(V)         : 3.27

Optical Launch Power(dBm)     : -5.9739

Laser Bias Current(mA)        : 12.888

Temperature(Centigrade)       : 52.47

对怀疑故障的光模块进行交叉验证,如更换端口、与正常的光模块互换,确认是光模块本身故障还是相邻设备或中间链路故障。

如仍无法确认,请将故障信息发送技术支持人员分析。

3.7  端口存在FCS等错误统计故障处理 3.7.1  故障描述

通过show statistics查看到端口存在FCS等错误统计故障。

P3500(CONFIG/L2/BRIDGE)#show statistics xge 1

Port                                    :XGE 1

Rx total octets                         :0

Rx total frames                         :0

Rx multicast frames                     :0

Rx broadcast frames                     :0

Rx discards                             :0

Rx puase frames                         :0

Rx control frames                       :0

Tx total octets                         :420

Tx total frames                         :6

Tx multicast frames                     :0

Tx broadcast frames                     :0

Tx discards                             :0

Tx puase frames                         :0

Tx control frames                       :0

Rx 64 octets                            :0

Rx 65 to127 octets                      :0

Rx 128 to255 octets                     :0

Rx 256 to 511 octets                    :0

Rx 512 to 1023 octets                   :0

Rx 1024 to 1518 octets                  :0

Rx 1519 to 1522 octets                  :0

Rx Jumbo frames                         :0

Tx 64 octets                            :3

Tx 65 to127 octets                      :3

Tx 128 to255 octets                     :0

Tx 256 to 511 octets                    :0

Tx 512 to 1023 octets                   :0

Tx 1024 to 1518 octets                  :0

Tx 1519 to 1522 octets                  :0

Tx Jumbo frames                         :0

Rx undersize frames                     :0

Rx Fragments                            :0

Rx FCS Error Frames                     :0

Rx Alignment Error Frames               :0

Rx Oversize Frames                      :0

Rx Jabber Frames                        :0

Rx Code Errors                          :0

Tx Deferrals                            :0

Tx Excessive Deferrals                  :0

Tx Single Collisions                    :0

Tx Multiple Collisions                  :0

Tx Late Collisions                      :0

3.7.2  故障处理步骤 1. 查看错误报文统计信息从而判断故障问题

通过show counter命令,查看端口出入方向的错包统计具体是哪项在增长,从而判断故障问题。为方便查看,也可以在用户视图下使用clear counters 清空端口统计报文再观察。

(1)     端口入方向出现FCS错包且计数持续增加。

a.     使用仪器测试链路,链路质量差或者线路光信号衰减过大会导致报文在传输过程中出错。如链路故障请更换网线或光纤。

b.     与别的正常的端口更换网线或光纤光模块,如端口更换后错包消失,端口更换回来错包又再次出现,应为单板端口故障,请更换端口并将故障信息发送技术支持人员分析;如更换到其他正常端口仍会出现错包,则对端设备、中间传输链路故障的可能性较大,请排查。

(2)     排查对端设备或者中间的传输设备。检查端口入方向是否出现Overrun等错包且计数持续增加。Overrun计数是由于端口输入速率超出本端口处理能力,导致丢包。如果只有某一个端口收发包异常,或者某一个端口下挂设备的业务不通,同时这个单板上的其他端口都是正常的,可以多次查询show counter命令,如果Receiver errors有增加,且等于overruns的增加,那么可以怀疑是单板内部拥塞或堵死,请将故障信息发送技术支持人员分析。

(3)     检查端口入方向是否出现giants错包且计数持续增加。

检查两端的jumbo配置是否一致,如jumbo是否使能,端口默认的最大报文长度是否一致,允许最大报文长度是否一致。如果仍然无法确认,请将故障信息发送技术支持人员分析。

2. 若是光口请检查光模块的光功率是否正常

通过show transceiver命令查看光口所插光模块的数字诊断参数的当前测量值。若该光模块的光功率不正常,请更换同一型号的正常光模块。

4 业务类故障处理 4.1  业务流量不通 4.1.1  故障描述

OLT上出现业务不通的问题。

4.1.2  故障处理流程

 

4.1.3  故障处理步骤 1. 确认物理链路正常

1) 确认设备硬件运行正常。

2) 确认物理链路正常。

2. 检查mac表项学习

如果确认版本没有问题且配置已经下发,此时业务流量不通,请先确认设备是否已经学到对应表项。

# 查询P3500的mac学习表项。

P3500#brief-show mac-address

Agingtimer                    :300

Total MAC Count               :4

S-VID     MAC Address         Forward Port   Type           Virtual Port   Gem Port

---------------------------------------------------------------------------------------

31        01:00:94:00:00:01   Slot 1         Dynamic        1/1/1/1        289

31        02:02:94:00:00:02   TRUNK 1        Dynamic

4094      a0:c0:a8:d2:fe:02   Slot 1         Management

1         00:1c:82:0b:60:4b   Local          Management

4094      00:1c:82:0b:60:4b   Local          Management

TOTAL Count: 3

 

可以看到设备从1号槽位olt1接口关联的ont1接口的vport1端口接收到vlan tag为31的报文,学到的Mac地址为01:00:94:00:00:01;聚合口1接收的vlan tag为31的报文,学习到的Mac地址为02:02:94:00:00:02。

# 查询P3116的mac学习表项。

telnet@P3116(config-t)# show mac-address-table

Total Mac Addresses: 0

Interface Vlan  Type   LAG-Group  GroupID  MAC address        ONU-ID  GEM-Port  Cvid

---------------------------------------------------------------------------------------

telnet@P3116(config-t)#

3. 检查设备配置

如果发现mac表项都没有学习到,请检查如下的配置。

4. 检查链路聚合配置

如果配置了链路聚合,首先检查链路是否UP。

# 查询聚合口1信息。

P3500#configure l2 port show trunk 1

  Trunk group                :1

  Trunk name                 :1

  Port list                  :XGE 1,XGE 2

  Load balance scheme        :dstMAC

  Administrative Status      :UP

  Operational Status         :UP

  CfgSpeed                   :Auto

  CfgDup                     :Auto

  CfgFlow                    :Auto

  Actual speed               :10000M

  ActDup                     :Full

  ActFlow                    :Off

  Orient                     :Network

 

telnet@P3116(config-t-if-lg-1)# show link-aggregation summary

Group    Name               Ports                   Load balance

--------+------------------+-----------------------+------------------

1        NA                 ge2/1-2                 dst-mac

# 查询聚合口1链路状态。

P3500#configure l2 port show port trunk 1

Port                Admin  Oper CfgSpeed CfgDup CfgFlow ActSpeed ActDup  ActFlow Orient

XGE 1 (trunk 1)     Unlock UP    Auto     Auto   Auto    10000M  Full    Off     Network

XGE 2 (trunk 1)     Unlock UP    Auto     Auto   Auto    10000M  Full    Off     Network

telnet@P3116(config-t)# show interface link-aggregation 1 switchport

Link Aggregation Group: 1

 Switchport: Enabled

 AdminStatus: Enable

 Member list: ge2/1-2

 Load balance method: dst-mac

 Maximum receive frame: 1532

 Ingress vlan filter: Enabled

 Flow Control receive configured: Enabled

 Flow Control transmit configured: Enabled

 Storm-control multicast: disable

 Storm-control broadcast 131

 Storm-control unicast 131

 Link Status: Up

 Speed:10000Mbps,  BW 0 Mbps

 PVID: 1

telnet@P3116(config-t)#

5. 检查gpon模板配置

# 模板id 为1的是默认配置。

GPFA-1-1(config-t)# show configuration running gpon-profile

enable

configure terminal

 gpon profile dba id 1 name newprof_dba_1 type4 max 1244160

 gpon profile flow id 1 1 name newprof_flow_1 uni-type veip uni-bitmap 0xff upmap-type vlanId 101 101 pri-bitmap 0xff vport 1

 gpon profile flow id 2 1 name flow_2 uni-type ethernet-uni uni-bitmap 0xff upmap-type vlanId 31 31 pri-bitmap 0xff vport 1

 gpon profile flow id 2 2 name flow_2 uni-type ethernet-uni uni-bitmap 0xff upmap-type vlanId 32 32 pri-bitmap 0xff vport 2

 gpon profile flow id 2 3 name flow_2 uni-type ethernet-uni uni-bitmap 0xff upmap-type vlanId 33 33 pri-bitmap 0xff vport 3

 gpon profile flow id 2 4 name flow_2 uni-type ethernet-uni uni-bitmap 0xff upmap-type vlanId 34 34 pri-bitmap 0xff vport 4

 gpon profile rate-ctrl id 1 name newprof_rate_1 sir 102400 pir 102400

 gpon profile tcont-svc id 1 name newprof_tcontsvc_1 dba-id 1

 gpon profile vportsvc id 1 name newprof_vportsvc_1 us-pri 0 usratectrl-id 0 dsratectrl-id 0

 gpon profile tcont-bind id 1 v-port 1 name newprof_tcontbind_1 vportsvc-id 1 tcont-id 1 tcontsvc-id 1

 gpon profile tcont-bind id 2 v-port 1 name tcontbind_1 vportsvc-id 1 tcont-id 1 tcontsvc-id 1

 gpon profile tcont-bind id 2 v-port 2 name tcontbind_1 vportsvc-id 1 tcont-id 1 tcontsvc-id 1

 gpon profile tcont-bind id 2 v-port 3 name tcontbind_1 vportsvc-id 1 tcont-id 1 tcontsvc-id 1

 gpon profile tcont-bind id 2 v-port 4 name tcontbind_1 vportsvc-id 1 tcont-id 1 tcontsvc-id 1

 gpon ont-authentication snonly

 

exit all

GPFA-1-1(config-t)#

6. 检查ont接口配置

查看ont接口配置(Ont接口下涉及业务模板应用,uni端口vlan配置以及vport端口创建)

# 查询命令如下:

GPFA-1-1(config-t)# show configuration running interface-gpon-olt 1/

telnet@P3116(config-t)# show configuration running interface-gpon-olt 1/

查看不同olt口,不同ont接口,只需要修改olt id和ont id即可:

# 查看16口下 ont16的配置,以3500设备举例:

GPFA-1-1(config-if-gpon-ont-1/8/1)# show configuration running interface-gpon-olt 1/16 16

ont 1

 description "ONT-1"

 virtual-port 1 encrypt disabled

 virtual-port 2 encrypt disabled

 virtual-port 3 encrypt disabled

 virtual-port 4 encrypt disabled

 service flow-profile 2 tcont-bind-profile 2

 ont-vlan eth-uni 1 up-mode add-vid down-mode delete-vid up-pri 0 up-vid 31

 eth-uni 1 poe enable

 ont-vlan eth-uni 2 up-mode add-vid down-mode delete-vid up-pri 0 up-vid 31

 eth-uni 2 poe enable

 ont-vlan eth-uni 3 up-mode add-vid down-mode delete-vid up-pri 0 up-vid 31

 eth-uni 3 poe enable

 ont-vlan eth-uni 4 up-mode add-vid down-mode delete-vid up-pri 0 up-vid 31

 eth-uni 4 poe enable

 ont-vlan eth-uni 5 up-mode add-vid down-mode delete-vid up-pri 0 up-vid 31

 eth-uni 5 poe enable

 ont-vlan eth-uni 6 up-mode add-vid down-mode delete-vid up-pri 0 up-vid 32

 eth-uni 6 poe enable

 ont-vlan eth-uni 7 up-mode add-vid down-mode delete-vid up-pri 0 up-vid 33

 eth-uni 7 poe enable

eth-uni 8 poe enable

exit

GPFA-1-1(config-if-gpon-ont-1/8/1)#

7. 检查全局VLAN配置

# 查看全局VLAN配置,可以看到IS1/2口和聚合口1加入到vlan31,32,33,34。

P3500#brief-show vlan

vlan ingress check  : Enable

vlan user-isolation : Enable

S-Vlan TPID         : 0x8100

C-Vlan TPID         : 0x8100

 VID  Name                Ports                              Untag ports              Mode

----+-------------------+----------------------------------+------------------------+-------

1    DEFAULT_VLAN        IS 1/1-5/8,IU 1/1-3/4,XGE 1-4      IU 1/1-3/4,XGE 1-4       Full

31   31                  IS 1/2,TRUNK 1                                                Full

32   32                  IS 1/2,TRUNK 1                                                Full

33   33                  IS 1/2,TRUNK 1                                                Full

34   34                  IS 1/2,TRUNK 1                                                Full

4094 MNG_VLAN                                                                           Full

# 查看全局VLAN配置:telnet@P3116(config-t)# show configuration running vlan。

P3116(config-t)# show configuration running vlan enable

configure terminal

vlan 31

  member ge1/16,ge2/1 tagged

exit

8. 检查vlan-translate配置

# 查看全局vlan-translate。

P3500#brief-show vlan-translate

VLAN Translation Entry:

slot  port  ont   vport cvid      new-svid  new-cvid  cos       new-cos

--------------------------------------------------------------------------

1      16    1     1     31          31         4095       copy      8

 

# P3500的查看指定槽位/ont接口的vlan-translate。

P3500#brief-show vlan-translate slot 1 port 16 ont 1

VLAN Translation Entry:

slot  port  ont   vport cvid      new-svid  new-cvid  cos       new-cos

--------------------------------------------------------------------------

1     16     1     1      31         31         4095       copy      8

# P3116的vlan translate配置需要在olt接口下查询。

telnet@P3116(config-t)# show configuration running interface-gpon-olt 1/

9. 收集信息并寻求技术支持

如果上述检查完成后故障仍无法排除,请收集设备运行信息,并联系技术支持工程师。

提示

业务不通的时候也可以通过镜像功能观察受监控端口上的业务,具体参见“H3C GPON OLT交换机用户FAQ”中的“端口镜像”。

5 ONU常见故障处理 5.1  ONU的LOS灯闪烁 5.1.1  故障描述

ONU注册不上,los灯一直在闪烁。

5.1.2  故障处理流程

图5-1 ONU的LOS灯闪烁处理流程

 

5.1.3  故障处理步骤

(1)     ONU上光纤是否连接正确,光纤是否有弯折等。

(2)     olt上是否开启ONU自动绑定,进入olt的ftth视图,display this查看是否有ONU bind auto命令。

sys

System View: return to User View with Ctrl+Z.

[H3C]ftth

[H3C-ftth]onu bind auto

[H3C-ftth]onu bind auto chassis 1 slot 5

[H3C-ftth]onu bind auto chassis 1 slot 6

[H3C-ftth]display this

#

ftth

 onu bind auto

 onu bind auto chassis 1 slot 5

  bind auto chassis 1 slot 6

#

return。

(3)     还可以通过登录web页面查询ONU的接收光功率,ip地址也是192.168.0.240,

如下图所示,用户名密码也是admin/admin:

图5-2 ONU的接收光功率查询页面

 

登陆成功后点击左侧的PON连接信息,查询结果如下:

图5-3 PON连接信息和光模块信息

 

如果OLT上能查到ONU已经注册上,但ONU的LOS灯还一直在闪。则有可能是光功率太低导致的。

5.2  ONU无法上线 5.2.1  故障描述

ONU无法上线。

5.2.2  故障处理流程

图5-4 ONU无法上线处理流程

 

5.2.3  故障处理步骤

(1)     确保ONU上光纤是插好的,光纤没有弯折,光纤头没有松动。

(2)     查询ONU的接收光功率,方法同上一节,确保ONU有收光。

(3)     输入gponmgr get info命令查看ONU注册状态。

# gponmgr get info

^@ONU Info:

 ONU ID:    6

 ONU State: O5

 SN:        FHTT12345678

 PASSWD:

  ASCII:    '

  HEX:      27000064000000060000

 REGID:

  ASCII:

  HEX:      000000000000000000000000000000000000000000000000000000000000000000000000

 Key Idx:   0

 Key:       00000000000000000000000000000000

 O1 Timer:  0 ms

 O2 Timer:  0 ms

 OMCC ID:   0

#

正常注册时ONU State的值为O5,未注册时ONU State的值为O2,可以通过ONU State的值来判断ONU注册的阶段。

(4)     如果软件中注册进程异常挂掉,也可能造成ONU注册不上。

 

注意

请在ONU接入现网之前先完成业务配置。否则,可能存在未知单播数据流或者协议报文太多冲击CPU,导致ONU无法及时处理与olt的交互报文,ONU与olt的链接断开,ONU无法上线。

 

(5)     收集信息并寻求技术支持

如果上述检查完成后故障仍无法排除,请收集设备运行信息,并联系技术支持工程师。

 

5.3  PON网络卡顿 5.3.1  故障描述

PON网络流量不通,业务卡顿。

5.3.2  故障处理流程

图5-5 PON网络卡顿故障处理流程

 

5.3.3  故障处理步骤

(1)     确认现场组网环境。对业务功能配置划分明确,相互业务不要有干扰,配置干净。

(2)     查询ONU的上行带宽是否配置,除了最大带宽,还可以配上最小带宽和保证带宽等。

5.4  未注册的ONU设备查询不到 5.4.1  故障描述

当show ont-unbound 查询不到未注册ONU的信息,可以按照下面步骤进行基础检查。

5.4.2  故障处理流程

图5-6 未注册的ONU设备查询不到故障处理流程

 

5.4.3  故障处理步骤 1. 检查物理链路

(1)     检测ONU指示灯状态

当ONU设备的PON指示灯为绿灯闪烁,代表当前OLT口到ONU的物理链路正常,ONU处在注册或被OLT发现的状态,这个时候ONU是可以被发现的。

当ONU设备的LOS指示灯为红灯闪烁,代表当前OLT口到ONU的物理链路断开,ONU处于收不到光的状态,此时可以查看检查光模块类型。

(2)     检测OLT口发光状态

# 基于第1步,可以通过命令行查询OLT口查询状态,下面以P3116设备举例,3500类似

telnet@P3116(config-t)# show interface gpon-olt 1/8 optical-info

Transceiver Type              : SFP

Connector Type                : SC

Wave Length(nm)               : 1490

Vendor Name                   : H3C

Vendor Part Number            : 9801A3HG

Vendor Serial Number          : I9661220800806

Vendor Specific SN            : 219801A3HG5222F000V1

Manufacturing Date            : 20220223

Digital Diagnostic Monitor    : YES

Power Feed Voltage(V)         : 3.34

Optical Launch Power(dBm)     : 3.1704

Laser Bias Current(mA)        : 17.218

Temperature(Centigrade)       : 39.85

telnet@P3116(config-t)#

2. 检查光模块类型

# 查询OLT口光模块类型,如果检查OLT口发光正常,但是ONU依旧闪LOS灯,请查询OLT口光模块类型是否适配。

telnet@P3116(config-t)# show interface gpon-olt 1/8 transceiver type

port   transceiver type

-----------------------------------------------------------------------------------

8      sog4321-psgb

telnet@P3116(config-t)#

# 如果光模块类型不是上面的sog4321-psgb,请用下面命令修改。

telnet@P3116(config-t-if-gpon-olt-1/8)# transceiver type sog4321-psgb

3. 下发all-ont enable

如果查询不到ONU,可以在OLT口下发命令,让OLT口重新发光,等待10s左右,再查询ONU是否能被发现。

# 下发命令行如下:

telnet@P3116(config-t-if-gpon-olt-1/8)# all-ont enable

4. 收集信息并寻求技术支持

如果上述检查完成后故障仍无法排除,请收集设备运行信息,并联系技术支持工程师。

5.5  ONU 不能被自动发现或注册失败

查看下面的检查方法:

表5-1 光路故障

Fault Scope

可能原因

判断依据

恢复方法

OLT

SN没有配置正确

"show configure running"

重新配置SN.

GPFA-1-2(config-t)# show ont-unbound

ONU光模块发光被关闭

ONU不发光 @1310nm

”show interface gpon-olt 1/1 ont-unbound” 没有发现ONU

 

1.基于PON口enable所有ONU: GPFA-1-2(config-t-if-gpon-olt-1/1)#all-ont enable 2. Enable 单个ONU: GPFA-1-2(config-if-gpon-ont-1/1/1)# enable

3. 重启 ONU

ONU被deactive

"show configure running"

GPFA-1-2(config-if-gpon-ont-1/1/1)# deactive

GPFA-1-2(config-if-gpon-ont-1/1/1)# active

PON口被shutdown

"show configure running"

GPFA-1-2(config-t-if-gpon-olt-1/1)# no shutdown

光模块故障

"show interface gpon-olt 1/1 optical-info"

更换光模块或者切换到其他PON口

ONU

ONU没有上电

"show alarm" to check if "DGi" alarm is raised

检查ONU电源

PON口下存在流氓ONU (流氓ONU持续长发光导致其他ONU不能注册.)

1.开启长发光检测: GPFA-1-2(config-t)# anti-rogueont enable 2. "OPTICAL-TF" 告警上报

1. 移除流氓ONU

2. 完成后关闭流氓ONU检测

GPFA-1-2(config-t)#anti-rogueont disable

ONU硬件故障

1. ONU LED不正常 2. ONU发送光功率过低 3. ONU接收灵敏度过低

更换故障ONU或者掉电重启ONU

ODN

光纤接头不干净(衰减和反射增大)

 

清洁光纤接头

光纤过度弯折(衰减和反射增大)

 

整理光纤

光纤没有紧密连接

 

重新连接光纤

不同类型光纤接头连接在一起比如APC 和 UPC

 

更换分光器/光纤

 

查看光功率是否正常(P3500和P3100命令一致):

# OLT 光模块信息。

GPFA-1-2(config-t)# show interface gpon-olt 1/1 optical-info

# OLT光模块发送光功率范围:

Class B+: 1.5~ 5 dBm

Class C+: 3~7 dBm

# OLT 接收到ONU1发送的光功率。

GPFA-1-2(config-t)# show interface gpon-olt 1/1 optical-info ont 1 received-power

# OLT光模块接收灵敏度。

Class B+: -28 dBm

Class C+: -32 dBm

# ONU光模块信息。

GPFA-1-2(config-t)# show interface gpon-olt 1/1 ont 1 optical-info

# ONU光模块灵敏度。

-28dBm @ 1490nm

5.6  ONU频繁上下线

ONU频繁上下线、频繁产生光路告警、光路质量差导致或光路存在较大反射或衰减会导致交互报文存在较多误码而交互失败。查看告警并检查光路(P3500和P3100命令一致)。

GPFA-1-2(config-t)# show alarm

GPFA-1-2(config-t)# show alarm detail

GPFA-1-2(config-t)# show alarm-history

表5-2 光路告警

Alarm

Description

Cause

Actions

LOSi

Loss of signal for ONUi

Fiber of ONUi break occurs

Reconnect the fiber

LOS

Loss of Signal

Backbone fiber break occurs

Reconnect the fiber

LOFi

Loss of Frame of ONUi

ODN failure

Optimize the ODN

DOWi

Drift of window of ONUi

ODN failure

Optimize the ODN

SFi

Signal Fail of ONUi, when upstream BER of ONUi becomes >=10-4

ODN failure

Optimize the ODN

SDi

Signal degraded of ONUi, when upstream BER of ONUi becomes >=10-5

ODN failure

Optimize the ODN

LCDGi

Loss of GEM channel delineation

ODN failure

Optimize the ODN

SUFi

Start-up failure of ONUi

The ranging of ONUi has failed n times (n=2)

ODN failure

Optimize the ODN

LOAMi

Loss of PLOAM for ONUi

ODN failure

Optimize the ODN

DGi

Dying-Gasp of ONUi

ONUi is powered off

Restore power supply

 

5.7  系统其它告警

可以通过如下命令查看系统告警信息,并参考表5-3分析告警原因和解决方法。

P3500#alarm show alarm

告警列表说明如下表:

表5-3 告警列表

Alarm Description(English)

告警描述

级别

产生原因

解决方法

Module Type Mismatch

模块类型不匹配

Major

当前插入的模块类型和虚支配的模块类型不匹配

虚模块被解支配或当前插入模块被拔除或复位后清除

Module unrecognized

模块无法识别

Major

由于模块失败导致插入的模块无法被识别

模块以后被识别或模块被拔出或复位后清除

Module failed to come up

模块无法正常启动

Major

由于模块故障,尽管模块被节点识别,但是模块无法正常启动提供业务

模块以后启动业务或模块被拔出或复位后清除

Assigned module removal

模块被拔出

Major

正常匹配的模块被拔出

模块被重新插入或虚模块被解除支配后清除

Standby CSM removal

备用CSM模块被拔出

Major

备用的CSM模块被拔出

备用CSM模块插回后清除

Standby CSM is running a higher version image

备用CSM上正运行一个更高的版本软件

Minor

备用CSM上正运行一个更高的版本软件

CSM切换或备用CSM被拔出或复位后清除

Standby CSM is running a lower version image

备用CSM上正运行一个更低的版本软件

Major

备用CSM上正运行一个更低的版本软件

CSM切换或备用CSM被拔出或复位后清除

Module image version mismatch

模块软件版本不匹配

Minor

模块中正在运行的软件版本和节点版本文件中的不同

模块被拔出或复位后清除

Hearbeat signal failed between two redundancy CSM modules

主备用CSM之间的心跳信号失败

Major

主备用CSM之间的心跳信号失败

备用CSM被拔出或心跳信号恢复后清除

Protection uplink on active CSM is down

主用CSM的上行保护链路断开

Critical

主用CSM的上行保护链路断开

CSM切换,主用CSM被拔出或复位,主用CSM的上行保护链路恢复后清除

Protection uplink on standby CSM is down

备用CSM的上行保护链路断开

Major

备用CSM的上行保护链路断开

CSM切换,备用CSM被拔出或复位,备用CSM的上行保护链路恢复后清除

Image file failed to be downloaded into module

模块下载软件失败

Minor

模块下载软件失败

模块被拔出或后续的成功下载后清除

Version file is missing

版本文件未找到

Major

机框中没有版本文件

版本软件重新获取后清除

Module ambient temperature exceeds the warning threshold

模块周围温度超过了告警温度阀值

Minor

模块周围温度等于或高于告警温度阀值(T1)

模块复位,拔出或模块周围温度低于告警温度,或模块周围温度等于或高于短时容忍温度阀值

Module ambient temperature exceeds the short-time tolerance threshold

模块周围温度超过了短时容忍温度阀值

Major

模块周围温度等于或高于短时容忍温度阀值(T2)

模块复位,拔出或模块周围温度低于短时容忍温度阀值,或模块周围温度高于停工温度阀值

Environmental temperature cross the high-temperature threshold

模块周围温度超过了停工温度阀值

Major

模块周围温度等于或高于停工温度阀值(T3)

模块复位或拔出后清除

Environmental temperature cross the high-temperature threshold

环境温度超过高温阀值

Critical

检测到的环境温度超过高温阀值

节点复位,下次检测到的环境温度低于高温阀值3 °C后清除

Environmental temperature cross the low-temperature threshold

环境温度超过低温阀值

Warning

检测到的环境温度超过低温阀值

节点复位,下次检测到的环境温度高于低温阀值3 °C后清除

Fan Tray absent

风扇盘不在位

Major

风扇盘不在位

风扇盘插入后清除

One or two FANs fails working

一个或两个风扇停止工作

Minor

一个或两个风扇停止工作

风扇盘拔出,所有的风扇工作正常或超过两个风扇停止工作后清除

More than two FANs fail working

超过两个风扇停止工作

Major

超过两个风扇停止工作

风扇盘拔出,所有的风扇工作正常或只有一个或两个风扇停止工作后清除

Time server is down

时间服务器断开

Minor

在轮询周期内没有收到所有的配置的SNTP服务器的响应

在下一个轮询周期内收到任何一个SNTP服务器的响应后清除

External alarm raised

外部告警产生

Configurable

外部告警产生

外部告警清除,或外部告警输入去能后清除

The threshold of CPU occupancy in CSM is crossed

主用CSM的CPU占有率超过阀值

Minor

主用CSM的CPU占有率超过阀值

在下面的轮询中CPU占有率低于过负荷阀值后清除

The threshold of Memory occupancy in CSM is crossed

主用CSM的内存占有率超过阀值

Minor

主用CSM的内存占有率超过阀值

在下面的轮询中内存占有率低于过负荷阀值后清除

The threshold of 15min CPU occupancy is crossed

15分钟的CPU占有率超过阀值

Minor

模块15分钟的CPU占有率超过阀值

模块复位,或在下面的轮询中CPU占有率低于过负荷阀值后清除

-48VDC input is abnormal

-48V直流电源输入异常

Major

-48V直流电源输入过压,欠压或过流

-48V直流电源输入恢复正常

3.3VDC power output is abnormal

3.3V直流电源输出异常

Major

3.3V直流电源输出过压,欠压或过流

3.3V直流电源输出恢复正常

Ringer power output is abnormal

铃流电源输出异常

Major

铃流电源输出欠压或过流

铃流电源输出恢复正常

Power output is abnormal

电源输出异常

Critical

直流电源输出过压,欠压或过流

直流电源输出恢复正常

CSM uplink down

CSM上行链路断开

Major

CSM上行链路端口的运行状态是“断开”

CSM上行链路的工作状态变成“正常”或上行链路端口的管理状态变为“锁定”

CSM uplink locked

CSM上行链路“锁定”

Warning

CSM链路端口的管理状态为“锁定”

CSM链路端口的管理状态为“锁定”

Trunk work abnormal

Trunk工作异常

Major

1、该链路聚合对端的交换机路由器端口可能工作异常。

2、本设备与对端交换机路由器之间用于该链路聚合的线缆可能受损。

激活的trunk成员端口的实际速度、双工方式、或者流控一致

Trunk down

Trunk状态down

Major

CSM trunk的运行状态是“断开”

CSM trunk的工作状态变成“正常”或trunk的管理状态变为“锁定”

GE optical transceiver TX power high alarm

GE光模块发送光功率高告警

Major

OLT光模块发送光功率高于设置的阈值

OLT光模块发送光功率低于设置的阈值的5%

GE optical transceiver TX power low alarm

GE光模块发送光功率低告警

Major

OLT光模块发送光功率低于设置的阈值

OLT光模块发送光功率高于设置的阈值的5%

GE optical transceiver supply voltage high alarm

GE光模块收发器电压高告警

Major

GE光模块收发器电压高于设置的阈值

GE光模块收发器电压低于设置的阈值的5%

GE optical transceiver supply voltage low alarm

GE光模块收发器电压低告警

Major

GE光模块收发器电压低于设置的阈值

GE光模块收发器电压高于设置的阈值的5%

GE optical transceiver bias current high alarm

GE光模块收发器偏流高告警

Major

GE光模块收发器偏流高于设置的阈值

GE光模块收发器偏流低于设置的阈值的5%

GE optical transceiver bias current low alarm

GE光模块收发器偏流低告警

Major

GE光模块收发器偏流低于设置的阈值

GE光模块收发器偏流高于设置的阈值的5%

GE optical transceiver temperature high alarm

GE光模块收发器温度高告警

Major

GE光模块收发器温度高于设置的阈值

GE光模块收发器温度低于设置的阈值的5%

GE optical transceiver temperature low alarm

GE光模块收发器温度低告警

Major

GE光模块收发器温度低于设置的阈值

GE光模块收发器温度高于设置的阈值的5%

GE optical transceiver TX power high warning

GE光模块发送光功率高警告

Major

OLT光模块发送光功率高于设置的阈值

OLT光模块发送光功率低于设置的阈值的5%

GE optical transceiver TX power low warning

GE光模块发送光功率低警告

Major

OLT光模块发送光功率低于设置的阈值

OLT光模块发送光功率高于设置的阈值的5%

GE optical transceiver supply voltage high warning

GE光模块收发器电压高警告

Major

GE光模块收发器电压高于设置的阈值

GE光模块收发器电压低于设置的阈值的5%

GE optical transceiver supply voltage low warning

GE光模块收发器电压低警告

Warning

GE光模块收发器电压低于设置的阈值

GE光模块收发器电压高于设置的阈值的5%

GE optical transceiver bias current high warning

GE光模块收发器偏流高警告

Warning

GE光模块收发器偏流高于设置的阈值

GE光模块收发器偏流低于设置的阈值的5%

GE optical transceiver bias current low warning

GE光模块收发器偏流低警告

Warning

GE光模块收发器偏流低于设置的阈值

GE光模块收发器偏流高于设置的阈值的5%

GE optical transceiver temperature high warning

GE光模块收发器温度高警告

Warning

GE光模块收发器温度高于设置的阈值

GE光模块收发器温度低于设置的阈值的5%

GE optical transceiver temperature low warning

GE光模块收发器温度低警告

Warning

GE光模块收发器温度低于设置的阈值

GE光模块收发器温度高于设置的阈值的5%

GE optical transceiver Rx power high alarm

GE光模块收发器接收功率高告警

Major

GE光模块接收光功率高于设置的阈值

OLT光模块接收光功率低于设置的阈值的5%

GE optical transceiver Rx power low alarm

GE光模块收发器接收功率低告警

Major

GE光模块接收光功率低于设置的阈值

OLT光模块接收光功率高于设置的阈值的5%

GE optical transceiver Rx power high warning

GE光模块收发器接收功率高警告

Warning

GE光模块接收光功率高于设置的阈值

OLT光模块接收光功率低于设置的阈值的5%

GE optical transceiver Rx power low warning

GE光模块收发器接收功率低警告

Warning

GE光模块接收光功率低于设置的阈值

OLT光模块接收光功率高于设置的阈值的5%

LOS

PON 光口失效

Critical

PON光模块报告失败

PON端口的发送光功率恢复到最大最小阈值之间或端口去能后清除

LOSi

ONT LOSi Alarm

Critical

OLT收不到指定ONU的发光

OLT 探测到正常的ONU发光

SFi

ONUi信号失效

Critical

每个间隔T计算BER(ONU误码率)。T是应用程序设置的参数。 如果BER≥BER SF阈值,则SFi警报将发送到主机应用程序。 BER SF阈值定义为10-x,其中x为可在3到8范围内配置。

警报必须由主机清除成功激活ONU之后的应用程序.

SDi

ONUi信号降级

Major

每个间隔T计算BER(ONU误码率)。T是主机应用程序设置的参数。 如果BER≥BER SD阈值,则SDi警报将发送到主机应用程序。BER SD阈值为10-x,其中x可在4到9的范围内配置

SD阈值必须高于SF阈值。 当BER



【本文地址】

公司简介

联系我们

今日新闻

    推荐新闻

    专题文章
      CopyRight 2018-2019 实验室设备网 版权所有