NSN告警处理方法(包括MCPA) 目前7***告警存在7600-7609告警,内容如下: 这些告警主要依靠告警排除指导进行: 1、 先锁放该扇区 2、 通过远端重启硬件ESMC 3、 检查射频模块指示灯是否正常 4、 检查射频模块直流电源输入电压是否正常 5、 基站系统模块与射频模块之间的光纤连接匹配正常 6、 更换射频模块 7、 更换系统模块 按照上述一步一步指导,能很容易排查出故障。 典型故障处理: 76**告警的处理: 1、7600、7601、7602、是BCF级的告警,告警的严重等级7600最高,为严重告警,7601为重要告警,7602为提示性告警 2、7603、7604、7605是BTS(扇区)级告警,告警的严重等级7603最高,为严重告警,7604为重要告警,7605为提示性告警 3、7606、7607、7608是TRX(载频)级告警,告警的严重等级7606最高,为严重告警,7607为重要告警,7608为提示性告警 4、许多BCF级的告警由BTS级告警引起,许多BTS级告警又是由TRX级告警引起,所以BTS级告警是最常见的
5、所以76**告警主要介绍7606和7607告警的处理
一、处理7607(TRX OPERATION DEGEADED)告警的处理方法: 1、告警的意义:该告警主要告诉我们在载频中出现严重错误 2、主要处理方法:
MCPA触发7607告警与FLEXI BTS有很大的不同,MCPA没有合路器,集成度更高,在FLEXI BTS中传送数据的多根射频线、BUS线,演进到MCPA中,集成在一根光纤中传送数据。主要处理方法如下:
测量天馈驻波比在合理范围内,检查与射频单元相连的馈线头是否紧固 检查SFP光纤模块安装是否规范
检查光模块SFP型号(单模或多模)与光纤型号(单模或多模)是否一致 检查光纤工作状态、收发是否正常,光功率是否正常 近端重启射频模块 检查基站硬件数据库配置 排除以上,更换有故障的射频模块
二、处理7606(TRX FAULTY)告警的主要方法
1、告警意义:该告警主要告诉我们在载频中出现严重故障,此告警会闭锁载频。 2、主要处理方法:
MCPA触发7606告警与FLEXI BTS也有很大的不同,MCPA采用集中的基带处理计数,集成度更高,采用载频池的概念。主要处理方法如下:
近端重启硬件 远端重启BCF
检查本地扇区配置与BSC侧是否一致
检查本地功率配置与载频数量及时隙(BTS侧与BSC侧)是否匹配 检查光模块SFP型号(单模或多模)与光纤型号(单模或多模)是否一致 更换系统模块 更换射频模块
三、处理7745(CHANNEL FAILURE RATE ABOVE DEFINED THRESHOLD)告警办法与建议-1 统计原理:
OMC统计每个载频的每个时隙的信道失败率,对TCH时隙,如果失败率超过20%,对SDCCH时隙,失败率超过80%,则会出7745告警,统计时长为1小时,该告警只能在BSC上看到,通过BSC告警的增补信息,可以看到具体是哪个时隙故障率高,是TCH还是SDCCH信道以及失败率最高值。 告警分析:
该告警属于统计类综合告警,指出信道的失败率高于指定的值,信道失败率高有可能但不一定造成掉话率高,所以该告警跟掉话率高有较大的关系,该告警只是一个统计的结果,并没有指出造成该结果的原因,所以需要综合分析该告警的原因。 四、处理7745告警的办法及建议-2
该告警可能的原因非常多,主要有以下:
1、 基站有硬件告警:这种是最好解决的,只要有针对性的解决了硬件告警,7745告警就能消除
2、 基站无硬件告警,但硬件或软件确实存在问题,往往伴随上下行质量差,大致有以下可能情况:
载频性能下降,但是还未到出告警的程度,例如发射功率偏低等 基站的同步设置不对会造成切换掉话 光纤模块不紧也有可能掉话
A-bis口时隙设置有误,特别是Trxsig正确,TCH时隙根BSC不一致会产生
大量掉话
极少数发生过设备故障造成的干扰,无告警,但产生7745掉话
五、处理7745告警的办法及建议-3
天馈线问题造成的7745
天馈线驻波比偏高,天线方位角的各种问题: 两个单极化天线方位角不一致 扇区接反
建筑物及广告牌等的阻挡 全向天线安装过低,被抱杆阻挡
两个单极化间距不够1.3米,或者不在同一平面 全向天线距离塔身不足1米 天线下倾角问题: 定向天线上仰
两个单极化天线俯仰角不一致
天线安装不垂直
天线的其它问题:有可能天线的驻波比达标,但其他性能较差,但是工程的手段无法测出天线的全面性能
这些天线的问题都会影响到所覆盖的区域,影响到通话质量及掉话 六、处理7745告警的办法及建议-4
传输问题:曾经发生过微波传输引起的7745,换光端机后问题解决 网络规划不合理,主要是天线的覆盖区域不合理,造成越区覆盖 方位角不合理
下倾角不合理,有可能覆盖过远 网络信号差造成的弱覆盖引起的7745 干扰造成的掉话 频率规划不合理 直放站等干扰 塔放造成的干扰 其它干扰源
七、处理7745告警的方法及建议-5
BSC问题或参数引起的掉话等
有一些BSC参数可能影响到7745,例如以下参数的修改,造成7745增多
这两个参数门限系统默认值如下: ZEEN:TCHFR=TCH failure rate (20%) SCHFR=SDCCH failure rete (80%) 修改如下:
ZEEN:TCHFR=TCH failure rate (10%) SCHFR=SDCCH failure rete (20%) 半速率也会影响7745及掉话 八、处理7745告警的方法及建议-6
通过前面7745告警的可能原因分析,比较难处理的是没有其它硬件告警的7745,针对这部分的7745的处理,对设备厂家来说,主要是排除设备本身软硬件的原因及天馈线的原因,也就是针对建议2-3类相应的进行检查及处理,主要方法如下: 仔细检查基站同步设置,确保没有问题 仔细检查传输时隙分配,确保跟BSC一致 确保BSC的RDIV参数为“Y”
再次检查模块间连线可靠 检查天馈线驻波比
检查天线方位角、倾角等安装工艺指标是否存在问题 检查硬件数据库和实际一致 九、处理7745告警的方法及建议-7
在前面7步工作的基础上,对出7745的载频进行载频测试,对测试不过的载频进行互换。
处理7745最常用的方法是通过互换来检查出7745的载频和没出7745载频、连线、天馈线是否存在问题,观察是否跟着7745走,判断是否设备硬件本身的问题,需注意:
首先建议用互换的方式,即好的载频与坏的换,不要直接用新的换,这样做虽
然麻烦一点,但思路清晰,结果容易说明问题,直接拿新的换,由于不能百分百保证新板件一定没问题,所以换过后的结果没有百分百的说服力。 为了思路清晰,最好载频、连线、天馈线分别、分步更换。
如果7745的结果跟着硬件走,说明是硬件问题,不跟着走,说明根本次互换
的硬件无关。
如果本站7745告警伴随着7744、或者7746告警的话,则有可能是干扰或者拥塞造成。
十、关于断站故障
断站的标志告警就是7767(BCCH MISSING ),随后还会相继出现7700基站OMU信令初始化、7701 BCF基站主控板初始化、7708载频重启等。
如以下几种情况会引起断站:
BCCH载频故障引起的断站,主要告警表现为:7606告警,随后会出现基站
重启的一系列告警,如:7767、7701、7708等
8****系列的告警,一般是传输质量差告警(例如误码高等),错误累积到一
定程度就会引起传输失败(7704 PCM FAILURE),从而导致基站信令中断(7706 BTS O&M LINK FAILURE),基站重启
由传输引起的基站断站,查看历史告警时一般没有别的传输告警(8***系列告
警),直接出现(7704 PCM FAILURE),从而引起基站重启的一系列告警,如:7767、7706、7708
基站维护人员人为关闭基站,监控会出现7710告警,相继出现7767
基站断电,如果是交流电基站,没有蓄电池,也会出现断站,这是首先应该有
外部电源告警,然后出现断站的其他告警
基站主控单元ESM(五代站)故障也会造成断站,并且没有伴随告警,OMU
link 直接吊死
BSC方面的故障也有可能造成断站,例如BCSU重启
十一、7738(BTS WITH NO TRANSACTIONS)告警处理
告警意义:OMC统计到BTS无话务,告警增补信息指出告警原因 1=SDCCH无话务 2=TCH无话务
3=SDCCH和TCH均无话务 10=没有GPRS话务 故障可能原因:
基站本身问题(硬件或软件设置) A-bis口设置问题 BSC参数的调整
统计时长过短(可通过参数调整),确实没有话务 处理方法:
现场拨打测试语音及数据业务,测试正常的基本都不是设备问题,另外由于网
优在BSC上设置参数控制话务量的分配,对开通EDGE分离模式的站,一般设定非EDGE小区语音负荷在80%(参数控制)以上才会占用EDGE小区,及EDGE小区数据业务优先,所以大部分没有话务属于正常现象。 对拨打测试不正常的基站,检查硬件、软件设置,排除问题
7607告警处理专项报告
随着网络维护工作的不断深入和用户对通话质量要求的不断提高,处理各种感知类告警已经成为提高用户感知的重要手段之一。省公司也在 10 - 11年不断要求分公司加大对感知类告警的处理,切实提高用户感知度。而引发感知类告警的因素很多,对于一些隐性因素难以发现,这些给处理感知类告警带来了较大的难度。公司在汲取各分公司现有经验的基础上,经过反复的理论研究、不断的实践论证,寻找出了一套切实可行、行之有效的处理 7607 告警措施。 实施步骤:
一、7607告警信息分析 (7类告警处理)
经过对现网中存在的 7607 告警的总结,发现 7607 告警主要有以下几种: 1 、 7607 TRX OPERATION DEGRADED TRX test result antenna connection faulty. 注解:载频检测到天线连接失败
2 、 7607 TRX OPERATION DEGRADED
Rx levels differ too much between main and diversity antennas. 注解:主分级接收差异过大
3 、 7607 TRX OPERATION DEGRADED EXxx TRX module cooling fan(s) report no rotation 注解:载频风扇不转
4 、 7607 TRX OPERATION DEGRADED Commissioning file dimate control profile mismatch , On fans detected
注解:风扇配置与实际不符
5 、 7607 TRX OPERATION DEGRADED
ECxx RTC module has detected VSWR above minor limit at antenna 注解: RTC 模块检测到天线驻波比值超出门限 6 、 7607 TRX OPERATION DEGRADED
EXxx TRX module detected only one Rx aignal during RF Cable autodetection 注解:射频电缆检测到只有一路接收 7 、 7607 TRX OPERATION DEGRADED
RSSI detected Rx signal difference exceeding threshold 注解: RSSI 检测两路接收信号差值超出门限
二、告警处理思路:
(一)告警 1 - 2 处理
这两种 7607 告警大多出现在 NOKIA METROSITE 中。目前在网的 NOKIA METROSITE 大多作为室分信源使用。METROSITE 的每块载频均有天馈线连接并最终合成一路进入室分系统;载频 1 、 2 互为分集接收,载频 3 、 4 互为分集接收。当载频出现故障、连接载频的馈线出现故障、电桥出现故障或室分设备出现故障都可能天线连接失败,导致设备出现第一种告警;由于两两载频的互为分集接收,当连线出现错误、互为分集
接收的某一块载频出现故障或某一载频馈线出现故障都可能导致另一块载频主分集接收差异大,导致设备出现第二种告警。 检查及处理建议:
1 )检查设备硬件是否正常,及时更换故障载频;
2 )检查馈线工艺是否良好,对驻波值不符合要求的故障点及时处理; 3 )检查载频连线配置是否正确,及时纠正错误连接;
4 )检查室分元器件及室分设备是否正常,及时维修或更换故障单元。
5 )对于奇数配置的 METROSITE 站点,未开通载频的馈线和连线要求配置齐全。 案例:下面为市区公路局微蜂窝因射频线连接错误出现的 7607 告警。由上图可以看出,由于载频射频连线错误,造成告警( 7607 :载频检测到天线连接失败),由上图可以看出,经过维护人员进行调整后,告警消除,基站正常工作。
(二)告警 3 - 7 处理
这五种 7607 告警多出现在 NOKIA FLEXI 中。目前在网的 FLEXI 设备既做有室分信源也有做宏站。因为 FLEXI 基站在集成度和设备自检上的改进,告警指向较为明显;但同时由于 FLEXI 设备可能存在有待完善的地方,也给告警处理造成了一定的困难。
1 、对于第三种告警和第四种告警,主要是针对风扇产生的告警。
检查及处理建议:
1 )检查风扇电缆是否连接到载频。 2 )检查风扇有无阻挡。 3 )清除风扇灰尘及赃物。
4 )更换风扇。(部分基站曾发现风扇转依然出告警现象,主要是由风扇转速低引起) 5 )更换载频。(风扇更换后依然出现风扇告警)
2 、对于第五种告警主要是由于 VSWR ( 驻波)过高引起的,类似该类告警相对较多,在此不一一指出。
检查及处理建议:
1 )检测天馈线驻波值是否过高,使用DDU 模块时经常出现单口(A 口或者B 口)驻波比高的告警,及时处理天馈故障或天线故障;
2 )检查连接天线口的射频线有无问题,及时更换射频连线; 3 )检查合路单元是否存在故障,及时更换DDU 或者RTC 。
3 、对于第六种告警主要是由于实际连线与软件连线不统一造成。
检查及处理建议:
1) 检查载频连线及RX 连线接头,及时紧固连线或更换损坏的连线;
2) 检查实际连线配置与数据库连线配置是否相符,根据实际连线配置对数据库进行手动配置;
3) 检查载频硬件是否存在故障,更换出现告警的载频;
4) 检查双工器中是否部分连线口存在故障,更换载频硬件位置或更换双工器。
4 、第七种告警是是现网中FLEXI 站点存在最多的告警,也是7606 告警中较为难处理的一种告警。维护人员对这一类告警进行了专门的研究。
告警含义:
该告警实时测量并比较每个Trx 两路接收的差值,当差值大于设定的门限时触发告警,目的是提醒两路接收中的一路可能有问题。 主要原理:
基站不断对每个载频的两路接收电平值进行采样计算,必须每小时采样数大于160000 次才能得出统计结果,也就是每个载频需要有足够的话务量,如果某个载频话务量过少,结果就统计不出来,结果统计如果大于10dB ,该载频将出7607 告警,如果某扇区的所有载频都出7607 告警,这该扇区出7604 告警。 主要思路:
通过观察RSSI 测量值、分析RSSI 值的特点、载频功率测试、载频环路测试等手段,可以逐步缩小范围,确定故障点。 检查及处理建议:
当个别或部分载频出现第七种7607 告警时,按照第五种、第六种7607 告警的处理思路进行逐步排查和处理。
当整个扇区出现第七种7607 告警时,其检查及处理建议如下:
1 )对载频进行功率测试,确认小区RDIV 参数是否打开,及时联系交换打开RDIV 参数; 2 )检查RSSI 值情况,检查周围无线环境,确认天线周围无遮挡; 3 )检查RSSI 值情况,检查天线角度是否一致,及时对天线进行调整;
4 )检查RSSI 值情况,统计扇区切换关系,确认是否存在天线接反、接鸳鸯情况,及时调整天线;
5) 检查RSSI 值情况,判断RX 接收存在问题的是A 口还是B 口,测量天馈驻波值并及时处理天馈、天线或避雷器故障; 6 )对扇区数据库进行清空并重新配置; 7 )更换设备主控模块; 创新亮点:
对于以上情况仍无法处理掉的情况,分公司又专门进行了研究。通过研究我们发现, 该
告警从根本上所关注的只是两个天线接口处的差值,只要我们消除了差值告警就会消失。我们对各类设备进行了研究、实验。
1 、将 RTC 的 RXIN 和 RXOUT 连接。
通过查阅 NOKIA 设备资料,发现诺西称将 RTC 的 RXIN 和 RXOUT 连接就是在内部将 A 口和 B 口连接起来从而消除 RX 差值。经过实验我们发现,这种做法起不到资料中所说的作用。 2 、功分器。
功率分配器简称为功分器,它是把输入信号功率等分或不等分成
几路功率输出的器件。腔体功分器是功分器中的一种,结构是腔体的,如:同轴结构或波导结构。可平均的分配蜂窝网的大功率信号,具有反射和损耗小的特点。宽频设计,可广泛应用于单频段、多频段天线或泄露电缆系统,因采用无焊接点的同轴腔系统,使插损最小,可靠性增强。但该源器件输出口不能接大功率信号,只能接上行信号,也就是说功分器不能作大功率合路器使用。所以在尝试中无法使其长时间工作,容易损坏。 3 、耦合器。(为腔体耦合器)
腔体耦合器是一种具有定向传输特性的四端口器件,接入器件的信号按器件标称的耦合度进行能量分配。功率容限是指器件输入口所能承载的功率(即下行信号),耦合口不宜接大功率信号。方向性指标反映器件反向输入信号(上行信号)主耦合口隔离度。由于其无法对功率进行均匀分配,所以无法满足处理 7607 功率不平衡的要求。在告警处理尝试中无法消除该告警。 4 、电桥。
电桥的原理是将输入的两路信号进行混频,再等分的从两个输出口输出,这恰恰满足了我们希望消除两个接口差值的需求。其次,电桥的功率通过门限为 200W ,这也能满足基站设备下行的要求。最终我们采用了室分设备中经常使用的电桥。我们对以上处理方法仍处理不掉产生告警的小区,在基站设备与 8/7 馈线之间增加一个电桥,方法简单易行,的达到了既不影响基站性能又消除 7607 告警的目的。 案例:电桥在市区张井基站的应用
市区张井基站 4 扇区部分载频频繁出 7607 ( RSSI detected Rx signal difference exceeding threshold ),尝试过各种方法都不能解决。
由下图可以看出,该扇区载频 9 、 11 RSSI 值均超过标准门限值 10 ,高达 13 、 18 。 基站伴随告警,载频显示红灯
经过厂家电桥耦合后,基站告警完全消除,载频RSSI 值恢复到正常范围。 实施效果:
7607 告警处理手册的使用,特别是电桥的使用使得维护人员找到了一条较为完善的处理方法,一举攻克了 7607 告警处理难题,达到了理想的效果。经过近半个月在市区的尝试, 7607 告警从 5 月 1 日至 5 月 13 日的 658 条下降至目前的 326 条,告警数量大大下降。该手册在进一步完善后,将下发至各县市分公司并组织维护人员深入学习,届时将达到彻底消除该类告警的目的。