Самопроизвольная перезагрузка модулей

Всем доброго дня.

Столкнулся со следующей проблемой:

Есть узел, на котором стоят три моста: два на SM еРМР1000 Connectorized и один на SM Integrated. Все они подклчены к одному ИБП Ippon 2000 ВА. Сегодня заметил, что ePMP Connectorized сегодня перезагрузились в один и тот же момент, а мост Integrated продолжил работать в штатном режиме. Устройства других вендоров на этом узле также продолжили работать без перезагрузки. Также наблюдал похожую ситуацию с SM ePMP1000 Connectorized на других наших узлах с ИБП МАП Энергия. Кто-нибудь сталкивался с такой проблемой и удалось ли ее поправить?

какая температура за бортом???? мы сталкивались при -24. потом потеплело и нет больше такого

Температура плюс 5.

Аналогичная ситуация наблюдается и на секторах еРМР1000 на разных базовых станциях.

Также наблюдаю самопроизвольную перезагрузку еРМР1000 Integrated 5. как нибудь решили проблему?

Такая же ерунда происходит на одном из мостов на Integrated Radio

Вы бы хотя бы верисю софта указали, и логи.

Камбиум признал, что в версиях прошивки начиная 2.5 есть проблема ребута девайса с разной периодичностью. Было также  сказано, что эта проблема НЕ связана с температурой. Обещают в 2.5.3 ( скоро будет бета)  ее решить.

С нетерпением ждали новой версии, вера прошились на v2.6-RC13 ситуация не исправилась, как были ребуты так и остались. На картинке кусок статистики, время работы БС после обновления около 11ти часов.

Абонентские модули уходят в reboot после достижения определённого процента Retransmission Packets но откуда он берётся при идеальных условиях приёма - загадка.

Прошил прошивой 2.5.3 "ребутные девайсы "  но теперь другой гемор стали постояные дисконекты от базы причем от  20 проявлются вот логи :  Видимость прямая  повторяю дисконекты начинаются от -20 до -20 все ок :

00:00:23 ePMP1000-razvaldom kernel: ath_hal: 0.9.17.1 (AR9380, DEBUG, WRITE_EEPROM, 11D)
00:00:23 ePMP1000-razvaldom kernel: ath_dfs: Version 2.0.0
00:00:23 ePMP1000-razvaldom kernel: Copyright (c) 2005-2006 Atheros Communications, Inc. All Rights Reserved
00:00:23 ePMP1000-razvaldom kernel: ath_spectral: Version 2.0.0
00:00:23 ePMP1000-razvaldom kernel: Copyright (c) 2005-2009 Atheros Communications, Inc. All Rights Reserved
00:00:23 ePMP1000-razvaldom kernel: SPECTRAL module built on Dec 18 2015 22:49:20
00:00:23 ePMP1000-razvaldom kernel: device eth0 entered promiscuous mode
00:00:23 ePMP1000-razvaldom kernel: ath_dev: Copyright (c) 2001-2007 Atheros Communications, Inc, All Rights Reserved
00:00:23 ePMP1000-razvaldom kernel: br-lan: port 1(eth0) entering forwarding state
00:00:23 ePMP1000-razvaldom kernel: ath_ahb: 9.2.0_U10.5.13 (Atheros/multi-bss)
00:00:23 ePMP1000-razvaldom kernel: AH_CAL_IN_FLASH_AHB defined
00:00:23 ePMP1000-razvaldom kernel: __ath_attach: Set global_scn[0]
00:00:23 ePMP1000-razvaldom kernel: TxBuf flow control is disabled
00:00:23 ePMP1000-razvaldom kernel: hal_conf_parm.calInFlash 1
00:00:23 ePMP1000-razvaldom kernel: Bootstrap clock 40MHz
00:00:23 ePMP1000-razvaldom kernel: Wasp Enterprise mode: 0x00000000
00:00:23 ePMP1000-razvaldom kernel: ar9300RadioAttach: Need analog access recipe!!
00:00:23 ePMP1000-razvaldom kernel: Restoring Cal data from Flash
00:00:23 ePMP1000-razvaldom kernel: Restoring Cal data from Second Radio in Flash
00:00:23 ePMP1000-razvaldom kernel: Allow 5.9 channels: cal peer[7]=5950
00:00:23 ePMP1000-razvaldom kernel: ath_get_caps[5885] rx chainmask mismatch actual 3 sc_chainmak 0
00:00:23 ePMP1000-razvaldom kernel: ath_get_caps[5860] tx chainmask mismatch actual 3 sc_chainmak 0
00:00:23 ePMP1000-razvaldom kernel: tdd_classifier_init: ic=81fc02c0 classifier=81fd7378
00:00:23 ePMP1000-razvaldom kernel: ath_descdma_setup: tx DMA: 1024 buffers 1 desc/buf 128 desc_len
00:00:23 ePMP1000-razvaldom kernel: ath_descdma_setup: tx DMA map: 815c0000 (135168) -> 15c0000 (135168)
00:00:23 ePMP1000-razvaldom kernel: ath_descdma_setup: success, name = tx, nbuf = 1024
00:00:23 ePMP1000-razvaldom kernel: ath_descdma_setup: beacon DMA: 8 buffers 1 desc/buf 128 desc_len
00:00:23 ePMP1000-razvaldom kernel: ath_descdma_setup: beacon DMA map: a1ffa000 (4096) -> 1ffa000 (4096)
00:00:23 ePMP1000-razvaldom kernel: ath_descdma_setup: success, name = beacon, nbuf = 8
00:00:23 ePMP1000-razvaldom kernel: wifi0: Atheros 9340: mem=0xb8100000, irq=2
00:00:23 ePMP1000-razvaldom kernel: TXFCTL enabled in Mac:1
00:00:23 ePMP1000-razvaldom kernel: camb_debug_print_setup: type=63, counter=3
00:00:23 ePMP1000-razvaldom kernel: wlan_vap_create : enter. devhandle=0x81fc02c0, opmode=IEEE80211_M_STA, flags=0x1
00:00:23 ePMP1000-razvaldom kernel: latency control is ON, latency value is 150000000
00:00:23 ePMP1000-razvaldom kernel: wlan_vap_create : exit. devhandle=0x81fc02c0, opmode=IEEE80211_M_STA, flags=0x1.
00:00:23 ePMP1000-razvaldom kernel: 50, 30, 20
00:00:23 ePMP1000-razvaldom kernel: device ath0 entered promiscuous mode
00:00:23 ePMP1000-razvaldom kernel: br-lan: port 2(ath0) entering forwarding state
00:00:23 ePMP1000-razvaldom kernel: ieee80211_ioctl_getparam : parameter drv:tdd 0x284 not supported
00:00:25 ePMP1000-razvaldom dropbear[2295]: Running in background
00:00:28 ePMP1000-razvaldom kernel: TPC set initial Tx-Power to 19dbm
00:00:29 ePMP1000-razvaldom kernel: CCA receive level from HW, strong 10, weak 2
00:00:29 ePMP1000-razvaldom kernel: Flags 0, Scheduler Mode 0
00:00:29 ePMP1000-razvaldom kernel: SM associated with AP[00:04:56:cb:dc:a4]
00:00:29 ePMP1000-razvaldom kernel: connection is UP
00:00:30 ePMP1000-razvaldom snmpd[2109]: DFS status: N/A
00:00:32 ePMP1000-razvaldom kernel: enet1 port4 down
00:00:32 ePMP1000-razvaldom kernel: ATHR_GMAC:unit 1: phy 4 not up carrier 1
00:00:32 ePMP1000-razvaldom kernel: br-lan: port 1(eth0) entering disabled state
00:00:34 ePMP1000-razvaldom ifup: Enabling Router Solicitations on lan (br-lan)
00:00:34 ePMP1000-razvaldom firewall: removing lan (br-lan) from zone lan
00:00:35 ePMP1000-razvaldom firewall: adding lan (br-lan) to zone lan
00:00:36 ePMP1000-razvaldom kernel: Adding WDS entry for 00:04:56:ca:aa:5a, through ni=00:04:56:cb:dc:a4
00:00:46 ePMP1000-razvaldom kernel: enet1 port4 up 100Mbps Full duplex
00:00:46 ePMP1000-razvaldom kernel: ATHR_GMAC: Enet Unit:1 PHY:4 is UP RGMii 1000Mbps full duplex
00:00:46 ePMP1000-razvaldom kernel: ATHR_GMAC: done cfg2 0x7215 ifctl 0x0 miictrl
00:00:46 ePMP1000-razvaldom kernel: WASP ----> S27 PHY MDIO
00:00:46 ePMP1000-razvaldom kernel: Setting Drop CRC Errors, Pause Frames and Length Error frames
00:00:46 ePMP1000-razvaldom kernel: br-lan: port 1(eth0) entering forwarding state
00:00:51 ePMP1000-razvaldom kernel: enet1 port4 down
00:00:51 ePMP1000-razvaldom kernel: ATHR_GMAC:unit 1: phy 4 not up carrier 1
00:00:51 ePMP1000-razvaldom kernel: br-lan: port 1(eth0) entering disabled state
00:00:53 ePMP1000-razvaldom kernel: enet1 port4 up 100Mbps Full duplex
00:00:53 ePMP1000-razvaldom kernel: ATHR_GMAC: Enet Unit:1 PHY:4 is UP RGMii 1000Mbps full duplex
00:00:53 ePMP1000-razvaldom kernel: ATHR_GMAC: done cfg2 0x7215 ifctl 0x0 miictrl
00:00:53 ePMP1000-razvaldom kernel: WASP ----> S27 PHY MDIO
00:00:53 ePMP1000-razvaldom kernel: Setting Drop CRC Errors, Pause Frames and Length Error frames
00:00:53 ePMP1000-razvaldom kernel: br-lan: port 1(eth0) entering forwarding state
00:00:53 ePMP1000-razvaldom kernel: Adding WDS entry for 90:8d:78:c4:6c:6d, through ni=00:04:56:cb:dc:a4
00:44:59 ePMP1000-razvaldom kernel: Adding WDS entry for 90:8d:78:c4:6c:6d, through ni=00:04:56:cb:dc:a4
00:54:59 ePMP1000-razvaldom admin[4.10.99.253]: web_interface: User 'admin' is logged in...
00:55:41 ePMP1000-razvaldom admin[4.10.99.253]: set_param: {\"device_props\":{\"snmpTrapEnable\":\"1\"},\"template_props\":{\"config_id\":\"8\"}}
00:58:05 ePMP1000-razvaldom kernel:
00:58:05 ePMP1000-razvaldom kernel: mlme_sta_swgpfmiss_high_caa_timer_handler: GPFs miss, probably, because of high CCA threshold level. Restore default CCA level.
00:58:05 ePMP1000-razvaldom kernel: SM disassociated from AP[00:04:56:cb:dc:a4] F=5290 11naht20. Reason: 33 (GPFs MISS)
00:58:05 ePMP1000-razvaldom kernel: br-lan: port 2(ath0) entering disabled state
00:58:26 ePMP1000-razvaldom kernel: TPC set initial Tx-Power to 27dbm
00:58:48 ePMP1000-razvaldom kernel: CCA receive level from HW, strong 10, weak 2
00:58:48 ePMP1000-razvaldom kernel: SM associated with AP[00:04:56:cb:dc:a4]
00:58:49 ePMP1000-razvaldom kernel: connection is UP
00:58:49 ePMP1000-razvaldom kernel: br-lan: port 2(ath0) entering forwarding state
00:58:52 ePMP1000-razvaldom ifup: Enabling Router Solicitations on lan (br-lan)
00:58:53 ePMP1000-razvaldom firewall: removing lan (br-lan) from zone lan
00:58:54 ePMP1000-razvaldom firewall: adding lan (br-lan) to zone lan

В логе есть такая строчка:

00:58:05 ePMP1000-razvaldom kernel: mlme_sta_swgpfmiss_high_caa_timer_handler: GPFs miss, probably, because of high CCA threshold level. Restore default CCA level.

Это значит что радиочип восстанавливает калибрацию приёмника значениями по умолчанию.

Как версия после прогрева цепей калибрация уплывает, в итоге уровни CCA уходят на столько что устройство не в состянии принимать пакеты, в результате становится глухим.Со всеми вытекающими.

Возможно ребуты это способ проинициализировать приёмник заново, так как другими способами провести калибрацию не получается, но еще один момент это сложность узнать когда именно устройство оглохло, ведь программно этого не узнать.

Но это предположение, правды никто никогда не узнает.

Терпите.....

Кто испытывает проблемы с перезагрузками устройств, напишите мне на почту dmitry.moiseev@cambiumnetworks.com 

Внимание, вопрос:

- Почему прошивка 2.6.1-RC1-DDR-EPTP ещё не получила хотя-бы статус BETA? 42 часа ни единого разрыва, на сети... В общем всячески рекомендую всем срочно обновиться.