lugamodder
(lugamodder)
August 29, 2015, 12:09pm
1
Наблюдаю в логе AP EPMP100 GPS такую вещь довольно долгое время:
Aug 27 21:56:01 BS-Yugovostok snmpd: Watchdog:Abnormal SNMPd stop occured, restarting... Aug 27 22:06:01 BS-Yugovostok snmpd: Watchdog:Abnormal SNMPd stop occured, restarting... Aug 27 22:21:01 BS-Yugovostok snmpd: Watchdog:Abnormal SNMPd stop occured, restarting... Aug 27 22:36:01 BS-Yugovostok snmpd: Watchdog:Abnormal SNMPd stop occured, restarting... Aug 27 22:46:01 BS-Yugovostok snmpd: Watchdog:Abnormal SNMPd stop occured, restarting... Aug 27 23:01:01 BS-Yugovostok snmpd: Watchdog:Abnormal SNMPd stop occured, restarting... Aug 27 23:16:01 BS-Yugovostok snmpd: Watchdog:Abnormal SNMPd stop occured, restarting... Aug 27 23:21:01 BS-Yugovostok snmpd: Watchdog:Abnormal SNMPd stop occured, restarting... Aug 28 08:16:01 BS-Yugovostok snmpd: Watchdog:Abnormal SNMPd stop occured, restarting... Aug 28 08:21:01 BS-Yugovostok snmpd: Watchdog:Abnormal SNMPd stop occured, restarting... Aug 28 08:41:01 BS-Yugovostok snmpd: Watchdog:Abnormal SNMPd stop occured, restarting... Aug 28 08:46:01 BS-Yugovostok snmpd: Watchdog:Abnormal SNMPd stop occured, restarting... Aug 28 08:56:01 BS-Yugovostok snmpd: Watchdog:Abnormal SNMPd stop occured, restarting... Aug 28 09:01:01 BS-Yugovostok snmpd: Watchdog:Abnormal SNMPd stop occured, restarting... Aug 28 09:16:01 BS-Yugovostok snmpd: Watchdog:Abnormal SNMPd stop occured, restarting...
Прошивка 2.4.3. База в режиме Flexible. Рядом стоит такой же сектор БС, точно так же настроенный, но на другой частоте - такой проблемы нет.
Статистику снимаем Zabbix, проблем в снятии статистики не наблюдается. Массовые запросы выключены.
Почему может падать SNMPd?
Добрый день!
Падать может или из-за какого-то хитрого запроса или если память кончается. Хотелось бы конечно как-то отловить. Если есть возможность, то попробуйте 2.5 прошивку, вдруг мы это уже исправили.
lugamodder
(lugamodder)
September 4, 2015, 8:00am
3
На 2.5 пока не падает. Запросов хитрых тоже не каких, рядом такой же сектор с теми же запросами так себя не вел. А вот насчет памяти - как её утилизацию наблюдать? уже в другой теме тут вопрос задавал.
lugamodder
(lugamodder)
September 7, 2015, 10:13am
4
И снова. Но уже на другой базе.
Sep 7 12:39:24 BS--Severovostok kernel: SM[00:04:56:cc:71:b6] aid=8 disassociated. Reason: COMMUNICATION LOST Sep 7 12:40:46 BS--Severovostok kernel: SM[00:04:56:cc:71:b6] aid=8 disassociated. Reason: COMMUNICATION LOST Sep 7 12:41:35 BS--Severovostok kernel: SM[00:04:56:cc:71:b6] aid=8 disassociated. Reason: COMMUNICATION LOST Sep 7 12:42:36 BS--Severovostok kernel: SM[00:04:56:cc:71:b6] aid=8 disassociated. Reason: COMMUNICATION LOST Sep 7 12:43:50 BS--Severovostok kernel: SM[00:04:56:cc:71:b6] aid=8 disassociated. Reason: COMMUNICATION LOST Sep 7 12:44:47 BS--Severovostok kernel: SM[00:04:56:cc:71:b6] aid=8 disassociated. Reason: COMMUNICATION LOST Sep 7 12:45:04 BS--Severovostok kernel: SM[00:04:56:cc:71:b6] aid=8 disassociated. Reason: COMMUNICATION LOST Sep 7 12:45:37 BS--Severovostok kernel: SM[00:04:56:cc:71:b6] aid=8 disassociated. Reason: COMMUNICATION LOST Sep 7 12:47:06 BS--Severovostok kernel: SM[00:04:56:cc:71:b6] aid=8 disassociated. Reason: COMMUNICATION LOST Sep 7 12:48:14 BS--Severovostok kernel: SM[00:04:56:cc:71:b6] aid=8 disassociated. Reason: COMMUNICATION LOST Sep 7 12:49:08 BS--Severovostok kernel: SM[00:04:56:cc:71:b6] aid=8 disassociated. Reason: COMMUNICATION LOST Sep 7 12:50:49 BS--Severovostok kernel: SM[00:04:56:cc:71:b6] aid=8 disassociated. Reason: COMMUNICATION LOST Sep 7 12:52:01 BS--Severovostok kernel: SM[00:04:56:cc:71:b6] aid=8 disassociated. Reason: COMMUNICATION LOST Sep 7 12:52:50 BS--Severovostok kernel: SM[00:04:56:cc:71:b6] aid=8 disassociated. Reason: COMMUNICATION LOST Sep 7 12:53:09 BS--Severovostok kernel: SM[00:04:56:cc:71:b6] aid=8 disassociated. Reason: COMMUNICATION LOST Sep 7 12:54:18 BS--Severovostok kernel: SM[00:04:56:cc:71:b6] aid=8 disassociated. Reason: COMMUNICATION LOST Sep 7 12:55:12 BS--Severovostok kernel: SM[00:04:56:cc:71:b6] aid=8 disassociated. Reason: COMMUNICATION LOST Sep 7 12:56:48 BS--Severovostok kernel: SM[00:04:56:cc:71:b6] aid=8 disassociated. Reason: COMMUNICATION LOST Sep 7 12:58:30 BS--Severovostok kernel: SM[00:04:56:cc:71:b6] aid=8 disassociated. Reason: COMMUNICATION LOST Sep 7 12:59:34 BS--Severovostok kernel: SM[00:04:56:cc:71:b6] aid=8 disassociated. Reason: COMMUNICATION LOST Sep 7 13:00:35 BS--Severovostok kernel: SM[00:04:56:cc:71:b6] aid=8 disassociated. Reason: COMMUNICATION LOST Sep 7 13:01:58 BS--Severovostok kernel: SM[00:04:56:cc:71:b6] aid=8 disassociated. Reason: COMMUNICATION LOST Sep 7 13:02:52 BS--Severovostok kernel: SM[00:04:56:cc:71:b6] aid=8 disassociated. Reason: COMMUNICATION LOST Sep 7 13:04:17 BS--Severovostok kernel: SM[00:04:56:cc:71:b6] aid=8 disassociated. Reason: COMMUNICATION LOST Sep 7 13:05:25 BS--Severovostok kernel: SM[00:04:56:cc:71:b6] aid=8 disassociated. Reason: COMMUNICATION LOST Sep 7 13:07:08 BS--Severovostok admin[xxx]: web_interface: User 'admin' is logged in... Sep 7 13:07:51 BS--Severovostok kernel: SM[00:04:56:cc:71:b6] aid=8 disassociated. Reason: COMMUNICATION LOST Sep 7 13:08:01 BS--Severovostok snmpd: Watchdog:Abnormal SNMPd stop occured, restarting... Sep 7 13:08:04 BS--Severovostok snmpd[26430]: DFS status: N/A Sep 7 13:08:36 BS--Severovostok kernel: SM[00:04:56:cc:71:b6] aid=8 disassociated. Reason: COMMUNICATION LOST Sep 7 13:09:24 BS--Severovostok dropbear[28037]: Password auth succeeded for 'admin' from xxx:50738 Sep 7 13:09:27 BS--Severovostok kernel: SM[00:04:56:cc:71:b6] aid=8 disassociated. Reason: COMMUNICATION LOST
Теперь клиенты не коннектятся, доступ к БС есть, отображение параметров в веб жутко тормозит.
База 12 часов была отключена от аплинка изза аварии.
Fedor
(Fedor)
September 7, 2015, 11:49am
5
Добрый день.
Судя по предоставленному логу, не конектится один клиент.
COMMUNICATION LOST свидетельствует о том что теряются менеджмент пакеты.
Это может происходить по разным причинам.
В первую очередь такое возможно по причине высокой зашумленности.
Попробуйте перегрузить Базовую станцию и клиента.
Если у Вас есть возможность поделится доступом - мы поможем разобраться в проблеме.
Спасибо.
lugamodder
(lugamodder)
September 7, 2015, 12:39pm
6
Причина COMMUNICATION LOST понятна, был клиент с очень низким уровнем.
Непонятна проблема с SNMPd и фризами Web.
После перезагрузки падений SNMPd не наблюдается. Может быть есть утечка памяти?
Crazy_Max
(Crazy Max)
September 7, 2015, 5:41pm
7
Да точно есть утечка, причём радикальная, и видимо процесс snmpd когда не может послать трапы начинает их складывать в память, а потом крашится... У меня клиент в качестве базовой станции используется, так в нём при подключенных клиентах нельзя было прошивку поменть - памяти нехватало...
lugamodder
(lugamodder)
September 7, 2015, 6:30pm
8
У меня трапы не используются, отключены. Возможно утечку вызвают реконнекты клиентов, если бы был инструмент мониторинга утилизации памяти можно было бы протестировать.
lugamodder
(lugamodder)
October 20, 2015, 4:28am
9
на 2.5.1 проблема всё еще не решена.
Вы можете дать удаленый доступ по SSH?
lugamodder
(lugamodder)
October 20, 2015, 8:04am
11
Вышло недопонимание. Логи сняли - отдали разработчикам. Решаем проблему.
lugamodder
(lugamodder)
October 31, 2015, 8:53am
13
А если не секрет, когда планируется выход новой версии софта под EPMP1000 или появление бета-версии в открытом доступе?
Корректирующий релиз должен выйти на следующей неделе, в середине ноября должна появиться паблик бета версии с новым функционалом.