Watchdog Alarm 'rfd restarted'

Einrichtung, Nutzung und Hilfe zu RaspberryMatic (OCCU auf Raspberry Pi)

Moderatoren: jmaus, Co-Administratoren

Matthias K.
Beiträge: 1165
Registriert: 14.02.2016, 12:32
System: Alternative CCU (auf Basis OCCU)
Wohnort: Heidenheim
Hat sich bedankt: 57 Mal
Danksagung erhalten: 225 Mal

Watchdog Alarm 'rfd restarted'

Beitrag von Matthias K. » 21.04.2019, 11:33

Hallo Gemeinde und frohe Ostern!

Mit der aktuellen RaspberryMatic (3.45.5.20190330) und dem darin erstmal implementierten Monit habe ich das Problem, dass in unregelmäßigen Abständen (alle paar Tage) Monit beim RFD zuschlägt.
Syslog:

Code: Alles auswählen

Apr 21 10:51:06 192.168.1.220 local0:de.eq3.cbcs.lib.remotecommadapter.device.service.AccessPointWatchdog INFO  [vert.x-eventloop-thread-1] SYSTEM: Access Point Watchdog running periodic connection check... 
Apr 21 10:52:04 192.168.1.220 root: check_mk_agent - connection accepted from 192.168.1.4:56404
Apr 21 10:52:06 192.168.1.220 kernel: [1438395.528466] eq3loop: eq3loop_close_slave() mmd_bidcos
Apr 21 10:52:27 192.168.1.220 monit[2707]: 'rfd' process is not running
Apr 21 10:52:27 192.168.1.220 monit[2707]: 'rfd' trying to restart
Apr 21 10:52:27 192.168.1.220 monit[2707]: 'rfd' restart: '/etc/init.d/S61rfd restart'
Apr 21 10:52:27 192.168.1.220 kernel: [1438416.122043] eq3loop: eq3loop_open_slave() mmd_bidcos
Apr 21 10:52:41 192.168.1.220 monit[2707]: 'rfd' service restarted 1 times within 1 cycles(s) - exec
Apr 21 10:52:41 192.168.1.220 monit[2707]: 'rfd' exec: '/bin/triggerAlarm.tcl rfd restarted WatchDog-Alarm'
Apr 21 10:52:41 192.168.1.220 monit[2707]: 'rfd' process is running with pid 8569
Apr 21 10:52:41 192.168.1.220 monit[2707]: 'rfd' process is running after previous restart timeout (manually recovered?)
Apr 21 10:53:04 192.168.1.220 root: check_mk_agent - connection accepted from 192.168.1.4:56544
Apr 21 10:54:04 192.168.1.220 root: check_mk_agent - connection accepted from 192.168.1.4:56680
Wo kann ich da ansetzen zur Fehlersuche?
Das System lief bis zu dieser Firmware eigentlich recht unauffällig, alle bisherigen Probleme konnte ich auf eigene Fehler (meist in Skripten) zurückführen und dementsprechend beheben.

Benutzeravatar
jmaus
Beiträge: 9818
Registriert: 17.02.2015, 14:45
System: Alternative CCU (auf Basis OCCU)
Wohnort: Dresden
Hat sich bedankt: 459 Mal
Danksagung erhalten: 1855 Mal
Kontaktdaten:

Re: Watchdog Alarm 'rfd restarted'

Beitrag von jmaus » 21.04.2019, 12:28

Ich würde sagen das umgedreht ein schuh draus wird. D.h. Der Monit deckt nun einfach ein problem auf das einfach bis ketzt noch nicht aufgefallen ist. Aus irgendeinem Grund stürzt bei dir der 'rfd' Dienst ab und Monit startet diesen dann eben automatisch neu um das Problem zu kompensieren. Warum das passiert müsste man nun einmal genauer analysieren indem man z.b.den loglevel des rfd hochstellt und versucht rauszubekommen welche aktion dazu führt das der rfd dienst abschmiert...
RaspberryMatic 3.75.6.20240316 @ ProxmoxVE – ~200 Hm-RF/HmIP-RF/HmIPW Geräte + ioBroker + HomeAssistant – GitHub / Sponsors / PayPal / ☕️

Matthias K.
Beiträge: 1165
Registriert: 14.02.2016, 12:32
System: Alternative CCU (auf Basis OCCU)
Wohnort: Heidenheim
Hat sich bedankt: 57 Mal
Danksagung erhalten: 225 Mal

Re: Watchdog Alarm 'rfd restarted'

Beitrag von Matthias K. » 21.04.2019, 17:21

Danke für die Rückmeldung.

Und wie stelle ich den Log Level des RFD hoch? Bzw. was macht der RFD genau?
Bisher dachte ich, dass der für die (Funk-)Kommunikation zu den einzelnen Geräten zuständig ist. D.h. wäre das Problem vorher schon dagewesen hätte ich das doch nach kurzer Zeit merken müssen!? Meine RM lief aber bisher wochenlang problemlos durch.

Oder bringe ich da was durcheinander?

alchy
Beiträge: 10752
Registriert: 24.02.2011, 01:34
System: CCU
Hat sich bedankt: 65 Mal
Danksagung erhalten: 672 Mal

Re: Watchdog Alarm 'rfd restarted'

Beitrag von alchy » 21.04.2019, 17:46

scorpionking hat geschrieben:
21.04.2019, 17:21
hätte ich das doch nach kurzer Zeit merken müssen!? Meine RM lief aber bisher wochenlang problemlos durch.
Oder bringe ich da was durcheinander?
Nein machst du nicht.
Wenn vorher Bidcos RF ebenfalls abgestürzt wäre, würde das weiße Popup "Eine Komponente.:" auftauchen und die CCU würde nicht mehr mit den RF Geräten kommunizieren und vieles mehr.

Alchy

Blacklist................... almost full
Ignoranz ist die Summe aller Maßnahmen die man ergreift, um bestehende Tatsachen nicht sehen zu müssen.

© Sandra Pulsfort (*1974)

Lies bitte die Logik von WebUI Programmen und die Tipps und Tricks für Anfänger.

Wichtig auch CUxD ersetzt System.exec. Die HM Script Doku (Downloadart Skripte) hilft auch weiter.
Zum Testen von Scripten den >> HomeMatic Script Executor << von Anli benutzen.

Matthias K.
Beiträge: 1165
Registriert: 14.02.2016, 12:32
System: Alternative CCU (auf Basis OCCU)
Wohnort: Heidenheim
Hat sich bedankt: 57 Mal
Danksagung erhalten: 225 Mal

Re: Watchdog Alarm 'rfd restarted'

Beitrag von Matthias K. » 21.04.2019, 18:08

Hallo Alchy,

danke für deine Antwort. Eine derartige Meldung hatte ich zuletzt vor gefühlten Ewigkeiten (kann mich nur erinnern an die Anfänge von HmIP, dass ich das mal hatte, ist aber mind. 2-3 Jahre her, eher länger).
Dann kann ich das Problem also bisher nicht gehabt haben. Bleiben die Fragen:
Hat Monit Recht?
Wenn ja, wie finde ich raus, was das verursacht? Fehlerprotokoll für HM Funk auf alles loggen?
Setze einen Syslog-Server ein (rotate 21, daily), kann also im Zweifel auch recht große Logs nachträglich noch analysieren.

scorpionking

alchy
Beiträge: 10752
Registriert: 24.02.2011, 01:34
System: CCU
Hat sich bedankt: 65 Mal
Danksagung erhalten: 672 Mal

Re: Watchdog Alarm 'rfd restarted'

Beitrag von alchy » 21.04.2019, 18:31

Natürlich bemerkt man die Meldung auch nur, wenn man die Klickibunti geöffnet hat.
Was du aber bestimmt bemerkt hättest, wenn die RF Geräte nicht mehr am Funktionieren gewesen wären. :wink:
Denn wenn du nicht selber Hand angelegt hattest, wäre ein einmal abgestürzter Service eben auch dauerhaft abgestürzt. Jetzt wird er wohl automatisch restartet bei der RaspberryMatic.
scorpionking hat geschrieben:
21.04.2019, 18:08
Hat Monit Recht?

Keine Ahnung, ich setze keine RaspberryMatic ein.
Aber es wird schon so gewesen sein das der RF weg war. Jedoch ist auch nicht die richtige Frage, sondern was bringt den RF bei dir regelmäßig dazu seine Arbeit einzustellen, wo er doch vorher Jahre bei dir problemlos lief. Ursache und Wirkung :!:
Sich drüber zu freuen, das die Dienste automatisch restarten wäre mir zu flach.

Alchy

Blacklist................... almost full
Ignoranz ist die Summe aller Maßnahmen die man ergreift, um bestehende Tatsachen nicht sehen zu müssen.

© Sandra Pulsfort (*1974)

Lies bitte die Logik von WebUI Programmen und die Tipps und Tricks für Anfänger.

Wichtig auch CUxD ersetzt System.exec. Die HM Script Doku (Downloadart Skripte) hilft auch weiter.
Zum Testen von Scripten den >> HomeMatic Script Executor << von Anli benutzen.

Matthias K.
Beiträge: 1165
Registriert: 14.02.2016, 12:32
System: Alternative CCU (auf Basis OCCU)
Wohnort: Heidenheim
Hat sich bedankt: 57 Mal
Danksagung erhalten: 225 Mal

Re: Watchdog Alarm 'rfd restarted'

Beitrag von Matthias K. » 21.04.2019, 18:49

alchy hat geschrieben:
21.04.2019, 18:31
Aber es wird schon so gewesen sein das der RF weg war. Jedoch ist auch nicht die richtige Frage, sondern was bringt den RF bei dir regelmäßig dazu seine Arbeit einzustellen, wo er doch vorher Jahre bei dir problemlos lief. Ursache und Wirkung :!:
Sich drüber zu freuen, das die Dienste automatisch restarten wäre mir zu flach.
Mir auch, deshalb will ich ja wissen, wie ich weitere Infos finde... :wink:
Übrigens nicht regelmäßig, sondern unregelmäßig. Seit die FW 3.45.5.20190330 drauf ist waren es insgesamt 3 Mal.

Ich fühle mich übrigens auch durchaus auf der Linux Shell wohl, also immer her mit den Tipps... :D

Benutzeravatar
jmaus
Beiträge: 9818
Registriert: 17.02.2015, 14:45
System: Alternative CCU (auf Basis OCCU)
Wohnort: Dresden
Hat sich bedankt: 459 Mal
Danksagung erhalten: 1855 Mal
Kontaktdaten:

Re: Watchdog Alarm 'rfd restarted'

Beitrag von jmaus » 21.04.2019, 19:11

Du könntest einfach mit dem Befehl

Code: Alles auswählen

monit unmonitor rfd
Das monitoring des rfd deaktivieren und dann mal abwarten was passiert. Wenn er dann abschmiert weisst du zumindest das monit recht hatte. Dann weisst du zwar immer noch nicht warum, aber dann wäre man zumindest ein schritt weiter.

Ich vermute aktuell aber auch das monit recht hat weil man in deinem logfileauszug sieht das vor der monit meldung das eq3loop device meldet das die Verbindung zum rfd geschlossen wurde, was wiederum auf den absturz des rfd schliessen lässt.
RaspberryMatic 3.75.6.20240316 @ ProxmoxVE – ~200 Hm-RF/HmIP-RF/HmIPW Geräte + ioBroker + HomeAssistant – GitHub / Sponsors / PayPal / ☕️

Matthias K.
Beiträge: 1165
Registriert: 14.02.2016, 12:32
System: Alternative CCU (auf Basis OCCU)
Wohnort: Heidenheim
Hat sich bedankt: 57 Mal
Danksagung erhalten: 225 Mal

Re: Watchdog Alarm 'rfd restarted'

Beitrag von Matthias K. » 21.04.2019, 19:45

jmaus hat geschrieben:
21.04.2019, 19:11
Das monitoring des rfd deaktivieren und dann mal abwarten was passiert. Wenn er dann abschmiert weisst du zumindest das monit recht hatte. Dann weisst du zwar immer noch nicht warum, aber dann wäre man zumindest ein schritt weiter
Hab ich jetzt mal gemacht. Mal schauen...
Kann man den Monit nicht auch anweisen, den Absturz nur zu protokollieren anstatt den Dienst neuzustarten? Dann würde ich es ggf. etwas schneller merken...
jmaus hat geschrieben:
21.04.2019, 19:11
Ich vermute aktuell aber auch das monit recht hat weil man in deinem logfileauszug sieht das vor der monit meldung das eq3loop device meldet das die Verbindung zum rfd geschlossen wurde, was wiederum auf den absturz des rfd schliessen lässt.
Womit wir wieder bei der Frage sind: Welches Log Level muss ich hochsetzen, damit ich hier mehr Output bekomme und den Fehler hoffentlich finde?

Dadurch dass das nicht regelmäßig passiert, möchte ich für's nächste Mal so gut wie möglich gewappnet sein...

NickHM
Beiträge: 3729
Registriert: 23.09.2017, 12:04
Hat sich bedankt: 65 Mal
Danksagung erhalten: 119 Mal

Re: Watchdog Alarm 'rfd restarted'

Beitrag von NickHM » 22.04.2019, 07:17

"Homematic Funk"
Screenshot 2019-04-22 07.16.32.png

Antworten

Zurück zu „RaspberryMatic“