CCU2 hängt regelmäßig nach 45 Tagen Uptime

Einrichtung, Anschluss und Programmierung der HomeMatic CCU

Moderator: Co-Administratoren

Antworten
Odie
Beiträge: 5
Registriert: 06.12.2018, 18:35
Hat sich bedankt: 2 Mal

CCU2 hängt regelmäßig nach 45 Tagen Uptime

Beitrag von Odie » 06.02.2023, 18:29

Hallo, ich habe nichts dazu im Forum gefunden - kennt das jemand? Regelmäßig nach etwa 45 Tagen Uptime spinnt meine CCU2. Über die pocketControl App reagiert sie nicht mehr, schaltet auch keine Steckdosen und die Weboberfläche ist sehr langsam. Das hat sich über mehrere CCU- und CUxD-Versionen nicht geändert. Kann es sein daß da irgendwas in den 45 Tagen vollläuft? Speicher- oder Handle-Leak? Erinnert irgendwie an Windows 95, musste man das nicht auch deswegen alle soundsoviele Tage neu starten?

Kernel-Log (von CUxD abgerufen):

<6>[3933119.230000] [ 219] 0 219 826 19 0 0 0 udhcpd
<6>[3933119.240000] [ 271] 0 271 826 22 0 0 0 udhcpc
<6>[3933119.250000] [ 350] 0 350 484 21 0 0 0 ifplugd
<6>[3933119.260000] [ 376] 0 376 914 32 0 0 0 eq3configd
<6>[3933119.270000] [ 388] 0 388 958 42 0 0 0 ntpclient
<6>[3933119.270000] [ 395] 0 395 433 12 0 -13 -900 lighttpd-angel
<6>[3933119.280000] [ 397] 0 397 2032 696 0 -13 -900 lighttpd
<6>[3933119.290000] [ 404] 0 404 1434 93 0 -17 -1000 sshd
<6>[3933119.300000] [ 422] 0 422 883 40 0 0 0 cuxd
<6>[3933119.310000] [ 458] 0 458 1590 113 0 0 0 multimacd
<6>[3933119.310000] [ 482] 0 482 39271 36884 0 0 0 rfd
<6>[3933119.320000] [ 526] 0 526 41329 18954 0 0 0 java
<6>[3933119.330000] [ 617] 0 617 900 32 0 0 0 eq3-uds-service
<6>[3933119.340000] [ 624] 0 624 5458 2940 0 0 0 ReGaHss.normal
<6>[3933119.350000] [ 627] 0 627 971 55 0 0 0 hss_led
<6>[3933119.350000] [ 676] 0 676 1508 215 0 0 0 openvpn
<6>[3933119.360000] [ 680] 0 680 699 50 0 0 0 nginx
<6>[3933119.370000] [ 681] 0 681 699 50 0 0 0 nginx
<6>[3933119.380000] [ 689] 0 689 827 17 0 0 0 getty
<6>[3933119.390000] [10763] 0 10763 826 18 0 0 0 sh
<6>[3933119.390000] [10765] 0 10765 826 17 0 0 0 sh
<6>[3933119.400000] [10769] 0 10769 1394 130 0 0 0 wget
<3>[3933119.410000] Out of memory: Kill process 482 (rfd) score 549 or sacrifice child
<3>[3933119.420000] Killed process 482 (rfd) total-vm:157084kB, anon-rss:147368kB, file-rss:168kB
<6>[3933119.700000] eq3loop: eq3loop_close_slave() mmd_bidcos

Auszug aus dem SysLog (von CUxD abgerufen):

Feb 5 06:02:52 ccu2 user.warn kernel: [3933118.920000] [<c008770c>] (oom_kill_process+0x0/0x2d4) from [<c008803c>] (out_of_memory+0x1a8/0x218)
Feb 5 06:02:52 ccu2 user.warn kernel: [3933118.930000] [<c0087e94>] (out_of_memory+0x0/0x218) from [<c008b14c>] (__alloc_pages_nodemask+0x594/0x6f4)
Feb 5 06:02:52 ccu2 user.warn kernel: [3933118.940000] [<c008abb8>] (__alloc_pages_nodemask+0x0/0x6f4) from [<c00867cc>] (filemap_fault+0x258/0x430)
Feb 5 06:02:52 ccu2 user.warn kernel: [3933118.950000] [<c0086574>] (filemap_fault+0x0/0x430) from [<c009d43c>] (__do_fault+0xc4/0x4b8)
Feb 5 06:02:52 ccu2 user.warn kernel: [3933118.960000] [<c009d378>] (__do_fault+0x0/0x4b8) from [<c009fd84>] (handle_pte_fault+0x2ec/0xd34)
Feb 5 06:02:52 ccu2 user.warn kernel: [3933118.970000] [<c009fa98>] (handle_pte_fault+0x0/0xd34) from [<c00a0884>] (handle_mm_fault+0xb8/0xe8)
Feb 5 06:02:52 ccu2 user.warn kernel: [3933118.980000] [<c00a07cc>] (handle_mm_fault+0x0/0xe8) from [<c02fbca0>] (do_page_fault+0x184/0x3b8)
Feb 5 06:02:52 ccu2 user.warn kernel: [3933118.990000] [<c02fbb1c>] (do_page_fault+0x0/0x3b8) from [<c02fbef8>] (do_translation_fault+0x24/0xac)
Feb 5 06:02:52 ccu2 user.warn kernel: [3933119.000000] [<c02fbed4>] (do_translation_fault+0x0/0xac) from [<c00086d8>] (do_PrefetchAbort+0x3c/0xa0)
Feb 5 06:02:52 ccu2 user.warn kernel: [3933119.010000] r7:cf1c7fb0 r6:b68f0db8 r5:c0401a90 r4:00000005
Feb 5 06:02:52 ccu2 user.warn kernel: [3933119.010000] [<c000869c>] (do_PrefetchAbort+0x0/0xa0) from [<c02fa798>] (ret_from_exception+0x0/0x10)
Feb 5 06:02:52 ccu2 user.warn kernel: [3933119.020000] Exception stack(0xcf1c7fb0 to 0xcf1c7ff8)
Feb 5 06:02:52 ccu2 user.warn kernel: [3933119.030000] 7fa0: af9c8800 00000006 00000001 0000deab
Feb 5 06:02:52 ccu2 user.warn kernel: [3933119.030000] 7fc0: af9c8800 b6d49000 afbbe9c0 00000001 ffffffff af87f640 af9c8800 afbbe9bc
Feb 5 06:02:52 ccu2 user.warn kernel: [3933119.040000] 7fe0: 00000004 afbbe9a8 b6abdbf4 b68f0db8 60000010 ffffffff
Feb 5 06:02:52 ccu2 user.warn kernel: [3933119.050000] r7:00000001 r6:ffffffff r5:60000010 r4:b68f0db8
Feb 5 06:02:52 ccu2 user.warn kernel: [3933119.060000] Mem-info:
Feb 5 06:02:52 ccu2 user.warn kernel: [3933119.060000] Normal per-cpu:
Feb 5 06:02:52 ccu2 user.warn kernel: [3933119.060000] CPU 0: hi: 90, btch: 15 usd: 76
Feb 5 06:02:52 ccu2 user.warn kernel: [3933119.070000] active_anon:60688 inactive_anon:54 isolated_anon:0
Feb 5 06:02:52 ccu2 user.warn kernel: [3933119.070000] active_file:35 inactive_file:48 isolated_file:77
Feb 5 06:02:52 ccu2 user.warn kernel: [3933119.070000] unevictable:0 dirty:0 writeback:0 unstable:0
Feb 5 06:02:52 ccu2 user.warn kernel: [3933119.070000] free:502 slab_reclaimable:271 slab_unreclaimable:838
Feb 5 06:02:52 ccu2 user.warn kernel: [3933119.070000] mapped:149 shmem:379 pagetables:282 bounce:0
Feb 5 06:02:52 ccu2 user.warn kernel: [3933119.100000] Normal free:2008kB min:2036kB low:2544kB high:3052kB active_anon:242752kB inactive_anon:216kB active_file:140kB inactive_file:192kB unevictable:0kB isolated(anon):0kB isolated(file):308kB present:260096kB mlocked:0kB dirty:0kB writeback:0kB mapped:596kB shmem:1516kB slab_reclaimable:1084kB slab_unreclaimable:3352kB kernel_stack:1160kB pagetables:1128kB unstable:0kB bounce:0kB writeback_tmp:0kB pages_scanned:523 all_unreclaimable? yes

Im Syslog der CCU habe ich auch noch folgendes:

Feb 5 05:39:54 de.eq3.lib.measurement.MeasurementService ERROR [Timer-0] Could not retrieve unhandled events
java.util.ConcurrentModificationException
at java.util.ArrayList$Itr.checkForComodification(ArrayList.java:909)
at java.util.ArrayList$Itr.next(ArrayList.java:859)
at de.eq3.lib.measurement.MeasurementService.writeLogValues(MeasurementService.java:835)
at de.eq3.lib.measurement.MeasurementService.access$000(MeasurementService.java:50)
at de.eq3.lib.measurement.MeasurementService$EventTimerTask.run(MeasurementService.java:121)
at java.util.TimerThread.mainLoop(Timer.java:555)
at java.util.TimerThread.run(Timer.java:505)
Zuletzt geändert von Roland M. am 06.02.2023, 19:24, insgesamt 1-mal geändert.
Grund: Thema verschoben

Benutzeravatar
jmaus
Beiträge: 9819
Registriert: 17.02.2015, 14:45
System: Alternative CCU (auf Basis OCCU)
Wohnort: Dresden
Hat sich bedankt: 459 Mal
Danksagung erhalten: 1856 Mal
Kontaktdaten:

Re: CCU2 hängt regelmäßig nach 45 Tagen Uptime

Beitrag von jmaus » 06.02.2023, 18:40

Nun, in den Logfiles kann man sehr gut die Anmerkungen "oom_kill_process" und "out_of_memory" erkennen. Irgendetwas verbraucht also (vmtl. sukzessive) mehr und mehr memory bis es zum OOM (out-of-memory) kill des Linux Betriebssystems kommt und er damit notfallmäßig gewisse Prozesse hart beendet um überhaupt überleben zu können.

Du müsstest also erst einmal schauen was das so stück für stück mehr und mehr speicher verbraucht und vmtl. einfach nie freigibt. Entweder ein Addon oder irgendwelche Routinen oder hängende "system.Exec()" calls die nach und nach den gesamten Arbeitsspeicher wegfressen bis es eben gar nicht mehr geht.
RaspberryMatic 3.75.6.20240316 @ ProxmoxVE – ~200 Hm-RF/HmIP-RF/HmIPW Geräte + ioBroker + HomeAssistant – GitHub / Sponsors / PayPal / ☕️

Benutzeravatar
jmaus
Beiträge: 9819
Registriert: 17.02.2015, 14:45
System: Alternative CCU (auf Basis OCCU)
Wohnort: Dresden
Hat sich bedankt: 459 Mal
Danksagung erhalten: 1856 Mal
Kontaktdaten:

Re: CCU2 hängt regelmäßig nach 45 Tagen Uptime

Beitrag von jmaus » 06.02.2023, 18:47

Ich seh aber gerade folgendes in deinen Logs:

Code: Alles auswählen

<3>[3933119.410000] Out of memory: Kill process 482 (rfd) score 549 or sacrifice child
<3>[3933119.420000] Killed process 482 (rfd) total-vm:157084kB, anon-rss:147368kB, file-rss:168kB
Das liest sich für mich nach einem alten Bug im "rfd" Prozess der sukzessive mehr und mehr Speicher verbraucht (hier wohl mehr als 150MB bis der kill kam. Dies passiert vmtl. weil es dort ein Problem mit nicht ordentlich abgebauten XMLRPC Verbindungen gibt. Dieser Bug wurde in neueren rfd versionen die mit neueren CCU3 Firmwareversionen herausgekommen sind AFAIK beseitigt, aber eben nicht in den Versionen die es für die CCU2 gibt, da die CCU2 abgekündigt ist und daher end-of-life.

Also entweder upgradest du mal irgendwann auf die CCU3/RaspberryMatic, versuchst die vielen XMLRPC Aufrufe zu reduzieren oder du setzt in der Tat einen regelmäßigen automatischen Neustart um. Wie gesagt ist die CCU2 End-of-Life und daher solltest du keinerlei weitere Verbesserungen oder Bugfixes diesbzgl. mehr erwarten.
RaspberryMatic 3.75.6.20240316 @ ProxmoxVE – ~200 Hm-RF/HmIP-RF/HmIPW Geräte + ioBroker + HomeAssistant – GitHub / Sponsors / PayPal / ☕️

Odie
Beiträge: 5
Registriert: 06.12.2018, 18:35
Hat sich bedankt: 2 Mal

Re: CCU2 hängt regelmäßig nach 45 Tagen Uptime

Beitrag von Odie » 06.02.2023, 19:04

Oh wow danke für die schnelle Antwort! Ja diesen rfd hatte ich auch schon im Verdacht und hatte auch schon über einen regelmäßigen Neustart per Skript nachgedacht - der sollte die CUxD vorher halt auch definiert beenden.

Wie ist die CCU3 denn beim Stromverbrauch im Vergleich zur CCU2? Ich habe die CCU2 zusammen mit dem Router und dem Glasfasermodem an meiner USV hängen, damit die bei einem Stromausfall sich zumindest nochmal melden kann.

Die CCU3 gibt es ja auch schon eine Weile - kommt bald eine CCU4?

Benutzeravatar
Roland M.
Beiträge: 9738
Registriert: 08.12.2012, 15:53
System: CCU
Wohnort: Graz, Österreich
Hat sich bedankt: 251 Mal
Danksagung erhalten: 1357 Mal

Re: CCU2 hängt regelmäßig nach 45 Tagen Uptime

Beitrag von Roland M. » 06.02.2023, 19:36

Hallo!
Odie hat geschrieben:
06.02.2023, 19:04
Wie ist die CCU3 denn beim Stromverbrauch im Vergleich zur CCU2?
Die sind sehr vergleichbar.
Ich glaube mich erinnern zu können, die CCU3 im laufenden Betrieb mit ca. 3 W gemessen zu haben, die CCU2 habe ich nicht gemessen, deren Steckernetzteil hat aber eine maximale Leistung von auch nur 7,5 W.

Die CCU3 gibt es ja auch schon eine Weile - kommt bald eine CCU4?
Nein, sicher nicht.


Roland
Zur leichteren Hilfestellung bitte unbedingt beachten:
  • Bezeichnung (HM-... bzw. HmIP-...) der betroffenen Geräte angeben (nicht Artikelnummer)
  • Kurzbeschreibung des Soll-Zustandes (Was soll erreicht werden?)
  • Kurzbeschreibung des Ist-Zustandes (Was funktioniert nicht?)
  • Fehlermeldungen genau abschreiben, besser noch...
  • Screenshots von Programmen, Geräteeinstellungen und Fehlermeldungen (direkt als jpg/png) einstellen!

-----------------------------------------------------------------------
1. CCU2 mit ~100 Geräten (in Umstellung auf RaspberryMatic-OVA auf Proxmox-Server)
2. CCU2 per VPN mit ~50 Geräten (geplant: RaspberryMatic auf Charly)
3. CCU2 per VPN mit ~40 Geräten (geplant: RaspberryMatic auf CCU3)
CCU1, Test-CCU2, Raspi 1 mit kleinem Funkmodul, RaspberryMatic als VM unter Proxmox, Access Point,...

Benutzeravatar
robbi77
Beiträge: 13787
Registriert: 19.01.2011, 19:15
System: CCU
Wohnort: Landau
Hat sich bedankt: 181 Mal
Danksagung erhalten: 732 Mal

Re: CCU2 hängt regelmäßig nach 45 Tagen Uptime

Beitrag von robbi77 » 06.02.2023, 19:39

Ein RaspberryPi, mehr is da nich drin in der ccu3.
Es wird keine ccu4 geben. Gibts schon threads darüber …

Benutzeravatar
Baxxy
Beiträge: 10648
Registriert: 18.12.2018, 15:45
System: Alternative CCU (auf Basis OCCU)
Hat sich bedankt: 597 Mal
Danksagung erhalten: 2180 Mal

Re: CCU2 hängt regelmäßig nach 45 Tagen Uptime

Beitrag von Baxxy » 06.02.2023, 19:41

jmaus hat geschrieben:
06.02.2023, 18:47
Dies passiert vmtl. weil es dort ein Problem mit nicht ordentlich abgebauten XMLRPC Verbindungen gibt. Dieser Bug wurde in neueren rfd versionen die mit neueren CCU3 Firmwareversionen herausgekommen sind AFAIK beseitigt,
Wäre schön wenn du "AFAIK" mal konkretisierst und "zeigst" wo das passiert sein soll.
--> HIER <-- hatte ich ja kürzlich dargelegt das auch heutzutage (aktuelle RM) die INIT's teilweise nicht von alleine (nach Verbindungsabbruch) rausgeschmissen werden.

Odie
Beiträge: 5
Registriert: 06.12.2018, 18:35
Hat sich bedankt: 2 Mal

Re: CCU2 hängt regelmäßig nach 45 Tagen Uptime

Beitrag von Odie » 06.02.2023, 20:09

Hmm dann werd ich wohl mal RaspberryMatic ausprobieren. Einen Pi 3B habe ich hier und die HM-MOD-RPI-PCB habe ich auch schon lange ungeöffnet rumliegen - gibt es da eigentlich verschiedene Versionen? Mein Bausatz ist schon was älter...

Danke für die Infos!

Benutzeravatar
jmaus
Beiträge: 9819
Registriert: 17.02.2015, 14:45
System: Alternative CCU (auf Basis OCCU)
Wohnort: Dresden
Hat sich bedankt: 459 Mal
Danksagung erhalten: 1856 Mal
Kontaktdaten:

Re: CCU2 hängt regelmäßig nach 45 Tagen Uptime

Beitrag von jmaus » 06.02.2023, 20:54

Baxxy hat geschrieben:
06.02.2023, 19:41
jmaus hat geschrieben:
06.02.2023, 18:47
Dies passiert vmtl. weil es dort ein Problem mit nicht ordentlich abgebauten XMLRPC Verbindungen gibt. Dieser Bug wurde in neueren rfd versionen die mit neueren CCU3 Firmwareversionen herausgekommen sind AFAIK beseitigt,
Wäre schön wenn du "AFAIK" mal konkretisierst und "zeigst" wo das passiert sein soll.
Das Speicherproblem von dem ich hier gesprochen habe und das höchst wahrscheinlich der TE auf seiner CCU2 aktuell hat wurde in der 3.65.6 Firmware beseitigt und ist unter dem folgenden ChangeLog Eintrag vermerkt:

Code: Alles auswählen

[HMCCU-925] Ein Speicherfehler im Homematic Schnittstellenprozess (rfd) wurde behoben.
Baxxy hat geschrieben:
06.02.2023, 19:41
--> HIER <-- hatte ich ja kürzlich dargelegt das auch heutzutage (aktuelle RM) die INIT's teilweise nicht von alleine (nach Verbindungsabbruch) rausgeschmissen werden.
Das scheint vmtl. ein etwas anderes Problem zu sein. Wenn du das in der Tat mit der aktuellen rfd Version einfach reproduziert bekommst solltest du am besten dazu mal ein separates GitHub Ticket im RaspberryMatic Projekt aufmachen, dann kann ich dieses den eQ3 Entwicklern mal zukommen lassen und dann wird es dafür ggf. in Zukunft auch noch einen Fix geben.
RaspberryMatic 3.75.6.20240316 @ ProxmoxVE – ~200 Hm-RF/HmIP-RF/HmIPW Geräte + ioBroker + HomeAssistant – GitHub / Sponsors / PayPal / ☕️

Antworten

Zurück zu „HomeMatic Zentrale (CCU / CCU2 / CCU3 / Charly)“