Alle Aktoren sind plötzlich Zombies

Fragen, Support etc.

Moderator: Co-Administratoren

Antworten
gunterc
Beiträge: 34
Registriert: 05.04.2020, 12:09
System: Alternative CCU (auf Basis OCCU)
Danksagung erhalten: 1 Mal

Alle Aktoren sind plötzlich Zombies

Beitrag von gunterc » 13.03.2022, 12:36

Zunächst die Frage: Gibt es irgendeine Möglichkeit einen Aktor an einer CCU anzulernen, wenn der Aktor bereits an einer anderen CCU angemeldet ist UND es nicht möglich ist, den Aktor manuell in den Werkszustand zurückzusetzen?

Warum will ich das?
Ich habe einen Aktor, der hinter einer Tapete ist, und somit nicht ohne Stress mit der Frau zu erreichen ist.

Aber was ist überhaupt das Problem?
Das Problem ist, dass ich keinen meiner etwa 40 Aktoren mehr über mein WebUI auf einem seit Jahren laufenden RPi erreichen kann. Alle werden zwar wie gewohnt angezeigt, aber keiner reagiert und ich habe 36 Servicemeldungen die besagen, dass die 'Gerätekommunikation gestört' ist.
Das interessante ist, dass alle Aktoren autark wie gewohnt reagieren. Ich kann also mit Tastern die Rollladen bedienen und die Heizungsthermostate reagieren auf die Fenstersensoren. Sie sind also einerseits 'tot', andererseits funktionieren sie noch ...

Wie ich das hingekriegt habe?
Ja. Das ist eine gute Frage.
Derzeit habe ich zwei Hypothesen.

Die eigentlich wahrscheinlichere möchte ich fast ausschließen. Nämlich dass ich irgendwas abgeschossen habe (ist eigentlich klar :wink: ). Wenngleich ich in diesem Metier kein Experte bin, bin ich kein Hasardeur und weiß so halbwegs, was ich tue.
Andererseits habe ich gerade in den letzten Tagen verschiedene Dinge probiert, wo ich natürlich auch irgendwas zerstört haben könnte: Ich habe das 'ova' Image in einer VM installiert, in einer Standard-VM RasperryMatic in einem Container installiert, und schließlich auf einem NUC RaspberryMatic direkt in einem Container installiert. Letzteres zwar mit Unterstützung von Jens M., aber am Ende alles erfolgreich.

Übrigens RaspberryMatic im Container auf dem NUC ist das eigentliche Ziel der ganzen Zwischenschritte.

Bis zuletzt konnte ich auf alle Aktoren durch das WebUI meines ursprünglichen RPi zugreifen.
Aber ich hatte natürlich zeitweise zwei Zentralen aktiv: den RPi mit Funkmodul auf GPIO und jeweils eines der 'neuen' Systeme mit HmIP-RFUSB -Stick.

Die zweite Hypothese ist die, die ich präferiere, wenngleich auch die beliebig unwahrscheinlich ist:
Wir haben vor 4 Tagen einen neuen Zählerkasten bekommen. Just zu der Zeit, an der ich die Verbindung zu meinen Aktoren verloren habe, war plötzlich der Strom weg.
Ein Elektriker ist gekommen und hat festgestellt, dass eine Klemme am Haupt-Strom-Zähler einen Wackelkontakt hat. Um diesen Fehler eindeutig zu identifizieren, hat er natürlich an allem gewackelt und gerüttelt, sodass der Strom immer mal wieder kurz da war, dann wieder weg, dann .… und es hat natürlich auch etwas gepratzelt und gefunkt.

Der RPi fährt natürlich immer wieder automatisch hoch und wird dann immer wieder unsanft ausgeschaltet.

Mein Verdacht, dass vielleicht eine Spannungsspitze die Hardware zerstört hat, oder das Image auf dem RPi verklingwurft ist, hat sich nicht bewahrheitet:
Ich habe die Hardware komplett getauscht (anderer RPi, neues Image mit Backup-Daten, HM-RFUSB als Funkmodul).

Es wirkt so, als ob alle Aktoren quasi per 'broadcast' von der Station abgemeldet wurden, ohne aber in den Werkszustand zurückgesetzt worden zu sein, sodass sie irgendwo neu angemeldet werden können.
Wenn ich sie manuell zurücksetze, was bei allen, bis auf einen mit mehr oder weniger Aufwand ginge, können sie auch wieder angemeldet werden.

Fazit:
  • Die Hardware ist komplett in Ordnung.
  • WebUI, Netzwerk etc funktioniert.
  • Alle Aktoren sind von der CCU getrennt.
  • Alle Aktoren sind der Ansicht, noch irgendwo angemeldet zu sein.
Wie kann es passieren, dass alle Aktoren kollektiv, von einem Augenblick zum nächsten, von der CCU abgetrennt sind?

Wenn jemand im Forum hier eine Idee hat, fände ich das TOLL!
(ansonsten war das halt mal eine etwas 'spooky' Geschichte zum Wochenende.......)

jp112sdl
Beiträge: 12108
Registriert: 20.11.2016, 20:01
Hat sich bedankt: 848 Mal
Danksagung erhalten: 2148 Mal
Kontaktdaten:

Re: Alle Aktoren sind plötzlich Zombies

Beitrag von jp112sdl » 13.03.2022, 12:58

gunterc hat geschrieben:
13.03.2022, 12:36
Wie kann es passieren, dass alle Aktoren kollektiv, von einem Augenblick zum nächsten, von der CCU abgetrennt sind?
Störsender (Chinagerät, Billignetzteil, etc pp) auf 868 MHz

VG,
Jérôme ☕️

---
Support for my Homebrew-Devices: Download JP-HB-Devices Addon

MichaelN
Beiträge: 9635
Registriert: 27.04.2020, 10:34
System: CCU
Hat sich bedankt: 697 Mal
Danksagung erhalten: 1614 Mal

Re: Alle Aktoren sind plötzlich Zombies

Beitrag von MichaelN » 13.03.2022, 13:51

Recherchiere mal im forum zum Thema CarrierSenseLevel.
Sicheres Zeichen : Alle HMIP Geräte sind nicht erreichbar, die HM Geräte aber schon
LG, Michael.

Wenn du eine App zur Bedienung brauchst, dann hast du kein Smarthome.

Wettervorhersage über AccuWeather oder OpenWeatherMap+++ Rollladensteuerung 2.0 +++ JSON-API-Ausgaben auswerten +++ undokumentierte Skript-Befehle und Debugging-Tipps +++

Benutzeravatar
Roland M.
Beiträge: 9775
Registriert: 08.12.2012, 15:53
System: CCU
Wohnort: Graz, Österreich
Hat sich bedankt: 252 Mal
Danksagung erhalten: 1369 Mal

Re: Alle Aktoren sind plötzlich Zombies

Beitrag von Roland M. » 13.03.2022, 14:08

Hallo!

Du hast leider nicht gesagt, ob deine gestörten Geräte aus der HM- oder HmIP-Familie stammen.
Dementsprechend unterschiedlich kann auch die Fehlersuche in verschiedene Richtungen gehen.
gunterc hat geschrieben:
13.03.2022, 12:36
Zunächst die Frage: Gibt es irgendeine Möglichkeit einen Aktor an einer CCU anzulernen, wenn der Aktor bereits an einer anderen CCU angemeldet ist UND es nicht möglich ist, den Aktor manuell in den Werkszustand zurückzusetzen?
Nein.
Ein angelerntes Gerät kann nur mit der bereits bekannten CCU kommunizieren.
Ist es aber abgelernt, kann es auch ohne manuellen Zugriff an einer neuen CCU angelernt werden (HM über Seriennummer, HmIP über Stromversorgung aus-/einschalten).

Ich habe einen Aktor, der hinter einer Tapete ist, und somit nicht ohne Stress mit der Frau zu erreichen ist.
Lesson learned, Zugänglichkeit immer gewährleisten! ;)

Alle werden zwar wie gewohnt angezeigt, aber keiner reagiert und ich habe 36 Servicemeldungen die besagen, dass die 'Gerätekommunikation gestört' ist.
Bei HM das bekannte C26-Problem (stellvertretend), bei HmIP Carrier Sense.

Fazit:
  • Die Hardware ist komplett in Ordnung.
Muss nicht zwangsweise sein.
Es kann auch ein unauffälliges Gerät Amok laufen.


Roland
Zur leichteren Hilfestellung bitte unbedingt beachten:
  • Bezeichnung (HM-... bzw. HmIP-...) der betroffenen Geräte angeben (nicht Artikelnummer)
  • Kurzbeschreibung des Soll-Zustandes (Was soll erreicht werden?)
  • Kurzbeschreibung des Ist-Zustandes (Was funktioniert nicht?)
  • Fehlermeldungen genau abschreiben, besser noch...
  • Screenshots von Programmen, Geräteeinstellungen und Fehlermeldungen (direkt als jpg/png) einstellen!

-----------------------------------------------------------------------
1. CCU2 mit ~100 Geräten (in Umstellung auf RaspberryMatic-OVA auf Proxmox-Server)
2. CCU2 per VPN mit ~50 Geräten (geplant: RaspberryMatic auf Charly)
3. CCU2 per VPN mit ~40 Geräten (geplant: RaspberryMatic auf CCU3)
CCU1, Test-CCU2, Raspi 1 mit kleinem Funkmodul, RaspberryMatic als VM unter Proxmox, Access Point,...

gunterc
Beiträge: 34
Registriert: 05.04.2020, 12:09
System: Alternative CCU (auf Basis OCCU)
Danksagung erhalten: 1 Mal

Re: Alle Aktoren sind plötzlich Zombies

Beitrag von gunterc » 13.03.2022, 14:28

Hallo Roland, DANKE schon mal für die diversen Hinweise!
Du hast leider nicht gesagt, ob deine gestörten Geräte aus der HM- oder HmIP-Familie stammen.
Ich verwende ausschließlich HmIP.
HM über Seriennummer, HmIP über Stromversorgung aus-/einschalten
Also das mit Stromversorgung aus-/einschalten habe ich mehrfach mit einer Messsteckdose versucht. Ging nicht. Ich werde das aber noch mal mit einem Rollladen-Aktor versuchen, um den geht es mir.
Ja und dann kann das mit der HM-Methode (Seriennummer) noch ein ganz heißer Tipp sein. Das werde ich auf jeden Fall versuchen. Sollte bei HmIP eigentlich auch funktionieren. Da gebe ich auf jeden Fall Bescheid!
Bei HM das bekannte C26-Problem (stellvertretend), bei HmIP Carrier Sense.
Ich betreibe den RPi mit GPIO-Modul seit drei Jahren an genau derselben Stelle und ohne Probleme. Im WebUI wird 'n/a' angezeigt.
Wenn ich statt des GPIO-Moduls den Stick verwende ist Carrier Sense zwischen 0 und max 20%.
Wurde auf Carrier Sense zuerst aufmerksam, als ich RaspberryMatic in einer VM versuchte und 100% angezeigt wurde, und natürlich gar nichts ging.

MichaelN
Beiträge: 9635
Registriert: 27.04.2020, 10:34
System: CCU
Hat sich bedankt: 697 Mal
Danksagung erhalten: 1614 Mal

Re: Alle Aktoren sind plötzlich Zombies

Beitrag von MichaelN » 13.03.2022, 14:39

CS >10% sind bereits kritisch. Du misst einmal 20%, einmal sogar 100%. Das spricht viel für einen Störer.
LG, Michael.

Wenn du eine App zur Bedienung brauchst, dann hast du kein Smarthome.

Wettervorhersage über AccuWeather oder OpenWeatherMap+++ Rollladensteuerung 2.0 +++ JSON-API-Ausgaben auswerten +++ undokumentierte Skript-Befehle und Debugging-Tipps +++

Benutzeravatar
Roland M.
Beiträge: 9775
Registriert: 08.12.2012, 15:53
System: CCU
Wohnort: Graz, Österreich
Hat sich bedankt: 252 Mal
Danksagung erhalten: 1369 Mal

Re: Alle Aktoren sind plötzlich Zombies

Beitrag von Roland M. » 13.03.2022, 14:49

Hallo!
gunterc hat geschrieben:
13.03.2022, 14:28
Also das mit Stromversorgung aus-/einschalten habe ich mehrfach mit einer Messsteckdose versucht. Ging nicht.
Das funktioniert nur bei noch nicht angelernten Geräten!
Nicht angelernte HmIP-Geräte gehen nach Widerkehr der Spannungsversorgung für drei Minuten in den Anlernmodus.

Ja und dann kann das mit der HM-Methode (Seriennummer) noch ein ganz heißer Tipp sein.
Auch hier: für HmIP brauchst du SGTIN/KEY, aber Internetzugang hast du doch ohnehin, daher wäre das gar nicht notwendig.
Soviel ich weiß muss aber auch bei dieser Option das Gerät in den Anlernmodus gebracht werden.

Ich betreibe den RPi mit GPIO-Modul seit drei Jahren an genau derselben Stelle und ohne Probleme. Im WebUI wird 'n/a' angezeigt.
Dann verwendest du vermutlich das "kleine" Funkmodul, HM-MOD-RPI-PCB, das kann den CS nicht anzeigen.
Wenn ich statt des GPIO-Moduls den Stick verwende ist Carrier Sense zwischen 0 und max 20%.
Da haben wir auch schon das nächste Problem!
Wenn du das Funkmodul tauscht, müssen HmIP-Geräte (über die Internetverbindung mit dem eQ-3-Server) ein Rekeying machen! Das kann schon einige Zeit dauern und würde die Kommunikationsstörungen erklären!
Also auch wenn es am Wochenende schwer fällt, lass das System einmal in Ruhe mehrere Stunden stehen.


Roland
Zur leichteren Hilfestellung bitte unbedingt beachten:
  • Bezeichnung (HM-... bzw. HmIP-...) der betroffenen Geräte angeben (nicht Artikelnummer)
  • Kurzbeschreibung des Soll-Zustandes (Was soll erreicht werden?)
  • Kurzbeschreibung des Ist-Zustandes (Was funktioniert nicht?)
  • Fehlermeldungen genau abschreiben, besser noch...
  • Screenshots von Programmen, Geräteeinstellungen und Fehlermeldungen (direkt als jpg/png) einstellen!

-----------------------------------------------------------------------
1. CCU2 mit ~100 Geräten (in Umstellung auf RaspberryMatic-OVA auf Proxmox-Server)
2. CCU2 per VPN mit ~50 Geräten (geplant: RaspberryMatic auf Charly)
3. CCU2 per VPN mit ~40 Geräten (geplant: RaspberryMatic auf CCU3)
CCU1, Test-CCU2, Raspi 1 mit kleinem Funkmodul, RaspberryMatic als VM unter Proxmox, Access Point,...

gunterc
Beiträge: 34
Registriert: 05.04.2020, 12:09
System: Alternative CCU (auf Basis OCCU)
Danksagung erhalten: 1 Mal

Re: Alle Aktoren sind plötzlich Zombies

Beitrag von gunterc » 13.03.2022, 15:44

@Roland: Im 'homematic-ip-anwenderhandbuch.pdf' gibt es auf Seite 187 einen Hinweis:

Code: Alles auswählen

Homematic IP Geräte lassen sich nur im Auslieferungszustand an die CCU2/CCU3
anlernen. Setzen Sie daher Homematic IP Geräte, die Sie vorher an den Homematic IP
Access Point angelernt hatten, vor dem Anlernen an die CCU2/CCU3 auf die
Werkseinstellungen zurück. Informationen hierzu finden Sie in der Bedienungsan-
leitung des entsprechenden Homematic IP Gerätes.
Das deckt sich also mit dem, was Du schreibst.

Aber mal ne ganz andere Frage: Was habe ich eigentlich mit dem eQ-3-Server zu tun? In meiner Naivität gehe ich davon aus, das ich mit meinem RPi autark bin und keinerlei Internetverbindung brauche, auch wenn ich sie natürlich habe.

Benutzeravatar
Roland M.
Beiträge: 9775
Registriert: 08.12.2012, 15:53
System: CCU
Wohnort: Graz, Österreich
Hat sich bedankt: 252 Mal
Danksagung erhalten: 1369 Mal

Re: Alle Aktoren sind plötzlich Zombies

Beitrag von Roland M. » 14.03.2022, 00:03

Hallo!
gunterc hat geschrieben:
13.03.2022, 15:44
Was habe ich eigentlich mit dem eQ-3-Server zu tun? In meiner Naivität gehe ich davon aus, das ich mit meinem RPi autark bin und keinerlei Internetverbindung brauche
Das stimmt im Prinzip auch.
Die Internetverbindung ist nur beim Anlernen neuer HmIP-Geräte bequem, erspart man sich doch die Eingabe von SGTIN/KEY.

Hier sprechen wir aber von einem Sonderfall, dem Austausch des Funkmoduls, oder gleichbedeutend das Einspielen eines Backups auf eine neue CCU.
Hier müssen alle Partner informiert werden, dass nun statt Funkmodul abc das Funkmodul xyz angesprochen werden muss, eben das Rekeying Steht der eQ-3-Server nicht (mehr) zur Verfügung, müsste man jedes Gerät lokal resetten (wenn das hoffentlich in der Konfiguration nicht gesperrt wurde!) und an der neuen CCU / am neuen Funkmodul wieder neu mit SGTIN/KEY anlernen.
Mit anderen Worten, du müsstest wieder bei Null anfangen.

Hier im Forum gab es auch immer wieder Diskussionen, was passiert, wenn eQ-3 - aus welchen Gründen auch immer - final den Stecker zieht.


Roland
Zur leichteren Hilfestellung bitte unbedingt beachten:
  • Bezeichnung (HM-... bzw. HmIP-...) der betroffenen Geräte angeben (nicht Artikelnummer)
  • Kurzbeschreibung des Soll-Zustandes (Was soll erreicht werden?)
  • Kurzbeschreibung des Ist-Zustandes (Was funktioniert nicht?)
  • Fehlermeldungen genau abschreiben, besser noch...
  • Screenshots von Programmen, Geräteeinstellungen und Fehlermeldungen (direkt als jpg/png) einstellen!

-----------------------------------------------------------------------
1. CCU2 mit ~100 Geräten (in Umstellung auf RaspberryMatic-OVA auf Proxmox-Server)
2. CCU2 per VPN mit ~50 Geräten (geplant: RaspberryMatic auf Charly)
3. CCU2 per VPN mit ~40 Geräten (geplant: RaspberryMatic auf CCU3)
CCU1, Test-CCU2, Raspi 1 mit kleinem Funkmodul, RaspberryMatic als VM unter Proxmox, Access Point,...

gunterc
Beiträge: 34
Registriert: 05.04.2020, 12:09
System: Alternative CCU (auf Basis OCCU)
Danksagung erhalten: 1 Mal

Re: Alle Aktoren sind plötzlich Zombies

Beitrag von gunterc » 15.03.2022, 11:19

Nun gut. Für mich ist das Thema wohl erstmal durch. Ich fasse nur noch mal den Status zusammen, unter Berücksichtigung der Erkenntnisse aus diesen Kommentaren. DANKE noch mal dafür!
  • Ich betreibe seit über drei Jahren vollkommen problemlos einen Raspberry Pi 3B mit dem kleinen, auf dem GPIO Interface aufgesteckten Kommunikationsmodul.
  • Angelernt sind im Laufe der Zeit ca. 40 HmIP Aktoren.
  • Aus heiterem Himmel ist plötzlich kein einziger dieser Aktoren mehr über den RPi erreichbar. Alle Aktoren arbeiten aber noch wie gewohnt, reagieren also auf Fensterkontakte, lassen sich über Taster bedienen, etc.
  • Die naheliegende Vermutung, dass 'Carrier Sense' verantwortlich ist, schließe ich aus, weil das Aufsteckmodul jahrelang funktionierte, und ein inzwischen alternativ gesteckter HmIP-RFUSB Stick "0%" zeigt.
  • Überhaupt habe ich die komplette Hardware getauscht, anderer RPi B+, Stick als Kommunikationsmodul, korrektes Image vom Netz, Backup für die Daten.
  • Abgesehen natürlich von dem eigentlichen Problem, dass kein ehemals angelerntes Modul erreichbar ist, arbeitet alles normal:
    Der RPi meldet 35 Servicemeldungen, 'Carrier Sense 0%' und 'Duty Cycle 70%'. Die 70% kommen vermutlich daher, dass der RPi versucht, die angemeldeten Aktoren zu erreichen. Normalerweise hatte ich ca. 4%, als alles funktionierte. Es ist möglich (zurückgesetzte) Aktoren anzulernen, oder die neu angelernten wieder zu löschen.
  • Ich habe dem System jetzt 2Tage Zeit gegeben sich vielleicht doch wieder zu berappeln. Erfolglos.
  • Da alle Aktoren an einer Zentrale angemeldet sind, lassen sie sich nicht an einer anderen anmelden. Da ich sie nicht über eine Zentrale erreichen kann, um sie abzumelden, muss ich alle händisch in den Werkszustand versetzen, um sie danach wieder anmelden zu können. Auch der 'Trick' über 'Key' und 'SGTIN' funktioniert nur mit Modulen im Auslieferungszustand.
Schade. Aber nur gut, dass ich den RPi sowieso gerade durch einen NUC mit Docker ersetzen wollte. Da ein RPi-Backup offensichtlich nicht zu NUC/Docker kompatibel ist, muss ich sowieso alle Geräte neu anlernen und verknüpfen. Einzig das Zurücksetzen in den Auslieferungszustand wäre ergonomischer gewesen ......

Antworten

Zurück zu „Allgemeines zur OCCU“