Problem mid Telekom Glasfaser, wie kann ich die richtigen informationen ins Ticket übermitteln

vor einem Tag

Hi, 

Ich habe seid Anfang März ein wildes problem mit meinem FTH Anschluss. ca alle 2 Stunden bricht die ppoe sitzung (echo reply fehler) und baut sich nach 30 sekunden wieder auf. Anschluss ist von der Dämpfung perfect, Kabel von meiner Dreambox (Unifi) zum Glasfasermodem ist getauscht, alle Geräte mehrfach rebootet und auf der letzten softwareversion. 

Jetzt hatte ich den Techniker vor Ort und gehe den Weg lokale hardware zu tauschen, die unbekannte UDM durch fritzbox zu ersetzen usw. ein Prozess der lange dauert, desen Begründung ich verstehe und den ich natürlich supporte. Allerdings wird er nicht zum Erfolg führen und ich weiss nicht wie ich dies abkürzen kann. 

Warum ist das so ? Der Abbruch findet erst seit dem 5.3. statt, mit unveränderter Software und hardware auf meiner seite. Und ausserhalb des 50 sekunden reconnects ist die Verbindung perfect, kein Packetverlust, kein Slowdown, konstant gute Geschwindigkeit ....

Aber vor allem kommen die reconnect reproduzierbar im 2 Stunden Raster (kann auch mal 1 oder 3 sein) und vor allem immer zur gleichen "Minute". Am 5.3. fand der erster reconnect um 22:57 statt. seid dem schiebt sich die Minute konstant über ca. 30 sekunden nach hinten, aktuell bei :24. Dieser Rythmus verändert sich nie und ist sehr konstant über die letzten Tage. Wenn der Fehler inkl. eines Timeouts in einem meiner Geräte liegen würde so würde sich das schema nach Neustart oder reboot verändern. Selbst wenn ein Fehler einen konstanten Timeout auslösen würde, so würde dieser nach Neustart neu anlaufen und sich das Schema der minutenwerte deutlich verändern .....

Für mich sieht es eher nach einer Softwarekomponente oder configuration auf seiten des Telekom PPOE servers oder der authenifizierung aus. Das zeitliche Schema passt perfect zu einem 1 Stunden Timeout (wobei meist jeder zweite zu einem vollständigen Abbruch führt). Die Verschiebung im Minutenraster lassen sich sehr gut durch erkennungszeiten (3 pings bei mir) und die Verzögerung im Sessionaufbau erklären. 

Nun ist es aber so das im aktuellen Ticket der Prozess abgearbeitet wird, Kabel und ONT sind schon getauscht. Im nächsten Schritt wird es die UDM sein und man mich fragen ein Referenzgerät zu benutzen, dann eventuell das Modem näher am Router plazieren. Ich mache das gerne mit aber nichts davon erklärt das Zeitraster und irgendwie will aktuell niemand diese information aufnehmen oder auch nur berücksichtigen :(

Hilfe needed, I guess.

Letzte Aktivität

vor 59 Minuten

von

Gelöschter Nutzer

92

0

10

    • vor einem Tag

      Welches SFP Modul hast du drin? 

      Hat die Telekom direkt ausgebaut oder wars die Glasfaser Nordwest?  

      0

      0

    • vor einem Tag

      telekom direkt ausgebaut. und ich nutze kein sfp modul (hatte von Temperaturproblemen gehört. 

      Die UDM baut eine PPOE über 2.5GB/lan mit dem Glasfasermodem der Telekom auf.

      0

      0

    • vor einem Tag

      Hast du mal die Pigtails abgezogen? ggf. hast du dort Staubkörner drauf. 

      0

      0

    • vor einem Tag

      ja, alles durchgemessen und gut, würde auch alles nicht die regelmäßigkeit erklären die eigentlich der stärkste Hinweis auf eine Serverkomponente bzw. Konfiguration ist. 

      Aktuell hoffe ich das der ONT wechsel hier mittlebar hilft da er serverseitig im BRAS/ BNG vermutlich auch eine Configchange anstößt.

      0

      5

      von

      vor einem Tag

      Hallo @Codingfragments

       

      Herzlich willkommen in unserer Community. Ein paar Spezies hast du hier bereits erreicht, das ist gut 😉

      Das Ticket ist ebenfalls noch offen, hat der Außendienst heute gesagt, wie es damit weitergeht? Sollst du nach dem ONT Wechsel beobachten? 

       

      Halte uns hier gerne weiter auf dem Laufenden. 💬

       

      Viele Grüße Nadine 

      0

      von

      vor einem Tag

      Er wird morgen nochmal drauf schauen, aber ich kann jetzt schon zwei Ausfälle im bekannten Muster sehen. 

      Ich befürchte halt das der krass gleichmäßige und von lokalen Aktivitäten unabhängige Rythmus aktuell nicht einbezogen wird, und wir die nächsten Wochen mit lokaler Fehlersuche verbringen. In dem Fall gibt es zwar viele mögliche Fehlerquellen lokal aber eben keine die den Rythmus erklärt und niemand nimmt diesen Kommentar gerade auf :(

      Der Servicetechniker war/ist sehr nett und hilfbereit, aber ich fühle mich wie ein Bittsteller der alleine schon deshalb probleme verursacht das er nicht die klassische Fritzbox benutzt und dann noch so komplizierte Fakten liefern will oder, Gott beware, PPOE logfiles oder mehr :)

      0

      Uneingeloggter Nutzer

      von

    • vor 59 Minuten

      Codingfragments

      LCP

      ja, als nächstes dann vermutlich ein refferenzgerät mit einer höheren LCP timeout ... (udm macht 3 failed echo mit 10 sec cadence. ) Es kann durchaus sein das es mit einer Fritzbox im 5/30 raster funktioniert (ändert nichts daran das trotzdem jede zweite Stunde die Session für 60 sekunden steht, alle Zoom-calls abbrechen und ich meine Backup logik ändern muss. 

      Meine Wahrnehmung ist leider das Informationen die ich liefern kann nicht im Case berücksichtigt werden. Gibt es hier für mich einen Weg das Augenmerk auf die Serverseite zu legen denn :

      1) es gibt keinen sinnvollen Grund warum einen Kundenseitige Kabelstörung eine Störung exakt im Stundenraster verursachen sollte, und das über Wochen im selben Raster

      2) es gibt keine sinnvollen Grund warum eine Kundenseitige Softwarestörung vorliegt die im Stundenraster zum Abbruch führt, natürlich ist ein Timeout oder ähnliches (Buffer overflow, ...  ) denkbar der genau jeweils eine Stunde nach connect einen Abbruch auslöst entweder im ONT oder dem Router ABER desen Raster hätte sich dann beim Restart verschoben, also Probleme bei minutet 20 dann neustart bei minute 40 ab dann Probleme im Stundenraster bei minute 42 .... ) Das ist aber nicht der fall. Dir Abbrüche finden im Stundenraster statt aber seit Wochen auf der selben Minute (bzw. einer erklärbaren Verschiebung die sich durche eine Stunden timeout + 50-90 Sekunden reconnect ergibt. Um konstant diesen wert "wandert" das ereigniss ...

      3) tcpdumps und ppoe logs belegen eine ultra-stabile verbindung bis eben zum problem, dann sofortiger reconnect und wieder Stabili

      Vor allem das Minutenscharfe Stundenraster über Wochen deutet klar auf ein Problem im bereich server (software) hin, das entweder durch eine Konfiguration oder update Anfang März aufgetreten ist. 

      Nur, will diese Diagnosedaten aktuell niemand sehen :(. Könnt ihr da helfen oder wie ist mein weiterer Weg ?

      Und ja, ich mache das (diagnose von netzwerk und software incidents) beruflich, bzw. habe es lange jahre hands on gemacht. Ich verstehe das euer Team prozessen folgt :( 

      Codingfragments

      LCP

      @Codingfragments 

      Dann zeig uns doch mal einen Screenshot von den LCP Paketen im wireshark mit Zeitstempel und VLAN Prio.

      Welche Firmware läuft denn auf dem Glasfasermodem? Gibt es im Modem ein Log wo man das letzte Update zeitlich nachvollziehen könnte?

      0

      0

    Uneingeloggter Nutzer

    von

    Beliebte Tags letzte 7 Tage

    Loading...Loading...Loading...Loading...Loading...Loading...Loading...Loading...Loading...Loading...