Community-Browser
abbrechen
Suchergebnisse werden angezeigt für 
Stattdessen suchen nach 
Meintest du: 

Durchsuchung nach warnungs-relevantem Inhalt

Sind Sie kein Privatkunde? Dann geht's hier zur Business Community
Aktueller Hinweis
iPhone 11, iPhone 11 Pro, iPhone 11 Pro Max und Apple Watch Series 5: Hier geht´s zu unserem Sammelbeitrag
Status: Umgesetzt

Durchsuchung nach warnungs-relevantem Inhalt

Ich habe schon lange bemerkt, daß die Beitragstexte auf sehr simple Art

auf warnungs-relevante Inhalte durchsucht werden.

Das kann wesentlich mehr sophisticated gemacht werden.

Durch gekonntere Verwendung von Regular Expressions.

 

Status: Umgesetzt
Kommentare

Beispiel:

^(1\d\d|2[0-4]\d|25[0-5]|[1-9]\d|\d)\.(?1)\.(?1)\.(?1)$

 

Vorstehender Regulärer Ausdruck prüft IP-Adressen (IPv4).

Und zwar absolut erschöpfend!

Es wird jeder erdenkliche Fehler gefunden!

Die RA-Syntax hier liegt jenseits der Basic Regular Expressions (BRE)

sowie der Extended Regular Expressions (ERE).

 

Status geändert in: Angenommen

Hey @maglite,

 

ja, du hast Recht. Der Hinweis auf mögliche sensible Daten ploppt im Moment zu häufig auf. Wir sind gerade dabei, diese Funktion zu verbessern.

 

Liebe Grüße

Mi C. und Waldemar H.

 

PS: Reguläre Ausdrücke verwenden wir jetzt schon. Sie müssten nur etwas engmaschiger gemacht werden und bestimmte Situationen besser rausfiltern. 

 

 

@maglite Danke dir für den Regex-Vorschlag für IP-Adressen. Falls du Spaß daran hast und dich gut mit Regex auskennst, kannst du dich gerne folgender Herausforderung stellen:

  • IP-Adressen müssen erkannt werden.
  • Kundennummern oder Zugangsnummern müssen erkannt werden.
  • Telefonnummern müssen erkannt werden (in den verschiedensten Schreibweisen).
  • E-Mail-Adressen müssen erkannt werden.
  • Gleichzeitig darf die Erwähnung eines Nutzers (@mention) den Hinweis nicht auslösen.
  • Gleichzeitig darf eine gefundene Ziffernfolge den Hinweis nicht auslösen, wenn diese sich in einer Url befindet (z.B. https://telekomhilft.telekom.de/t5/Vorschlaege-fuer-die-Community/Durchsuchung-nach-warnungs-relevan...)

 

Danke dir für den Regex-Vorschlag für IP-Adressen.

Falls du Spaß daran hast und dich gut mit Regex auskennst, kannst du dich gerne folgender Herausforderung stellen:

Ich bin Regexp-Experte.

Welche Regexp-Engine(s) steht/stehen Euch denn zur Verfügung?

Unter Unix sind BRE und ERE Standard.

Dann gibt es eine Reihe von Engines (~20), die weit über die vorgenannten

hinausgehen. Beispielsweise die im gvim-Editor, in Perl, etc.

Ich nenne die mal XRE.

  • IP-Adressen müssen erkannt werden.
    Ein Beispiel zeigte ich hier bereits (XRE).
  • Kundennummern oder Zugangsnummern müssen erkannt werden.
    \d{10} oder [1-7][0-8][0-9]{8}
  • Telefonnummern müssen erkannt werden (in den verschiedensten Schreibweisen).
  • E-Mail-Adressen müssen erkannt werden.
  • Gleichzeitig darf die Erwähnung eines Nutzers (@mention) den Hinweis nicht auslösen.
  • Gleichzeitig darf eine gefundene Ziffernfolge den Hinweis nicht auslösen, wenn diese sich in einer Url befindet

Keine der vorstehenden Aufgaben ist eine Hürde für mich.

Die interne genaue Definition z.B. der Kundennummer muß ich aber wissen.

Die Definition 10 Ziffern lang ist wahrscheinlich nicht ausreichend.

Es sind auch Operationen notwendig, die über das einfache Anwenden

eines RA auf eine Zeichenfolge (true/false) hinausgehen.

Die RA-Engines sind auch verschiedengradig unterschiedlich, besonders

das Maskierzeichen und den Substitutionsmechanismus betreffend.

Man muß leider davon ausgehen, daß User in Beiträgen gewöhnliche Wörter

ohne WhiteSpace dazwischen mit gesuchten Token/Pattern verbinden.

Es sprengt leider den Rahmen, Namen zu finden;

Straße und Ort ist eher möglich.

 

Wir verwenden Javascript RegExp Object: https://www.w3schools.com/jsref/jsref_obj_regexp.asp

 

Kundennummern sind bei uns in der Regel 8-12 stellig (Mobilfunk 8-stellig, Festnetz 10-stellig und Zugangsnummern 12-stellig, mit Mitbenutzer-Nummer sind Zugangsnummer 17-stellig. Dann kommt hiner der 12-stelligen Nummer noch -0001).

 

Definitionen 1, 2, 3 oder 4 (Warnfenster) ?:

  1. Warnung nur aufgrund einer 0/1-Aussage (wie aktuell vorliegend).
  2. Warnung mit Mitteilung der Art des ersten kompromittierenden Textes.
  3. Warnung mit Mitteilung des ersten kompromittierenden Textes selbst.
  4. Warnung mit Mitteilung der Art des ersten kompromittierenden Textes
    und des Textes selbst.

Fragen 1, 2, 3, 4, 5, 6:

  1. Können bei Kundennummern, die aus 8 oder 10 Ziffern bestehen, bei jeder
    Zifferposition alle Ziffern 0 bis 9 vorkommen?
    Also auch führende Null '0'?
  2. Hat die Anschlußkennung (12) stets mindestens eine führende '0'?
  3. Hat die Zugangsnummer (8-12) stets eine führende '0'?
  4. Ist der Bindestrich vor Mitbenutzernummer (-0001) optional?
    Ich kenne die ohne -, nach Zugangsnummer.
  5. Wie groß kann die Mitbenutzernummer werden?
    Größer als 0099?
  6. Benutzername (geplant):
    0011111111110222222222220001@t-online.de
    001111111111022222222222-0001@t-online.de
    0011111111110222222222#0001@t-online.de
    AnschlußkennungZugangsnummer[#][-]Mitbenutzernummer@t-online.de
    #:  wenn Zugangsnummer weniger als 12 Ziffern.
    Erkennung auch bei teilweisem Vorkommnis.

.


@maglite schrieb:

Definitionen 1, 2, 3 oder 4 (Warnfenster) ?:

  1. Warnung nur aufgrund einer 0/1-Aussage (wie aktuell vorliegend).
  2. Warnung mit Mitteilung der Art des ersten kompromittierenden Textes.
  3. Warnung mit Mitteilung des ersten kompromittierenden Textes selbst.
  4. Warnung mit Mitteilung der Art des ersten kompromittierenden Textes
    und des Textes selbst.

Nummero 1, so wie aktuell.


@maglite schrieb:
1. Können bei Kundennummern, die aus 8 oder 10 Ziffern bestehen, bei jeder

Zifferposition alle Ziffern 0 bis 9 vorkommen?
Also auch führende Null '0'?


Eigentlicht nicht. Am besten sicherheitshalber aber mit berücksichtigen. Im Festznetz-Bereich kenne ich zwar keine Kundennummer mit einer führenden Null, aber ich bin mir nicht sicher, ob es vereinzelt im Mobilfunk-Bereich solche Kundennummern gibt. 

 


@maglite schrieb:
2. Hat die Anschlußkennung (12) stets mindestens eine führende '0'?

Ja.

 


@maglite schrieb:
3. Hat die Zugangsnummer (8-12) stets eine führende '0'?

Nein, kommt aber bei älteren Zugangsnummern vor, darum auf jeden Fall berücksichtigen.  

 


@maglite schrieb:
4. Ist der Bindestrich vor Mitbenutzernummer (-0001) optional? Ich kenne die ohne -, nach Zugangsnummer.

Das kommt auf den Kontext an. Normalerweise mit Bindestrich, kann aber auch ohne Bindestrich vorkommen. Die ganze Mitbenutzernummer ist eher optional. In den meisten Situationen wird heute nur die Zugangsnummer von Kunden erwähnt. 

 


@maglite schrieb:
5. Wie groß kann die Mitbenutzernummer werden? Größer als 0099?

Ja, sie geht theoretisch bis einschließlich 9999. In der Praxis sollte es nur noch die Mitbenutzernummer 0001 geben. Ich bin mir aber nicht sicher, ob es vereinzelt Ausnahmen gibt und manche Geschäftskunden vielleicht doch noch mehrere Mitbenutzer haben. Schadet nicht einfach bis 9999 zu prüfen. 

 


@maglite schrieb:
6. Benutzername (geplant):

0011111111110222222222220001@t-online.de
001111111111022222222222-0001@t-online.de
0011111111110222222222#0001@t-online.de
AnschlußkennungZugangsnummer[#][-]Mitbenutzernummer@t-online.de
#:  wenn Zugangsnummer weniger als 12 Ziffern.
Erkennung auch bei teilweisem Vorkommnis.


Sieht gut aus. 

 

Meine Anschlußkennung lautet:  009878767654,

hat also zwei führende Nullen.

Eine führende '0' hat eine Kennung garantiert -- sind es garantiert sogar zwei?

 

Der Hintergrund ist, daß durch führende '00' die

Erkennungswahrscheinlichkeit sehr stark steigt (evtl.Faktor >700)!

Dies ebenso, wenn ich von einer Mitbenutzernummer 00XX ausgehen kann!

 

Ja, es sind zwei führende Nullen bei einer Anschlusskennung. 

Du kannst auch bei der Mitbenutzernummer von zwei führenden Nullen ausgehen. Mir ist seit längerem keine Mitbenutzernummer untergekommen, die größer als 0099 war. 

 

Eigentlich müßte das ohne weitere (größere) Erklärungen schon klar sein.

Aber es muß auch am Bestimmungsort getestet werden.

Bei mir läuft das makellos.

In der Vorschau sehe ich 4 Emoticons, auch in Code.

 

<script type="text/javascript">
     const Beitrag= 'sfiu=name@tele@kom.de.com';
     function expressions(beitrag)
     {
        let RA= /(?:\b[a-z]{3,8Teufel?(?:\/\/(?:[a-z]Fröhlich?\/|\/\/)(?:\w+:\S*@|\w+@)?(?:[^\/\s:]+)(?::\d{1,5})?(?:\/[^\/\s]+)*\b\/?/gi;
        if (RA.test(beitrag))  beitrag= beitrag.replace(RA, ' ');
        RA= /([01]\d\d|2[0-4]\d|25[0-5]|\d\d|\d)\.([01]\d\d|2[0-4]\d|25[0-5]|\d\d|\d)\.([01]\d\d|2[0-4]\d|25[0-5]|\d\d|\d)\.(?:[01]\d\d|2[0-4]\d|25[0-5]|\d\d|\d)/g;
        let r;
        while (r= RA.exec(beitrag))  {
           if (r[1]&&r[2])  {
             if (r[1]+'.'+r[2] !== '192.168')  return true;
           }
        }
        RA= /00\d{10}(?Traurig?:32|52|55)\d{10}00\d\d|(?:32|52|55)\d{10}|0\d{8,10}#00\d\d|0\d{8,10})(?:@t-online\.de)?/gi;
        if (RA.test(beitrag))  return true;
        RA= /\b(?Traurig?:32|52|55)\d{10}00\d\d|(?:32|52|55)\d{10}|0\d{8,10}#00\d\d|0\d{8,10})\b(?:@t-online\.de)?/gi;
        if (RA.test(beitrag))  return true;
        RA= /\b[^@\s]+@[^.\s]+(?:\.[^@.\s]+)+\b/gi;
        if (RA.test(beitrag))  return true;
        RA= /(?:\+\d{1,3} *|00\d{1,3} *)?[-(]?\d{2,5} *[-)\/]?(?:\d| *\d| *- *\d){3,10}\b/g;
        if (RA.test(beitrag))  return true;
        RA= /(?:\d{10}|\d{8})/g;
        if (RA.test(beitrag))  return true;
        return false;
     }
     if (expressions(Beitrag))  /*createPopUp*/;
  </script>