Statistische Methoden |
||
In bestimmten Fällen kann anhand statistischer Auswertungen eine Aussage über die Richtigkeit eingegebener Daten gemacht werden. Ein typisches Beispiel wäre die Prüfung von Vornamen anhand einer Tabelle. Wenn man bei der Eingabe des Vornamens Heinz um eine Taste nach rechts rutscht, gibt man Jromu ein, rutscht man eine Taste nach links, entsteht Gwubt. Solche Verunstaltungen sind auf Grund der üblichen Tastenanordnung typisch und werden von Menschen sofort als Fehler erkannt, auch wenn der Originalbeleg nicht verfügbar ist. Immerhin gibt es aber seltene Vornamen, die s-wohl Folge eines Eingabefehlers, als auch tatsächlich richtig sein können. Hier hilft eine statistische Auswertung mit weicher Fehlernachricht. Dabei wird eine Tabelle benützt, die zu jedem Vornamen auch seine relative Häufigkeit angibt. Fehlt der eingegebene Name oder enthält die Tabelle einen niedrigen Häufigkeitswert, so wird der Bediener entsprechend informiert. Nachdem die Schreibweise kontrolliert wurde, kann die Eingabe entweder korrigiert (bei Fehler) oder belassen werden, wie sie ist. Der Begriff weiche Fehlernachricht weist darauf hin, daß bei Bedarf die Eingabe trotz Fehlernachricht fortgesetzt werden kann. Man verabschiedet sich hier vom Gedanken der totalen Kontrolle mit Zwangsmaßnahmen und geht davon aus, daß Fehler unabsichtlich gemacht werden und nicht aus Bösartigkeit (gegen die es ohnehin keinen perfekten Schutz gäbe). Im konkreten Fall könnte man in die Tabelle auch das zugehörige Geschlecht aufnehmen (soweit eindeutig) und so z.B. eine zusätzliche Prüfung der Anrede (Herr/Frau) ermöglichen. Solche statistischen Prüfmethoden bedingen einiges an Programmierungsaufwand, können aber die Richtigkeit der Eingaben wesentlich erhöhen. Manchmal werden neuronale Netzwerke als überlegene Lösung für komplexere Prüfungen genannt, z.B. für die Prüfung der Kreditwürdigkeit von Personen anhand mehrer persönlicher Informationen (Alter, Einkommen, Familienstand, etc). Grundsätzlich ist diese Methode ebenfalls eine statistische Methode, wobei der statistischen Auswertung dort die sogenannte Lernphase entspricht, bei der das neuronale Netzwerk mit einer Anzahl bereits vorhandener Datensätze gefüttert wird. Anders ist vor allem, daß das neuronale
Netzwerk die Bedeutung der einzelnen Datenfelder nicht vorprogrammiert
bekommt, sondern in der Lernphase selbst findet (hoffentlich).
Die Bedeutung dieser Methode dürfte in relativ seltenen
Fällen liegen, in denen Menschen selbst ihre Entscheidungsmethoden
nicht erklären können. Eine Anwendung war in der Hoch-Zeit
der neuronalen Netzwerke ein Programm, das Sachbearbeiter bei
der Entscheidung über die Vergabe von Kreditkarten unterstützen
sollte. |