ENSOFT-Logo
Startseite Hintergrundwissen Prüfmethoden Statistische Methoden

Statistische Methoden

In bestimmten Fällen kann anhand statistischer Auswertungen eine Aussage über die Richtigkeit eingegebener Daten gemacht werden. Ein typisches Beispiel wäre die Prüfung von Vornamen anhand einer Tabelle. Wenn man bei der Eingabe des Vornamens „Heinz“ um eine Taste nach rechts rutscht, gibt man „Jromu“ ein, rutscht man eine Taste nach links, entsteht „Gwubt“. Solche Verunstaltungen sind auf Grund der üblichen Tastenanordnung typisch und werden von Menschen sofort als Fehler erkannt, auch wenn der Originalbeleg nicht verfügbar ist.

Immerhin gibt es aber seltene Vornamen, die s-wohl Folge eines Eingabefehlers, als auch tatsächlich richtig sein können. Hier hilft eine statistische Auswertung mit „weicher“ Fehlernachricht. Dabei wird eine Tabelle benützt, die zu jedem Vornamen auch seine relative Häufigkeit angibt. Fehlt der eingegebene Name oder enthält die Tabelle einen niedrigen Häufigkeitswert, so wird der Bediener entsprechend informiert. Nachdem die Schreibweise kontrolliert wurde, kann die Eingabe entweder korrigiert (bei Fehler) oder belassen werden, wie sie ist. Der Begriff „weiche Fehlernachricht“ weist darauf hin, daß bei Bedarf die Eingabe trotz Fehlernachricht fortgesetzt werden kann. Man verabschiedet sich hier vom Gedanken der totalen Kontrolle mit Zwangsmaßnahmen und geht davon aus, daß Fehler unabsichtlich gemacht werden und nicht aus Bösartigkeit (gegen die es ohnehin keinen perfekten Schutz gäbe). Im konkreten Fall könnte man in die Tabelle auch das zugehörige Geschlecht aufnehmen (soweit eindeutig) und so z.B. eine zusätzliche Prüfung der Anrede (Herr/Frau) ermöglichen.

Solche statistischen Prüfmethoden bedingen einiges an Programmierungsaufwand, können aber die Richtigkeit der Eingaben wesentlich erhöhen. Manchmal werden „neuronale Netzwerke“ als überlegene Lösung für komplexere Prüfungen genannt, z.B. für die Prüfung der Kreditwürdigkeit von Personen anhand mehrer persönlicher Informationen (Alter, Einkommen, Familienstand, etc). Grundsätzlich ist diese Methode ebenfalls eine statistische Methode, wobei der statistischen Auswertung dort die sogenannte „Lernphase“ entspricht, bei der das neuronale Netzwerk mit einer Anzahl bereits vorhandener Datensätze gefüttert wird.

Anders ist vor allem, daß das neuronale Netzwerk die Bedeutung der einzelnen Datenfelder nicht vorprogrammiert bekommt, sondern in der Lernphase selbst „findet“ (hoffentlich). Die Bedeutung dieser Methode dürfte in relativ seltenen Fällen liegen, in denen Menschen selbst ihre Entscheidungsmethoden nicht erklären können. Eine Anwendung war in der „Hoch-Zeit“ der neuronalen Netzwerke ein Programm, das Sachbearbeiter bei der Entscheidung über die Vergabe von Kreditkarten unterstützen sollte.

In der „normalen“ Datenerfassung werden neuronale Netzwerke nicht eingesetzt.