Informationstechnik für die Fachlichkeit (4)

Informationsmodell Merkmalsbegriffe und Kataloge

24. Juli 2013 | Von | Kategorie: DATENBANKEN

Im Teil 3 war es um Merkmale gegangen, diese kleinen Informationselemente, die mit einem Informationsobjekt verknüpft werden, um es näher zu beschreiben oder zu identifizieren.

Solche Merkmale bestehen immer aus einem Pärchen, nämlich der Merkmalsbedeutung (z.B. Familienname, Geburtsdatum, Fahrzeugtyp, Ortsname, etc.) und einem Merkmalsbegriff. Nur Merkmalsbedeutung und Merkmalsbegriff zusammen ergeben ein Merkmal, das von einem Dritten eindeutig und richtig verstanden werden kann.

Formale Regeln für Merkmalsbegriffe

Pflichtmerkmale / „Mussfelder“

Sobald für jeden Objekttyp die Kandidaten für die Merkmalsbedeutungen aufgelistet sind, kommt die Frage nach „den ‚Pflichtmerkmalen‘ aufs Tapet.
Pflichtmerkmale sind solche Merkmale, für die bei der Neuanlage eines entsprechenden Objekts angegeben werden müssen. Man möchte damit eine gewisse Einheitlichkeit bei der Erfassung erzwingen und Mindestanforderungen an die Informationsqualität durchsetzen. In einem polizeilichen Informationssystem wird man z.B. beim Objekttyp Person die Merkmalsbedeutungen Familienname, Vorname und Geburtsdatum als Pflichtfelder definieren. Die Folge ist, dass der Anwender gezwungen wird, in den zugehörigen Datenfeldern einen passenden Merkmalsbegriff einzutragen.

Was tun, wenn Pflichtmerkmale nicht bekannt sind?!

In diesem Zusammenhang wird häufig ein Denkfehler gemacht: Denn die Anforderung lautet lediglich „einen Wert eintragen“, man könnte auch sagen: „das Feld nicht leer lassen“. Die Anforderung lautet jedoch nicht „man muss den Familiennamen / Vornamen / das Geburtsdatum kennen“.

Selbstverständlich muss es möglich sein, auch solche Objekte anzulegen, für die man die Angaben zu Pflichtmerkmalen / Pflichtdatenfeldern nicht kennt. In solchen Fällen sollten sich bereits die Entwickler des Informationsmodells überlegen, welche Erfassungsregeln sie ihren späteren Anwendern für solche Fälle an die Hand geben. Nach meiner Erfahrung hat es sich bewährt, für Personen, deren Familienname unbekannt ist, einen Platzhalter zu verwenden, der z.B. so aussieht UPm3 und für den (ebenfalls unbekannten) Vornamen den Namen des „Falles“ einzutragen, in dem diese Person vorkommt. Das UPm3 steht für UP = Unbekannte Person; m = männlich und die 3 steht für die dritte unbekannte Person in dem Fall / Verfahren, in dem die jeweilige Person erfasst wurde.

Formatregeln für Merkmalsbegriffe (Datenformate)

Datenformate sind „Regeln“ für den formalen Aufbau von Merkmalsbegriffen. Da soll das Geburtsdatum (und viele andere Datumsangaben) nur numerisch sein und der Aufbauregeln folgen JJJJMMDD. Die Uhrzeit soll „vierstellig“ und im „24-Stundenformat“ angegeben werden, besteht dann also aus zwei Ziffern für die Stunden und zwei Ziffern für die Minutenangabe. Die Postleitzahl soll immer aus fünf Ziffern bestehen, die Telefonnummer darf nur aus Ziffern bestehen und keine Buchstaben oder Sonderzeiten enthalten. Eine Email-Adresse soll keine Umlaute enthalten, eine URL vielleicht nur aus Kleinbuchstaben bestehen, für die Bankleitzahl oder die (neue) IBAN gibt es feste Bildungsregeln u.v.m.

Natürlich erhöht es die Informationsqualität, wenn Datenbank und Erfassungsanwendung solche Regeln (in einheitlicher Weise) kennen und deren Einhaltung erzwingen. Allerdings kosten solche Regeln auch – nämlich mehr Aufwand bei der Implementierung und jeder Änderung. Insofern ist abzuwägen zwischen der erwünschten Informationsqualität und dem Zusatzaufwand, den die Regeln so mit sich bringen.

Die Praxis aus den polizeilichen Informationssystemen besagt, dass Datenformat-Regeln sinnvoll sind bei den häufig vorkommenden numerischen Eingaben, also bei Datums- und Zeitangaben, bei Telefonnummern, bei Bankleitzahl und IBAN (,sofern die eine große Rolle spielen) und sehr sinnvoll erscheinen bei Email-Adressen und URLs.

Zu berücksichtigen sind bei der Festlegung von Datenformaten auch verwandte Informationssysteme, mit denen u.U. ein Informationsaustausch stattfindet. Es spart nämlich viel Zeit und Aufwand (im Rahmen des Informationsaustauschs), wenn man sich frühzeitig auf entsprechende Datenformat-Regeln verständigt und eine vernünftige Anzahl solcher Regeln einheitlich anwendet. Geschieht das nicht, muss bei der Übermittlung von Informationen an ein anderes System entweder der Absender oder der Empfänger für eine entsprechende Konvertierung solcher Datenformate sorgen, sofern dies überhaupt möglich ist.

Inhaltliche Regeln für Merkmalsbegriffe

… für identifizierende Merkmale

Identifizierende Merkmale sind solche, die Namensangaben, Kennzeichen, Identifizierungsnummern o.ä. wiedergeben. Man sollte darauf achten, dass wirklich jedes Informationsobjekt ausreichend viele und aussagekräftige identifizierende Merkmale erhält. Denn sie sorgen dafür, dass das Informations-Objekt in der Datenbank 1:1 einem entsprechenden Objekt in der Wirklichkeit zugeordnet werden kann.

Merkmale, die zur Bildung eines Objektnamens beitragen

Es ist gute Praxis, dass für jedes Informationsobjekt ein Name gebildet wird, anhand dessen der Anwender dieses Objekt eindeutig erkennen kann. Meist wird der Objektname gebildet, indem die Merkmalsbegriffe von dafür festgelegten (meist identifizierenden) Merkmalsbedeutungen / Datenfeldern aneinandergereiht werden.

Für ein Objekt vom Typ Person zum Beispiel besteht ein solcher Objektname aus Familienname, Vorname und Geburtsdatum (ggf. noch Geburtsort). Für ein Objekt vom Typ Ortsangabe besteht der Objektname aus Ortsname, PLZ, Straße und Hausnummer. Sie sehen an diesen Beispielen, dass man Objektnamen so zu bilden versucht, dass sie eindeutig werden, d.h. es für jedes Objekt (in der Wirklichkeit) einen eindeutigen Objektnamen im Informationssystem gibt.
Gerade für die Merkmale, die zur Bildung des Objektnamens herangezogen werden, macht es natürlich Sinn, diese auch als Pflichtmerkmalstypen zu definieren. Damit wird sichergestellt, dass ein Objektname immer „vollständig“ ist, d.h. aus den notwendigen Bestandteilen besteht.

… für beschreibende Merkmale

Beschreibende Merkmale werden verwendet, um die Äußerlichkeiten, das Verhalten oder die Leistungsmerkmale eines Objektes zu beschreiben. Identifizierende Merkmale können leicht und eindeutig festgestellt werden, weil man sie häufig aus einem Dokument ablesen kann – man denke an den Ausweis einer Person, den Fahrzeugschein eines Autos, die Ortsnetzkennzahl und Rufnummer eines Telefonanschlusses, etc. Außerdem gibt es dafür i.d.R. ergänzende Registrierungssysteme (Einwohnermeldeamt, KFZ-Zulassungsstelle, Telefonverzeichnis, etc.), wo man überprüfen kann, ob die vorhandenen identifizierenden Angaben zu einem konkreten und tatsächlich registrierten „Objekt“ passen.
Bei den beschreibenden Merkmalen ist das häufig anders: Geradezu Legende sind die Begriffe, die für Personenbeschreibungen verwendet werden. Denn solche Beschreibungen sind subjektiv. Eine Zeuge, der eine entsprechende Beschreibung abgibt, formuliert das nach seinem subjektiven Empfinden. Der Polizeibeamte, der dies aufnimmt oder wiedergibt, versucht u.U., dies „polizeiakten“-konform auszudrücken.

Kataloge für Merkmalsbegriffe

Dieser Subjektivität glaubte man – und glauben viele bis heute – eine Lösung entgegen setzen zu können in Form von (scheinbar objektiven) Katalogen für Merkmalsbegriffe.

Solche Kataloge erscheinen als „Liste“ im Datenfeld zu einer Merkmalsbedeutung, sobald der Anwender das entsprechende Merkmal erfasst oder verändern möchte. Das ist notwendig und sinnvoll, wenn es z.B. um die Merkmalsbedeutung ‚Geschlecht‘ oder ‚Familienstand‘ einer Person geht. Im Katalog der Begriffe steht dann eine übersichtliche, geordnete Liste möglicher Begriffe und der Anwender kann mit einem Mausklick den gewünschten Begriff auswählen. Solche Kataloge steigern die Informationsqualität, weil die Begriffe in immer gleicher Schreibweise erfasst werden und nicht einmal abgekürzt und einmal nicht abgekürzt, mal mit Großbuchstaben am Anfang, mal gewürzt mit einem Tippfehler u.ä.

Auch wenn Kataloge zu einer bestimmten Merkmalsbedeutung hunderte oder tausende von Begriffen umfassen, können sie Sinn machen. Man denke z.B. an Orte mit zugehörigen Ortskennzahlen, an die Paragraphen aus dem Strafgesetzbuch mit Paragraphennummer und Text und ähnliches, also an Begriffe, die relativ lang und komplex sind. Kataloge für solche Begriffe bieten eine echte Erleichterung für den Anwender: Sie geben ihm – erstens – die Sicherheit, den gewünschten Begriff genau so zu „erfassen“, wie dies notwendig ist. Und sie zeigen ihm – zweitens – überhaupt erst an, welche Alternativen für diese Merkmalsbedeutung überhaupt möglich sind. Und da die Softwaretechnik es auch erlaubt, Kataloge mit Oberbegriffen zu gliedern bzw. in solchen Katalogen zu suchen, geht die Auswahl eines Begriffs auch in großen Katalogen i.d.R. recht schnell, wenn die Anwendungssoftware dies unterstützt.

Wenn Kataloge zum Problem für Verständnis und Verständigung werden …

Es sei wieder einmal daran erinnert, dass polizeiliche Informationssysteme vor allem die Aufgabe haben, Informationen zu kommunizieren: Der Erfasser einer Information, der Polizeibeamte A, teilt damit beliebigen Nutzern eine Information mit, die diese Nutzer – an anderen Orten, in anderen Dienststellen und ggf. erst drei Jahre später lesen, dann jedoch so verstehen sollen, wie der Erfasser dies gemeint hatte.

Problematisch werden Kataloge für Merkmalsbegriffe dann, wenn sie schon für den Erfasser keine passende oder eindeutige Alternative anbieten, für das, was er ausdrücken möchte. Nehmen wir den Fall für die Merkmalsbedeutung „Gestalt einer Person“: Hier bietet ein Katalog die Merkmalsbegriffe an: „dick“, „kräftig“, „untersetzt“. Was ist nun was? Da sich der Erfasser für einen Begriff entscheiden muss, beschreibt er die Person als „kräftig“. Diese Information wird an ein anderes Informationssystem übertragen. Dort gibt es den Merkmalsbegriff „kräftig“ allerdings nicht, wohl aber den Begriff „korpulent“. Und der Effekt?! An sich vorhandene Information wird nicht gefunden!

Ein anderes Beispiel: Hier geht es um Begriffe zur Merkmalsbedeutung „Erscheinungsbild – ethnischer Typ“: Angeboten werden – neben vielen anderen – die Begriffe „südeuropäisch“, „südosteuropäisch“, sowie „südländisch“. Wo sind Definitionen für solche Begriffe hinterlegt?! Wie soll ein Polizeibeamter zwischen den dreien unterscheiden und – vor allem – von welcher Signifikanz oder Relevanz sind solche haarklauberischen Unterscheidungen?!

Man könnte das als Verirrungen abtun eines an sich sinnvollen Grundansatzes, nämlich dem, dass Begriffskataloge zur Verfügung gestellt werden, um die Informationsqualität zu steigern und die Erfassungsgeschwindigkeit zu erhöhen. Mein Eindruck ist, dass sich hier eine Subkultur der Katalog-Befürworter verselbstständigt hat, die der Meinung anhängt, dass nahezu alle Erscheinungen der Wirklichkeit durch vorgegebene Begriffskataloge abgebildet werden können. Und die gleichzeitig übersehen hat, dass die Herausforderungen an ihresgleichen auf anderen Gebieten liegen (nämlich bei der Beschäftigung mit Daten- und Informationsmodellen) und nicht bei der epischen Beschäftigung mit Begriffskatalogen.

Was spricht gegen umfassend verwendete Begriffs-Kataloge?

  • Gegen diesen Ansatz spricht (1) die Lebenserfahrung. Oder wer hätte vor dem 11. 09.2011 an „Flugausbildung“ als wesentliches Auswertungskriterium gedacht, d.h.: Kataloge sind niemals so umfassend, dass sie alle Eventualitäten der Wirklichkeit abbilden.
  • Gegen diesen Ansatz spricht (2) der damit verbundene Aufwand für die Erstellung und Abstimmung der entsprechenden Kataloge. Jeder, der an solchen Prozessen beteiligt war weiß, dass man sich in entsprechenden Sitzungen von „Bund-Länder- “ / „IG Fall-“ oder sonstigen Kooperationen trefflich und mit hohem Zeitaufwand darüber streiten konnte, ob der Oberkörper eine Frau nun als „drall“ oder als „vollbusig“ zu bezeichnen ist.
  • Gegen diesen Ansatz spricht (3) die offensichtliche Tatsache, dass weder beim BKA noch bei den Ländern und in den entsprechenden Entwicklungs- und Pflegekooperationen genügend Ressourcen vorhanden sind, um Kataloge vollständig und mit zeitnah zutreffenden Begriffen (was z.B. bei Fahrzeugmarken oder -modellen eine Rolle spielt!) zu erstellen und dann auch fortlaufend zu pflegen. So findet man denn in der Praxis reihenweise Kataloge, die die absonderlichsten Spezialitäten enthalten, bei denen jedoch wichtige und häufig benötigte Begriffe gar nicht enthalten sind – und daher auch nicht ausgewählt werden können.

Kataloge und der Informationsaustausch zwischen Informationssystemen

Viele genutzte Informationssysteme für den Informationsaustausch zwischen Polizeibehörden in der Bundesrepublik arbeiten mit mehr als 200 Katalogen, von denen viele weit mehr als hundert Begriffe enthalten, ohne dass dabei auch nur ansatzweise von Systematik, Vollständigkeit oder sachlich-logischer Gliderung nach Ober-/Unterbegriffen gesprochen werden könnte. Wenn man Informationen an diese Systeme übermitteln will bzw. muss, ist es jedoch unumgänglich, die entsprechenden Merkmalsbegriffe zu nutzen. Denn das Zielsystem akzeptiert nicht anderes für die entsprechende Merkmalsbedeutung. Das wusste der Polizeibeamte jedoch u.U. gar nicht, der z.B. eine Meldung verfasst und an „sein“ LKA geschickt hat. Die Folge ist, dass die bereits erfasste und elektronisch gespeicherte Meldung noch einmal von einem Sachbearbeiter im LKA gesichtet werden muss, nur um die vom Erfasser verwendete Begrifflichkeit (möglichst wenig sinnentstellend) zu übertragen in die vom Zielsystem akzepierten Begriffe.

Erschwerend kommt in diesen Fällen hinzu, dass das Zielsystem solche Begriffe nicht als Zeichenfolge („südländisch“) akzeptiert, sondern statt der Zeichenfolge einen numerischen Code erwartet („12398765“), der dem Merkmalsbegriff „südländisch“ für die Merkmalsbedeutung „Erscheinungsbild – ethnischer Typ“ entspricht. Im Rahmen der Informationsübermittlung muss also die Zeichenfolge übersetzt werden in den entsprechenden numerischen Wert und – tunlichst – geprüft werden, ob dieser Wert für den angegebenen Katalog (d.h. diese Merkmalsbedeutung) auch definiert ist. Wenn nicht, wird die übermittelte Information vom Zielsystem zurückgewiesen. Wenn dagegen ein numerischer Wert übermittelt wird, der im Zielsystem existiert (,wenn auch mit anderer Bedeutung), kann leicht aus dem „Südländer“ im Beispiel ein „Südasiate“ werden. Zu bemerken sind solche Fehler so gut wie gar nicht, denn wer hätte schon die Zeit, solche Vergleiche anzustellen?!

Feststellungen und Empfehlungen

  1. In den diversen, aktuell laufenden Entwicklungsprojekten für polizeiliche Informationssysteme wird zu viel Zeit und Geld verschwendet für den Teilaspekt der Entwicklung und Abstimmung von Begriffskatalogen. So, wie die Kataloge derzeit sind, wird damit weder mehr Informationsqualität erreicht, noch mehr Effektivität bei der Erfassung bzw. Auswertung. Es bedarf eines grundlegenden, konzeptionellen Ansatzes, wie – im Rahmen der Gesamtentwicklung eines Informationsmodells – mit Katalogen für Merkmalsbegriffe umgegangen wird.
  2. ie Begriffskataloge von wichtigen Zentralsystemen sind derzeit nicht aufeinander abgestimmt. Ein „Fallbearbeitungssystem“, das zwei oder mehr dieser Systeme beliefern soll, müßte entsprechende Mapping-Informationen für jedes einzelne Zentralsystem vorhalten und ständig pflegen – ein Aufwand, der sich minimieren ließe, wenn auf Ebene der Zentralsysteme an eine Harmonisierung der Kataloge gedacht würde!
  3. Wenn Kataloge für Merkmalsbegriffe zu mehr Informationsqualität führen sollen, braucht der erfassende (und nutzende) Polizeibeamte klare Regeln, was mit welchem Begriff zu bezeichnen ist. Von Ansätzen (der ZKR) einmal abgesehen, sind solche Regeln nicht festzustellen. Vor allem aber fehlt es in allen Bundes- und Landespolizeibehörden an der Zeit für Beamte, sich mit diesen Regeln vertraut zumachen bzw. an der Erkenntnis und dem politischen Willen, dass dafür Aus- bzw. Fortbildung notwendig ist.
  4. Kataloge für Merkmalsbegriffe, die nicht eindeutig einen abgegrenzten Wortschatz beinhalten (wie z.B. für „Geschlecht“ oder für „Familienstand“) müssen die Möglichkeit vorsehen, dass der Anwender einen Begriff frei wählen kann, wenn die aus dem Katalog angebotenen Begriffe nicht passen, um auszudrücken, was er meint. Die Erfassungs- bzw. Auswertungsanwendungen sind dementsprechend um ein Element zu ergänzen, das die Verwendung eines „freien“ Begriffs ermöglicht.
  5. Schluss mit dem Unsinn des Mappings von Merkmalsbegriffen auf nichts sagende numerische Werte. Dies nützt allein den Entwicklern /Servicekräften für das Zielsystem und vervielfacht den Aufwand bei den S(p)endern von Informationen an das Zielsystem.
  6. Ausblick

    Im nächsten Teil dieser Serie wird es um Beziehungen gehen – und um so manches Missverständnis, zum Beispiel über die Frage, was eigentlich die „Rolle einer Person im Verfahren“ ist.

    ___________________________________________________________________________________________________

    Dieser Beitrag ist Teil der Serie …

    Informationstechnik für die Fachlichkeit

    Sämtliche bisher erschienenen Beiträge der gleichen Serie

    Teil 1: Daten- und Informationsmodelle
    Teil 2: Entwicklung des Informationsmodell – Objekttypen
    Teil 3: Entwicklung des Informationsmodells – Merkmalsbedeutungen / „Datenfelder“
    Teil 4: Entwicklung des Informationsmodells – Merkmalsbegriffe und Kataloge
    Teil 5: Was hat Informationstechnik mit den NSU-Ermittlungen zu tun?!
    Teil 6: Wie kommt das Informationsmodell ins Datenmodell?
     

Schlagworte: , , , , , , , , ,

Schreibe einen Kommentar