De Maizière und seine Vorschläge für Gesichtserkennungssysteme an Flughäfen und Bahnhöfen

Science-Fiction-Visionen des Bundesinnenministers

25. August 2016 | Von | Kategorie: AUS DEM CIVES-BLOG

Unter den vielen Maßnahmen und Forderungen, die Bundesinnenminister Thomas de Maizière in den letzten Wochen aufs Tapet gebracht hat, um damit angeblich die Sicherheit in Deutschland zu erhöhen, sticht die Forderung nach Einführung einer Gesichtserkennungssoftware hervor: Dazu de Maizière im Originalton [1]:


„Es gibt für Privatpersonen die Möglichkeit, jemanden zu fotografieren und mit einer Gesichtserkennungssoftware im Internet herauszufinden, ob es sich um einen Prominenten oder einen Politiker handelt, den man gerade gesehen hat. Ich möchte eine solche Gesichtserkennungssoftware an den Videokameras an Flughäfen und Bahnhöfen einsetzen. Wenn dann ein Verdächtiger auftaucht und erkannt wird, zeigt das System das an.“

Was ist eine Gesichtserkennungssoftware?

Ganz allgemein gesagt, „liest“ eine Gesichtserkennungssoftware Bilder, wie sie zum Beispiel eine Überwachungskamera liefert, extrahiert ein oder mehrere Gesichter aus der Aufnahme (, die u.U. viele Gesichter enthält) und vergleicht jedes einzelne dieser Gesichter mit den Gesichtsbildern, die in einer Datenbank gespeichert sind.

Technische Herausforderungen bei der automatischen Gesichtserkennung und Personenidentifizierung

Schlechte Aufnahmequalität

Dass diese Aufgabe alles andere als trivial ist, kann sich jeder Hobbyfotograf vorstellen: Man denke nur an unscharfe Aufnahmen, schlechte Lichtverhältnisse, teilverdeckte Gesichter, nicht frontale Aufnahmen, Hüte und Mützen, Bärte, Brillen, Schirme oder sonstige Dinge, die sich Menschen ab und an vors Gesicht halten.
Die Qualität der Aufnahmen von Überwachungskameras ist nicht mit den Porträtfotos vergleichbar, die jemand von sich selbst anfertigt, um sein Profil in den Sozialen Medien zu bereichern: Denn die zufälligen Schnappschüsse, die beim Vorbeilaufen unter einer Überwachungskamera entstehen, sind vom Gesichtsträger nicht auf gutes Aussehen und gute Erkennbarkeit ausgelegt.
Ein eigener Zweig der Informatik, die ‚Künstliche Intelligenz‘, beschäftigt sich seit Jahrzehnten mit diesem speziellen Fachgebiet und hat Fortschritte dabei erzielt, nicht optimale Aufnahmen besser auswertbar zu machen. Von einer 100-prozentigen Identifizierbarkeit einer Person anhand des Bildes einer Überwachungskamera kann jedoch noch keine Rede sein.

Wie Bilder von Gesichtern vergleichbar gemacht werden: Erstellung des Faceprint

Um Gesichter per Computer miteinander vergleichbar zu machen, werden Mess- und Beschreibungsverfahren eingesetzt. Diese sind nicht standardisiert, sondern unterscheiden sich gegebenenfalls von Anbieter zu Anbieter. Bei diesen Verfahren werden Messungen – auf der Basis des vorliegenden, erkennbaren Gesichtsbildes – vorgenommen, um ein Set von objektiv beschreibbaren Merkmalen zu erhalten. Dazu gehören zum Beispiel

  • Abstand der Augen,
  • Breite der Nase,
  • Tiefe der Augenhöhlen,
  • Form der Kieferknochen,
  • Länge der Augenbrauen u.v.m.

Das gesamte Set dieser Merkmale wird als Faceprint (‚Gesichtsabdruck‘; in Analogie zum finger print, dem Fingerabdruck) bezeichnet. Die Messwerte und beschreibenden Merkmale werden codiert; das hat den Vorteil, dass sich ein Faceprint in sehr komprimierter Form, im Wesentlichen bestehend aus Zeichen und Ziffern, darstellen und speichern lässt.

Qualitätsverbesserungen und Normalisierung bei schlechter Aufnahmequalität vor dem eigentlichen Vergleich

Schon an diesen Beispielen wird deutlich, wie schwierig es ist, anhand eines zufällig aufgenommenen Bildes aus einer Videoüberwachung, das ein Gesicht z.B. von schräg seitlich oben zeigt, zu Messwerten und beschreibenden Kriterien zu kommen, die annähernd mit der Wirklichkeit (also dem tatsächlichen Gesicht) übereinstimmen.

Für den Abgleich eines Bildes aus einer Überwachungskamera mit den Bildern in der Vergleichsdatenbank ist es also notwendig, zunächst das unter Umständen in schlechter Aufnahmequalität vorliegende Bild überhaupt auswertbar zu machen. Diese Teilaufgabe entspricht dem, was man aus Bildbearbeitungsprogrammen unter der Funktion ‚Autokorrektur‘ kennt.

Zusätzlich kann das Bild durch einen nicht-frontalen Aufnahmewinkel perspektivisch verzerrt sein. Solche Verzerrungen müssen ’normalisiert‘ werden, d.h. durch entsprechende Rechenoperationen bereinigt werden, um annähernd zu Messwerten zu kommen, die den objektiven Werten bei optimalem Aufnahmewinkel entsprechen.

Erst nach der optischen Optimierung der Aufnahme und eventuell notwendiger Normalisierung macht es Sinn, aus der Aufnahme des Bildes den Faceprint zu messen und zu bestimmen. Dieser Faceprint ist dann die Grundlage, um das Bild eines Gesichts aus einer Überwachungskamera mit Faceprints zu vergleichen, die in einer Vergleichsdatenbank gespeichert sind. [a]

Hohe Anforderungen an die Systemausstattung

Die Extraktion von Gesichtsbildern aus rohen Szenebildern, die Qualitätsverbesserung jedes einzelnen Gesichtsbildes und die anschließende Normalisierung und Vermessung des Bildes zur Erstellung des Faceprints erfordern – rein theoretisch – Überwachungskameras, in denen solche Fähigkeiten integriert sind. Da würde die Sache sehr teuer machen. Die wahrscheinlichere Alternative ist, dass die rohen Bilder aus den Überwachungskameras – nahezu in Echtzeit! – an einen Server übertragen werden. Das setzt ausreichend schnelle und immer verfügbare Datenleitungen voraus – auch keine billige Sache!

An dem oder den Servern muss dann – wiederum nahezu in Echtzeit (nach den Vorstellungen von de Maizière!) – die Qualitätsverbesserung und die Vermessung und Erstellung des Faceprints erfolgen. Erst wenn der vorliegt, kann ein Vergleich des Faceprints aus der Überwachungskamera mit den in der Vergleichsdatenbank gespeicherten Faceprints erfolgen. Auch wenn hier mit Sicherheit ausgeklügelte Vergleichsoperationen zum Einsatz kommen, die die Vergleiche möglichst zeit- und speicher-effektiv machen, muss man von Abermillionen von Vergleichen ausgehen. Und insgesamt also von einer notwendigen, extrem leistungsfähigen Systemausstattung.

Reichlich schlichte Vorstellungen

Gemessen an den hier nur im Überblick beschriebenen, technischen Herausforderungen bei der Gesichtserkennung und dem automatischen Vergleich von Gesichtsbildern erscheinen die Visionen des Bundesinnenministers ziemlich wirklichkeitsfremd.

„Wenn dann ein Verdächtiger auftaucht und erkannt wird, zeigt das System das an.“ So sieht das der Bundesinnenminister. Er scheint die Vision zu haben, dass ein Gesichtserkennungssystem in Echtzeit beobachtet und auswerten kann, ob sich potenziell gefährliche Subjekte in ihrem Überwachungsbereich bewegen und dass ‚das System‘ daraufhin einen Alarm auslösen kann.

Diese Vision wirft mehrere Fragen auf:

Was ist ein Verdächtiger und woran erkennt das System einen Verdächtigen?

Geht es um Menschen, die verdächtig sind, einen Amoklauf zu begehen? Oder mit einer Axt um sich zu schlagen? Oder einen Koffer mit Sprengstoff irgendwo abzustellen? Wie sieht ein solcher Mensch aus? Erkennt man ihn an der Kleidung? Wie bewegt sich ein verdächtiger potenzieller Amokläufer? Wie verhält sich jemand, der verdächtig ist, einen Terroranschlag auszuführen? Und wie programmiert man eine Gesichtserkennungssoftware so, dass sie aus Videoaufzeichnungen zu den richtigen Auswertungsergebnissen kommt?

Gibt es Bild-Datenbanken mit den Bildern von Verdächtigen?! – und wenn ja: Wer füttert die?

Wenn das System einen Verdächtigen jedoch nicht anhand seines Äußeren bestimmen kann, braucht es eine Vergleichsbasis: Also eine Datenbank mit den Bildern bzw. Faceprints gegen die es Gesichtsbilder aus der Überwachungskamera vergleichen soll. Dies setzt voraus, dass es eine zum Vergleich heranzuziehende Datenbank gibt, in der die Bilder aller Verdächtigen gespeichert sind.

CIVES hat daher bei der Pressestelle des Innenministeriums angefragt, in welchen Fällen von Amokläufen bzw. terroristischen Anschlägen in den letzten fünf Jahren in Deutschland den Sicherheitsbehörden Gesichtsfotos der späteren Tatverdächtigen / Beschuldigten / überführten Täter vorlagen. Die Antwort war deutlich: „Eine statische Erhebung / Auswertung liegt dem BMI hierzu nicht vor.“

Werden die Lichtbilder von uns allen aus dem Personalausweisregister zum Vergleich herangezogen?

Nicht auszuschließen ist, dass der Bundesinnenminister die Vorstellung hegt, dass zum Vergleich die Lichtbilder der Millionen von Bundesbürgern herangezogen werden, die den Personalausweisbehörden vorliegen; weil man einen Bundespersonalausweis bekanntlich nur dann erhält, wenn man ein Lichtbild abliefert. Dieses Lichtbild wird, zusammen mit zahlreichen anderen Daten, die der elektronischen Identifizierung einer Person dienen sollen, im Personalausweisregister gespeichert.

Und es ist sicher kein Zufall, dass (nach §15, Abs. 1 PAuswG) Polizeidienststellen die gespeicherten Daten – einschließlich des Lichtbildes – im Rahmen ihrer Aufgaben und Befugnisse zum automatisierten Abruf nutzen dürfen. Und dass – nach §24, Abs. 2 des gleichen Gesetzes – den Polizeibehörden die Daten auch durch Datenübertragung übermittelt werden dürfen. [b]

Mit dieser Information im Hinterkopf wollten wir von der Presseabteilung des BMI wissen:

  1. Werden dazu die biometrischen Bilder (also Fotografien der Gesichter) von Inhabern von deutschen Bundespersonalausweisen herangezogen bzw. ist dies für die Zukunft geplant?
  2. Werden dazu die biometrischen Bilder (also Fotografien der Gesichter) von Schutzsuchenden verwendet, die seit Anfang 2015 nach Deutschland eingereist sind und hier Asylanträge gestellt haben bzw. (vermutlich) noch zu stellen beabsichtigen?
  3. Wenn ja (zu 1 bzw. 2): Auf welcher Rechtsgrundlage beruht die Nutzung dieser für anderen Zwecke erhobenen Fotografien / personenbezogenen Informationen?


Dazu, teilt uns die Sprecherin des Ministeriums mit, „können derzeit noch keine Angaben gemacht werden“
Eine bemerkenswerte einsilbige Antwort, wie wir finden …

Was geschieht, wenn das System einen Verdächtigen erkannt hat?!

„Wenn dann ein Verdächtiger auftaucht und erkannt wird, zeigt das System das an.“ Sagt der Innenminister. Wir fragen uns allerdings: Wem zeigt ‚das System‘ was an? Sitzen da Leuten in Überwachungszentralen hinter Bildschirmen? Und ‚das System‘ zeigt denen, wenn es einen ‚Verdächtigen‘ erkannt hat? Oder gibt es zentrale Beobachtungsstände? Wird dort der Alarm ausgelöst, wenn ‚das System‘ einen Verdächtigen erkannt hat?? Um welche Überwachungszentralen handelt es sich dabei? Gibt es die bereits und können sie für diese Zwecke genutzt werden? Wenn nicht: Bis wann und mit welchem Kosten werden diese Zentralen aufgebaut?

Was geschieht, nachdem ‚das System‘ dies angezeigt hat? Wer löst dann einen Einsatzbefehl aus? Welche Kräfte sind überhaupt vor Ort verfügbar? Können ausreichend Kräfte zeitnah an den Ort des Geschehens (bzw. des Verdächtigen?!) gebracht werden? Angesichts der föderalen Struktur der Polizeibehörden erscheint diese Annahme wirklichkeitsfremd. Wie sollte die Bundespolizei Landespolizeikräfte in den Einsatz bringen können? Oder umgekehrt? Woher sollten die zuständigen Polizeibehörden – in den meisten Ländern, wie auch bei der Bundespolizei bis zur Grenze der Funktionsfähigkeit kaputtgespart – die Kräfte hernehmen, um quasi jederzeit an jedem Ort einsetzbar zu sein?!

Geht es um Gefahrenabwehr oder um die Dokumentation strafbaren Verhaltens?

Oder geht es gar nicht um das Erkennen einer Gefahrensituation und um die schnelle Reagieren zur Gefahrenabwehr oder zumindest Schadensreduzierung. Das ist es ja, was der Bundesinnenminister mit seinem „…zeigt das System das an.“ suggeriert. Geht es nicht vielmehr darum, die Beweise zu dokumentieren für die Anwesenheit von Personen zum bestimmten Zeitpunkt an einem bestimmten Ort?! Die Möglichkeiten der technischen Umsetzung jedenfalls sprechen viel mehr für diese letzte Möglichkeit. Dann allerdings muss sich Herr de Maizière fragen lassen, ob es Absicht oder Inkompetenz ist, mit der er seine Vision von der Gesichtserkennung verbreitet.

Gibt es einsatzfertige Lösungen?

Vielleicht gibt es ja längst Systeme, die all diese technischen Herausforderungen meistern. Dachten wir uns und haben beim BMI nachgefragt:

„Handelt es sich um ein bestimmtes Produkt/Erkennungssystem, das hier eingeführt werden soll und, wenn ja, welches Produkt ist dies?

  1. Welche Vergleiche mit anderen Produkten mit vergleichbaren Leistungsmerkmalen liegen vor?
  2. Hat es bereits Praxistests in deutschen Sicherheitsbehörden gegeben?
  3. Wenn ja: Wie lange und in welchem Umfang und mit welchen Ergebnissen?“

Darauf antwortete die Sprecherin des BMI:
„Wir stehen Anfang des Diskussionsprozesses. Im Rahmen einer Projektgruppe zwischen BMI, DB AG, BPOL und BKA haben erste Gespräche stattgefunden. Zum konkreten Einsatz von Technik/Software können derzeit noch keine Angaben gemacht werden.“

Das Ergebnis

Der ganze Wirbel, den Bundesinnenminister de Maizière veranstaltet, diesmal unter dem Slogan von ‚Gesichtserkennungssoftware‘ ist Ausdruck seiner Schaufensterpolitik. Behauptungen, die beruhigend wirken sollen, Aktivität demonstrieren und die rechtliche Grenzen weiter verschieben – zu Lasten der Bürgerrechte. Ganz ähnlich war es mit dem Slogan „Ran an die Datentöpfe“ vor wenigen Monaten. [4]

Doch die markigen Slogans haben leider kein Abbild in der Realität. Was immer dieses Bundesinnenministerium – und seine untergeordneten Behörden – in den vergangenen Jahren an technischen Projekten angefasst hat, ist entweder völlig gescheitert, war uneffektiv, kam viel zu spät und war viel zu teuer. Das vernichtende Zeugnis, das der Bundesrechnungshof dem Bundesinnenministerium für sein Management von IT-Projekte ausstellte, dürfte in der Geschichte der Bundesrepublik bisher einmalig sein. Es heißt dort [3]: „Die Bundesregierung wird komplexe IT-Projekte … nur dann im zeitlichen und finanziellen Rahmen erfolgreich beenden, wenn sie ihre IT-Steuerung grundlegend verändert. Sie muss eigenes Know-How stärken, …“

Die Beispiele für völlig oder in wesentlichen Teilen gescheiterte Projekte des BMI sind ebenso zahl- wie folgenreich: Der BOS-Digitalfunk – um Jahre verspätet. Das polizeiliche Informationssystem Inpol-Neu. Ein komplettes Fiasko, das weitgehend unbemerkt von der Öffentlichkeit durch ein komplett anderes System (=Inpol-Neu-Neu) ersetzt wurde. Der Polizeiliche Informations- und Analyseverbund PIAV – um Jahre zu spät, mit großen Ankündigungen gestartet und in einer geradezu peinlichen Minimalversion in den „Probe-Wirkbetrieb“ gegangen. Aktuell spricht kein Offizieller mehr zitierfähig über den PIAV. Doch dieser und andere IT-Projekte des BMI haben mindestens dreistellige Millionenbeträge verschlungen.

Zugegeben: Das alles sind Projekte, bei denen der Bund in Person des Bundesinnenministerium mit den Ländern gemeinsam zu funktionierenden Lösungen kommen muss. Das allerdings würde auch gelten für die neueste Vision des Herrn de Maizière: Das Gesichtserkennungssystem. Was sollte den Bürger, der an mehr Sicherheit interessiert ist und was sollte den Steuerzahler überzeugen davon, dass ein solch anspruchsvolles Projekt besser klappt, als alle Versuche zuvor, die samt und sonders fehlgeschlagen sind???

Oder geht es um etwas ganz anderes?

… wie so oft bei Herrn de Maizière, der ja schon öfters Vorstöße geritten hat, die dann Jahre später vom Bundesverfassungsgericht wieder einkassiert wurden?! Denn Vieles spricht dafür, dass de Maizière hier ein System vor Augen hat, bei dem die Bundespolizei auf Flughäfen (Grenzpolizei!) und Bahnhöfen (Bahnpolizei!) ein Netz von Überwachungskameras betreibt, deren Aufnahmen abgeglichen werden mit den Millionen von Lichtbildern, die vertrauensvolle deutsche Bürger abgeliefert haben fürs Personalausweisregister. Auch dies wäre ein technisch sehr anspruchsvolles Projekt. Die Länder(polizeien) würden funktional dazu nicht unbedingt gebraucht. Der Bund jedoch erhielte auf diese Weise die Möglichkeit zur flächendeckenden Mobilitätskontrolle der Teile der Bevölkerung, die Bahnen und Flugzeuge nutzen. Eine Hypothese – zweifelsohne! Jedoch nicht völlig abwegig …

Fußnoten

[a]   Falls Sie sich gefragt haben, warum beim Fotografieren Ihrer letzten Passfotos für den neuen Personalausweis gar so exakte Vorgaben gemacht wurden, wie sie Ihr Gesicht zu halten haben, und dass Sie nicht lächeln sollen: Der Grund liegt darin, dass man ein ‚ideales‘ / normiertes Foto Ihres Gesichtes haben will. Das natürlich auch zur Erstellung / Errechnung eines Faceprints von Ihrem Gesicht verwendet werden kann.

[b]   Sollten Sie sich für die Einzelheiten im Gesetzestext interessieren, empfehlen wir die direkte Lektüre dort …

Quellen

[1]   ’Hier erklärt de Maizière wie er uns schützen will‘, 22.08.2016, [Interview mit der Bild am Sonntag], Bundesministerium des Innern
http://www.bmi.bund.de/SharedDocs/Interviews/DE/2016/08/interview-bams.html

[2]   ’How Facial Recognition Systems Work‘, by Kevin Bonsor & Ryan Johnson, heruntergeladen am 24.08.2016
http://electronics.howstuffworks.com/gadgets/high-tech-gadgets/facial-recognition.htm

[3]   ’Massive Kritik des Bundesrechnungshofs an IT-Projekten des Bundes‘, 23.10.2014, POLICE-IT
https://police-it.org/massive-kritik-des-rechnungshofs-an-it-projekten-des-bundes

[4]    ‚Fakten zum Informationsaustausch der Polizeien in Deutschland: Die aktuelle Situation ist ein Desaster‘, 19.06.2016, POLICE-IT
https://police-it.org/die-aktuelle-situation-ist-ein-desaster

Copyright

Sämtliche Urheber und Nutzungsrechte an diesem und anderen Artikeln dieser Serie liegen bei der CIVES Redaktionsbüro GmbH.
(C) 2016ff CIVES Redaktionsbüro GmbH

Schlagworte: , , , , , , , , , , , , ,

Schreibe einen Kommentar