Was ist Gesichtserkennung? KI für Big Brother

Kann Big Brother Ihr Gesicht anhand der Videoüberwachung auf Straßenebene identifizieren und feststellen, ob Sie glücklich, traurig oder wütend sind? Kann diese Identifizierung zu Ihrer Festnahme eines ausstehenden Haftbefehls führen? Wie hoch ist die Wahrscheinlichkeit, dass die Identifikation falsch ist und sich wirklich mit jemand anderem verbindet? Können Sie die Überwachung mit einem Trick vollständig besiegen?

Können Sie auf der anderen Seite in einen Tresor gelangen, der durch eine Kamera und eine Gesichtserkennungssoftware geschützt ist, indem Sie einen Ausdruck des Gesichts einer autorisierten Person hochhalten? Was ist, wenn Sie eine 3-D-Maske des Gesichts einer autorisierten Person aufsetzen?

Willkommen bei der Gesichtserkennung - und dem Spoofing der Gesichtserkennung.

Was ist Gesichtserkennung?

Die Gesichtserkennung ist eine Methode zur Identifizierung einer unbekannten Person oder zur Authentifizierung der Identität einer bestimmten Person anhand ihres Gesichts. Es ist ein Zweig der Computer Vision, aber die Gesichtserkennung ist spezialisiert und beinhaltet soziales Gepäck für einige Anwendungen sowie einige Schwachstellen für Spoofing.

Wie funktioniert die Gesichtserkennung?

Die frühen Gesichtserkennungsalgorithmen (die heute noch in verbesserter und automatisierterer Form verwendet werden) basieren auf biometrischen Daten (z. B. dem Abstand zwischen den Augen), um die gemessenen Gesichtsmerkmale aus einem zweidimensionalen Bild in eine Reihe von Zahlen (ein Merkmal) umzuwandeln Vektor oder Vorlage), die das Gesicht beschreibt. Der Erkennungsprozess vergleicht diese Vektoren dann mit einer Datenbank bekannter Gesichter, die auf die gleiche Weise auf Merkmale abgebildet wurden. Eine Komplikation bei diesem Prozess besteht darin, die Flächen an eine normalisierte Ansicht anzupassen, um die Drehung und Neigung des Kopfes zu berücksichtigen, bevor die Metriken extrahiert werden. Diese Klasse von Algorithmen wird als geometrisch bezeichnet .

Ein anderer Ansatz zur Gesichtserkennung besteht darin, 2D-Gesichtsbilder zu normalisieren und zu komprimieren und diese mit einer Datenbank ähnlich normalisierter und komprimierter Bilder zu vergleichen. Diese Klasse von Algorithmen wird als photometrisch bezeichnet .

Die dreidimensionale Gesichtserkennung verwendet 3D-Sensoren, um das Gesichtsbild zu erfassen, oder rekonstruiert das 3D-Bild von drei 2D-Tracking-Kameras, die auf verschiedene Winkel gerichtet sind. Die 3D-Gesichtserkennung kann erheblich genauer sein als die 2D-Erkennung.

Die Hauttexturanalyse ordnet die Linien, Muster und Flecken auf dem Gesicht einer Person einem anderen Merkmalsvektor zu. Durch Hinzufügen einer Hauttexturanalyse zur 2D- oder 3D-Gesichtserkennung kann die Erkennungsgenauigkeit um 20 bis 25 Prozent verbessert werden, insbesondere bei Doppelgängerinnen und Zwillingen. Sie können auch alle Methoden kombinieren und multispektrale Bilder (sichtbares Licht und Infrarot) hinzufügen, um noch mehr Genauigkeit zu erzielen.

Die Gesichtserkennung hat sich seit Beginn des Feldes im Jahr 1964 von Jahr zu Jahr verbessert. Im Durchschnitt hat sich die Fehlerquote alle zwei Jahre um die Hälfte verringert.

In Verbindung stehendes Video: Wie Gesichtserkennung funktioniert

Tests von Anbietern für Gesichtserkennung

NIST, das US-amerikanische National Institute of Standards and Technology, führt seit 2000 Tests von Gesichtserkennungsalgorithmen durch, den Face Recognition Vendor Test (FRVT). Bei den verwendeten Bilddatensätzen handelt es sich hauptsächlich um Fahndungsfotos von Strafverfolgungsbehörden, aber auch um In-the- wilde Standbilder, wie sie in Wikimedia zu finden sind, und Bilder mit niedriger Auflösung von Webcams.

Die FRVT-Algorithmen werden hauptsächlich von kommerziellen Anbietern eingereicht. Die Vergleiche im Jahresvergleich zeigen erhebliche Leistungs- und Genauigkeitsgewinne. Laut den Anbietern ist dies hauptsächlich auf die Verwendung von tiefen Faltungs-Neuronalen Netzen zurückzuführen.

Verwandte NIST-Gesichtserkennungstestprogramme haben demografische Effekte, die Erkennung von Gesichtsveränderungen, die Identifizierung von Gesichtern, die in sozialen Medien veröffentlicht wurden, und die Identifizierung von Gesichtern in Videos untersucht. Eine frühere Testreihe wurde in den 1990er Jahren unter einem anderen Namen, der Gesichtserkennungstechnologie (FERET), durchgeführt.

NIST

Gesichtserkennungsanwendungen

Gesichtserkennungsanwendungen fallen meist in drei Hauptkategorien: Sicherheit, Gesundheit und Marketing / Einzelhandel. Sicherheit umfasst die Strafverfolgung, und diese Klasse von Gesichtserkennungsanwendungen kann so harmlos sein, wie Personen schneller und genauer mit ihren Passfotos abzugleichen als Menschen, und so gruselig wie das Szenario „Person of Interest“, in dem Personen über CCTV verfolgt und verglichen werden zu gesammelten Fotodatenbanken. Die Sicherheit außerhalb der Strafverfolgung umfasst gängige Anwendungen wie das Entsperren von Gesichtern für Mobiltelefone und die Zugangskontrolle für Labors und Tresore.

Zu den gesundheitlichen Anwendungen der Gesichtserkennung gehören das Einchecken von Patienten, die Erkennung von Emotionen in Echtzeit, die Verfolgung von Patienten in einer Einrichtung, die Beurteilung des Schmerzniveaus bei nonverbalen Patienten, die Erkennung bestimmter Krankheiten und Zustände, die Identifizierung des Personals und die Sicherheit der Einrichtung. Marketing- und Einzelhandelsanwendungen der Gesichtserkennung umfassen die Identifizierung von Mitgliedern des Treueprogramms, die Identifizierung und Verfolgung bekannter Ladendiebe sowie das Erkennen von Personen und ihren Emotionen für gezielte Produktvorschläge.

Kontroversen, Vorurteile und Verbote bei der Gesichtserkennung

Zu sagen, dass einige dieser Anwendungen umstritten sind, wäre eine Untertreibung. Wie in einem Artikel der New York Times aus dem Jahr 2019 erläutert, hat die Gesichtserkennung kontrovers diskutiert, von der Verwendung für die Stadionüberwachung bis hin zu rassistischer Software.

Stadionüberwachung? Die Gesichtserkennung wurde beim Super Bowl 2001 verwendet: Die Software identifizierte 19 Personen, von denen angenommen wurde, dass sie Gegenstand ausstehender Haftbefehle sind, obwohl keine verhaftet wurden (nicht aus Mangel an Versuchen).

Rassistische Software? Es gab mehrere Probleme, angefangen mit der Gesichtsverfolgungssoftware von 2009, mit der Weiße, aber nicht Schwarze verfolgt werden konnten, und mit der MIT-Studie von 2015, die zeigte, dass die Gesichtserkennungssoftware der damaligen Zeit bei weißen männlichen Gesichtern viel besser funktionierte als bei weiblichen und / oder Schwarze Gesichter.

Diese Art von Problemen hat zu einem völligen Verbot von Gesichtserkennungssoftware an bestimmten Orten oder für bestimmte Zwecke geführt. Im Jahr 2019 war San Francisco die erste große amerikanische Stadt, die die Polizei und andere Strafverfolgungsbehörden daran hinderte, Gesichtserkennungssoftware zu verwenden. Microsoft forderte Bundesvorschriften zur Gesichtserkennung; und MIT zeigten, dass Amazon Rekognition mehr Probleme hatte, das weibliche Geschlecht als das männliche Geschlecht anhand von Gesichtsbildern zu bestimmen, sowie mehr Probleme mit dem schwarzen weiblichen Geschlecht als mit dem weißen weiblichen Geschlecht.

Im Juni 2020 gab Microsoft bekannt, dass es seine Gesichtserkennungssoftware nicht verkaufen wird und hat sie nicht an die Polizei verkauft. Amazon hat der Polizei ein Jahr lang verboten, Rekognition zu verwenden. und IBM gab seine Gesichtserkennungstechnologie auf. Das vollständige Verbot der Gesichtserkennung wird jedoch nicht einfach sein, da es in iPhones (Face ID) und anderen Geräten, Software und Technologien weit verbreitet ist.

Nicht jede Gesichtserkennungssoftware leidet unter denselben Vorurteilen. Die demografische Effektstudie NIST aus dem Jahr 2019 knüpfte an die MIT-Arbeit an und zeigte, dass die algorithmische demografische Verzerrung bei Entwicklern von Gesichtserkennungssoftware sehr unterschiedlich ist. Ja, es gibt demografische Auswirkungen auf die Rate falscher Übereinstimmungen und die Rate falscher Nichtübereinstimmungen bei Gesichtsidentifizierungsalgorithmen, diese können jedoch von Anbieter zu Anbieter um mehrere Größenordnungen variieren und sind im Laufe der Zeit zurückgegangen.

Hacking Gesichtserkennung und Anti-Spoofing-Techniken

Angesichts der potenziellen Bedrohung der Privatsphäre durch Gesichtserkennung und der Anziehungskraft, Zugang zu hochwertigen Ressourcen zu erhalten, die durch Gesichtsauthentifizierung geschützt sind, wurden viele Anstrengungen unternommen, um die Technologie zu hacken oder zu fälschen. Sie können ein gedrucktes Bild eines Gesichts anstelle eines lebenden Gesichts oder ein Bild auf einem Bildschirm oder eine 3D-gedruckte Maske präsentieren, um die Authentifizierung zu bestehen. Für die Videoüberwachung können Sie ein Video wiedergeben. Um eine Überwachung zu vermeiden, können Sie die Stoffe und das Make-up „CV Dazzle“ und / oder die IR-Lichtsender ausprobieren, um die Software zu täuschen, Ihr Gesicht nicht zu erkennen.

Natürlich gibt es Bemühungen, Anti-Spoofing-Techniken für all diese Angriffe zu entwickeln. Um gedruckte Bilder zu erkennen, verwenden Anbieter einen Lebendigkeitstest, z. B. das Warten auf das Blinken des Motivs, eine Bewegungsanalyse oder Infrarot, um ein lebendes Gesicht von einem gedruckten Bild zu unterscheiden. Ein anderer Ansatz ist die Durchführung einer Mikrotexturanalyse, da sich die menschliche Haut optisch von Drucken und Maskenmaterialien unterscheidet. Die neuesten Anti-Spoofing-Techniken basieren hauptsächlich auf tiefen Faltungs-Neuronalen Netzen.

Dies ist ein sich entwickelndes Feld. Es gibt einen Waffenkrieg zwischen Angreifern und Anti-Spoofing-Software sowie akademische Forschungen zur Wirksamkeit verschiedener Angriffs- und Verteidigungstechniken.

Anbieter von Gesichtserkennung

Laut der Electronic Frontier Foundation ist MorphoTrust, eine Tochtergesellschaft von Idemia (früher bekannt als OT-Morpho oder Safran), einer der größten Anbieter von Gesichtserkennung und anderen biometrischen Identifikationstechnologien in den USA. Es hat Systeme für staatliche DMVs, Strafverfolgungsbehörden von Bund und Ländern, Grenzkontrollen und Flughäfen (einschließlich TSA PreCheck) sowie das Außenministerium entwickelt. Andere gängige Anbieter sind 3M, Cognitec, DataWorks Plus, Dynamic Imaging Systems, FaceFirst und NEC Global.

Der NIST Face Recognition Vendor Test listet Algorithmen von vielen weiteren Anbietern aus der ganzen Welt auf. Es gibt auch mehrere Open-Source-Gesichtserkennungsalgorithmen unterschiedlicher Qualität und einige wichtige Cloud-Dienste, die Gesichtserkennung bieten.

Amazon Rekognition ist ein Bild- und Videoanalysedienst, der Objekte, Personen, Text, Szenen und Aktivitäten identifizieren kann, einschließlich Gesichtsanalyse und benutzerdefinierter Etiketten. Die Google Cloud Vision-API ist ein vorab trainierter Bildanalysedienst, mit dem Objekte und Gesichter erkannt, gedruckter und handgeschriebener Text gelesen und Metadaten in Ihren Bildkatalog integriert werden können. Mit Google AutoML Vision können Sie benutzerdefinierte Bildmodelle trainieren.

Die Azure Face-API erkennt Gesichter und Attribute in einem Bild, identifiziert Personen, die mit einer Person in Ihrem privaten Repository von bis zu 1 Million Personen übereinstimmen, und erkennt wahrgenommene Emotionen. Die Face-API kann in der Cloud oder am Rand in Containern ausgeführt werden.

Gesichtsdatensätze für das Erkennungstraining

Zum Herunterladen stehen Dutzende von Gesichtsdatensätzen zur Verfügung, die für das Erkennungstraining verwendet werden können. Nicht alle Gesichtsdatensätze sind gleich: Sie variieren in der Regel in Bildgröße, Anzahl der dargestellten Personen, Anzahl der Bilder pro Person, Bildbedingungen und Beleuchtung. Strafverfolgungsbehörden haben auch Zugriff auf nicht öffentliche Gesichtsdatensätze wie aktuelle Fahndungsfotos und Führerscheinbilder.

Einige der größeren Gesichtsdatenbanken sind beschriftete Gesichter in freier Wildbahn mit ~ 13.000 einzigartigen Personen. FERET, verwendet für die frühen NIST-Tests; die im laufenden NIST FRVT verwendete Mugshot-Datenbank; die SCFace-Überwachungskamera-Datenbank, die auch mit Gesichtspunkten verfügbar ist; und beschriftete Wikipedia-Gesichter mit ~ 1,5 KB eindeutigen Identitäten. Einige dieser Datenbanken enthalten mehrere Bilder pro Identität. Diese Liste des Forschers Ethan Meyers bietet einige überzeugende Ratschläge zur Auswahl eines Gesichtsdatensatzes für einen bestimmten Zweck.

Zusammenfassend lässt sich sagen, dass sich die Gesichtserkennung verbessert und die Anbieter lernen, die meisten Spoofings zu erkennen. Einige Anwendungen der Technologie sind jedoch umstritten. Die Fehlerrate für die Gesichtserkennung halbiert sich laut NIST alle zwei Jahre. Anbieter haben ihre Anti-Spoofing-Techniken durch die Integration von Faltungs-Neuronalen Netzen verbessert.

Inzwischen gibt es Initiativen, um die Verwendung der Gesichtserkennung bei der Überwachung zu verbieten, insbesondere durch die Polizei. Ein vollständiges Verbot der Gesichtserkennung wäre jedoch schwierig, da sie weit verbreitet ist.

Lesen Sie mehr über maschinelles Lernen und tiefes Lernen:

  • Deep Learning vs. Machine Learning: Verstehen Sie die Unterschiede
  • Was ist maschinelles Lernen? Aus Daten abgeleitete Intelligenz
  • Was ist tiefes Lernen? Algorithmen, die das menschliche Gehirn nachahmen
  • Algorithmen für maschinelles Lernen erklärt
  • Automatisiertes maschinelles Lernen oder AutoML erklärt
  • Betreutes Lernen erklärt
  • Halbüberwachtes Lernen erklärt
  • Unbeaufsichtigtes Lernen erklärt
  • Verstärkungslernen erklärt
  • Was ist Computer Vision? KI für Bilder und Videos
  • Was ist Gesichtserkennung? KI für Big Brother
  • Was ist die Verarbeitung natürlicher Sprache? KI für Sprache und Text
  • Kaggle: Wo Datenwissenschaftler lernen und konkurrieren
  • Was ist CUDA? Parallelverarbeitung für GPUs