Rückblick: Google Cloud AI beleuchtet maschinelles Lernen

Google verfügt über einen der größten Stacks für maschinelles Lernen in der Branche und konzentriert sich derzeit auf seine Google Cloud AI- und Machine Learning-Plattform. Google hat TensorFlow vor Jahren als Open Source herausgebracht, aber TensorFlow ist immer noch das ausgereifteste und am häufigsten zitierte Deep-Learning-Framework. Ebenso hat Google Kubernetes vor Jahren als Open Source ausgegliedert, aber es ist immer noch das dominierende Container-Management-System.

Google ist eine der wichtigsten Quellen für Tools und Infrastrukturen für Entwickler, Datenwissenschaftler und Experten für maschinelles Lernen. In der Vergangenheit war Google AI jedoch für Geschäftsanalysten ohne ernsthaften Hintergrund in den Bereichen Datenwissenschaft oder Programmierung nicht besonders attraktiv. Das beginnt sich zu ändern.

Die Google Cloud-Plattform für KI und maschinelles Lernen enthält KI-Bausteine, die KI-Plattform und Beschleuniger sowie KI-Lösungen. Die KI-Lösungen sind ziemlich neu und richten sich eher an Unternehmensmanager als an Datenwissenschaftler. Sie können die Beratung durch Google oder seine Partner umfassen.

Die KI-Bausteine, die vorab trainiert, aber anpassbar sind, können ohne genaue Programmier- oder Datenwissenskenntnisse verwendet werden. Trotzdem werden sie häufig von erfahrenen Datenwissenschaftlern aus pragmatischen Gründen verwendet, um Dinge ohne umfangreiches Modelltraining zu erledigen.

Die KI-Plattform und die Beschleuniger sind im Allgemeinen für ernsthafte Datenwissenschaftler gedacht und erfordern Codierungskenntnisse, Kenntnisse der Datenaufbereitungstechniken und viel Schulungszeit. Ich empfehle, erst dorthin zu gehen, nachdem Sie die entsprechenden Bausteine ​​ausprobiert haben.

In den AI-Angeboten von Google Cloud fehlen noch einige Links, insbesondere bei der Datenaufbereitung. Das, was Google Cloud einem Datenimport- und -konditionierungsdienst am nächsten kommt, ist der Cloud-Dataprep von Trifacta von Drittanbietern. Ich habe es vor einem Jahr versucht und war überwältigt. Das in Cloud AutoML Tables integrierte Feature-Engineering ist jedoch vielversprechend, und es wäre nützlich, diese Art von Service für andere Szenarien verfügbar zu haben.

Die nahtlose Unterseite der KI hat mit Ethik und Verantwortung (oder deren Fehlen) zu tun, zusammen mit anhaltenden Modellverzerrungen (häufig aufgrund voreingenommener Daten, die für das Training verwendet werden). Google hat seine KI-Prinzipien im Jahr 2018 veröffentlicht. Es ist in Arbeit, aber es ist eine Grundlage für die Anleitung, wie in einem kürzlich veröffentlichten Blog-Beitrag zu verantwortungsbewusster KI erläutert.

Es gibt viel Wettbewerb auf dem KI-Markt (über ein Dutzend Anbieter) und viel Wettbewerb auf dem öffentlichen Cloud-Markt (über ein halbes Dutzend glaubwürdiger Anbieter). Um den Vergleichen gerecht zu werden, müsste ich einen Artikel schreiben, der mindestens fünfmal so lang ist wie dieser. So sehr ich es hasse, sie wegzulassen, muss ich die meisten Produktvergleiche weglassen. Für den offensichtlichsten Vergleich kann ich zusammenfassen: AWS macht das meiste, was Google macht, und ist auch sehr gut, berechnet aber im Allgemeinen höhere Preise.

Google Cloud AI-Bausteine

Google Cloud AI-Bausteine ​​sind benutzerfreundliche Komponenten, die Sie in Ihre eigenen Anwendungen integrieren können, um Sicht, Sprache, Konversation und strukturierte Daten hinzuzufügen. Viele der KI-Bausteine ​​sind vorab trainierte neuronale Netze, können jedoch durch Transferlernen und Suche nach neuronalen Netzen angepasst werden, wenn sie nicht sofort Ihren Anforderungen entsprechen. AutoML-Tabellen sind insofern etwas anders, als sie den Prozess automatisieren, den ein Datenwissenschaftler verwenden würde, um das beste Modell für maschinelles Lernen für einen tabellarischen Datensatz zu finden.

AutoML

Die AutoML-Dienste von Google Cloud bieten angepasste tiefe neuronale Netze für die Übersetzung von Sprachpaaren, die Textklassifizierung, Objekterkennung, Bildklassifizierung sowie die Klassifizierung und Verfolgung von Videoobjekten. Sie benötigen markierte Daten für das Training, erfordern jedoch keine wesentlichen Kenntnisse in Bezug auf Deep Learning, Transfer Learning oder Programmierung.

Google Cloud AutoML passt die kampferprobten, hochgenauen tiefen neuronalen Netze von Google an Ihre getaggten Daten an. Anstatt beim Training von Modellen aus Ihren Daten von vorne zu beginnen, implementiert AutoML das automatische Deep-Transfer-Lernen (dh es beginnt mit einem vorhandenen tiefen neuronalen Netzwerk, das auf anderen Daten trainiert wurde) und die Suche nach neuronalen Architekturen (dh es findet die richtige Kombination zusätzlicher Netzwerkebenen) ) für die Übersetzung von Sprachpaaren und die anderen oben aufgeführten Dienste.

In jedem Bereich verfügt Google bereits über einen oder mehrere vorab geschulte Dienste, die auf tiefen neuronalen Netzen und riesigen Mengen gekennzeichneter Daten basieren. Diese funktionieren möglicherweise unverändert für Ihre Daten, und Sie sollten dies testen, um Zeit und Geld zu sparen. Wenn sie nicht das tun, was Sie benötigen, können Sie mit Google Cloud AutoML ein Modell erstellen, das dies tut, ohne dass Sie wissen müssen, wie man Transferlernen durchführt oder neuronale Netze entwirft.

Transferlernen bietet zwei große Vorteile gegenüber dem Training eines neuronalen Netzwerks von Grund auf. Erstens werden für das Training viel weniger Daten benötigt, da die meisten Schichten des Netzwerks bereits gut trainiert sind. Zweitens trainiert es viel schneller, da nur die letzten Schichten optimiert werden.

Während die Google Cloud AutoML-Dienste früher zusammen als Paket präsentiert wurden, werden sie jetzt mit ihren vorab geschulten Basisdiensten aufgelistet. Was die meisten anderen Unternehmen als AutoML bezeichnen, wird von Google Cloud AutoML Tables ausgeführt.

Lesen Sie den vollständigen Test von Google Cloud AutoML

AutoML-Tabellen

Der übliche datenwissenschaftliche Prozess für viele Regressions- und Klassifizierungsprobleme besteht darin, eine Datentabelle für das Training zu erstellen, die Daten zu bereinigen und zu konditionieren, Feature-Engineering durchzuführen und zu versuchen, alle geeigneten Modelle auf der transformierten Tabelle zu trainieren, einschließlich eines Optimierungsschritts die Hyperparameter der besten Modelle. Google Cloud AutoML-Tabellen können diesen gesamten Vorgang automatisch ausführen, sobald Sie das Zielfeld manuell identifiziert haben.

AutoML-Tabellen durchsuchen automatisch den Modellzoo von Google nach strukturierten Daten, um das beste Modell für Ihre Anforderungen zu finden. Dies reicht von linearen / logistischen Regressionsmodellen für einfachere Datensätze bis hin zu erweiterten Suchmethoden für Tiefen, Ensembles und Architekturen für größere, komplexere. Es automatisiert das Feature-Engineering für eine Vielzahl von tabellarischen Datenprimitiven - wie Zahlen, Klassen, Zeichenfolgen, Zeitstempeln und Listen - und hilft Ihnen, fehlende Werte, Ausreißer und andere häufig auftretende Datenprobleme zu erkennen und zu beheben.

Die codelose Oberfläche führt Sie durch den gesamten Lebenszyklus des maschinellen Lernens, sodass jeder in Ihrem Team problemlos Modelle erstellen und diese zuverlässig in breitere Anwendungen integrieren kann. AutoML-Tabellen bieten umfangreiche Funktionen zur Erklärung von Eingabedaten und Modellverhalten sowie Leitplanken, um häufige Fehler zu vermeiden. AutoML-Tabellen sind auch in API- und Notebook-Umgebungen verfügbar.

AutoML-Tabellen konkurrieren mit Driverless AI und mehreren anderen AutoML-Implementierungen und Frameworks.

Vision API

Die Google Cloud Vision-API ist ein vorab geschulter maschineller Lerndienst zum Kategorisieren von Bildern und Extrahieren verschiedener Funktionen. Es kann Bilder in Tausende von vorab trainierten Kategorien klassifizieren, die von generischen Objekten und Tieren im Bild (wie einer Katze) über allgemeine Bedingungen (z. B. Dämmerung) bis hin zu bestimmten Sehenswürdigkeiten (Eiffelturm, Grand Canyon) reichen. und identifizieren allgemeine Eigenschaften des Bildes, wie seine dominanten Farben. Es kann Bereiche isolieren, die Gesichter sind, und dann geometrische (Gesichtsausrichtung und Orientierungspunkte) und emotionale Analysen auf die Gesichter anwenden, obwohl Gesichter nicht als zu bestimmten Personen gehörend erkannt werden, außer für Prominente (für die eine spezielle Nutzungslizenz erforderlich ist). Die Vision API verwendet OCR, um Text in Bildern in mehr als 50 Sprachen und verschiedenen Dateitypen zu erkennen. Es kann auch Produktlogos identifizieren und Erwachsene erkennen,gewalttätige und medizinische Inhalte.

Lesen Sie den vollständigen Test der APIs für maschinelles Lernen in Google Cloud

Video Intelligence API

Die Google Cloud Video Intelligence-API erkennt automatisch mehr als 20.000 Objekte, Orte und Aktionen in gespeicherten und gestreamten Videos. Es unterscheidet auch Szenenänderungen und extrahiert umfangreiche Metadaten auf Video-, Aufnahme- oder Bildebene. Es führt zusätzlich die Texterkennung und -extraktion mithilfe von OCR durch, erkennt explizite Inhalte, automatisiert Untertitel und Untertitel, erkennt Logos und erkennt Gesichter, Personen und Posen.

Google empfiehlt die Video Intelligence-API zum Extrahieren von Metadaten zum Indizieren, Organisieren und Durchsuchen Ihrer Videoinhalte. Es kann Videos transkribieren und Untertitel generieren sowie unangemessene Inhalte kennzeichnen und filtern - alles kostengünstiger als menschliche Transkriptoren. Zu den Anwendungsfällen gehören Inhaltsmoderation, Inhaltsempfehlungen, Medienarchive und kontextbezogene Werbung.

API für natürliche Sprache

Die Verarbeitung natürlicher Sprache (NLP) ist ein wichtiger Bestandteil der „geheimen Sauce“, mit der Eingaben in die Google-Suche und in den Google-Assistenten gut funktionieren. Die Google Cloud Natural Language API stellt Ihren Programmen dieselbe Technologie zur Verfügung. Es kann eine Syntaxanalyse (siehe Abbildung unten), Entitätsextraktion, Stimmungsanalyse und Inhaltsklassifizierung in 10 Sprachen durchführen. Sie können die Sprache angeben, wenn Sie sie kennen. Andernfalls versucht die API, die Sprache automatisch zu erkennen. Eine separate API, die derzeit auf Anfrage für den frühzeitigen Zugriff verfügbar ist, ist auf Inhalte im Gesundheitswesen spezialisiert.

Lesen Sie den vollständigen Test der APIs für maschinelles Lernen in Google Cloud

Übersetzung

Die Google Cloud Translation API kann über hundert Sprachpaare übersetzen, die Ausgangssprache automatisch erkennen, wenn Sie sie nicht angeben, und es gibt drei Varianten: Basic, Advanced und Media Translation. Die Advanced Translation API unterstützt ein Glossar, eine Stapelübersetzung und die Verwendung benutzerdefinierter Modelle. Die Basic Translation API wird im Wesentlichen von der Google Translate-Benutzeroberfläche verwendet. Mit AutoML Translation können Sie benutzerdefinierte Modelle mithilfe von Transferlernen trainieren.

Die Media Translation API übersetzt Inhalte direkt aus Audio (Sprache), entweder Audiodateien oder Streams, in 12 Sprachen und generiert automatisch Interpunktion. Es gibt separate Modelle für Video- und Telefonanruf-Audio.

Lesen Sie den vollständigen Test der APIs für maschinelles Lernen in Google Cloud