Die wahre Geschichte, wie Big-Data-Analysen Obama zum Sieg verhalfen

Sie haben vielleicht gehört, wie der statistische Assistent Nate Silver bei den Präsidentschaftswahlen 2012 die Wahlstimmen für jeden Staat vorhergesagt hat, was zeigt, dass die Datenerfassung von Rohdaten viel zuverlässiger ist als die traditionelle Panditerie. Was Sie wahrscheinlich noch nicht gehört haben, ist, wie die Obama-Kampagne ein 100-köpfiges Analytics-Team aufgebaut hat, um Dutzende Terabyte an Daten mit einer Kombination aus der HP Vertica MPP-Analysedatenbank (Massively Parallel Processing) und Vorhersagemodellen mit R und Stata zu verarbeiten Wettbewerbsvorteile erzielen.

Der Big-Data-Ansatz wird von Obama-Kampagnenmanager Jim Messina gewürdigt, der sich entschlossen hat, kopfüber in eine analyseorientierte Kampagne einzusteigen. Messina kommentierte: "Wir wollten Daten über alles verlangen, wir wollten alles messen ... wir wollten ein Analyseteam in uns aufnehmen, um uns die ganze Zeit zu untersuchen, um sicherzustellen, dass wir klug sind." Um sicherzustellen, dass alles gemessen wurde, wurden die Mitarbeiter dahingehend bewertet, ob sie Daten eingegeben haben. Das Mantra lautete: "Wenn Sie die Daten nicht eingegeben haben, haben Sie die Arbeit nicht erledigt."

[Laden Sie Big Data Analytics Deep Dive herunter, um einen umfassenden, praktischen Überblick über dieses boomende Feld zu erhalten. | Nutzen Sie die Leistungsfähigkeit von Hadoop mit den 7 Top-Tools zur Zähmung von Big Data. ]]

Stiefel auf dem Boden

Von den 100 Analytics-Mitarbeitern arbeiteten 50 in einer speziellen Analytics-Abteilung, 20 Analysten waren auf die verschiedenen Hauptquartiere der Kampagne verteilt, und weitere 30 waren vor Ort, um die Daten zu interpretieren.

Chris Wegrzyn, Direktor für Datenarchitektur im Democratic National Committee, beschrieb die Herausforderungen, Chancen und Wege für die Erstellung der analytikgesteuerten Kampagne. Wegrzyn bemerkte, dass sich die Schlüsselmessungen auf die Daten selbst, die Modellierung und das Experimentieren konzentrierten. Die Kerndaten enthielten die Fakten über die Wählerschaft und den Wahlkampfbetrieb. Modellierung wurde verwendet, um die Wählerschaft auf der Ebene der einzelnen Wähler zu verstehen. Schließlich half die Auswertung der Ergebnisse von Experimenten der Kampagne zu erfahren, wie ihre Aktionen die Menschen tatsächlich beeinflussten.

Der wichtigste Leistungsindikator für die Kampagne war natürlich die Zahl derer, die Obama wählen wollten, geteilt durch diejenigen, die insgesamt abstimmen wollten. Die Kampagne verstand, dass es drei Hebel gab, um diese Zahl zu maximieren: Registrierung, Überzeugung und Wahlbeteiligung. Sie mussten ihre Zielgruppe der Wähler ermutigen, sich zu registrieren, die Unentschlossenen davon zu überzeugen, für Obama zu stimmen, und dann alles tun, um sicherzustellen, dass die Obama-Wähler am Wahltag zur Abstimmung erscheinen.

Marschieren der Truppen

In der Vergangenheit hatten alle diese Abteilungen ausgefeilte Analysetechnologien verwendet, ihre individuellen Analyseansätze jedoch unabhängig voneinander implementiert. Die Kampagne 2012 hat all das geändert.

Die richtigen Personen und Mandate waren wichtig, um eine einheitliche Analyseumgebung zu verwirklichen. Das Executive Buy-In des Kampagnenmanagers Messina war von wesentlicher Bedeutung. Ohne diese Autorität wäre jede ehrgeizige Initiative möglicherweise umgangen oder ganz eingestellt worden. Darüber hinaus verfügte das Kernteam über umfassende Analyseerfahrung aus früheren Kampagnen - und hochtalentierte Analysemitarbeiter, die weit unter dem Marktpreis eingestellt wurden.