H2O Plattform Workshop
von Hassan Namarvar, Hauptdatenwissenschaftlerin.
Das Ingenieurteam von ShareThis traf sich am Mittwoch zu einer praktischen H2O Werkstatt. Während des Workshops stellte ich das schnellste In-Memory-Open-Source-H der Welt vor.2O-Plattform für maschinelles Lernen und prädiktive Analytik. Das war wertvoll, denn das Team ist nun in der Lage:
1) Machen Sie sich mit den wichtigsten Funktionen des H vertraut.2O-Plattform im Vergleich zu anderen Open-Source-Maschinenlern-Tools.
2) Laden Sie die neueste Version der Plattform herunter, installieren Sie sie auf ihrem eigenen lokalen Rechner und verwenden Sie die Plattform-Web-API, um einen großen Datensatz hochzuladen und Daten zu untersuchen.
3) Erstellen Sie ein CPA-Modell (Kosten pro Aktion) unter Verwendung des GLM (generalisiertes lineares Modell) auf dem realen Datensatz einer ShareThis Kampagne.
4) Validierung des Modells am Testset und Interpretation der Ergebnisse.
5) Bauen Sie fortgeschrittenere Modelle wie GBMs (Gradient Boost Models), Big Data Random Forests und vergleichen Sie die Leistung dieser Modelle mit dem Multi-Modeling Scores Modul.
6) Besprechen Sie die überragenden Ergebnisse des genauen GLM-Modells, das in der Produktion eingesetzt wird, und der A/B-Tests, die in den letzten zwei Monaten an einer tatsächlichen Kampagne durchgeführt wurden.
Insgesamt konnte das Team in weniger als einer Stunde hochmoderne Optimierungsmodelle für Online-Werbung nachbauen! Ohne die Verwendung des H2O-Plattform hätte der gesamte End-to-End-Prozess selbst für einen versierten Datenwissenschaftler Monate dauern können.