Optimisation de la publicité d'affichage en ligne avec H2O
par Hassan Namarvar, principal scientifique des données
Nous avons tenu une rencontre de science des données (comme une série de SF Data Mining rencontres) à ShareThis siège social à Palo Alto le 9 décembre 2014. J'ai présenté notre travail d'équipe sur l'optimisation de l'affichage publicitaire en ligne. Dans le domaine de l'affichage publicitaire en ligne, le but ultime est de fournir une publicité optimale et pertinente à un utilisateur en ligne afin de l'inciter à prendre une mesure telle que l'achat d'un produit ou l'inscription à un service. Cela nécessite d'estimer la probabilité de conversion pour un utilisateur, un contenu, un annonceur, un emplacement, un appareil donné, etc. L'estimation de la conversion est une tâche extrêmement difficile car les événements de conversion sont rares et la dimension des données est énorme. Dans cet exposé, j'ai présenté comment, à ShareThisNous nous sommes attaqués au problème de l'estimation de la conversion. Plus précisément, j'ai décrit comment nous avons construit les modèles CPA en tirant parti ShareThis réseaux sociaux et Ad échangent des ensembles de données et appliquent les algorithmes d'apprentissage machine de pointe tels que GLM, GBM et Random Forest fournis par le Plate-forme H2O. J'ai présenté quelques résultats de campagnes publicitaires en direct à la production pour montrer l'efficacité de notre approche. Pour plus de détails, vous pouvez regarder la vidéo et le deck suivants à partir d'hier parler