Taller de la plataforma H2O
por Hassan Namarvar, científico principal de datos
El equipo de ingeniería en ShareThis se reunió el miércoles por un Hands-on H2O taller. Durante el taller, introduje el más rápido del mundo en la memoria de código abierto H2O plataforma de aprendizaje de máquinas y analítica predictiva. Esto era valioso porque el equipo ahora es capaz de:
1) Familiarícese con las características importantes de la H2O plataforma versus otras herramientas de aprendizaje de máquinas de código abierto.
2) Descargue la versión de borde sangrante de la plataforma, instálelo en su propia máquina local y utilice la plataforma web API para cargar un gran DataSet e investigar los datos.
3) construir un modelo CPA (costo por acción) utilizando el GLM (modelo lineal generalizado) en un DataSet real de la campaña ShareThis.
4) validar el modelo en el juego de prueba e interpretar los resultados.
5) construya modelos más avanzados tales como GBMS (modelos del alza del gradiente), los bosques aleatorios grandes de los datos y compare el funcionamiento de estos modelos usando el módulo de las cuentas del multi-modelado.
6) discutir los resultados superiores del modelo GLM exacto desplegado a la producción y a/B probado en una campaña real para los últimos dos meses.
En general, el equipo fue capaz de reproducir modelos altamente avanzados de optimización de anuncios en línea en menos de una hora! Sin usar el H2O plataforma todo el proceso end-to-end podría haber tardado meses incluso para un científico de datos inteligente.