Construcción de modelos/automatización de reentrenamiento @ ShareThis uso de la plataforma H20

Construcción de modelos/automatización de reentrenamiento @ ShareThis uso de la plataforma H20

Por 1 de junio, 2017Ingeniería

Dr. Changyi Zhu, ingeniero principal

Se ha creado ShareThis una interfaz de API de REST (Java) H2O (versión 2/H2O-2), como se muestra a continuación, para automatizar la construcción de modelos y el readiestramiento

Con el fin de mejorar el rendimiento de la campaña, es imperativo actualizar continuamente los modelos aprendidos de la máquina para que los modelos utilicen datos recientes para la afinación fina. Para ello, necesitamos una tubería automatizada. Usamos H20 ( http://http://h2o.ai/ ) plataforma para construir modelos. Tiene una interfaz de usuario agradable para construir nuevos modelos. La interfaz de usuario es muy útil para experimentar con nuevos modelos, pero una vez que un algoritmo de modelo se ha decidido, reentrenamiento con datos más recientes y empujarlo a la producción debe ser mucho más automatizado (API impulsado).  Puesto que más de la infraestructura está en Java, queremos construir una interfaz que lo haga fácil.

Imagen


Preparar propiedades de entrada de Model Builder

Esta interfaz proporciona un archivo de propiedad de entrada predeterminado (para el modelo GBM o GLM). Los JSONS que se muestran a continuación se pueden modificar para un modelo específico (GBM).

Imagen

Imagen


Construir el modelo

UN guión de Bash predeterminado que se muestra a continuación se puede modificar para ejecutar la compilación (para un modelo GBM).

#!/bin/bash
java $classpath com. ShareThis . Service. H2O. modelo. GBM bin/res/GBM. Properties

UN archivo jar para el modelo será generado por la interfaz y puede ser cargado por una aplicación dinámicamente para optimización. Tanto la solicitud de reposo como la respuesta se guardan en un archivo de registro para análisis adicionales para automatizar el proceso de construcción/readiestramiento del modelo

Analizar la respuesta del resto para la construcción de modelos/reentrenamiento

El archivo de registro puede ser cargado por un analizador utilizando Java. util. Las propiedades y las respuestas REST, que se guardan como pares clave/valor, se pueden obtener mediante las siguientes claves:

respuesta dearchivode importación de cadena final estática pública
público estático final String analizar respuesta dearchivo
respuesta decompilacióndel modelo de cadena final estática pública
público estático final String modelopredecirrespuesta
público estático modelo de cadenafinal inspeccionar respuesta
público estático final String modeloCalcAUC_RESPONSE

Los valores de respuesta se pueden deserializar en una lista de objetos Java utilizando las clases incluidas en la interfaz. Estas respuestas pueden ser analizadas entonces por un analizador, que es parte de un proyecto futuro, para un conjunto dado de reglas para afinar las propiedades de entrada del modelo para un modelo específico.

Sobre ShareThis

ShareThis ha desbloqueado el poder del comportamiento digital global sintetizando los datos de participación social, interés e intención desde 2007. Gracias al comportamiento de los consumidores en más de tres millones de dominios globales, ShareThis observa las acciones en tiempo real de personas reales en destinos digitales reales.

Suscríbase a nuestro boletín de noticias

Recibe las últimas noticias, consejos y actualizaciones

Suscribirse

Contenido relacionado