Construcción de modelos/automatización de reentrenamiento @ ShareThis uso de la plataforma H20
Dr. Changyi Zhu, ingeniero principal
Se ha creado ShareThis una interfaz de API de REST (Java) H2O (versión 2/H2O-2), como se muestra a continuación, para automatizar la construcción de modelos y el readiestramiento
Con el fin de mejorar el rendimiento de la campaña, es imperativo actualizar continuamente los modelos aprendidos de la máquina para que los modelos utilicen datos recientes para la afinación fina. Para ello, necesitamos una tubería automatizada. Usamos H20 ( http://http://h2o.ai/ ) plataforma para construir modelos. Tiene una interfaz de usuario agradable para construir nuevos modelos. La interfaz de usuario es muy útil para experimentar con nuevos modelos, pero una vez que un algoritmo de modelo se ha decidido, reentrenamiento con datos más recientes y empujarlo a la producción debe ser mucho más automatizado (API impulsado). Puesto que más de la infraestructura está en Java, queremos construir una interfaz que lo haga fácil.
Preparar propiedades de entrada de Model Builder
Esta interfaz proporciona un archivo de propiedad de entrada predeterminado (para el modelo GBM o GLM). Los JSONS que se muestran a continuación se pueden modificar para un modelo específico (GBM).
Construir el modelo
UN guión de Bash predeterminado que se muestra a continuación se puede modificar para ejecutar la compilación (para un modelo GBM).
#!/bin/bash
java $classpath com. ShareThis . Service. H2O. modelo. GBM bin/res/GBM. Properties
UN archivo jar para el modelo será generado por la interfaz y puede ser cargado por una aplicación dinámicamente para optimización. Tanto la solicitud de reposo como la respuesta se guardan en un archivo de registro para análisis adicionales para automatizar el proceso de construcción/readiestramiento del modelo
Analizar la respuesta del resto para la construcción de modelos/reentrenamiento
El archivo de registro puede ser cargado por un analizador utilizando Java. util. Las propiedades y las respuestas REST, que se guardan como pares clave/valor, se pueden obtener mediante las siguientes claves:
respuesta dearchivode importación de cadena final estática pública
público estático final String analizar respuesta dearchivo
respuesta decompilacióndel modelo de cadena final estática pública
público estático final String modelopredecirrespuesta
público estático modelo de cadenafinal inspeccionar respuesta
público estático final String modeloCalcAUC_RESPONSE
Los valores de respuesta se pueden deserializar en una lista de objetos Java utilizando las clases incluidas en la interfaz. Estas respuestas pueden ser analizadas entonces por un analizador, que es parte de un proyecto futuro, para un conjunto dado de reglas para afinar las propiedades de entrada del modelo para un modelo específico.