モデル構築/再教育の自動化 @ShareThis H20プラットフォームを使用

プリンシパルエンジニア、Changyi Zhu博士

モデルの構築と再教育を自動化するために、ShareThis 、以下のようなH2O(バージョン2/h2o-2)Rest API(Java)のインターフェースが作成されています。

キャンペーンのパフォーマンスを向上させるためには、機械学習されたモデルを継続的に更新し、モデルが最新のデータを使用して微調整を行うことが不可欠です。これを行うためには、自動化されたパイプラインが必要です。私たちは、H20 ( http://http://h2o.ai/ ) モデルを構築するためのプラットフォームです。新しいモデルを構築するための素晴らしいUIを備えています。UIは新しいモデルを試すのにとても便利ですが、モデルのアルゴリズムが決定した後は、より最近のデータを使って再トレーニングを行い、それをプロダクションにプッシュすることは、より自動化(API駆動)されるべきです。 インフラの多くがJavaで構成されているので、それを容易にするインターフェースを構築したいと考えています。

イメージ


モデルビルダーの入力プロパティの準備

このインターフェースでは、デフォルトの入力プロパティ・ファイル(GBM または GLM モデル用)が提供されます。以下に示すJSONは、特定の(GBM)モデル用に変更することができます。

イメージ

イメージ


モデルの構築

以下に示すデフォルトのbashスクリプトを変更して、ビルドを実行することができます(GBMモデルの場合)。

#!/bin/bash
java $CLASSPATH com.sharethis.service.h2o.model.GBM bin/res/gbm.properties

モデル用のjarファイルはインターフェースによって生成され、最適化のためにアプリケーションによって動的に読み込まれます。RESTリクエストとレスポンスの両方がログファイルに保存され、モデル構築/再トレーニングプロセスを自動化するためのさらなる分析に利用されます。

RESTレスポンスを分析して、モデル構築/再トレーニングを行う

このログファイルは、java.util.Analyzerを使ってアナライザで読み込むことができます。プロパティや、キーと値のペアで保存されているRESTレスポンスには、以下のキーでアクセスできます。

public static final StringIMPORTFILERESPONSE
public static final StringPARSEFILERESPONSE
public static final StringMODELBUILDRESPONSE
public static final StringMODELPREDICTRESPONSE
public static final StringMODELINSPECTRESPONSE
public static final StringMODELCALCAUC_RESPONSE

レスポンスの値は、インターフェースに含まれるクラスを使用して、Javaオブジェクトのリストにデシリアライズすることができます。これらのレスポンスは、将来のプロジェクトの一部であるアナライザーによって、特定のモデルのモデル入力プロパティを調整するためのルールのセットを分析することができます。

についてShareThis

ShareThis は、2007年以来、ソーシャルシェア、インタレスト、インテントのデータを統合することで、グローバルなデジタル行動の力を引き出してきました。300万以上のグローバルドメインにおける消費者の行動をもとに、ShareThis は、実際のデジタルデスティネーションにおける実際の人々の行動をリアルタイムに観察しています。

ニュースレターを購読する

最新のニュース、ヒント、アップデートを入手する

登録

関連コンテンツ