模型構建/再培訓自動化@ ShareThis 使用 H20 平台
朱昌義博士,首席工程師
H2O(版本 2/h2o-2) 休息 API (Java) 介面(如下所示)已創建於 ShareThis 自動化模型構建和再培訓
為了提高市場活動性能,必須不斷刷新機器學習模型,以便模型使用最新數據進行微調。為此,我們需要一個自動化管道。我們使用 H20 ( H20 ) ( http://http://h2o.ai/ )構建模型的平臺。它有一個不錯的用戶介面來構建新的模型。UI 嘗試新模型非常方便,但一旦確定了模型演演演算法,重新訓練使用較新的數據並將其推送到生產中應更加自動化(API 驅動)。 由於更多的基礎結構位於 JAVA 上,因此我們希望構建一個介面,使其變得簡單。
準備模型產生器輸入屬性
此介面提供了默認輸入屬性檔(對於 GBM 或 GLM 模型)。可以針對特定 (GBM) 模型修改下面顯示的分子。
編譯模型
可以修改下面顯示的預設 bash 腳本來運行生成(對於 GBM 模型)。
*!/bin/bash
java $CLASSPATH com. sharethis .service.h2o.model.GBM bin/res/gbm.屬性
模型的 jar 檔將由介面生成,並且可以由應用程式動態載入以進行優化。REST 要求與回應都儲存在紀錄檔中,以便進一步分析,以自動執行模型建構/重新訓練過程
分析模型建構/再培訓的 REST 回應
日誌檔可以由分析器使用 java.util 載入。屬性與 REST 回應 (儲存為鍵/ 值對) 可透過以下鍵存取:
公開靜態最終字串 IMPORT檔案回應
公開靜態最終字串 PARSE檔案回應
公開靜態最終字串模型生成回應
公開靜態最終字串模型預測回應
公開靜態最終字串模型INSPECT 回應
公開靜態最終字串模型CALCAUC_RESPONSE
可以使用介面中包含的類將回應值解序列化為 java 物件清單。然後,分析器可以分析這些回應(它是未來專案的一部分)來分析一組用於調整特定模型的模型輸入屬性的規則。