模型構建/再培訓自動化@ ShareThis 使用 H20 平台

朱昌義博士,首席工程師

H2O(版本 2/h2o-2) 休息 API (Java) 介面(如下所示)已創建於 ShareThis 自動化模型構建和再培訓

為了提高市場活動性能,必須不斷刷新機器學習模型,以便模型使用最新數據進行微調。為此,我們需要一個自動化管道。我們使用 H20 ( H20 ) ( http://http://h2o.ai/ )構建模型的平臺。它有一個不錯的用戶介面來構建新的模型。UI 嘗試新模型非常方便,但一旦確定了模型演演演算法,重新訓練使用較新的數據並將其推送到生產中應更加自動化(API 驅動)。 由於更多的基礎結構位於 JAVA 上,因此我們希望構建一個介面,使其變得簡單。

影像


準備模型產生器輸入屬性

此介面提供了默認輸入屬性檔(對於 GBM 或 GLM 模型)。可以針對特定 (GBM) 模型修改下面顯示的分子。

影像

影像


編譯模型

可以修改下面顯示的預設 bash 腳本來運行生成(對於 GBM 模型)。

*!/bin/bash
java $CLASSPATH com. sharethis .service.h2o.model.GBM bin/res/gbm.屬性

模型的 jar 檔將由介面生成,並且可以由應用程式動態載入以進行優化。REST 要求與回應都儲存在紀錄檔中,以便進一步分析,以自動執行模型建構/重新訓練過程

分析模型建構/再培訓的 REST 回應

日誌檔可以由分析器使用 java.util 載入。屬性與 REST 回應 (儲存為鍵/ 值對) 可透過以下鍵存取:

公開靜態最終字串 IMPORT檔案回應
公開靜態最終字串 PARSE檔案回應
公開靜態最終字串模型生成回應
公開靜態最終字串模型預測回應
公開靜態最終字串模型INSPECT 回應
公開靜態最終字串模型CALCAUC_RESPONSE

可以使用介面中包含的類將回應值解序列化為 java 物件清單。然後,分析器可以分析這些回應(它是未來專案的一部分)來分析一組用於調整特定模型的模型輸入屬性的規則。

關於 ShareThis

ShareThis 自 2007 年以來,通過綜合社會共用、興趣和意圖數據,解鎖了全球數位行為的力量。受全球超過300萬個功能變數名稱的消費者行為推動, ShareThis 觀察真實人員在真實數位目的地上的即時操作。

訂閱我們的時事通訊

獲取最新消息、提示和更新

訂閱

相關內容