哈桑·納瑪律瓦爾,首席數據科學家
專案團隊在 ShareThis 週三見面, 動手 H2O 車間。在研討會期間,我介紹了世界上最快的記憶體開源H2用於機器學習和預測分析的 O 平臺。這是有價值的,因為團隊現在能夠:
1) 熟悉 H 的重要功能2O 平臺與其他開源機器學習工具相比。
2) 下載平臺的出血邊緣版本,將其安裝在自己的本地電腦上,並使用平臺 Web API 上傳大型數據集並調查數據。
3) 使用 GLM(通用線性模型)在 ShareThis 市場活動的真實數據集。
4) 驗證測試集上的模型並解釋結果。
5) 構建更高級的模型,如 GBM(梯度提升模型)、大數據隨機林,並使用多建模分數模組比較這些模型的性能。
6) 討論部署到生產和過去兩個月實際市場活動中測試的精確光和/B模型的卓越結果。
總體而言,該團隊能夠在不到一小時的時間內重新生成高度先進的在線廣告優化模型!不要使用 H2對於一位精明的數據科學家來說,整個端到端流程可能需要幾個月時間。