看相似建模的幕後花絮

在當今快節奏的數字市場中,保持競爭優勢是重中之重。這意味著,作為媒體買家,您一直在尋找改善定位的方法,以便充分利用廣告收入。 

很有可能,您已經使用類似建模來優化廣告支出。借助類似建模,您可以使用第一方數據創建更多更有可能轉化或互動的使用者受眾。但是,如果不完全瞭解相似建模的工作原理,您可能無法利用這個強大的基於機器學習的工具的全部功能。 

什麼是相似建模?

在機器學習技術的説明下, 類似建模 獲取現有客戶的數據集(稱為“種子集”),並利用該數據集創建具有相似屬性和行為的更大的新潛在買家受眾。

這些共用的屬性和行為意味著您現在擁有一群高度相關的人群,他們更有可能對您的產品或服務感興趣。 

幕後花絮:相似建模的工作原理

現在我們知道了相似建模的一般定義,是時候看看“引擎蓋下”發生了什麼了。通過了解類似建模的工作原理,您將能夠更好地優化廣告預算並減少低效的廣告支出。 

雖然每個程式設計平臺都有自己的方法,但總體上相似建模過程有許多共同的元素:

數據採集

您的「理想客戶」種子集是使用第一方數據構建的。您很可能不需要包含全部甚至大部分第一方數據來創建種子集 — 事實上,每個程式化平臺對於可以與您的第一方數據匹配哪些數據點以在其網路中找到理想客戶方面都有不同的限制。但是,您不使用的任何第一方數據在種子前階段仍然很有用,可以過濾和磨練誰是最有價值的客戶。 

您使用的種子集數據將取決於您的廣告系列目標。例如,用於為定位最有可能購買產品 A 的使用者的廣告系列構建種子集的數據可能包含按與產品 A 相關的行為或購買歷史記錄資訊(例如最近購買、重複購買以及將產品添加到購物車的操作)篩選的客戶清單。 

數據分析

由於您選擇重點關注的屬性(和行為)將構成類似受眾的基礎,因此您需要創建具有非常適合廣告系列目標的屬性的受眾。然後,程式化平臺將使用多種技術(包括機器學習演算法)來説明分析種子集數據,並確定這些屬性中的模式和相似性。

例如,假設您的目標是提高品牌知名度。在這種情況下,平臺可能會識別與更廣泛的種子集的興趣、社交媒體行為和品牌親和力相關的屬性和行為模式。但是,對於轉化廣告系列,購買歷史記錄、在線購物行為、產品親和力和平臺內轉化中的模式很可能是更好的預測指標。對於這兩個目標,某些人口和地理屬性可能是相關的。

在選擇要分析和用於相似模型的屬性時,還需要平衡品質與比例。更多的屬性意味著目標受眾的定位度越高,但您最終可能會得到一個規模小得多的類似受眾。 

相似 模型/受眾創建

在此階段,程式化平臺使用 機器學習技術 以構建和訓練相似模型。此模型包括已識別的種子屬性和行為,然後可用於創建具有相似屬性和行為的使用者的自定義受眾。

創建后,您的相似模型不會一成不變。相反,程式化平臺將根據出現或添加的任何新數據或變數繼續對其進行優化。該平臺還可能不時調整或修改其專有的機器學習演算法,以反映目標受眾的任何變化——例如,通貨膨脹可能意味著客戶變得更加註重價格,從而導致其購買行為的轉變。 

機器學習和相似建模

機器學習推動了相似建模過程,每個程式化平臺都有自己專有的機器學習演算法。 

相似建模中常用幾種類型的機器學習技術。以下是一些最流行技術的簡化說明:

  • PU 學習: PU 學習(正-未標記學習)處理僅包含正示例和未標記示例的數據。您的種子集包含正面範例(例如,將商品添加到購物車的客戶)。PU 學習使用這些正面示例來識別程式化平台數據中與正面示例相似的未標記示例。 
  • 梯度提升機 (GBM):GBM 使用反覆運算過程,通過使用決策樹來預測結果(例如,一個人是否喜歡做飯)、檢測錯誤並創建新的決策樹來糾正這些錯誤,從而識別目標市場屬性。這些決策樹通常具有單個根節點,其他節點從該根節點分支出來,用戶根據目標和數據集設置最大深度。 
  • 邏輯回歸:邏輯回歸是一種機器學習技術,它通過識別受眾特徵和所需屬性(訂閱續訂)之間的模式來預測事件發生(例如,續訂訂閱)的概率。
  • 隨機森林: 顧名思義,隨機森林技術使用多個決策樹根據客戶的特徵(例如,某人是否會點擊連結)進行預測。然後,需要這些決策樹的總體共識來形成最終預測。
  • 神經網路:就像人腦一樣,神經網路使用互連的節點(“神經元”)對由客戶特徵(即年齡、性別、位置)組成的輸入數據執行複雜的計算。結果是一個概率分數,該分數根據這些特徵預測所需屬性(例如,參與社交媒體帖子)的可能性。
  • 支援向量機: SVM 的工作原理是找到邊界(稱為超平面),該邊界最能區分已知表現出所需屬性(例如,對體育的興趣)的客戶和未表現出所需屬性的客戶。 
  • K 最近鄰 (KNN):KNN 使用鄰近性進行預測。“k”是指最近鄰居的數量,基於它們與目標屬性的距離(或相似性),用於進行預測(例如,客戶是否會填寫在線表單)。 

相似建模的優缺點

類似建模為廣告主提供了幾個優點:

  • 可以擴展有限的第一方數據
  • 改善廣告效果
  • 高效定位
  • 具有成本效益的客戶獲取
  • 更好的轉化和潛在客戶生成

然而,另一方面,缺點是:

  • 種子集和機器學習演算法數據缺乏多樣性可能導致偏差
  • 需要高品質的靜態種子集數據
  • 不合併即時第一方數據來捕獲行為或偏好變化
  • 無法識別未開發的受眾

挖掘相似建模的潛力

借助類似建模的強大功能,您可以建立與最有價值的客戶具有相似屬性和行為的潛在買家受眾,從而提高轉化的可能性。 

您還可以通過以下方式豐富您的第一方數據來改善相似建模的缺點 ShareThis 數據。我們先進的數據科學功能使用最新的一流技術來豐富您的種子受眾,在相似建模方面發揮重要作用。 與我們聯繫 以瞭解更多資訊。 

About ShareThis

ShareThis has unlocked the power of global digital behavior by synthesizing social share, interest, and intent data since 2007. Powered by consumer behavior on over three million global domains, ShareThis observes real-time actions from real people on real digital destinations.

Subscribe to our Newsletter

Get the latest news, tips, and updates

Subscribe

Related Content