ルックライクモデリングの裏側を見る

今日の速いペースのデジタル市場では、競合他社に先んじることが最重要課題です。つまり、メディアバイヤーとして、広告費を最大限に活用するために、ターゲティングを改善する方法を常に探し求めているのです。 

広告費を最適化するために、そっくりさんモデリングを利用したことがある方も多いのではないでしょうか。類似モデリングでは、ファーストパーティデータを使用して、コンバージョンやエンゲージメントの可能性が高い人々の拡張オーディエンスを作成することができます。しかし、類似モデリングがどのように機能するかを十分に理解していないと、この強力な機械学習ベースのツールの機能を十分に活用できていないかもしれません。 

Lookalikeモデリングとは?

機械学習技術の助けを借りて、「シードセット」と呼ばれる既存顧客のデータセットを取得し、これを使用して、同様の属性や行動を共有する潜在的な購入者の新しい大規模なオーディエンスを 作成することができます。

これらの属性や行動を共有することで、あなたの商品やサービスに興味を持つ可能性の高い、関連性の高い人々のプールを手に入れることができるのです。 

舞台裏:そっくりさんモデルの仕組み

そっくりさんモデリングの一般的な定義がわかったところで、今度は「その裏側」で何が行われているかを見ていきましょう。類似性モデリングの仕組みを理解することで、広告予算を最適化し、非効率な広告費を削減することができるようになります。 

各プログラマティック・プラットフォームは独自の方法を採用していますが、全体的に見ると、そっくりさんモデリングのプロセスに共通する要素がいくつかあります:

データ収集

理想的な顧客」のシードセットは、ファーストパーティデータを使用して作成されます。実際、プログラマティック・プラットフォームごとに、ネットワーク内の理想的な顧客を見つけるためにファーストパーティデータと照合できるデータポイントに制限があります。しかし、使用しないファーストパーティデータは、プレシード段階で、最も価値のある顧客を選別し、絞り込むために役立つことがあります。 

使用するシードセット・データは、キャンペーンの目的によって異なります。例えば、商品Aを購入する可能性が高い人をターゲットにしたキャンペーンのシードセットを構築するために使用するデータは、最近の購入、リピート購入、商品をカートに追加するアクションなど、商品Aに関連する行動や購入履歴情報でフィルタリングした顧客のリストで構成されるかもしれません。 

データ分析

あなたが注目する属性(および行動)は、そっくりさんオーディエンスの基礎を形成するため、あなたのキャンペーン目的に合った属性を持つオーディエンスを作成したいと思うでしょう。プログラマティック・プラットフォームは、機械学習アルゴリズムを含む多くの技術を使用して、シードセットのデータを分析し、これらの属性のパターンと類似性を特定します。

例えば、ブランドの認知度を高めることが目的であるとします。その場合、プラットフォームは、幅広いシードセットの興味、ソーシャルメディア行動、ブランドへの親和性に関連する属性や行動のパターンを特定するかもしれません。しかし、コンバージョンキャンペーンでは、購入履歴、オンラインショッピング行動、商品への親和性、プラットフォーム内でのコンバージョンのパターンがより良い予測因子となる可能性が高いでしょう。また、どちらの目的でも、特定の人口統計学的、地理的属性が関連する可能性があります。

また、類似モデルの分析に使用する属性を選択する際には、品質と規模のバランスを取る必要があります。属性が多ければ多いほど、より高度にターゲット化されたオーディエンスができることになりますが、その分、そっくりさんオーディエンスが小さくなってしまう可能性があります。 

ルッカライクモデル /オーディエンス作成

この段階で、プログラマティック・プラットフォームが使用するのは 機械学習技術 を使用して、そっくりさんモデルを構築し、トレーニングします。このモデルには、特定されたシード属性と行動が含まれており、これを使用して、同様の属性と行動を共有する人々からなるカスタムオーディエンスを作成することが可能です。

一度作成したそっくりさんモデルは、そのままでは使えません。プログラマティック・プラットフォームは、新しいデータや変数が発生したり追加されたりすると、それに基づいてルックライクモデルを改良し続けます。例えば、インフレの影響で顧客の価格意識が高まり、購買行動が変化した場合など、ターゲットオーディエンスの変化を反映するために、プラットフォームは独自の機械学習アルゴリズムを随時調整・修正することもあります。 

機械学習とそっくりさんモデリング

機械学習はそっくりさんモデリングのプロセスを推進し、あらゆるプログラマティック・プラットフォームは独自の機械学習アルゴリズムを持っています。 

そっくりさんモデリングでは、いくつかの種類の機械学習技法が一般的に使用されている。以下は、最も一般的な手法のいくつかを簡略化して説明したものである:

  • PU学習です: PU学習(positive-unlabeled learning)は、正の例とラベルのない例のみを含むデータで動作します。シードセットには、ポジティブな例(例えば、カートに商品を追加した顧客)が含まれています。PU学習は、これらのポジティブな例を使用して、プログラムプラットフォームのデータから、ポジティブな例に類似したラベルのない例を特定します。 
  • グラディエント・ブースティング・マシン(GBM):GBMは、決定木を用いて結果(例えば、料理が好きかどうか)を予測し、エラーを検出し、エラーを修正する新しい決定木を作成するという反復プロセスを用いて、ターゲット市場の属性を特定します。この決定木は通常、1つのルートノードから他のノードが分岐し、ユーザーは目的とデータセットに基づいて最大深度を設定する。 
  • ロジスティック回帰ロジスティック回帰は、視聴者の特性と希望する属性(購読更新)の間のパターンを特定することで、イベント(例えば、購読更新)の発生確率を予測する機械学習手法です。
  • ランダムフォレスト: ランダムフォレストとは、その名の通り、複数の決定木を用いて、顧客の特性(例えば、ある人がリンクをクリックするかどうかなど)に基づいた予測を行う手法です。そして、これらの決定木の総合的なコンセンサスを取って、最終的な予測を行います。
  • ニューラル・ネットワーク:人間の脳のように、ニューラルネットワークは、相互に接続されたノード(「ニューロン」)を使用して、顧客の特性(年齢、性別、場所など)からなる入力データに対して複雑な計算を実行します。その結果、これらの特性に基づいて、希望する属性(例えば、ソーシャルメディアへの投稿への関与)の可能性を予測する確率のスコアが生成されます。
  • サポートベクターマシン(SVM): SVMは、目的の属性(例えば、スポーツに興味がある)を持つ顧客とそうでない顧客を最もよく分ける境界線(超平面として知られている)を見つけることによって機能します。 
  • K-nearest Neighbors (KNN)です:KNNは、近接性を利用して予測を行います。k」は、ターゲット属性との距離(または類似度)に基づいて、予測に使用する最近傍の数を意味します(例えば、顧客がオンラインフォームに記入するかどうかなど)。 

そっくりさんモデリングの長所と短所

Lookalikeモデリングは、広告主にとっていくつかの利点があります:

  • は、限られたファーストパーティデータを拡張することができます
  • アドパフォーマンスの向上
  • 効率的なターゲティング
  • 費用対効果の高い顧客獲得
  • コンバージョンとリードジェネレーションの向上

しかし、その反面、短所もあります:

  • シードセットや機械学習アルゴリズムのデータに多様性がないため、バイアスがかかることがある。
  • は、質の高いスタティックシードセットデータが必要です。
  • 行動や嗜好の変化を捉えるためのリアルタイムのファーストパーティデータを組み込んでいない。
  • アンタッチャブルオーディエンスがわからない

そっくりさんモデリングのポテンシャルを引き出す

ルックライクモデリングの力を使えば、最も価値のある顧客と属性や行動が似ている潜在的な購入者のオーディエンスを構築でき、コンバージョンの可能性が高まります。 

また、ファーストパーティデータをShareThis データで充実させることで、lookalike modeling の欠点を改善することができます。当社の高度なデータサイエンス機能は、最新のベストインクラスの技術を使用してシードオーディエンスを充実させ、lookalikeモデリングに関してすべての違いを生み出します。 お問い合わせはこちら をご覧ください。 

についてShareThis

ShareThis は、2007年以来、ソーシャルシェア、インタレスト、インテントのデータを統合することで、グローバルなデジタル行動の力を引き出してきました。300万以上のグローバルドメインにおける消費者の行動をもとに、ShareThis は、実際のデジタルデスティネーションにおける実際の人々の行動をリアルタイムに観察しています。

ニュースレターを購読する

最新のニュース、ヒント、アップデートを入手する

登録

関連コンテンツ