Ver sob o capuz da modelação por semelhança

No mercado digital actual de ritmo acelerado, manter-se à frente da concorrência é uma prioridade máxima. Isto significa que, como comprador de meios de comunicação, está sempre à procura de formas de melhorar a sua segmentação, para que possa tirar o máximo partido dos seus dólares publicitários. 

É provável que tenha usado modelos semelhantes para optimizar os seus gastos com anúncios. Com a modelagem semelhante, pode usar os seus dados de primeira pessoa para criar um público alargado de pessoas que têm mais probabilidade de se converter ou de se envolver. Mas sem uma compreensão completa de como funciona a modelação semelhante, pode não estar a aproveitar todas as capacidades desta poderosa ferramenta baseada na aprendizagem por máquina. 

O que é a Modelação Lookalike?

Com a ajuda de técnicas de aprendizagem de máquinas, a modelagem semelhante toma um conjunto de dados - referido como um "conjunto de sementes" - dos seus actuais clientes e utiliza-o para criar uma nova e maior audiência de potenciais compradores que partilham atributos e comportamentos semelhantes.

Estes atributos e comportamentos partilhados significam que tem agora um conjunto altamente relevante de pessoas que têm mais probabilidades de estar interessadas nos seus produtos ou serviços. 

Bastidores: Como funciona a modelação semelhante

Agora que conhecemos a definição geral de modelagem semelhante, é altura de olhar para o que se passa "debaixo do capô". Ao compreender como funciona a modelagem semelhante, estará mais apto a optimizar o seu orçamento de publicidade e a reduzir os gastos ineficientes com publicidade. 

Embora cada plataforma programática tenha os seus próprios métodos, há uma série de elementos comuns ao processo de modelação semelhante em geral:

Recolha de dados

O seu conjunto de sementes "clientes ideais" é construído utilizando dados de primeira mão. Muito provavelmente não precisará de incluir todos ou mesmo a maioria dos seus dados de primeira parte para criar o seu conjunto de sementes, cada plataforma programática tem diferentes limitações quanto aos pontos de dados que podem corresponder aos seus dados de primeira parte para encontrar clientes ideais na sua rede. Mas quaisquer dados de primeira parte que não utilize ainda podem ser úteis durante a fase de pré-sementeira, para filtrar e afiar quem são os seus clientes mais valiosos. 

Os dados do conjunto de sementes que utilizarão dependerão dos objectivos da sua campanha. Por exemplo, os dados utilizados para construir um conjunto de sementes para uma campanha dirigida às pessoas mais susceptíveis de comprar o Produto A podem consistir numa lista de clientes filtrada por informações comportamentais ou do histórico de compras relacionadas com o Produto A, tais como compras recentes, compras repetidas, e a acção de adicionar o produto aos seus carrinhos. 

Análise de dados

Uma vez que os atributos (e comportamentos) em que escolhe concentrar-se constituirão a base do seu público semelhante, desejará criar audiências com atributos que se ajustem bem aos seus objectivos de campanha. As plataformas programáticas utilizarão então uma série de técnicas, incluindo algoritmos de aprendizagem de máquinas, para ajudar a analisar os dados do seu conjunto de sementes e identificar padrões e semelhanças nestes atributos.

Por exemplo, suponha que o seu objectivo é aumentar o conhecimento da marca. Nesse caso, a plataforma poderá identificar padrões em atributos e comportamentos relacionados com os interesses do seu conjunto de sementes mais amplo, comportamento das redes sociais e afinidade com a marca. No entanto, para uma campanha de conversão, os padrões no histórico de compras, comportamento de compras online, afinidade de produtos, e conversões na plataforma seriam muito provavelmente melhores preditores. E com ambos os objectivos, certos atributos demográficos e geográficos poderiam ser relevantes.

Também precisará de equilibrar qualidade versus escala ao escolher os atributos que deseja analisar e utilizar para o seu modelo semelhante. Mais atributos significarão um público mais direccionado, mas provavelmente acabará com um público semelhante que é muito menor. 

Criação de Modelo/Audience Lookalike

Nesta fase, a plataforma programática utiliza técnicas de aprendizagem de máquinas para construir e treinar o modelo similar. Este modelo inclui os atributos e comportamentos de sementes identificados que podem depois ser utilizados para criar um público personalizado de pessoas que partilham atributos e comportamentos semelhantes.

Uma vez criado, o seu modelo similar não é definido em pedra. Em vez disso, a plataforma programática continuará a aperfeiçoá-lo, com base em quaisquer novos dados ou variáveis que surjam ou sejam adicionados. A plataforma pode também ajustar ou modificar de tempos a tempos os seus algoritmos proprietários de aprendizagem da máquina para reflectir quaisquer mudanças no público-alvo - por exemplo, a inflação pode significar que os clientes se tornam mais conscientes dos preços, causando uma mudança no seu comportamento de compra. 

Aprendizagem mecânica e modelação semelhante

A aprendizagem de máquinas impulsiona o processo de modelação da semelhança, e cada plataforma programática tem os seus próprios algoritmos de aprendizagem de máquinas. 

Vários tipos de técnicas de aprendizagem de máquinas são comummente utilizados na modelação de modelos semelhantes. A seguir apresentam-se explicações simplificadas de algumas das técnicas mais populares:

  • PU Aprendizagem: A aprendizagem PU (aprendizagem sem rótulo positivo) funciona com dados que contêm apenas exemplos positivos e exemplos sem rótulo. O seu conjunto de sementes contém exemplos positivos (por exemplo, clientes que adicionam artigos ao seu carrinho de compras). A aprendizagem PU utiliza estes exemplos positivos para identificar exemplos não rotulados nos dados da plataforma programática que são semelhantes aos exemplos positivos. 
  • Máquinas de Reforço de Gradiente (GBMs): Utilizando um processo iterativo, as GBMs identificam atributos do mercado alvo utilizando árvores de decisão para prever resultados (por exemplo, se uma pessoa gosta de cozinhar), detectar erros, e criar novas árvores de decisão que corrijam esses erros. Estas árvores de decisão têm tipicamente um único nó de raiz do qual outros nós se ramificam, e o utilizador estabelece uma profundidade máxima, com base nos objectivos e no conjunto de dados. 
  • Regressão logística: A regressão logística é uma técnica de aprendizagem automática que prevê a probabilidade da ocorrência de um evento (por exemplo, a renovação de uma assinatura) através da identificação de padrões entre as características do público e o atributo desejado (a renovação da assinatura).
  • Florestas Aleatórias: Como o seu nome indica, a técnica das florestas aleatórias utiliza várias árvores de decisão para fazer previsões baseadas nas características dos clientes (por exemplo, se alguém vai clicar num link). É então necessário o consenso geral destas árvores de decisão para formar uma previsão final.
  • Redes Neuronais: Tal como o cérebro humano, as redes neurais utilizam nós interligados ("neurónios") para realizar cálculos complexos sobre os dados de entrada que consistem nas características dos clientes (ou seja, idade, sexo, localização). O resultado é uma pontuação de probabilidade que prevê a probabilidade do atributo desejado (por exemplo, o envolvimento num posto de comunicação social) com base nestas características.
  • Máquinas Vectoriais de Apoio (SVMs): As SVMs funcionam ao encontrar o limite (conhecido como hiperplano) que melhor separa os clientes conhecidos por exibirem o atributo desejado (por exemplo, um interesse pelo desporto) daqueles que não o fazem. 
  • K-nearest Neighbors (KNN): A KNN utiliza a proximidade para fazer previsões. O "k" refere-se ao número de vizinhos mais próximos, com base na sua distância (ou similaridade) ao atributo alvo, utilizado para fazer a previsão (por exemplo, se um cliente irá preencher um formulário online). 

Prós e Contras da Modelação Lookalike

A modelação lookalike oferece aos anunciantes vários profissionais:

  • pode expandir dados limitados de primeira parte
  • melhor desempenho dos anúncios
  • focalização eficiente
  • aquisição rentável de clientes
  • melhor conversão e geração de chumbo

No entanto, do lado oposto, estão os contras:

  • a falta de diversidade nos dados do conjunto de sementes e dos algoritmos de aprendizagem de máquinas pode levar a enviesamentos
  • requer um conjunto de dados estáticos de sementes de qualidade
  • não incorpora dados de primeira parte em tempo real para captar alterações comportamentais ou de preferências
  • não consegue identificar audiências inexploradas

Tirar partido do Potencial da Modelação Lookalike

Com o poder de modelagem semelhante, pode construir uma audiência de potenciais compradores que partilham atributos e comportamentos semelhantes aos seus clientes mais valiosos - aumentando a probabilidade de conversões. 

Também pode melhorar as vantagens de uma modelagem semelhante enriquecendo os seus dados de primeira pessoa com ShareThis data. As nossas capacidades avançadas de ciência de dados utilizam as mais recentes técnicas da melhor qualidade para enriquecer o seu público de sementes, fazendo toda a diferença quando se trata de modelagem similar. Entre em contacto connosco para saber mais. 

Sobre ShareThis

ShareThis has unlocked the power of global digital behavior by synthesizing social share, interest, and intent data since 2007. Impulsionado pelo comportamento do consumidor em mais de três milhões de domínios globais, ShareThis observa acções em tempo real de pessoas reais em destinos digitais reais.

Subscreva a nossa Newsletter

Receba as últimas notícias, dicas e actualizações

Assine

Conteúdo relacionado