Mira bajo el capó de los modelos de semejanza

En el vertiginoso mercado digital actual, mantenerse por delante de la competencia es una prioridad absoluta. Esto significa que, como comprador de medios, siempre estás buscando formas de mejorar tu segmentación para sacar el máximo partido a tu inversión publicitaria. 

Lo más probable es que haya utilizado el modelado de similitudes para optimizar su gasto publicitario. Con el modelado de semejanza, puede utilizar sus datos de origen para crear una audiencia ampliada de personas con más probabilidades de convertir o interactuar. Pero si no comprende bien cómo funciona el modelado por semejanza, es posible que no aproveche todas las posibilidades de esta potente herramienta basada en el aprendizaje automático. 

¿Qué es el modelado por semejanza?

Con la ayuda de técnicas de aprendizaje automático, el modelado de semejanza toma un conjunto de datos -denominado "conjunto semilla"- de sus clientes actuales y lo utiliza para crear un público nuevo y más amplio de compradores potenciales que comparten atributos y comportamientos similares.

Estos atributos y comportamientos compartidos significan que ahora dispone de un grupo de personas muy relevantes que tienen más probabilidades de estar interesadas en sus productos o servicios. 

Entre bastidores: cómo funciona el modelaje por semejanza

Ahora que ya conocemos la definición general del modelado de semejanza, es hora de ver qué ocurre "bajo el capó". Al comprender cómo funciona el modelado por semejanza, podrá optimizar mejor su presupuesto publicitario y reducir el gasto publicitario ineficiente. 

Aunque cada plataforma programática tendrá sus propios métodos, hay una serie de elementos comunes al proceso general de modelado de semejanza:

Recogida de datos

Su conjunto de semillas de "clientes ideales" se construye utilizando datos de origen. Lo más probable es que no tenga que incluir todos o incluso la mayoría de sus datos de origen para crear su conjunto de semillas, de hecho, cada plataforma programática tiene diferentes limitaciones sobre qué puntos de datos pueden coincidir con sus datos de origen para encontrar clientes ideales en su red. Sin embargo, los datos de origen que no utilice pueden seguir siendo útiles durante la fase de preselección, para filtrar y perfeccionar quiénes son sus clientes más valiosos. 

Los datos del conjunto de semillas que utilice dependerán de los objetivos de su campaña. Por ejemplo, los datos utilizados para crear un conjunto de semillas para una campaña dirigida a las personas con más probabilidades de comprar el producto A podrían consistir en una lista de clientes filtrados por información de comportamiento o historial de compra relacionada con el producto A, como compras recientes, compras repetidas y la acción de añadir el producto a sus carritos. 

Análisis de datos

Dado que los atributos (y comportamientos) en los que decida centrarse formarán la base de su audiencia similar, querrá crear audiencias con atributos que se ajusten bien a los objetivos de su campaña. A continuación, las plataformas programáticas utilizarán una serie de técnicas, incluidos algoritmos de aprendizaje automático, para ayudar a analizar los datos de su conjunto de semillas e identificar patrones y similitudes en estos atributos.

Por ejemplo, supongamos que su objetivo es dar a conocer la marca. En ese caso, la plataforma podría identificar patrones de atributos y comportamientos relacionados con los intereses, el comportamiento en las redes sociales y la afinidad con la marca de su conjunto de semillas más amplio. Para una campaña de conversión, sin embargo, los patrones en el historial de compras, el comportamiento de compra en línea, la afinidad con el producto y las conversiones en la plataforma serían probablemente mejores predictores. Y con ambos objetivos, ciertos atributos demográficos y geográficos podrían ser relevantes.

También tendrá que sopesar la calidad frente a la escala a la hora de elegir los atributos que desea analizar y utilizar para su modelo de similitud. Un mayor número de atributos se traducirá en un público más específico, pero lo más probable es que acabe teniendo un público similar mucho más reducido. 

Creación de modelos/audiencias similares

En esta fase, la plataforma programática utiliza técnicas de aprendizaje automático para construir y entrenar el modelo de semejanza. Este modelo incluye los atributos y comportamientos semilla identificados que luego pueden utilizarse para crear una audiencia personalizada de personas que comparten atributos y comportamientos similares.

Una vez creado, el modelo de semejanza no es inamovible. Por el contrario, la plataforma programática seguirá perfeccionándolo en función de los nuevos datos o variables que surjan o se añadan. La plataforma también puede ajustar o modificar sus propios algoritmos de aprendizaje automático de vez en cuando para reflejar cualquier cambio en el público objetivo; por ejemplo, la inflación puede significar que los clientes se vuelvan más conscientes de los precios, provocando un cambio en su comportamiento de compra. 

Aprendizaje automático y modelos de semejanza

El aprendizaje automático impulsa el proceso de modelado de semejanza, y cada plataforma programática tiene sus propios algoritmos de aprendizaje automático. 

En el modelado por semejanza se suelen utilizar varios tipos de técnicas de aprendizaje automático. A continuación se ofrecen explicaciones simplificadas de algunas de las técnicas más populares:

  • Aprendizaje PU: El aprendizaje PU (aprendizaje positivo no etiquetado) funciona con datos que contienen sólo ejemplos positivos y ejemplos no etiquetados. Su conjunto de semillas contiene ejemplos positivos (por ejemplo, clientes que añaden artículos a su cesta). El aprendizaje PU utiliza estos ejemplos positivos para identificar ejemplos no etiquetados en los datos de la plataforma programática que son similares a los ejemplos positivos. 
  • Máquinas de aumento gradual (GBM): Mediante un proceso iterativo, las GBM identifican los atributos del mercado objetivo utilizando árboles de decisión para predecir resultados (por ejemplo, si a una persona le gusta cocinar), detectar errores y crear nuevos árboles de decisión que los corrijan. Estos árboles de decisión suelen tener un único nodo raíz a partir del cual se ramifican otros nodos, y el usuario establece una profundidad máxima, en función de los objetivos y el conjunto de datos. 
  • Regresión logística: La regresión logística es una técnica de aprendizaje automático que predice la probabilidad de que se produzca un evento (por ejemplo, la renovación de una suscripción) mediante la identificación de patrones entre las características de la audiencia y el atributo deseado (la renovación de la suscripción).
  • Bosques aleatorios: Como su nombre indica, la técnica de los bosques aleatorios utiliza varios árboles de decisión para hacer predicciones basadas en las características de los clientes (por ejemplo, si alguien hará clic en un enlace). A continuación, toma el consenso global de estos árboles de decisión para formar una predicción final.
  • Redes neuronales: Al igual que el cerebro humano, las redes neuronales utilizan nodos interconectados ("neuronas") para realizar cálculos complejos a partir de datos de entrada consistentes en características de los clientes (es decir, edad, sexo, ubicación). El resultado es una puntuación de probabilidad que predice la probabilidad del atributo deseado (por ejemplo, la participación en una publicación en las redes sociales) en función de estas características.
  • Máquinas de vectores soporte (SVM): Las SVM funcionan encontrando el límite (conocido como hiperplano) que mejor separa a los clientes que muestran el atributo deseado (por ejemplo, interés por los deportes) de los que no. 
  • K-Nearest Neighbors (KNN): KNN utiliza la proximidad para hacer predicciones. La "k" se refiere al número de vecinos más cercanos, en función de su distancia (o similitud) con el atributo objetivo, que se utilizan para hacer la predicción (por ejemplo, si un cliente rellenará un formulario en línea). 

Ventajas e inconvenientes de los modelos similares

El modelado por semejanza ofrece varias ventajas a los anunciantes:

  • puede ampliar los datos limitados de origen
  • mejora del rendimiento de los anuncios
  • selección eficaz
  • captación rentable de clientes
  • mejor conversión y generación de clientes potenciales

En el lado opuesto, sin embargo, están los contras:

  • la falta de diversidad en los datos del conjunto de semillas y de los algoritmos de aprendizaje automático puede dar lugar a sesgos
  • requiere un conjunto de datos de semillas estáticas de calidad
  • no incorpora datos de primera mano en tiempo real para captar cambios de comportamiento o preferencias
  • no puede identificar audiencias sin explotar

Aproveche el potencial de los modelos de semejanza

Con el poder del modelado de semejanza, puede crear una audiencia de compradores potenciales que compartan atributos y comportamientos similares a sus clientes más valiosos, aumentando la probabilidad de conversiones. 

También puede mejorar las contras del modelado de semejanza enriqueciendo sus datos de origen con datos de ShareThis. Nuestras capacidades avanzadas de ciencia de datos utilizan las mejores técnicas de su clase para enriquecer su audiencia de semillas, marcando la diferencia cuando se trata de modelos de semejanza. Póngase en contacto con nosotros para saber más. 

Sobre ShareThis

ShareThis ha desbloqueado el poder del comportamiento digital global sintetizando los datos de participación social, interés e intención desde 2007. Gracias al comportamiento de los consumidores en más de tres millones de dominios globales, ShareThis observa las acciones en tiempo real de personas reales en destinos digitales reales.

Suscríbase a nuestro boletín de noticias

Recibe las últimas noticias, consejos y actualizaciones

Suscribirse

Contenido relacionado