Técnica de PNL: Mejorar las experiencias de los consumidores con el reconocimiento de entidades con nombre (NER)

Es un poco de un enigma. En la era digital actual, los datos hacen girar el mundo de los negocios, lo que significa que las empresas necesitan datos, muchos datos. Pero los datos en bruto son prácticamente inútiles. Para aprovechar al máximo los datos recopilados, se necesita un caja de herramientas llena de técnicas de procesamiento del lenguaje natural (PNL) para ayudarle a aprovechar el poder del aprendizaje automático y extraer las múltiples perspectivas que esconden sus datos.

Una de las herramientas de PLN más útiles es la técnica de reconocimiento de entidades con nombre (NER). A diferencia de otras técnicas de PLN más sencillas, el NER es un modelo de aprendizaje supervisado: Antes de poder utilizar un modelo NER, hay que entrenarlo primero con un conjunto de datos de categorías de entidades predefinidas. Este entrenamiento altamente personalizable es lo que confiere a NER su potencia, ya que usted predefine la información que desea extraer.

¿Qué es el reconocimiento de entidades con nombre (NER)?

El NER, también conocido como "entity chunking" o extracción de entidades, es una técnica de PNL que analiza los datos de texto para identificar y categorizar entidades con nombre predefinidas. El proceso extrae datos estructurados -las entidades- de los datos brutos. Estos datos estructurados pueden analizarse para obtener información y aplicarse en numerosos casos de uso empresarial.

¿Qué son las entidades con nombre?

Las entidades con nombre son las piezas fundamentales de información que se encuentran dentro de cada declaración o frase, como por ejemplo

  • Nombres
    • Gente
    • Organizaciones
    • Lugares
    • Productos
  • Unidades temporales
    • Fecha
    • Times
  • Números
    • Medidas 
    • Distancias
    • Dinero / Precios
    • Cantidades

Las entidades con nombre son la clave de la flexibilidad de un modelo NER: Como pueden ser lo que usted elija, tiene la posibilidad de entrenar su modelo para extraer la información exacta que necesita para su caso de uso particular. 

¿Cómo funciona el NER?

Piense en lo que ocurre cuando lee: A medida que tus ojos escudriñan las palabras, identificas automáticamente las entidades nombradas. Por ejemplo, cuando lees la frase "El 27 de octubre de 2022, Wendy dejó el País de Nunca Jamás para comenzar su nuevo puesto como directora general de Lost Boys Inc.", es probable que reconozcas las siguientes entidades con nombre:

  • Fecha: 27 de junio de 2022
  • Persona: Wendy
  • Ubicación: Neverland
  • Ocupación: CEO
  • Organización: Lost Boys Inc.

Las máquinas, en cambio, utilizan un lenguaje binario (0, 1). Y los 0 y 1 están muy lejos de la riqueza y profundidad del lenguaje humano. Dado que el lenguaje de las máquinas y el lenguaje humano son considerablemente diferentes, hay que utilizar el aprendizaje automático para entrenar primero el modelo NER. Para ello se utilizan conjuntos de datos predefinidos que contienen las categorías de entidades con nombre elegidas. Por ejemplo, en el escenario anterior se han predefinido las categorías de entidad fecha, persona, ubicación, ocupación y organización.

¿Cómo funciona el NER? Una vez entrenados, los modelos NER utilizan un proceso de dos pasos para imitar la forma en que los humanos leen. En primer lugar, el modelo identifica una entidad con nombre y, a continuación, la clasifica o categoriza.

Algunos sistemas NER utilizan vectores de palabras para mejorar la velocidad y la precisión. Los vectores de palabras representan las palabras como números, pero en lugar de limitarse a asignar a cada palabra un número, los vectores de palabras generan representaciones numéricas en formato decimal en una serie de dimensiones, como la frecuencia de aparición en diversos contextos. ¿El resultado? Las palabras similares tienen números estrechamente relacionados entre sí, lo que permite al modelo NER encontrar palabras similares con rapidez y precisión. 

He aquí un ejemplo extremadamente simplificado. Supongamos que trabaja con un conjunto de datos compuesto por reseñas de su tienda de muebles. Trabajando en una sola dimensión, el vector de palabras que su modelo preentrenado genera para "lámpara" es 0,223458993. Los vectores de palabras pueden ayudarle a encontrar palabras similares a "lámpara":

luz: 0,212835892

esconcejo: 0.212444586

araña: 0.199875213

Resolver el reto de la ambigüedad

Parte de la complejidad del lenguaje humano reside en el número de palabras que tienen múltiples significados. También conocidas como homónimas, para los humanos estas palabras no suelen ser ambiguas siempre que haya suficiente contexto para descifrar el significado correcto. 

Por ejemplo, sabemos lo que se quiere decir en cada una de las siguientes frases por el contexto:

El lanzador lanzó tres strikes seguidos.

Pidieron otra jarra de agua helada.

Sin embargo, las máquinas no son capaces de entender el contexto, por lo que el lenguaje ambiguo de este ejemplo supone un verdadero reto. Pero como los modelos NER son modelos de aprendizaje supervisado, lo que significa que deben ser entrenados primero antes de poder ser aplicados, se han desarrollado enfoques de aprendizaje automático que les ayudan a superar este reto. 

Se podría utilizar simplemente el NER para recoger y almacenar más datos estructurados en una base de datos. Pero la capacidad de NER para extraer datos estructurados a partir de datos brutos hace que sea útil en un gran número de casos de uso, entre ellos:

Función de búsqueda en el comercio electrónico. Una función de búsqueda precisa puede ser crucial para las ventas del comercio electrónico. Por ejemplo, un cliente que busca una "mesa de cóctel redonda blanca" no está buscando productos blancos, productos redondos, productos de cóctel o cualquier tipo de mesa. Una función de búsqueda con NER ofrecería los resultados correctos clasificando "blanco" como [color del producto], "redondo" como [forma del producto] y "mesa de cóctel" como [tipo de producto].

Atención al cliente. La existencia de múltiples departamentos, productos y sucursales puede suponer un gran reto para su equipo de atención al cliente. Sin embargo, antes de poder atender las reclamaciones, es necesario clasificar los correos electrónicos y los tickets de los clientes para determinar de qué ubicaciones, productos y departamentos se trata. NER puede hacer que el flujo de trabajo de su equipo sea más eficiente al categorizar entidades como [ubicación] y [producto], y enviar automáticamente las quejas y consultas clasificadas al miembro del equipo adecuado. 

Haga un seguimiento de los problemas recurrentes. Hoy en día, es tan probable que los clientes acudan a las redes sociales para presentar una queja como que lo hagan por correo electrónico o por teléfono. Las empresas, conscientes de esta tendencia, suelen crear un gestor de redes sociales específico para gestionar este tipo de reclamaciones. A continuación, se puede utilizar un modelo NER en este canal de redes sociales orientado a las quejas para clasificar los tweets o las publicaciones en datos que pueden utilizarse para detectar productos, lugares o incluso momentos clave del día que atraen las quejas recurrentes. 

Chatbots de soporte. Los chatbots ofrecen a las empresas una forma de resolver rápidamente los problemas más comunes. Puede utilizar NER para entrenar a su bot de asistencia para que resuelva eficazmente una serie de problemas típicos de asistencia utilizando un conjunto de datos de entrenamiento que contenga entidades relevantes para estos problemas dentro del contexto del chat. Basándose en la identificación y clasificación de estas entidades -por ejemplo, los números de serie de los productos o los códigos de los cupones-, el bot puede ofrecer una respuesta relevante o marcar el chat para su escalado. 

Segmentación de la audiencia. ShareThis aplica NER para filtrar sus datos hacia abajo extrayendo entidades de las páginas web que llevan su código Javascript, lo que le permite llegar a su público objetivo perfecto. Así, por ejemplo, al distinguir Apple (la empresa) de la manzana (la fruta), NER puede identificar el segmento de audiencia que tiene interés en los productos de Apple. 

Conclusión

Los datos en bruto que ha recogido no pueden utilizarse tal cual. Enriquezca sus datos con datos de un proveedor como ShareThis y aplique modelos NER para identificar, extraer y clasificar entidades importantes. Con el uso de la NER, puede transformar sus datos enriquecidos en una fuente inestimable de información que puede aplicarse a una gran variedad de casos de uso, y que le permitirá apoyar mejor los flujos de trabajo de sus equipos. 

Sobre ShareThis

ShareThis ha desbloqueado el poder del comportamiento digital global sintetizando los datos de participación social, interés e intención desde 2007. Gracias al comportamiento de los consumidores en más de tres millones de dominios globales, ShareThis observa las acciones en tiempo real de personas reales en destinos digitales reales.

Suscríbase a nuestro boletín de noticias

Recibe las últimas noticias, consejos y actualizaciones

Suscribirse

Contenido relacionado