C'est un peu une énigme. À l'ère du numérique, les données font tourner le monde des affaires, ce qui signifie que les entreprises ont besoin de données - beaucoup, beaucoup de données. Mais les données à l'état brut sont pratiquement inutiles. Pour exploiter pleinement les données que vous avez collectées, vous avez besoin d'un système de gestion des données. boîte à outils remplie de techniques de traitement du langage naturel (NLP) pour vous aider à exploiter la puissance de l'apprentissage automatique et à extraire les multiples informations qui se cachent dans vos données.
La technique de reconnaissance des entités nommées (NER) est l'un des outils les plus utiles de la PNL. Contrairement à d'autres techniques NLP plus simples, la NER est un modèle d'apprentissage supervisé : Avant de pouvoir utiliser un modèle NER, vous devez d'abord l'entraîner avec un ensemble de données de catégories d'entités prédéfinies. Cette formation hautement personnalisable est ce qui donne à NER sa puissance, car vous prédéfinissez les informations que vous voulez extraire.
Qu'est-ce que la reconnaissance des entités nommées (NER) ?
Le NER, également appelé "entity chunking" ou "entity extraction", est une technique de traitement automatique des langues qui analyse les données textuelles afin d'identifier et de catégoriser des entités nommées prédéfinies. Le processus extrait les données structurées - les entités - des données brutes. Ces données structurées peuvent ensuite être analysées pour en tirer des enseignements et être appliquées dans de nombreux cas d'utilisation commerciale.
Que sont les entités nommées ?
Les entités nommées sont les éléments d'information fondamentaux que l'on trouve dans chaque déclaration ou phrase, par exemple :
- Noms
- Personnes
- Organisations
- Places
- Produits
- Unités temporelles
- Date
- Times
- Numéros
- Mesures
- Distances
- Argent / Prix
- Quantités
Les entités nommées sont la clé de la flexibilité d'un modèle NER : Parce qu'elles peuvent être n'importe lesquelles, vous avez la possibilité d'entraîner votre modèle à extraire les informations exactes dont vous avez besoin pour votre cas d'utilisation particulier.
Comment fonctionne le NER ?
Considérez ce qui se passe lorsque vous lisez : Lorsque vos yeux parcourent les mots, vous identifiez automatiquement toute entité nommée. Par exemple, lorsque vous lisez la phrase "Le 27 octobre 2022, Wendy quitte le Pays Imaginaire pour occuper son nouveau poste de PDG de Lost Boys Inc."vous avez probablement reconnu les entités nommées suivantes :
- Date : 27 juin 2022
- Personne : Wendy
- Emplacement : Neverland
- Profession : PDG
- Organisation : Lost Boys Inc.
Les machines, quant à elles, utilisent un langage binaire (0, 1). Et les 0 et les 1 sont bien loin de la richesse et de la profondeur du langage humain. Étant donné que le langage des machines et le langage humain sont considérablement différents, l'apprentissage automatique doit être utilisé pour former le modèle NER. Pour ce faire, on utilise des ensembles de données prédéfinis contenant les catégories d'entités nommées que vous avez choisies. Par exemple, dans le scénario ci-dessus, les catégories d'entités date, personne, lieu, profession et organisation ont été prédéfinies.
Comment fonctionne le NER ? Une fois entraînés, les modèles NER utilisent un processus en deux étapes pour imiter la façon dont les humains lisent. Tout d'abord, le modèle identifie une entité nommée, puis il classe ou catégorise cette entité.
Certains systèmes NER utilisent des vecteurs de mots pour améliorer la vitesse et la précision. Les vecteurs de mots représentent les mots comme des nombres, mais au lieu d'attribuer simplement un numéro à chaque mot, les vecteurs de mots génèrent des représentations numériques au format décimal sur un certain nombre de dimensions, comme la fréquence d'apparition dans une variété de contextes. Le résultat ? Les mots similaires ont des numéros très proches les uns des autres, ce qui permet au modèle NER de trouver des mots similaires rapidement et avec précision.
Voici un exemple extrêmement simplifié. Supposons que vous travaillez avec un ensemble de données composé de commentaires sur votre magasin de meubles. En travaillant sur une seule dimension, le vecteur de mots que votre modèle pré-entraîné génère pour "lampe" est 0,223458993. Les vecteurs de mots peuvent vous aider à trouver des mots similaires à "lampe" :
lumière : 0.212835892
applique : 0.212444586
lustre : 0.199875213
Résoudre le problème de l'ambiguïté
Une partie de la complexité du langage humain réside dans le nombre de mots qui ont plusieurs significations. Également connus sous le nom d'homonymes, ces mots ne sont généralement pas ambigus pour les humains, tant que le contexte est suffisant pour déchiffrer le sens correct.
Par exemple, nous savons ce qu'il faut entendre dans chacune des phrases suivantes grâce au contexte :
Le lanceur a lancé trois strikes d'affilée.
Ils ont demandé un autre pichet d'eau glacée.
Les machines, cependant, ne sont pas capables de comprendre le contexte, et le langage ambigu de cet exemple représente donc un véritable défi. Mais comme les modèles de NER sont des modèles d'apprentissage supervisé, ce qui signifie qu'ils doivent d'abord être formés avant de pouvoir être appliqués, des approches d'apprentissage automatique ont été développées pour les aider à relever ce défi.
Cas d'utilisation populaires des NER
Vous pourriez simplement utiliser NER pour collecter et stocker des données plus structurées dans une base de données. Mais la capacité de NER à extraire des données structurées à partir de données brutes le rend utile dans un grand nombre de cas d'utilisation, notamment :
Fonction de recherche pour le commerce électronique. Une fonction de recherche précise peut être cruciale pour les ventes en ligne. Par exemple, un client qui recherche une "table de cocktail ronde blanche" ne cherche pas des produits blancs, des produits ronds, des produits de cocktail ou n'importe quel type de table. Une fonction de recherche alimentée par les NER fournirait les bons résultats en classant "blanc" comme [couleur du produit], "rond" comme [forme du produit] et "table de cocktail" comme [type de produit].
Assistance à la clientèle. La multiplicité des départements, des produits et des succursales peut constituer un véritable défi pour votre équipe d'assistance clientèle. Avant de pouvoir traiter les réclamations, les e-mails et les tickets des clients doivent être triés pour déterminer les sites, les produits et les départements concernés. NER peut rendre le flux de travail de votre équipe plus efficace en catégorisant des entités telles que [lieu] et [produit], et en envoyant automatiquement les plaintes et les requêtes triées au membre de l'équipe concerné.
Suivre les problèmes récurrents. De nos jours, les clients sont tout aussi susceptibles de se tourner vers réseaux sociaux pour déposer une plainte que d'envoyer un courriel ou de téléphoner. Les entreprises conscientes de cette tendance créent souvent une adresse réseaux sociaux distincte pour traiter ces plaintes. Un modèle NER peut alors être utilisé sur ce flux réseaux sociaux orienté vers les plaintes pour trier les tweets ou les messages en données qui peuvent être utilisées pour détecter les produits, les lieux ou même les moments clés de la journée qui suscitent des plaintes récurrentes.
Support des chatbots. Les chatbots permettent aux entreprises de proposer des solutions rapides à des problèmes courants. Vous pouvez utiliser les NER pour entraîner votre robot d'assistance à traiter efficacement un certain nombre de problèmes d'assistance typiques en utilisant un ensemble de données d'entraînement contenant des entités pertinentes pour ces problèmes dans le contexte du chat. En fonction de l'identification et de la classification de ces entités (par exemple, les numéros de série des produits ou les codes de coupon), le robot peut soit fournir une réponse pertinente, soit signaler le chat pour une escalade.
Ciblage/segmentation de l'audience. ShareThis applique le NER pour filtrer ses données vers le bas en extrayant les entités des pages Web portant son code Javascript, ce qui vous permet d'atteindre votre audience cible parfaite. Ainsi, par exemple, en distinguant Apple (la société) de apple (le fruit), NER peut identifier le segment d'audience qui s'intéresse aux produits Apple.
Conclusion
Les données brutes que vous avez collectées ne peuvent pas être utilisées telles quelles. Enrichissez-les davantage avec des données provenant d'un fournisseur comme ShareThis, puis appliquez des modèles NER pour identifier, extraire et classer les entités importantes. Grâce au NER, vous pouvez transformer vos données enrichies en une source inestimable d'informations qui peuvent être appliquées à une variété de cas d'utilisation et vous permettre de mieux soutenir les flux de travail de vos équipes.