NLP-Verfahren: Verbesserung der Verbrauchererfahrungen mit Named Entity Recognition (NER)

Es ist ein ziemliches Rätsel. Im heutigen digitalen Zeitalter sind Daten der Motor der Geschäftswelt. Das bedeutet, dass Unternehmen Daten benötigen - viele, viele Daten. Aber Daten in ihrem Rohzustand sind praktisch nutzlos. Um die gesammelten Daten in vollem Umfang nutzen zu können, benötigen Sie eine Toolbox mit Techniken zur Verarbeitung natürlicher Sprache (NLP) um Sie dabei zu unterstützen, die Leistungsfähigkeit des maschinellen Lernens zu nutzen und die vielfältigen Erkenntnisse zu gewinnen, die sich in Ihren Daten verbergen.

Zu den nützlichsten dieser NLP-Tools gehört die Technik der Named Entity Recognition (NER). Im Gegensatz zu einfacheren NLP-Techniken handelt es sich bei NER um ein überwachtes Lernmodell: Bevor Sie ein NER-Modell verwenden können, müssen Sie es zunächst mit einem Datensatz von vordefinierten Entitätskategorien trainieren. Dieses hochgradig anpassbare Training macht die Stärke von NER aus, da Sie die Informationen, die Sie extrahieren möchten, im Voraus festlegen.

Was ist Named Entity Recognition (NER)?

NER, auch bekannt als Entity Chunking oder Entity Extraction, ist eine NLP-Technik, die Textdaten scannt, um vordefinierte benannte Entitäten zu identifizieren und zu kategorisieren. Der Prozess extrahiert strukturierte Daten - die Entitäten - aus Rohdaten. Diese strukturierten Daten können dann analysiert werden, um Erkenntnisse zu gewinnen und in zahlreichen Geschäftsfällen eingesetzt zu werden.

Was sind benannte Entitäten?

Benannte Entitäten sind die grundlegenden Informationen, die in jeder Aussage oder jedem Satz enthalten sind, z. B.:

  • Namen
    • Menschen
    • Organisationen
    • Orte
    • Produkte
  • Zeitliche Einheiten
    • Datum
    • Zeiten
  • Zahlen
    • Messungen 
    • Entfernungen
    • Geld / Preisgestaltung
    • Mengen

Benannte Entitäten sind der Schlüssel zur Flexibilität eines NER-Modells: Da sie beliebig sein können, haben Sie die Möglichkeit, Ihr Modell so zu trainieren, dass es genau die Informationen extrahiert, die Sie für Ihren speziellen Anwendungsfall benötigen. 

Wie funktioniert die NER?

Bedenken Sie, was beim Lesen passiert: Während Ihre Augen die Wörter abtasten, identifizieren Sie automatisch alle genannten Personen. Wenn Sie zum Beispiel den Satz "Am 27. Oktober 2022 verließ Wendy Neverland, um ihre neue Stelle als CEO von Lost Boys Inc. anzutreten.", haben Sie wahrscheinlich die folgenden Personen erkannt:

  • Datum: Juni 27, 2022
  • Person: Wendy
  • Standort: Nimmerland
  • Berufliche Tätigkeit: CEO
  • Organisation: Lost Boys Inc.

Maschinen hingegen verwenden eine binäre Sprache (0, 1). Und 0s und 1s sind weit entfernt von der Reichhaltigkeit und Tiefe der menschlichen Sprache. Da sich Maschinensprache und menschliche Sprache erheblich unterscheiden, muss das NER-Modell zunächst mit Hilfe des maschinellen Lernens trainiert werden. Dazu werden vordefinierte Datensätze verwendet, die die von Ihnen gewählten Kategorien benannter Entitäten enthalten. Im obigen Szenario wurden zum Beispiel die Entitätskategorien Datum, Person, Ort, Beruf und Organisation vordefiniert.

Wie funktioniert also NER? Sobald sie trainiert sind, verwenden NER-Modelle einen zweistufigen Prozess, um die Art und Weise, wie Menschen lesen, zu imitieren. Zunächst identifiziert das Modell eine benannte Entität, und dann klassifiziert oder kategorisiert es diese Entität.

Einige NER-Systeme verwenden Wortvektoren, um Geschwindigkeit und Genauigkeit zu verbessern. Wortvektoren stellen Wörter als Zahlen dar, aber anstatt einfach jedem Wort eine Zahl zuzuordnen, erzeugen Wortvektoren numerische Darstellungen im Dezimalformat über eine Reihe von Dimensionen, wie z. B. die Häufigkeit des Auftretens in einer Vielzahl von Kontexten. Das Ergebnis? Ähnliche Wörter haben Zahlen, die eng miteinander verbunden sind, so dass das NER-Modell ähnliche Wörter schnell und genau finden kann. 

Hier ist ein extrem vereinfachtes Beispiel. Nehmen wir an, Sie arbeiten mit einem Datensatz, der aus Bewertungen Ihres Möbelgeschäfts besteht. Wenn Sie nur über eine Dimension arbeiten, ist der Wortvektor, den Ihr trainiertes Modell für "Lampe" erzeugt, 0,223458993. Wortvektoren können Ihnen helfen, Wörter zu finden, die dem Wort "Lampe" ähnlich sind:

hell: 0,212835892

Leuchte: 0.212444586

Kronleuchter: 0.199875213

Das Problem der Mehrdeutigkeit lösen

Ein Teil der Komplexität der menschlichen Sprache liegt in der Anzahl der Wörter, die mehrere Bedeutungen haben. Diese auch als Homonyme bezeichneten Wörter sind für den Menschen in der Regel nicht mehrdeutig, solange ein ausreichender Kontext vorhanden ist, um die richtige Bedeutung zu entschlüsseln. 

Zum Beispiel wissen wir aufgrund des Kontextes, was in jedem der folgenden Sätze gemeint ist:

Der Pitcher hat drei Strikes hintereinander geworfen.

Sie baten um einen weiteren Krug mit Eiswasser.

Maschinen sind jedoch nicht in der Lage, den Kontext zu verstehen, so dass die mehrdeutige Sprache in diesem Beispiel eine echte Herausforderung darstellt. Da es sich bei NER-Modellen jedoch um überwachte Lernmodelle handelt, d. h. sie müssen zunächst trainiert werden, bevor sie angewendet werden können, wurden Ansätze für maschinelles Lernen entwickelt, die ihnen helfen, diese Herausforderung zu meistern. 

Sie könnten NER einfach dazu verwenden, mehr strukturierte Daten zu sammeln und in einer Datenbank zu speichern. Aber die Fähigkeit von NER, strukturierte Daten aus Rohdaten zu extrahieren, macht es für eine große Anzahl von Anwendungsfällen nützlich, darunter:

Suchfunktion im elektronischen Handel. Eine genaue Suchfunktion kann für den Verkauf im elektronischen Handel entscheidend sein. Ein Kunde, der zum Beispiel nach einem "weißen, runden Cocktailtisch" sucht, sucht nicht nach weißen Produkten, runden Produkten, Cocktailprodukten oder irgendeiner Art von Tisch. Eine NER-gestützte Suchfunktion würde die richtigen Ergebnisse liefern, indem sie "weiß" als [Produktfarbe], "rund" als [Produktform] und "Cocktailtisch" als [Produkttyp] kategorisiert.

Kundenbetreuung. Mehrere Abteilungen, Produkte und Niederlassungen können Ihr Kundensupport-Team vor eine große Herausforderung stellen. Bevor Beschwerden jedoch bearbeitet werden können, müssen Kunden-E-Mails und Tickets sortiert werden, um festzustellen, welche Standorte, Produkte und Abteilungen betroffen sind. NER kann den Arbeitsablauf Ihres Teams effizienter gestalten, indem es Entitäten wie [Standort] und [Produkt] kategorisiert und die sortierten Beschwerden und Anfragen automatisch an das richtige Teammitglied weiterleitet. 

Verfolgen Sie wiederkehrende Probleme. Heutzutage ist es genauso wahrscheinlich, dass Kunden sich in den sozialen Medien beschweren, wie sie es per E-Mail oder telefonisch tun. Unternehmen, die sich dieses Trends bewusst sind, richten oft einen separaten Social-Media-Handle speziell für die Bearbeitung solcher Beschwerden ein. Ein NER-Modell kann dann in diesem beschwerdeorientierten Social-Media-Feed verwendet werden, um Tweets oder Posts in Daten zu sortieren, die verwendet werden können, um Produkte, Standorte oder sogar wichtige Tageszeiten zu erkennen, die zu wiederkehrenden Beschwerden führen. 

Chatbots zur Unterstützung. Chatbots bieten Unternehmen die Möglichkeit, schnelle Lösungen für allgemeine Probleme anzubieten. Sie können NER verwenden, um Ihren Support-Bot zu trainieren, damit er eine Reihe typischer Support-Probleme effizient lösen kann, indem Sie einen Trainingsdatensatz verwenden, der Entitäten enthält, die für diese Probleme im Chat-Kontext relevant sind. Auf der Grundlage der Identifizierung und Klassifizierung dieser Entitäten - z. B. Produktseriennummern oder Gutscheincodes - kann der Bot entweder eine relevante Antwort liefern oder den Chat zur Eskalation kennzeichnen. 

Targeting/Zielgruppensegmentierung. ShareThis wendet NER an, um seine Daten zu filtern, indem es Entitäten aus Webseiten extrahiert, die seinen Javascript-Code tragen, wodurch Sie Ihr perfektes Zielpublikum erreichen können. So kann NER beispielsweise durch die Unterscheidung von Apple (dem Unternehmen) und Apfel (der Frucht) das Zielgruppensegment identifizieren, das sich für Apple-Produkte interessiert. 

Fazit

Die von Ihnen gesammelten Rohdaten können nicht ohne Weiteres verwendet werden. Reichern Sie Ihre Daten mit Daten von einem Anbieter wie ShareThis an und wenden Sie dann NER-Modelle an, um wichtige Entitäten zu identifizieren, zu extrahieren und zu klassifizieren. Mithilfe von NER können Sie Ihre angereicherten Daten in eine unschätzbare Quelle von Erkenntnissen umwandeln, die in einer Vielzahl von Anwendungsfällen eingesetzt werden können und es Ihnen ermöglichen, die Arbeitsabläufe Ihrer Teams besser zu unterstützen. 

Über ShareThis

ShareThis erschließt seit 2007 die Macht des globalen digitalen Verhaltens durch die Synthese von Social Share-, Interessen- und Absichtsdaten. Auf der Grundlage des Verbraucherverhaltens auf mehr als drei Millionen globalen Domains beobachtet ShareThis Echtzeit-Aktionen von echten Menschen auf echten digitalen Zielen.

Abonnieren Sie unseren Newsletter

Erhalten Sie die neuesten Nachrichten, Tipps und Updates

Abonnieren

Verwandte Inhalte