Entity Search

Entity Search ist das Tool zur Erkennung benannter Entitäten (Named Entity Recognition, NER) von Openindex. Mit diesem Tool lassen sich relevante Informationen wie Namen, Firmen, Organisationen, Orte usw. aus beliebigen Texten extrahieren. Entity Search erkennt immer mehr Entitäten in beliebigen Texten durch Training mit großen Datensätzen. Eingaben können als Text, PDF, Webseite oder in anderen Formaten erfolgen. Für Tests und kleine Datenmengen kann die Eingabe über ein Webformular erfolgen; alternativ bieten wir eine API an. Dadurch lässt sich die Technologie in automatisierte Prozesse integrieren.

Openindex inside
Entwickelt mit fortschrittlicher Suchmaschinentechnologie von OpenIndex
Privatsphäre garantiert
Openindex legt größten Wert auf Datenschutz. Alle erhobenen Daten werden anonymisiert gespeichert. Es werden keine Daten verkauft oder an Dritte weitergegeben.
Extrahieren Sie zahlreiche Entitäten aus Ihrem Text
Findet automatisch Personen, Marken, Orte, Zeitangaben und vieles mehr.
Funktioniert auf jeder Website und Textquelle
Die Technologie hinter den Websites oder Datenquellen ist unerheblich, solange die Ausgabe von unserem Parser gelesen werden kann. Als Eingabe können beliebige zugängliche Websites, aber auch Textdateien, PDFs usw. dienen.
Unterstützung für mehrere Sprachen
Wir unterstützen derzeit 48 Sprachen für die Entitätssuche, arbeiten aber an weiteren Sprachmodellen. Sie unterstützt etwa 40 verschiedene Entitätstypen und integriert sich nahtlos in unseren Parser.
API verfügbar
Über eine Web-API kann die Entitätssuche abgefragt werden. Dadurch lässt sich die Technologie in automatisierte Prozesse integrieren.

Probieren Sie die Online-Demo unten aus.

Geben Sie unten im Textfeld eine URL oder einen Freitext ein und sehen Sie, welche Informationen extrahiert werden.

oder

{{ content }}

Die Entitätssuche verwendet die folgenden Techniken

Apache OpenNLP
Apache OpenNLP ist ein auf maschinellem Lernen basierendes Toolkit zur Verarbeitung von natürlichsprachlichen Texten.
Apache Solr
Solr ist die beliebte, extrem schnelle Open-Source-Suchplattform für Unternehmen, die auf Apache Lucene™ basiert. Openindex verfügt über eine eigene, hochgradig angepasste und optimierte Solr-Instanz, die als Basis unserer Plattform dient.
Perceptrons
Ein Perceptron ist ein neuronales Netzwerk, dessen Neuronen in verschiedenen Schichten miteinander verbunden sind. Die erste Schicht besteht aus Eingangsneuronen, an die die Eingangssignale angelegt werden.
Maximum Entropy
Das Prinzip der maximum entropy besagt, dass die Wahrscheinlichkeitsverteilung, die den aktuellen Wissensstand am besten widerspiegelt, diejenige mit der größten Entropie ist, unter Berücksichtigung korrekt erfasster vorheriger Daten.
PoS tagging
In der Korpuslinguistik bezeichnet man als part-of-speech tagging, auch grammatikalische Bestimmung genannt, die Kennzeichnung eines Wortes in einem Text als Teil eines bestimmten Wortes, basierend auf der Definition und dem Kontext.