Openindex inside

Gebouwd op de geavanceerde zoekmachinetechnologie van Openindex.

Privacy gegarandeerd

Bij Openindex draait alles om het respecteren van privacy. Alle verzamelde gegevens worden geanonimiseerd opgeslagen. Er worden geen gegevens verkocht of verstrekt aan derden.

Extraheer talloze entiteiten uit je tekst

Vindt geautomatiseerd personen, merken, locaties, tijdsaanduidingen en nog veel meer.

Werkt op elke website en tekstbron

Het maakt niet uit welke techniek er achter de websites of databronnen zit, zolang de output maar leesbaar is voor onze parser. De input kan iedere toegankelijke website zijn, maar ook tekstbestanden, pdf’s etc.

Ondersteuning voor meerdere talen

Momenteel ondersteunen we achtenveertig talen voor EntitySearch, maar er worden meer aanvullende taalmodellen gebouwd. Het ondersteunt ongeveer veertig verschillende entiteitstypen en het integreert naadloos met onze parser.

API beschikbaar

Er is een web API beschikbaar waarmee entitysearch bevraagd kan worden. Hiermee kan de techniek in geautomatiseerde processen worden geïntegreerd.

Probeer de online demo hieronder

Typ een URL of tekst in het tekstvak en zie welke informatie wordt opgehaald.

OR

{{ content }}

Entitysearch maakt gebruik van de volgende technieken

Apache OpenNLP

Apache OpenNLP is een toolkit op basis van machine learning voor de verwerking van tekst in natuurlijke taal.

Apache Solr

Solr is het populaire, razendsnelle, open source enterprise search-platform dat is gebouwd op Apache Lucene ™. Openindex heeft zijn eigen sterk aangepaste en geoptimaliseerde Solr-instantie die als basis van ons platform dient.

Perceptrons

Een perceptron is een neuraal netwerk waarin de neuronen in verschillende lagen met elkaar verbonden zijn. Een eerste laag bestaat uit ingangsneuronen, waar de inputsignalen aangelegd worden.

Maximum Entropy

Het principe van maximale entropie stelt dat de kansverdeling die het beste de huidige stand van kennis weergeeft, degene is met de grootste entropie, in de context van nauwkeurig vermelde eerdere gegevens.

PoS tagging

In de corpuslinguïstiek is part-of-speech-tagging, ook wel grammaticale tagging genoemd, het markeren van een woord in een tekst dat overeenkomt met een bepaald woordgedeelte, gebaseerd op zowel de definitie als de context.

Meer informatie

Als je geïnteresseerd bent in Entitysearch neem dan contact op met ons om de mogelijkheden door te spreken.


Entitysearch is beschikbaar in de volgende talen:

  • Afrikaans
  • العربية Arabic
  • Български, Bulgarian
  • Català, Catalan
  • Česky, Czech
  • Dansk, Danish
  • Deutsch, German
  • Ελληνικά, Greek
  • English
  • Español, Spanish
  • Eesti, Estonian
  • فارسی, Farsi
  • Suomi, Finnish
  • Français, French
  • Frysk, West Frisian
  • Gaeilge, Irish
  • Gàidhlig, Scottish Gaelic
  • Galego, Galician
  • עברית, Hebrew
  • हिन्दी, Hindi
  • Hrvatski, Croatian
  • Magyar, Hungarian
  • Bahasa Indonesia, Indonesian
  • Íslenska, Icelandic
  • Italiano, Italian
  • 日本語, Japanese
  • 한국어, Korean
  • Lietuvių, Lithuanian
  • Latviešu, Latvian
  • मराठी, Marathi
  • Malti, Maltese
  • Nederlands, Dutch
  • Norsk (bokmål), Norwegian
  • Polski, Polish
  • Português, Portuguese
  • Română, Romanian
  • Русский, Russian
  • Slovenčina, Slovak
  • Slovenščina, Slovenian
  • српски, Serbian
  • Svenska, Swedish
  • தமிழ், Tamil
  • ภาษาไทย, Thai
  • Tagalog
  • Türkçe, Turkish
  • Українська, Ukrainian
  • اردو, Urdu
  • Tiếng Việt, Vietnamese
  • 中文, Chinese