Glossar

agglomerativ

Das agglomerative Clustering ist eine Art hierarchisches Clustering, bei dem Cluster aus einzelnen Instanzen gebildet werden, die iterativ nach Ähnlichkeit zusammengefasst werden, bis alle zu einer einzigen Gruppe gehören.

Anwendungsprogrammierschnittstelle (API)

Eine Anwendungsprogrammierschnittstelle legt formal fest, wie Softwarekomponenten miteinander kommunizieren. Eine Daten-API kann Nutzern einen systematischen Weg bieten, um Informationen aus dem Internet zu lesen oder zu holen. Die Scikit-Learn-API bietet einen allgemeinen Zugang zu Algorithmen für maschinelles Lernen, die über Klassenvererbung implementiert werden.

Bag-of-Words (BOW)/Continuous Bag-of-Words (CBOW)

Bag-of-Words ist eine Methode zur Codierung von Text, bei der jedes Dokument aus dem Korpus in einen Vektor umgewandelt wird, dessen Länge dem Vokabular des Korpus entspricht. Die wichtigste Erkenntnis einer Bag-of-Words-Darstellung ist, dass Bedeutung und Ähnlichkeit im Vokabular kodiert werden.

Bartender

Baleen ist ein Open-Source-Dienst zur automatischen Erfassung von Blogs, mit dem ein Korpus für die Forschung im Bereich der natürlichen Sprachverarbeitung erstellt werden kann.

Betweenness-Zentralität

Bei einem Knoten N in einem Graphen G gibt die Betweenness-Zentralität an, wie verbunden G durch N ist. Die Betweenness-Zentralität wird als Verhältnis der kürzesten Wege in G, die N einschließen, zur Gesamtzahl der kürzesten Wege in G berechnet.

Vorspannung

Der Bias ist eine ...

Get Angewandte Textanalyse mit Python now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.