Vorwort
Diese Arbeit wurde mithilfe von KI übersetzt. Wir freuen uns über dein Feedback und deine Kommentare: translation-feedback@oreilly.com
Natürliche Sprachverarbeitung (NLP) ist ein Gebiet an der Schnittstelle zwischen Informatik, künstlicher Intelligenz und Linguistik. Es geht darum, Systeme zu entwickeln, die menschliche Sprache verarbeiten und verstehen können. Seit seinen Anfängen in den 1950er Jahren und bis vor Kurzem war NLP vor allem eine Domäne der Hochschulen und Forschungslabors und erforderte eine lange formale Ausbildung und Schulung. Die Durchbrüche des letzten Jahrzehnts haben dazu geführt, dass NLP zunehmend in verschiedenen Bereichen wie Einzelhandel, Gesundheitswesen, Finanzen, Recht, Marketing, Personalwesen und vielen anderen eingesetzt wird. Es gibt eine Reihe von treibenden Kräften für diese Entwicklungen:
- Weit verbreitete und einfach zu verwendende NLP-Tools, -Techniken und -APIs sind in der Branche mittlerweile allgegenwärtig. Es gab noch nie einen besseren Zeitpunkt, um schnelle NLP-Lösungen zu entwickeln.
- Die Entwicklung besser interpretierbarer und verallgemeinerter Ansätze hat die Ausgangsleistung selbst für komplexe NLP-Aufgaben wie Konversationsaufgaben in offenen Domänen und die Beantwortung von Fragen verbessert, die zuvor praktisch nicht machbar waren.
- Immer mehr Unternehmen, darunter Google, Microsoft und Amazon, investieren stark in interaktive Verbraucherprodukte, bei denen die Sprache als primäres Kommunikationsmedium eingesetzt wird.
- Die zunehmende Verfügbarkeit nützlicher Open-Source-Datensätze zusammen mit Standard-Benchmarks hat als Katalysator für diese Revolution gewirkt, im Gegensatz zu proprietären Datensätzen, die nur für bestimmte Organisationen und Einzelpersonen zugänglich sind .
- Die Einsatzmöglichkeiten von NLP gehen über Englisch und andere wichtige Sprachen hinaus. Es werden Datensätze und sprachspezifische Modelle auch für die weniger häufig digitalisierten Sprachen erstellt. Ein erfolgreiches Produkt, das aus diesen Bemühungen hervorging, war ein nahezu perfektes Tool zur automatischen maschinellen Übersetzung, das allen Personen mit einem Smartphone zur Verfügung steht.
Angesichts dieser schnell wachsenden Nutzung hat ein wachsender Teil der Belegschaft, die diese NLP-Systeme entwickelt, mit begrenzter Erfahrung und theoretischem Wissen über das Thema zu kämpfen. Dieses Buch befasst sich mit diesem Bedarf aus einer angewandten Perspektive. Unser Buch soll den Lesern helfen, NLP-Systeme in Unternehmen zu entwickeln, zu iterieren und zu skalieren und sie für verschiedene Branchen anzupassen.
Warum wir dieses Buch geschrieben haben
Es gibt viele beliebte Bücher über NLP. Während einige davon als Lehrbücher dienen und sich auf theoretische Aspekte konzentrieren, zielen andere darauf ab, NLP-Konzepte durch viele Codebeispiele einzuführen. Wieder andere konzentrieren sich auf bestimmte NLP- oder Machine-Learning-Bibliotheken und bieten Anleitungen zum Lösen verschiedener NLP-Probleme mithilfe der Bibliotheken. Warum brauchen wir also ein weiteres Buch über NLP?
Wir entwickeln und skalieren seit über einem Jahrzehnt NLP-Lösungen an führenden Universitäten und Technologieunternehmen. Während wir Kollegen und andere Ingenieure betreuten, bemerkten wir eine Lücke zwischen der NLP-Praxis in der Industrie und den NLP-Fähigkeiten von neuen Ingenieuren und insbesondere von solchen, die gerade erst mit NLP anfangen. In NLP-Workshops, die wir für Fachleute aus der Industrie durchgeführt haben, haben wir festgestellt, dass auch Führungskräfte aus Wirtschaft und Technik diese Lücken haben.
Die meisten Online-Kurse und Bücher behandeln NLP-Probleme anhand von Spielzeug-Anwendungsfällen und beliebten (oft großen, sauberen und gut definierten) Datensätzen. Dies vermittelt zwar die allgemeinen Methoden des NLP, bietet aber unserer Meinung nach keine ausreichende Grundlage, um neue Probleme anzugehen und spezifische Lösungen in der realen Welt zu entwickeln. Häufig auftretende Probleme bei der Entwicklung von realen Anwendungen, wie z. B. das Sammeln von Daten, die Arbeit mit verrauschten Daten und Signalen, die schrittweise Entwicklung von Lösungen und Probleme beim Einsatz der Lösungen als Teil einer größeren Anwendung, werden unseres Wissens nach in den vorhandenen Ressourcen nicht behandelt. Außerdem stellten wir fest, dass bewährte Methoden zur Entwicklung von NLP-Systemen in den meisten Szenarien fehlen. Wir waren der Meinung, dass ein Buch benötigt wird, um diese Lücke zu schließen, und so wurde dieses Buch geboren!
Die Philosophie
Wir wollen eine ganzheitliche und praktische Perspektive bieten, die es dem Leser ermöglicht, erfolgreich NLP-Lösungen in größeren Produktkonfigurationen zu entwickeln. Daher werden die meisten Kapitel von Code-Walkthroughs im zugehörigen Git-Repository begleitet. Für Leser, die tiefer einsteigen wollen, wird das Buch durch umfangreiche Referenzen ergänzt. Im gesamten Buch beginnen wir mit einer einfachen Lösung und bauen schrittweise komplexere Lösungen auf, indem wir einen MVP-Ansatz (Minimum Viable Product) verfolgen, wie er in der Praxis üblich ist . Wir geben auch Tipps, die auf unseren Erfahrungen und Erkenntnissen beruhen. Wenn möglich, wird jedes Kapitel von einer Diskussion über den aktuellen Stand der Technik in diesem Bereich begleitet. Die meisten Kapitel schließen mit einer Fallstudie über reale Anwendungsfälle ab.
Stell dir die Aufgabe vor, einen Chatbot oder ein Textklassifizierungssystem in deinem Unternehmen aufzubauen. Zu Beginn gibt es vielleicht nur wenige oder gar keine Daten, mit denen du arbeiten kannst. Zu diesem Zeitpunkt ist eine einfache Lösung mit regelbasierten Systemen oder traditionellem maschinellen Lernen geeignet. Je mehr Daten du anhäufst, desto ausgefeiltere NLP-Techniken (die oft datenintensiv sind) können eingesetzt werden, einschließlich Deep Learning. Auf jeder Stufe dieser Reise gibt es Dutzende von alternativen Ansätzen, die man wählen kann. Dieses Buch hilft dir, dich in diesem Labyrinth von Optionen zurechtzufinden.
Umfang
Dieses Buch bietet einen umfassenden Überblick über die Entwicklung von NLP-Anwendungen in der realen Welt. Wir decken den gesamten Lebenszyklus eines typischen NLP-Projekts ab - von der Datenerfassung bis zur Bereitstellung und Überwachung des Modells. Einige dieser Schritte sind auf jede ML-Pipeline anwendbar, während andere sehr spezifisch für NLP sind. Wir stellen auch aufgabenspezifische Fallstudien und domänenspezifische Anleitungen vor, um ein NLP-System von Grund auf aufzubauen. Wir behandeln eine Reihe von Aufgaben, die von der Textklassifizierung über die Beantwortung von Fragen bis hin zur Informationsextraktion und zu Dialogsystemen reichen. Außerdem bieten wir Rezepte für die Anwendung dieser Aufgaben in Bereichen wie E-Commerce, Gesundheitswesen, soziale Medien und Finanzen. Aufgrund der Tiefe und Breite der Themen und Szenarien, die wir abdecken, werden wir den Code und alle Konzepte nicht Schritt für Schritt erläutern. Für Details der Implementierung haben wir ausführliche Quellcode-Notebooks bereitgestellt. Die Codeschnipsel in diesem Buch decken die Kernlogik ab und überspringen oft einleitende Schritte wie das Einrichten einer Bibliothek oder das Importieren eines Pakets, da diese in den zugehörigen Notizbüchern behandelt werden. Um das breite Spektrum an Konzepten abzudecken, haben wir mehr als 450 ausführliche Referenzen angegeben, um diese Themen zu vertiefen. Dieses Buch ist ein alltägliches Kochbuch, das dir einen pragmatischen Überblick über den Aufbau eines NLP-Systems verschafft und dir als Sprungbrett dient, um die Anwendung von NLP in deinem Bereich zu erweitern.
Wer sollte dieses Buch lesen?
Dieses Buch richtet sich an alle, die an der Entwicklung von NLP-Anwendungen für reale Anwendungsfälle beteiligt sind. Dazu gehören Softwareentwickler und -tester, Ingenieure für maschinelles Lernen, Dateningenieure, MLOps-Ingenieure, NLP-Ingenieure, Datenwissenschaftler, Produktmanager, Personalmanager, Vizepräsidenten, CXOs und Startup-Gründer. Dazu gehören auch diejenigen, die an der Datenerstellung und den Annotationsprozessen beteiligt sind - kurzum alle, die in irgendeiner Weise am Aufbau von NLP-Systemen in der Industrie beteiligt sind. Auch wenn nicht alle Kapitel für alle Rollen nützlich sind, haben wir versucht, klare Erklärungen zu geben, die weniger Fachjargon und mehr intuitives Verständnis beinhalten, wo immer es möglich ist. Wir glauben, dass in jedem Kapitel etwas für alle potenziellen Leser/innen zu finden ist, die an einer ganzheitlichen Perspektive für die Entwicklung von NLP-Anwendungen interessiert sind.
Einige Kapitel oder Abschnitte können auch ohne viel Programmiererfahrung verstanden werden und Code-Bits können bei Bedarf übersprungen werden. Die ersten beiden Abschnitte in Kapitel 1 und Kapitel 9 oder die Abschnitte "Der Data Science-Prozess" und "Wie du KI in deinem Unternehmen zum Erfolg führst" in Kapitel 11 können von allen Lesergruppen ohne Programmierkenntnisse verstanden werden. Im weiteren Verlauf des Buches wirst du in allen Kapiteln weitere Abschnitte dieser Art finden. Um jedoch den größtmöglichen Nutzen aus diesem Buch, seinen Notizbüchern und Referenzen zu ziehen, erwarten wir, dass die Leser/innen über die folgenden Vorkenntnisse verfügen:
- Fortgeschrittene Kenntnisse in der Python-Programmierung. Zum Beispiel das Verstehen von Python-Funktionen wie Listenverständnis, das Schreiben von Funktionen und Klassen und die Nutzung vorhandener Bibliotheken.
- Vertrautheit mit verschiedenen Aspekten des Lebenszyklus der Softwareentwicklung (SDLC) wie Design, Entwicklung, Testen, DevOps usw.
- Grundlagen des maschinellen Lernens, einschließlich Vertrautheit mit gängigen Algorithmen des maschinellen Lernens wie logistischer Regression und Entscheidungsbäumen und der Fähigkeit, diese in Python mit vorhandenen Bibliotheken wie scikit-learn zu nutzen.
- Grundkenntnisse in NLP sind nützlich, aber nicht zwingend erforderlich. Eine Vorstellung von Aufgaben wie Textklassifizierung und Named Entity Recognition ist ebenfalls hilfreich.
Was du lernen wirst
Unsere Zielgruppe sind vor allem Ingenieure und Wissenschaftler, die NLP-Systeme für verschiedene Branchen entwickeln. Einige der gängigen Berufsbezeichnungen sind: Softwareentwickler, NLP-Ingenieur, ML-Ingenieur und Datenwissenschaftler. Das Buch kann auch für Produktmanager und technische Leiter hilfreich sein. Für diejenigen, die Spitzenforschung im Bereich NLP betreiben, ist es jedoch nicht so hilfreich, da wir keine tiefgehenden theoretischen und technischen Details zu NLP-Konzepten behandeln. Mit diesem Buch wirst du:
- Verstehe das breite Spektrum an Problemstellungen, Aufgaben und Lösungsansätzen im NLP.
- Sammle Erfahrungen bei der Implementierung und Bewertung verschiedener NLP-Anwendungen und wende dabei Methoden des maschinellen Lernens und des Deep Learning an.
- Stimmen Sie eine NLP-Lösung auf das Geschäftsproblem und die Branche ab.
- Evaluiere verschiedene Algorithmen und Ansätze für die jeweilige Aufgabe, den Datensatz und das Stadium des NLP-Produkts.
- Plane den Lebenszyklus des NLP-Produkts und entwickle Softwarelösungen nach bewährten Methoden für Release, Deployment und DevOps für NLP-Systeme.
- Verstehe bewährte Methoden, Chancen und den Fahrplan für NLP aus der Sicht eines Geschäfts- und Produktleiters.
Du wirst auch lernen, wie du deine Lösungen für verschiedene Branchen wie das Gesundheitswesen, den Finanzsektor und den Einzelhandel anpassen kannst. Außerdem erfährst du, welche Besonderheiten in jeder Branche zu beachten sind.
Aufbau des Buches
Das Buch ist in vier Abschnitte unterteilt. Abbildung P-1 veranschaulicht die Gliederung der Kapitel. Einzelne Kapitel, die nicht direkt mit anderen Kapiteln verbunden sind, können am einfachsten übersprungen werden, wenn du weitergehst.
Teil I, Grundlagen, dient als Fundament für den Rest des Buches, indem er einen Überblick über NLP gibt(Kapitel 1), typische Datenverarbeitungs- und Modellierungspipelines erörtert, die beim Aufbau von NLP-Systemen verwendet werden(Kapitel 2), und verschiedene Arten der Darstellung von Textdaten im NLP vorstellt(Kapitel 3).
Teil II, Grundlagen, konzentriert sich auf die häufigsten NLP-Anwendungen, wobei der Schwerpunkt auf realen Anwendungsfällen liegt. Wo es möglich ist, zeigen wir mehrere Lösungen für das jeweilige Problem, um zu demonstrieren, wie man zwischen verschiedenen Optionen wählen kann. Einige Anwendungen sind die Textklassifizierung(Kapitel 4), die Informationsextraktion(Kapitel 5) und der Aufbau von Chatbots(Kapitel 6). Wir stellen auch andere Anwendungen wie Suche, Themenmodellierung, Textzusammenfassung und maschinelle Übersetzung vor und diskutieren praktische Anwendungsfälle(Kapitel 7).
Teil III, Angewandt (Kapitel 8-10), konzentriert sich auf drei Branchen, in denen NLP stark genutzt wird, mit einer detaillierten Diskussion über die spezifischen Probleme dieser Bereiche und darüber, wie NLP bei deren Lösung nützlich ist.
Teil IV(Kapitel 11) fasst schließlich das Gelernte zusammen, indem er sich mit den Fragen befasst, die mit dem End-to-End-Einsatz von NLP-Systemen in der Praxis verbunden sind.
Wie man dieses Buch liest
Wie man das Buch liest, hängt von der jeweiligen Rolle und dem Ziel ab. Datenwissenschaftlern oder Ingenieuren, die sich mit NLP befassen, empfehlen wir, die Kapitel 1-6 zu lesen und sich dann auf das jeweilige Gebiet oder Teilproblem zu konzentrieren, das sie interessiert. Jemandem in einer Führungsposition empfehlen wir, sich auf die Kapitel 1, 2 und 11 zu konzentrieren. Ein besonderes Augenmerk sollte auf die Fallstudien in den Kapiteln 3-7 gelegt werden, die weitere Ideen für die Entwicklung von NLP-Anwendungen von Grund auf liefern. Produktverantwortliche sollten sich intensiv mit den Referenzen zu den entsprechenden Kapiteln sowie mit Kapitel 11 beschäftigen.
NLP-Anwendungen für verschiedene Bereiche können sich von den allgemeinen Problemen unterscheiden, die in den Kapiteln 3-7 behandelt werden. Deshalb haben wir uns mehr auf bestimmte Bereiche wie E-Commerce, soziale Medien, Gesundheitswesen, Finanzen und Recht konzentriert. Wenn dein Interesse oder deine Arbeit dich in diese Bereiche führt, kannst du diese Kapitel und die dazugehörigen Verweise vertiefen.
In diesem Buch verwendete Konventionen
In diesem Buch werden die folgenden typografischen Konventionen verwendet:
- Kursiv
-
Weist auf neue Begriffe, URLs, E-Mail-Adressen, Dateinamen und Dateierweiterungen hin.
Constant width
-
Wird für Programmlistings sowie innerhalb von Absätzen verwendet, um auf Programmelemente wie Variablen- oder Funktionsnamen, Datenbanken, Datentypen, Umgebungsvariablen, Anweisungen und Schlüsselwörter hinzuweisen.
Constant width bold
-
Zeigt Befehle oder anderen Text an, der vom Benutzer wortwörtlich eingetippt werden sollte.
Constant width italic
-
Zeigt Text an, der durch vom Benutzer eingegebene Werte oder durch kontextabhängige Werte ersetzt werden soll.
Tipp
Dieses Element steht für einen Tipp oder eine Anregung.
Hinweis
Dieses Element steht für einen allgemeinen Hinweis.
Warnung
Dieses Element weist auf eine Warnung oder einen Warnhinweis hin.
Code-Beispiele verwenden
Zusätzliches Material (Code-Beispiele, Übungen usw.) steht unter https://oreil.ly/PracticalNLP zum Download bereit .
Wenn du eine technische Frage oder ein Problem mit den Codebeispielen hast, sende bitte eine E-Mail an bookquestions@oreilly.com.
Dieses Buch soll dir helfen, deine Arbeit zu erledigen. Wenn in diesem Buch Beispielcode angeboten wird, darfst du ihn in deinen Programmen und deiner Dokumentation verwenden. Du musst uns nicht um Erlaubnis fragen, es sei denn, du reproduzierst einen großen Teil des Codes. Wenn du zum Beispiel ein Programm schreibst, das mehrere Teile des Codes aus diesem Buch verwendet, brauchst du keine Erlaubnis. Der Verkauf oder die Verbreitung von Beispielen aus O'Reilly-Büchern erfordert jedoch eine Genehmigung. Die Beantwortung einer Frage mit einem Zitat aus diesem Buch und einem Beispielcode erfordert keine Genehmigung. Wenn du einen großen Teil des Beispielcodes aus diesem Buch in die Dokumentation deines Produkts aufnimmst, ist eine Genehmigung erforderlich .
Wir freuen uns über eine Namensnennung, verlangen sie aber in der Regel nicht. Eine Quellenangabe umfasst normalerweise den Titel, den Autor, den Verlag und die ISBN. Zum Beispiel:"Practical Natural Language Processing" von Sowmya Vajjala, Bodhisattwa Majumder, Anuj Gupta, und Harshit Surana (O'Reilly). Copyright 2020 Anuj Gupta, Bodhisattwa Prasad Majumder, Sowmya Vajjala, and Harshit Surana, 978-1-492-05405-4."
Wenn du der Meinung bist, dass deine Verwendung von Codebeispielen nicht unter die Fair-Use-Regelung oder die oben genannte Erlaubnis fällt, kannst du uns gerne unter permissions@oreilly.com kontaktieren .
O'Reilly Online Learning
Hinweis
Seit mehr als 40 Jahren bietet O'Reilly Media Schulungen, Wissen und Einblicke in Technologie und Wirtschaft, um Unternehmen zum Erfolg zu verhelfen.
Unser einzigartiges Netzwerk von Experten und Innovatoren teilt sein Wissen und seine Erfahrung durch Bücher, Artikel und unsere Online-Lernplattform. Die Online-Lernplattform von O'Reilly bietet dir On-Demand-Zugang zu Live-Trainingskursen, ausführlichen Lernpfaden, interaktiven Programmierumgebungen und einer umfangreichen Text- und Videosammlung von O'Reilly und über 200 anderen Verlagen. Weitere Informationen erhältst du unter http://oreilly.com.
Wie du uns kontaktierst
Bitte richte Kommentare und Fragen zu diesem Buch an den Verlag:
- O'Reilly Media, Inc.
- 1005 Gravenstein Highway Nord
- Sebastopol, CA 95472
- 800-998-9938 (in den Vereinigten Staaten oder Kanada)
- 707-829-0515 (international oder lokal)
- 707-829-0104 (Fax)
Wir haben eine Webseite für dieses Buch, auf der wir Errata, Beispiele und zusätzliche Informationen auflisten. Du kannst diese Seite unter https://oreil.ly/PNLP aufrufen .
Schreib eine E-Mail an bookquestions@oreilly.com, um Kommentare oder technische Fragen zu diesem Buch zu stellen.
Neuigkeiten und Informationen über unsere Bücher und Kurse findest du unter http://oreilly.com.
Finde uns auf Facebook: http://facebook.com/oreilly
Folge uns auf Twitter: http://twitter.com/oreillymedia
Schau uns auf YouTube: http://youtube.com/oreillymedia
Weitere Informationen
Im GitHub Repo findest du Notizbücher, die verschiedene im Buch behandelte Konzepte erklären. Die Notebooks sind nach Kapiteln geordnet. Wir stellen auch zusätzliche Notizbücher zur Verfügung, die nicht unbedingt im Buch behandelt werden.
Buch-Website: http://www.practicalnlp.ai
Die Welt des NLP entwickelt sich ständig weiter. Um auf dem Laufenden zu bleiben, wie sich die im Buch erwähnten Konzepte in ein, zwei und fünf Jahren in den größeren Kontext einfügen, kannst du unserem Blog folgen. Wir halten ihn mit relevanten Beiträgen und Artikeln auf dem Laufenden und kennzeichnen jeden Beitrag mit dem Titel des entsprechenden Kapitels im Buch.
Kontakt zu den Autoren:
- E-Mail: authors@practicalnlp.ai
- Linkedin: https://linkedin.com/company/practical-nlp
- Twitter: https://twitter.com/PracticalNLProc
- Facebook: https://oreil.ly/facebookPNLP
Danksagungen
Ein Buch wie dieses ist ein Kompendium des Wissens; es kann daher nicht isoliert existieren. Beim Schreiben dieses Buches haben wir uns von verschiedenen Büchern, Forschungsarbeiten, Softwareprojekten und zahlreichen anderen Ressourcen im Internet inspirieren lassen und viele Informationen gesammelt. Wir danken der NLP- und Machine Learning-Community für ihre Bemühungen. Wir haben lediglich auf den Schultern dieser Giganten gestanden. Wir danken auch verschiedenen Personen, die an einigen Vorträgen und Workshops der Autoren teilgenommen und sich an Diskussionen beteiligt haben, die zu der Idee führten, dieses Buch zu schreiben und seine Prämisse zu gestalten. Dieses Buch ist das Ergebnis einer langen Zusammenarbeit und viele Menschen haben uns auf unterschiedliche Weise bei unserem Vorhaben unterstützt.
Wir danken den O'Reilly-Reviewern Will Scott, Darren Cook, Ramya Balasubramaniam, Priyanka Raghavan und Siddharth Narayanan für ihre sorgfältigen, unschätzbaren und detaillierten Kommentare, die uns geholfen haben, frühere Entwürfe zu verbessern. Die detaillierten Rückmeldungen von Siddharth Sharma, Sumod Mohan, Vinayak Hegde, Aasish Pappu, Taranjeet Singh, Kartikay Bagla und Varun Purushotham haben uns geholfen, die Qualität des Inhalts zu verbessern.
Wir sind auch Rui Shu, Shreyans Dhankhar, Jitin Kapila, Kumarjit Pathak, Ernest Kirubakaran Selvaraj, Robin Singh, Ayush Datta, Vishal Gupta und Nachiketh sehr dankbar für ihre Hilfe bei der Erstellung der frühen Versionen der Code-Notebooks. Unser besonderer Dank gilt Varun Purushotham, der mehrere Wochen damit verbracht hat, unsere Entwürfe zu lesen und die Code-Notizbücher vorzubereiten und gegenzuprüfen. Ohne seinen Beitrag wäre dieses Buch nicht dasselbe.
Wir möchten dem Team von O'Reilly Media danken, ohne das dies nicht möglich gewesen wäre: Jonathan Hassell, der uns diese Gelegenheit gegeben hat; Melissa Potter, die sich während dieser Reise regelmäßig mit uns in Verbindung gesetzt und geduldig alle unsere Fragen beantwortet hat! Beth Kelly und Holly Forsyth für die Hilfe und Unterstützung bei der Ausarbeitung der Kapitelentwürfe zu einem Buch.
Zum Schluss folgen persönliche Danksagungen von jedem Autor:
Sowmya: Mein erster und größter Dank geht an meine Tochter Sahasra Malathi, deren Geburt und erstes Lebensjahr mit dem Schreiben dieses Buches zusammenfiel. Es ist nicht leicht, ein Buch zu schreiben, und schon gar nicht mit einem Neugeborenen. Und doch haben wir es geschafft. Danke, Sahasra! Meine Mutter Geethamani und mein Mann Sriram haben mich beim Schreiben unterstützt, indem sie in verschiedenen Phasen des Schreibens die Betreuung des Babys und die Aufgaben im Haushalt übernommen haben. Meine Freundinnen Purnima und Visala hatten immer ein offenes Ohr für meine aufregenden Neuigkeiten und meine Tiraden über das Buch. Mein Chef, Cyril Goutte, ermutigte mich und überprüfte meinen Schreibfortschritt immer wieder. In Gesprächen mit meinen ehemaligen Kollegen Chris Cardinal und Eric Le Fort habe ich viel über die Entwicklung von NLP-Lösungen für Branchenprobleme gelernt, ohne die ich vielleicht nie auf die Idee gekommen wäre, an einem solchen Buch mitzuarbeiten. Ich danke ihnen allen für ihre Unterstützung.
Bodhisattwa: Ich möchte diese Gelegenheit nutzen, um mich bei meinen Eltern zu bedanken, für ihre unbestreitbare Aufopferung und die ständige Ermutigung, die mich zu der Person gemacht haben, die ich heute bin. Sie haben mir die Liebe und die Hingabe zum Lernen in meinem Leben eingeflößt. Ich bin meinen Beratern, Prof. Animesh Mukherjee und Pawan Goyal, die mich in die Welt des NLP eingeführt haben, und Prof. Julian McAuley, der für meine fachliche, akademische und persönliche Entwicklung in meiner Doktorandenlaufbahn von grundlegender Bedeutung ist, auf ewig dankbar. Die Kurse meiner anderen Professoren - Taylor Berg-Kirkpatrick, Lawrence Saul, David Kriegman, Debasis Sengupta, Sudeshna Sarkar und Sourav Sen Gupta - haben mein Wissen zu diesem Thema maßgeblich geprägt. In den Anfängen des Buches haben mich meine Kollegen aus den Walmart Labs - insbesondere Subhasish Misra, Arunita Das, Smaranya Dey, Sumanth Prabhu und Rajesh Bhat - zu dieser verrückten Idee motiviert. Meinen Mentoren bei Google AI, Microsoft Research, Amazon Alexa und meinen Laborkolleginnen und -kollegen der UCSD NLP Group danke ich für ihre Unterstützung und Hilfe auf dieser ganzen Reise. Auch meine Freunde Sanchaita Hazra, Sujoy Paul und Digbalay Bose, die mir bei diesem Mammutprojekt durch dick und dünn zur Seite standen, verdienen eine besondere Erwähnung. Und schließlich wäre das alles nicht möglich gewesen ohne meine Koautoren, die an dieses Projekt geglaubt haben und bis zum Schluss zusammengehalten haben!
Anuj: Zuallererst möchte ich meiner Frau Anu und meinem Sohn Nirvaan meine aufrichtige Dankbarkeit aussprechen. Ohne ihre unermüdliche Unterstützung wäre ich nicht in der Lage gewesen, die letzten drei Jahre diesem Projekt zu widmen. Vielen Dank dafür! Ich möchte auch meinen Eltern und meiner Familie für ihre Ermutigung danken. Ein großes Dankeschön geht an Saurabh Arora, der mich in die Welt des NLP eingeführt hat. Vielen Dank an meine Freunde, den verstorbenen Vivek Jain und Mayur Hemani; sie haben mich immer ermutigt, weiterzumachen, besonders in schwierigen Zeiten. Ich möchte mich auch bei all den großartigen Menschen bedanken, die sich in der Machine-Learning-Community in Bangalore engagieren, insbesondere bei: Sumod Mohan, Vijay Gabale, Nishant Sinha, Ashwin Kumar, Mukundhan Srinivasan, Zainab Bawa und Naresh Jain für all die wunderbaren und zum Nachdenken anregenden Diskussionen. Ich möchte meinen ehemaligen und aktuellen Kollegen bei CSTAR, Airwoot, FreshWorks, Huawei Research, Intuit und Vahan, Inc. für alles danken, was sie mich gelehrt haben. Meinen Professoren Kannan Srinathan, P.R.K. Rao und B. Yegnanarayana, deren Lehren mich zutiefst geprägt haben.
Harshit: Ich möchte meinen Eltern danken, die mich unterstützt und ermutigt haben, jede verrückte Idee zu verfolgen, die ich hatte. Ich kann meinen lieben Freunden Preeti Shrimal und Dev Chandan nicht genug danken. Sie haben mich während der gesamten Reise des Buches begleitet. Meinen Mitbegründern Abhimanyu Vyas und Aviral Mathur danke ich dafür, dass sie unser Startup angepasst haben, um mir bei der Fertigstellung des Buches zu helfen. Ich möchte mich bei all meinen ehemaligen Kollegen bei Quipio und Notify.io bedanken, die mir geholfen haben, mein Denken zu kristallisieren, insbesondere bei Zubin Wadia, Amit Kumar und Naveen Koorakula. Ohne meine Professoren und alles, was sie mir beigebracht haben, wäre das alles nicht möglich gewesen - danke, Prof. Luis von Ahn, Anil Kumar Singh, Alan W Black, William Cohen, Lori Levin und Carlos Guestrin. Ich möchte mich auch bei Kaustuv DeBiswas, Siddharth Narayanan, Siddharth Sharma, Alok Parlikar, Nathan Schneider, Aasish Pappu, Manish Jawa, Sumit Pandey und Mohit Ranka bedanken, die mich an verschiedenen Stellen auf diesem Weg unterstützt haben .
Get Praktische natürliche Sprachverarbeitung now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.