Vorlesung und Übung (Laura Kallmeyer)
Montag 08.30-10.00 und Dienstag 08.30-10.00.
Erste Sitzung: Montag 12.04.2021. Letzte Sitzung: 20.07.2021.
Aufgrund der Coronakrise findet die Veranstaltung online statt. Nähere Informationen hier auf der Kursseite im Moodle.
Zusammenfassung
Ziel der Veranstaltung ist es, einen Überblick über Ziele und Methoden der Computerlinguistik zu vermitteln. Die Arbeitsweise der Computerlinguistik wird anhand von Beispielen aus verschiedenen linguistischen Bereichen (Phonologie, Morphologie, Syntax und Semantik) verdeutlicht. Parallel dazu werden Techniken für die formale Repräsentation und automatische Verarbeitung sprachlicher Informationen eingeführt. Die Bedeutung der Computerlinguistik für die Entwicklung praktischer sprachverarbeitender Systeme (etwa für maschinelle Übersetzung, Spracherkennung und automatische Informationsgewinnung aus Texten) wird in der Lehrveranstaltung hervorgehoben.
Hier findet man das Draft von September 2020 der 3rd edition des Buches Speech and Language Processing von Daniel Jurafsky und James H. Martin: https://web.stanford.edu/~jurafsky/slp3/ed3book.pdf
Programm und Folien
(Es handelt teilweise um die Folien vergangener Jahre, daher das nicht immer ganz aktuelle Datum.)
- 12.04.21 Introduction
- 13.04.21 Endliche Automaten (Finite State Automata, FSA). Hier ein Video zur Umwandlung eines NFA in einen DFA, und hier eines zur Minimierung eines DFA (Samya Daleh).
- 19.04.21 FSA continuted
- 20.04.21 Reguläre Ausdrücke, reguläre Grammatiken
Hier ein Video zur Ermittlung eines regulären Audrucks für einen gegebenen DFA (Samya Daleh). - 26.04.21 reguläre Ausrücke continued
- 27.04.21 Anwendung Endliche Automaten und Transduktoren: Morphologie
- 03.05.21 Morphologie mit FST continued
- 04.05.21 FST continued
- 10.05.21 N-Grams und Sprachmodelle
- 11.05.21 Sprachmodelle continued
- 17.05.21 POS-Tagging, Hidden Markov Models
- 18.05.21 HMM continued
- 24.05.21 fällt aus (Pfingsten)
- 25.05.21 Kontextfreie Grammatiken, Kellerautomaten
- 31.05.21 CFG continued
- 01.06.21 CFG: Formale Eigenschaften, Normalformen
- 07.06.21 CFG continued
- 08.06.21 CFG continued (Pumping Lemma). Exkurs: natürliche Sprachen sind nicht kontextfrei.
- 14.06.21 Merkmalsstrukturen und Unifikation
- 15.06.21 Merkmalsstrukturen continued
- 21.06.21 Symbolisches Parsing (Konstituentenstruktur)
- 22.06.21 Symbolisches Parsing continued
- 28.06.21 PCFG, probabilistisches Konstituentenparsing
- 29.06.21 PCFG contnued
- 05.07.21 Vektorsemantik (= distributionelle Semantik)
- 06.07.21 Vektorsemantik continued
- 12.07.21 Wiederholung: Klausur von 2020, Altklausuren: siehe Moodle.
- 13.07.21 Wiederholung
- 19.07.21 Wiederholung, hybrid, in Hörsaal 25.31.HS 5J (24 Corona-Plätze). Nähere Infos im Moodle.
- 20.07.21 Wiederholung, online, webex. Link siehe Moodle.
Abschlussklausur am 02.08.2021 von 12.15 Uhr bis 15.15 Uhr in Präsenz. Details folgen noch.
Hausaufgaben
Es gibt wöchentliche Hausaufgaben (beginnend in der ersten Vorlesungswoche, insgesamt 12 Aufgabenblätter). Abgabe der Hausaufgaben über Moodle. Es darf auch in Gruppen gearbeitet werden, aber nur Gruppen von maximal 3 Personen. In dem Fall reicht eine gemeinsam abgegebene Lösung, natürlich versehen mit den Namen aller Mitglieder der Arbeitsgruppe.
Die Hausaufgaben müssen selbstständig gelöst werden. Insbesondere darf nicht untereinander abgeschrieben werden. Lösungen, die offensichtlich abgeschrieben wurden, werden mit 0 Punkten bewertet.
Bei Fragen zu den Hausaufgaben kann man sich an die Tutoren der Veranstaltung wenden.
- Hausaufgabe zu FSA, Abgabe 26.04.21. Mit Lösung.
- Hausaufgabe zu regulären Ausdrücken, Abgabe 03.05.21. Mit Lösung.
- Hausaufgabe zu FST und Morphologie, Abgabe 10.05.21. Mit Lösung.
- Hausaufgabe zu n-gram language models, Abgabe 17.05.21. Mit Lösung.
- Hausaufgabe zu HMM, Abgabe 25.05.21. Mit Lösung.
- Hausaufgabe zu CFG, Abgabe 31.05.21. Mit Lösung.
- Hausaufgabe CFG 2, Abgabe 07.06.21. Mit Lösung.
- Hausaufgabe CFG 3, Abgabe 14.06.21. Mit Lösung.
- Hausaufgabe zu Merkmalsstrukturen, Abgabe 21.06.21. Mit Lösung.
- Hausaufgabe zu Parsing, Abgabe 28.06.21. Mit Lösung.
- Hausaufgabe zu PCFG, Abgabe 05.07.21. Mit Lösung.
- Hausaufgabe zu Vektorsemantik, Abgabe 12.07.21. Mit Lösung.
Leistungsnachweise
AP: Mindestens 50% der Hausaufgabenpunkte müssen erreicht werden. Die Note ist die Note der Klausur, wobei über die 50% hinaus erreichte Hausaufgabenpunkte angerechnet werden (siehe Moodle für Details).
BN: Mindestens 50% der Hausaufgaben müssen bearbeitet werden.