Vorlesung und Übung (Laura Kallmeyer)
Montag 08.30-10.00 und Dienstag 08.30-10.00.
Erste Sitzung: Montag 20.04.2020. Letzte Sitzung: 14.07.2020. Abschlussklausur 20.07.2020, 8.30-11.30 Uhr, Hörsaal 25.21.HS 2A.
Aufgrund der Coronakrise findet die Veranstaltung online statt. Nähere Informationen hier auf der Kursseite im Moodle.
Zusammenfassung
Ziel der Veranstaltung ist es, einen Überblick über Ziele und Methoden der Computerlinguistik zu vermitteln. Die Arbeitsweise der Computerlinguistik wird anhand von Beispielen aus verschiedenen linguistischen Bereichen (Phonologie, Morphologie, Syntax und Semantik) verdeutlicht. Parallel dazu werden Techniken für die formale Repräsentation und automatische Verarbeitung sprachlicher Informationen eingeführt. Die Bedeutung der Computerlinguistik für die Entwicklung praktischer sprachverarbeitender Systeme (etwa für maschinelle Übersetzung, Spracherkennung und automatische Informationsgewinnung aus Texten) wird in der Lehrveranstaltung hervorgehoben.
Hier findet man das Draft von September 2018 der 3rd edition des Buches Speech and Language Processing von Daniel Jurafsky und James H. Martin.
Programm und Folien
- 20.-21.04.20 Einführung und Endliche Automaten
Hier ein Video zur Umwandlung eines NFA in einen DFA, und hier eines zur Minimierung eines DFA (Samya Daleh). - 27.-28.04.20 Reguläre Ausdrücke, reguläre Grammatiken
Hier ein Video zur Ermittlung eines regulären Audrucks für einen gegebenen DFA (Samya Daleh). - 04.-05.05.20 Anwendung Endliche Automaten und Transduktoren: Morphologie
- 11.-12.05.20 N-Grams und Sprachmodelle
- 15.05. und 19.05.20 POS-Tagging, Hidden Markov Models Achtung: die Vorlesung von Montag ist auf den Freitag davor (15.5. statt 18.5.) vorverlegt.
- 25.-26.05.20 Kontextfreie Grammatiken, Kellerautomaten
- 01.06.20 fällt aus (Pfingstmontag)
- 02.06.20 Fortsetzung CFG, PDA.
- 08.-09.06.20 CFG: Formale Eigenschaften, Normalformen
- 15.-16.06.20 Merkmalsstrukturen und Unifikation
- 22.-23.06.20 Symbolisches Parsing
- 29.-30.06.20 Probabilistische Grammatiken
- 06.-07.07.20 Distributionelle Semantik
- 13.-14..07.20 Vorbereitung Abschlussklausur.
Themenwünsche für diese Wiederholungssitzung bitte im Vorfeld per Email an Laura Kallmeyer schicken. - 20.07.20, 10.00-13.00 Uhr Abschlussklausur, Räume 5B, 5C 5F, 5G.
Erlaubte Hilfsmittel: Zwei Din-A4 Seiten mit Notizen. (= entweder zwei einseitig beschriebene Blätter oder ein zweiseitig beschriebenes Blatt)
Aufteilung auf die vier Räme: Nachnamen A bis G in 5B, Nachnamen H bis N in 5C, Nachnamen O bis S in 5F, Nachnamen T bis Z in 5G.
Zu weiteren Details bzgl. Organisation der Klausur siehe die allgemeinen Infos im Moodle.
Material zum Üben: Zwischenklausur 2019 und Abschlussklausur 2019 mit Lösungen (diesmal umfasst die Klausur den gesamten Stoff, entspricht also beiden Klausuren zusammen genommen).
Weitere alte Klausuren sind auf den Kursseiten der letzten Jahre verlinkt.
Hausaufgaben
Es gibt wöchentliche Hausaufgaben (beginnend in der ersten Vorlesungswoche). Abgabe der Hausaufgaben über Moodle. Es darf auch in Gruppen gearbeitet werden, aber nur Gruppen von maximal 3 Personen. In dem Fall reicht eine gemeinsam abgegebene Lösung, natürlich versehen mit den Namen aller Mitglieder der Arbeitsgruppe.
Die Hausaufgaben müssen selbstständig gelöst werden. Insbesondere darf nicht untereinander abgeschrieben werden. Lösungen, die offensichtlich abgeschrieben wurden, werden mit 0 Punkten bewertet.
Bei Fragen zu den Hausaufgaben kann man sich an die Tutoren der Veranstaltung wenden.
- Hausaufgabe zu FSA (mit Lösung).
- Hausaufgabe zu regulären Ausdrücken (mit Lösung).
- Hausaufgabe zu FST und Morphologie (mit Lösung).
- Hausaufgabe zu n-gram Sprachmodellen (mit Lösung).
- Hausaufgabe zu HMM (mit Lösung).
- Hausaufgabe zu CFG (mit Lösung).
- Hausaufgabe zu CFG 2 (mit Lösung).
- Hausaufgabe zu CFG 3 (mit Lösung).
- Hausaufgabe zu Merkmalsstrukturen (mit Lösung).
- Hausaufgabe zu Parsing (mit Lösung).
- Hausaufgabe zu PCFG (mit Lösung).
Leistungsnachweise
AP: Mindestens 50% der Hausaufgabenpunkte müssen erreicht werden. Die Note ist die Note der Klausur, wobei über die 50% hinaus erreichte Hausaufgabenpunkte angerechnet werden (siehe Moodle für Details).
BN: Mindestens 50% der Hausaufgaben müssen bearbeitet werden.