Vorlesung und Übung (Laura Kallmeyer)

Montag 08.30-10.00 Raum 24.21.01.85, ab 23.05.22 montags immer 23.21 HS 3H, und Dienstag 08.30-10.00 Raum 25.21.HS 5E.

Erste Sitzung: Montag 04.04.2022. Letzte Sitzung: 12.07.2022.

Der Kurs findet in Präsenz statt. Nähere Informationen hier auf der Kursseite im Moodle.

Zusammenfassung

Ziel der Veranstaltung ist es, einen Überblick über Ziele und Methoden der Computerlinguistik zu vermitteln. Die Arbeitsweise der Computerlinguistik wird anhand von Beispielen aus verschiedenen linguistischen Bereichen (Phonologie, Morphologie, Syntax und Semantik) verdeutlicht. Parallel dazu werden Techniken für die formale Repräsentation und automatische Verarbeitung sprachlicher Informationen eingeführt. Die Bedeutung der Computerlinguistik für die Entwicklung praktischer sprachverarbeitender Systeme (etwa für maschinelle Übersetzung, Spracherkennung und automatische Informationsgewinnung aus Texten) wird in der Lehrveranstaltung hervorgehoben.

Hier findet man das Draft von September 2020 der 3rd edition des Buches Speech and Language Processing von Daniel Jurafsky und James H. Martin: https://web.stanford.edu/~jurafsky/slp3/ed3book.pdf

Programm und Folien

04.04.22 Introduction 
05.04.22 Endliche Automaten (Finite State Automata, FSA).
Hier ein Video zur Umwandlung eines NFA in einen DFA, und hier eines zur Minimierung eines DFA (Samya Daleh).
11.04.22 FSA continuted
12.04.22 Reguläre Ausdrücke, reguläre Grammatiken
Hier ein Video zur Ermittlung eines regulären Audrucks für einen gegebenen DFA (Samya Daleh).
18.04.22 fällt aus (Ostermontag)
19.04.22 reguläre Ausrücke continued
25.04.22 Anwendung Endliche Automaten und Transduktoren: Morphologie
26.04.22 Morphologie mit FST continued
02.05.22 FST continued
03.05.22 N-Grams und Sprachmodelle (language models)
09.05.22 Hidden Markov Models, POS Tagging 
10.05.22 HMM continued
16.05.22 HMM continued
17.05.22 Wiederholung. Ein Link zu alten Klausuren mit Lösungen findet sich im Moodle. 
23.05.22 Zwischenklausur, 23.21, Hörsaal 3H. Erlaubte Hilfsmittel: Eine Din-A4 Seite mit Notizen.
24.05.22 Kontextfreie Grammatiken, Kellerautomaten
30.05.22 23.21, HS 3H! CFG continued
31.05.22 Kellerautomaten continued
06.06.22 fällt aus (Pfingsten)
07.06.22 CFG: Formale Eigenschaften, Normalformen 
13.06.22 CFG continued (Pumping Lemma). Exkurs: natürliche Sprachen sind nicht kontextfrei.
14.06.22 Merkmalsstrukturen und Unifikation
20.06.22 Merkmalsstrukturen  continued
21.06.22 Merkmalsstrukturen continued
27.06.22 Symbolisches Parsing (Konstituentenstruktur)
28.06.22 PCFG, probabilistisches Konstituentenparsing
04.07.22 PCFG continued
05.07.22 Vektorsemantik (= distributionelle Semantik)
11.07.22 Wiederholung
12.07.22 Abschlussklausur. Erlaubte Hilfsmittel: Eine Din-A4 Seite mit Notizen.

Hausaufgaben

Es gibt wöchentliche Hausaufgaben (beginnend in der ersten Vorlesungswoche, insgesamt 12 Aufgabenblätter). Abgabe der Hausaufgaben über Moodle. Es darf auch in Gruppen gearbeitet werden, aber nur Gruppen von maximal 3 Personen. In dem Fall reicht eine gemeinsam abgegebene Lösung, natürlich versehen mit den Namen aller Mitglieder der Arbeitsgruppe.

Die Hausaufgaben müssen selbstständig gelöst werden. Insbesondere darf nicht untereinander abgeschrieben werden. Lösungen, die offensichtlich abgeschrieben wurden, werden mit 0 Punkten bewertet.

Abgabe der Hausaufgaben im Moodle. Bei Fragen zu den Hausaufgaben kann man sich an die Tutoren der Veranstaltung wenden.

  1. Hausaufgabe zu FSA, Abgabe 12.04.22 vor der Vorlesung. Mit Lösung.
  2. Hausaufgabe zu FSA/reguläre Ausdrücke, Abgabe 19.04.22 vor der Vorlesung. Mit Lösung.
  3. Hausaufgabe zu regulären Ausdrücken, regulären Grammatiken, Abgabe 26.04.22 vor der Vorlesung. Mit Lösung.
  4. Hausaufgabe FST und Morphologie, Abgabe 03.05.22 vor der Vorlesung. Mit Lösung.
  5. Hausaufgabe n-Gramme und Sprachmodelle, Abgabe 10.05.22 vor der Vorlesung. Mit Lösung.
  6. Hausaufgabe HMM und POS tagging, Abgabe 17.05.22 vor der Vorlesung. Mit Lösung.
  7. Hausaufgabe CFG, Abgabe 07.06.22 vor der Vorlesung. Mit Lösung.
  8. Hausaufgabe PDA und CFG. Abgabe 14.06.22 vor der Vorlesung. Mit Lösung.
  9. Hausaufgabe CFG Formale Eigenschaften. Abgabe 21.06.22 vor der Vorlesung. Mit Lösung.
  10. Hausaufgabe Merkmalsstrukturen. Abgabe 28.06.22 vor der Vorlesung. Mit Lösung.
  11. Hausaufgabe symbolisches Parsing. Abgabe 05.07.22 vor der Vorlesung. Mit Lösung.
  12. Hausaufgabe PCFG. Abgabe 11.07.22 vor der Vorlesung. Mit Lösung.
Leistungsnachweise

AP: Mindestens 50% der Hausaufgabenpunkte müssen erreicht werden. Die Note ist der Durchschnitt der Noten der beiden Klausuren, wobei über die 50% hinaus erreichte Hausaufgabenpunkte angerechnet werden (siehe Moodle für Details).

BN: Mindestens 50% der Hausaufgaben müssen bearbeitet werden.