Aufbauseminar (Laura Kallmeyer)
Module im BA CL integrativ: CL3, CL5, CL6
Montag 10.30-12.00, Raum 23.21.04.22 und Donnerstag 10.30-12.00, Raum 23.21.U1.72.
Erste Sitzung: Montag 11.10.2021. Letzte Sitzung: 03.02.2022.
Das Seminar wird hybrid stattfinden. Nähere Infos hier auf der Moodle Seite des Kurses.
Summary
Since the 80s, we know that natural languages are not context-free. Starting from this insight, the notion of mild context-sensitivity has been developed, which is oftentimes assumed to constitute a good characterization of the complexity of natural languages.
In this course, we will look at some mildly context-sensitive grammar formalisms, more specifically at tree-rewriting formalisms such as Tree Adjoining Grammars (TAG) and at Linear Context-Free Rewriting Systems (LCFRS). We will investigate their formal properties, learn about symbolic parsing algorithms that have been proposed for them and also give an overview of data-driven approaches to using these formalisms in the context of probabilistic parsing. Finally, we will also cover recent approaches to grammar-less transition-based parsing that aim at generating structures that are beyond the structures context-free grammars can describe.
Textbook: Laura Kallmeyer (2010): Parsing Beyond Context-Free Grammars. Springer.
Further references are given on the slides.
Schedule and slides (under construction)
The following contains still some links to old slides, from the 2018 edition of the course, which was taught by Tatiana Bladier and Laura Kallmeyer. Slides might be updated later. The concrete form of the seminar will be fixed at the beginning of October, including requirements for BNs and APs.
- 11.10.21 Introduction (updated 12.10.21)
- 14.10.21 Natural languages are not context-free (updated 14.10.21)
- 18.10.21 Tree Adjoining Grammars (updated 15.10.21)
- 21.10.21 TAG continued
- 25.10.21 Formal properties of Tree Adjoining Languages
- 28.10.21 Chart parsing for TAG (CYK parsing) (updated 22.10.21). Session is held by Tatiana Bladier.
- 01.11.21 holiday
- 04.11.21 Chart parsing for TAG continued (CYK, Earley). An example for CYK can be found here: ex-tag-cyk , for Earley here.
- 08.11.21 Chart parsing for TAG continued
- 11.11.21, TAG: Grammar induction, updated 13.11.21
- 15.11.21 Grammar induction for TAG continued.
- 18.11.21 Data-driven TAG parsing: TIG. (updated 18.11.21) An example for TIG parsing can be found here and also in the solution to the TIG homework (see below)
- 22.11.21 Data-driven TAG parsing continued.
- 25.11.21 Preparation mid-term exam. The exam from 2018 including solutions can be found here. Further exercises for preparing can be found here.
- 29.11.21 Mid-term exam. Präsenzpflicht!
- 02.12.21 Supertagging (updated 01.12.2021)
- 06.12.21 Linear Context-Free Rewriting Systems (LCFRS) (updated 01.12.2021)
- 09.12.21 LCFRS: Formal properties
- 13.12.21 LCFRS normal forms (updated 13.12.21)
- 16.12.21 Chart parsing for LCFRS
- 20.12.21 LCFRS chart parsing continued (incremental Earley)
- 06.01.22 EPDA, session is prerecorded, see information in moodle or rocketchat
- 10.01.22 Thread Automata
- 14.01.22 Thread Automata continued
- 17.01.22 Data-driven LCFRS parsing
- 20.01.22 Data-oriented parsing
- 24.01.22 DOP continued
- 27.01.22 Preparation of final exam. Preparation exercises, final exam from 2018: final-exam-2018_solutions.
- 31.01.22 Final exam. Präsenz für APs, online für BNs.
- 03.02.22 Discussion exam
Hausaufgaben (under construction)
Es gibt wöchentliche Hausaufgaben. Abgabe der Hausaufgaben über Moodle. Es darf auch in Gruppen gearbeitet werden, aber nur Gruppen von maximal 3 Personen. In dem Fall reicht eine gemeinsam abgegebene Lösung, natürlich versehen mit den Namen aller Mitglieder der Arbeitsgruppe.
Die Hausaufgaben müssen selbstständig gelöst werden. Insbesondere darf nicht untereinander abgeschrieben werden. Lösungen, die offensichtlich abgeschrieben wurden, werden als nicht abgegeben bewertet.
- Hausaufgabe zu CFG: beyond-homework-cfg, Abgabe 20.10 (mit Lösung)
- Hausaufgabe zu TAG: beyond-homework-tag, Abgabe 27.10. (mit Lösung)
- Hausaufgabe zu formalen Eigenschaften von TAG: beyondCFG-homework-tag2, Abgabe 3.11. (mit Lösung)
- Hausaufgabe zu TAG Chart Parsing: beyondCFG-homework-tag-parsing, Abgabe 10.11. (mit Lösung)
- Hausaufgabe zu TAG Earley Parsing und TAG Extraktion:beyondCFG-tag-earley-extraction, Abgabe 17.11. (mit Lösung)
- Hausaufgabe zu TIG: beyondCFG-homework-tig, Abgabe 24.11. (mit Lösung)
- Hausaufgabe zu LCFRS: beyondCFG-homework-lcfrs, Abgabe 15.12. (mit Lösung)
- Hausaufgabe zu LCFRS Parsing: beyondCFG-homework-lcfrs-parsing Abgabe 12.01. (mit Lösung)
- Hausaufgabe zu EPDA: beyondCFG-homework-epda Abgabe 19.01., (mit Lösung)
- Hausaufgabe zu Data-driven LCFRS parsing: beyondCFG-homework-lcfrs-data-driven, freiwillig (kann fehlende Punkte bei den anderen Hausaufgaben ausgleichen), Abgabe 26.01.
Leistungsnachweise
AP: Alle Hausaufgaben müssen sinnvoll bearbeitet und abgegeben werden, bis auf die letzte, die freiwillig ist. (Max. zwei nicht bearbeitete Hausaufgabenblätter sind erlaubt.) Darüber hinaus müssen die beiden Klausuren mitgeschrieben werden. Diese werden benotet. Die Gesamtnote setzt sich zu gleichen Teilen aus den beiden Klausurnoten zusammen.
BN: Alle Hausaufgaben müssen sinnvoll bearbeitet und abgegeben werden, bis auf die letzte, die freiwillig ist. (Max. zwei nicht bearbeitete Hausaufgabenblätter sind erlaubt.) Darüber hinaus müssen die beiden Klausuren mitgeschrieben werden, wobei mindestens die Hälfte der Aufgaben sinnvoll bearbeitet werden muss.