Python für Linguisten (Methodenkurs)
SoSe 15
Organisatorisches
Dozentin: Wiebke Petersen
Co-Dozentin: Esther Seyffarth
Sitzungen: Mo. 12.30-14:00 Uhr Raum 25.41.00.65 und Di. 16:30-18:00 Raum 23.21.00.81-83
Sprechstunde: Mo. 17:00-18:00 in Raum 24.53.00.91
Telefon: 81-15295
Hinweis zum Starten von Python 3.4
Der einfachste Weg, IDLE für Python 3 an den Rechnerräumen zu starten, ist folgender:
- Kommandozeile öffnen und eingeben:
- in Raum 23.21.00.81/83: "activate cl"
- in Raum 25.41.00.65: "activate py34"
- "idle" eingeben
Literaturempfehlung
- Allen B. Downey (2012). Think Python: How to Think Like a Computer Scientist. O'Reilly Media
- Mark Pilgrim (2004). Dive into Python: Python from novice to pro.
- Steven Bird, Ewan Klein, and Edward Loper (2009). Natural Language Processing with Python -- Analyzing Text with the Natural Language Toolkit. O'Reilly Media
- Michael Dawson (2010): Python Programming for the absolute beginner. 3rd edition. Course Technology / Cengage Learning
- Jacob Perkins (2010): Python Text Processing with NLTK 2.0 Cookbook. Packt Publishing.
Folien
- Foliensatz 1
- Foliensatz 2
- Foliensatz 3
- Foliensatz 4
- Foliensatz FileIO
- Foliensatz 5
- Reguläre Ausdrücke
- Fehlerbehandlung und Fehlervermeidung
- NLTK
- Python-Packages und praktische Übung
Tutorials
- http://www.python-kurs.eu/ (deutsch, textbasiert)
- https://www.coursera.org/course/programming1 (englisch, Videos, Anmeldung erforderlich)
Verlaufsprotokolle (Python-Shell)
Inputdateien für Aufgaben
Aufgaben und Musterlösungen
- Aufgabensammlung für den Test als Textdatei, Stand: 17.04.2015
- Musterlösung zu der Übersetzungsaufgabe (dictionaries), 18.05.2015
- Musterlösung zur lateinischen Deklinationsaufgabe (Bildschirmausgabe)
- Musterlösung zur lateinischen Deklinationsaufgabe (wahlweise Bildschirm oder Dateiausgabe)
- Musterlösung zur CMU-Dict-Aufgabe, 27.05.2015
- Musterlösung zur RegEx-Emailadressen-Aufgabe, 26.05.2015
- Projektaufgaben, 2.6.2015. Materialien: minitext.txt, minitext_token.txt. Etherpad zum schnellen Austausch von Code-Schnipseln
- zu korrigierendes Fehlerprogramm (29.06.)
- Beispiellösung für das Fehlerprogramm
- Übungsaufgaben (Klausurvorbereitung) 30.06.2015
- Programmierprojekt, Gruppe Tokenizer
- Programmierprojekt, Gruppe Textstatistik 2
- Programmierprojekt, Gruppe Konkordanz
- Musterlösungen für die praktischen Klausuraufgaben (es gab jeweils viele verschiedene mögliche Lösungen, man musste nicht zwingend die gleichen Ansätze wählen wie in der Musterlösung)
- Aufgabe: Wikipedia-Korpus (13.07.2015)
- Aufgabe: Wikipedia-Korpus Teillösung (14.07.2015)
- NLP-Verarbeitung des Wikipedia-Korpus (14.07.2015)
- Test von Lemmatizer und Stemmer (14.07.2015)