Dozentin: Wiebke Petersen
Sitzungen: Die 14.30 - 16.00 Uhr in Raum 24.21.03.61 (Computerraum)
Sprechstunde: Nach Absprache
Telefon: 81-15295
E-Mail:
Abschluss des Kurses:
BN : Für den Beteiligungsnachweis wird eine aktive Teilnahme am Kurs erwartet, sowie das erfolgreiche Abschließen des Kurses “Machine Learning” auf Coursera. Hierfür schicken Sie bitte einen Screenshot als Nachweis an mich.
AP : Für die Abschlussprüfung sollen die erlernten Kursinhalte in einem Projekt angewandt werden.
Es steht Ihnen frei, ob Sie mit eigenen oder fremden Datensätzen arbeiten. Je nachdem wie Sie sich entscheiden, erwarte ich allerdings eine andere Schwerpunktsetzung der Arbeit.
Abgabe ist zum Ende der vorlesungsfreien Zeit.
Eigene Daten
Wenn Sie sich für eigene Daten entscheiden und es schwierig ist diese zu erheben, es unklar ist, welche Merkmale zu wählen sind, die genaue Fragestellung erst noch herausgearbeitet werden muss und die Daten nicht auf Anhieb die erwarteten Zusammenhänge zeigen, so sollten Sie Ihr Vorgehen und Ihre Entscheidungen genau beschreiben. Hierbei kann es völlig ausreichend sein, sich auf einen Algorithmus zu konzentrieren.
Beispieldaten
Greifen Sie jedoch auf Beispieldatensätze zurück, die regelmäßig für das Testen von maschinellen Lernverfahren eingesetzt werden, so sollten Sie mindestens zwei Verfahren einsetzen (eventuell auch ein Verfahren, das nicht Bestandteil des Kurses ist), die Ergebnisse vergleichen und diskutieren. Bei der Verwendung von vorgegebenen Datensätzen nimmt die Darstellung der Algorithmen naturgemäß einen größeren Anteil der Arbeit ein, da das Beschreiben der Datenerhebung und der Merkmalsauswahl entfällt.
Neuer Studiengang: Computerlinguistik
Der Kurs folgt dem Prinzip des “inverted classroom”. Wir werden uns gemeinsam die Inhalte zu dem Kurs “Machine Learning” von Andrew Ng erarbeiten ( Link zum MOOC). Bitte legen Sie sich einen Account auf der Coursera-Seite an und melden Sie sich für den Kurs an. Für die Sitzungen müssen Sie die jeweiligen Materialien durchgearbeitet haben:
Hilfreiche Links
Datensätze
Language Data
(Dryer, Matthew S. & Haspelmath, Martin (eds.) 2013. The World Atlas of Language Structures Online. Leipzig: Max Planck Institute for Evolutionary Anthropology.)
Vorzubereiten: “Introduction”, “Linear Regression” und “Linear Algebra”
Vorzubereiten : “Multivariative Linear Regression”, “Computing Parameters Analytically”, sowie die Implementierung der Basisfunktionen(programming assignment)
Sie können die Programmieraufgabe in Octave oder in R lösen (von mir auch in Python oder was Sie sonst wünschen). Bitte bringen Sie ihre Programme zur Sitzung mit.
Falls Sie mit R arbeiten wollen, finden Sie hier die Starter-Dateien: (R-Code). Sie müssten zusätzliche Pakete installieren: install.packages(c(‘rgl’,‘lbfgsb3’,‘SnowballC’,‘raster’,‘jsonlite’, ‘httr’))
Vorzubereiten: “Logistic Regression” und “Regularization”
Vorzubereiten: “Regularization” und Wiederholung
Schauen Sie sich bitte die bisherigen Materialien noch einmal intensiv durch
Vorzubereiten: “Neural Networks: Representation”
Vorzubereiten: “Neural Networks: Learning”
Vorzubereiten: “Advice for Applying Machine Learning”
Vorzubereiten: “Machine Learning System Design”
Vorzubereiten: “Support Vector Machines”
Vorzubereiten: “Unsupervised Learning”
Fällt aus
Vorzubereiten: “Anomaly Detection”
Vorzubereiten: “Large Scale Machine Learning”
Vorzubereiten: “Application Example: Photo OCR”