_Empfohlene Unterrichtsinhalte als Vorbereitung f√ºr dieses Thema: 01-03 (Variablen), 02-01 (Strings), 02-02 (Listen), 03-02 (Bedingungen), 03-03 (Schleifen)_

# Einf√ºhrung in die computerlinguistische Programmierung mit Python
# 04-02: Dateien schreiben üìù
Der Inhalt von Variablen ist immer bis zum Ende der Laufzeit verf√ºgbar. Ausgaben, die wir mit `print()` umsetzen, sind nur so lange sichtbar, bis wir das Terminal schlie√üen. Wenn wir Informationen **langfristig speichern** wollen, k√∂nnen wir Dateien im Dateisystem des Computers anlegen und sie mit Inhalten f√ºllen.

Der folgende Code erzeugt eine Datei und schreibt einige Zeilen in diese Datei:

In [None]:
filename = "secrets.txt"

# Mit dieser Zeile √∂ffnen wir die Datei
# zum Schreiben ("w" wie "write").
with open(filename, "w") as outfile:

    # Hier definieren wir den Inhalt,
    # der in die Datei geschrieben
    # werden soll.
    content = """Ich mag Python mehr als Java.
Ich mag Kuhmilch mehr als Sojamilch.
Ich mag Herbst lieber als Fr√ºhling."""
    
    # Dieser print-Befehl gibt den Inhalt
    # in die Datei outfile aus.
    print(content, file=outfile)
    
    # Dieser print-Befehl gibt Informationen direkt hier aus.
    print("Daten wurden in der Datei " + filename + " gespeichert!")

Den Dateinamen k√∂nnen wir frei w√§hlen. Wir verwenden meist die Dateiendung `.txt` f√ºr Textdateien. Wenn wir nur den Namen angeben, wird die Datei im gleichen Verzeichnis erzeugt, in dem unser Pythoncode ausgef√ºhrt wird. Um einen anderen Speicherort zu w√§hlen, geben wir absolute Pfade an, z.B. `filename = "D:/Files/secrets.txt"`.



In [None]:
#######################################################
# OPTIONAL/HINWEIS                                    #
# Die folgenden zwei Zeilen k√∂nnt ihr an              # 
# den Anfang eures Codes kopieren, um herauszufinden, #
# in welchem Ordner der Code ausgef√ºhrt wird (und     #
# wo demnach die neue Datei gespeichert wird):        #
#######################################################

import os
print(os.getcwd())


Die Zeile, die mit `with` beginnt, √∂ffnet die Datei. Danach folgende Zeilen sind einger√ºckt: Nur innerhalb des Blocks k√∂nnen wir auf das Objekt `outfile` zugreifen.

Die allgemeine Form des Codes zum √ñffnen einer Datei im Schreibmodus sieht so aus:

```python
with open(<dateiname>, "w") as <dateivariable>:
    ...
    print(<inhalt>, file=<dateivariable>)
    
```

F√ºr alle einger√ºckten Zeilen ist die ge√∂ffnete Datei verf√ºgbar. Sobald wieder Code ohne Einr√ºckung folgt, wird die Datei automatisch vom Interpreter **geschlossen**.

Die Dateivariable ist ein Name, den wir frei w√§hlen k√∂nnen, √§hnlich wie bei der Laufvariable in `for`-Schleifen. Diese Variable brauchen wir, um Inhalte in die Datei zu schreiben: Wir verwenden hierf√ºr `print` mit dem zus√§tzlichen Parameter `file`. Dabei muss der Wert f√ºr `file` der Variablenname sein, den wir beim √ñffnen der Datei erzeugt haben.

Wir haben oben den Modus **`"w"` wie `write`** (schreiben) gew√§hlt. Bei jeder Ausf√ºhrung des Codes wird die Datei **komplett √ºberschrieben**. Wenn wir stattdessen **`"a"` wie `append`** (anh√§ngen) verwenden, wird neuer Inhalt immer nach dem bisherigen Inhalt platziert, sodass nichts verlorengeht. Hier kann man den Unterschied gut sehen, wenn man beide Code-Varianten ausf√ºhrt und am Ende die beiden Dateien vergleicht:

In [None]:
filename = "secrets_write.txt"

# Modus w
with open(filename, "w") as outfile:
    print("Secret:", file=outfile)
    content = "Ich mag Python mehr als Java."
    print(content, file=outfile)    
    print("Daten wurden in der Datei " + filename + " gespeichert!")

# Modus w
with open(filename, "w") as outfile:
    print("Secret:", file=outfile)
    content = "Ich mag Kuhmilch mehr als Sojamilch."
    print(content, file=outfile)    
    print("Daten wurden in der Datei " + filename + " gespeichert!")

# Modus w
with open(filename, "w") as outfile:
    print("Secret:", file=outfile)
    content = "Ich mag Herbst lieber als Fr√ºhling."""
    print(content, file=outfile)    
    print("Daten wurden in der Datei " + filename + " gespeichert!")        

In [None]:
filename = "secrets_append.txt"

# Modus a
with open(filename, "a") as outfile:
    print("Secret:", file=outfile)
    content = "Ich mag Python mehr als Java."
    print(content, file=outfile)    
    print("Daten wurden in der Datei " + filename + " gespeichert!")

# Modus a
with open(filename, "a") as outfile:
    print("Secret:", file=outfile)
    content = "Ich mag Kuhmilch mehr als Sojamilch."
    print(content, file=outfile)    
    print("Daten wurden in der Datei " + filename + " gespeichert!")

# Modus a
with open(filename, "a") as outfile:
    print("Secret:", file=outfile)
    content = "Ich mag Herbst lieber als Fr√ºhling."""
    print(content, file=outfile)    
    print("Daten wurden in der Datei " + filename + " gespeichert!")        

## Encodings
Im Beispiel eben kam ein Umlaut vor, der m√∂glicherweise in den erzeugten Dateien nicht richtig dargestellt wurde. Das liegt daran, dass beim Schreiben von Dateien mehrere m√∂gliche technische Umsetzungen der einzelnen Zeichen zur Verf√ºgung stehen.

Um sicherzugehen, dass eine Datei korrekt geschrieben wird, k√∂nnen wir beim √ñffnen das Encoding `utf8` als Parameter √ºbergeben. Dann sieht unser Beispiel so aus:

In [None]:
filename = "secrets_umlaut.txt"

# Modus w
with open(filename, "w", encoding="utf8") as outfile:
    print("Secret:", file=outfile)
    content = "Sch√∂ne, √§sthetische Umlaute f√ºr alle!!"
    print(content, file=outfile)    
    print("Daten wurden in der Datei " + filename + " gespeichert!")

# Zusammenfassung
* Wir k√∂nnen Informationen in Dateien speichern, um sie dauerhaft verf√ºgbar zu machen.
* Dateien k√∂nnen mit `with open(...) as outfile:` ge√∂ffnet werden.
* Wir k√∂nnen nur innerhalb des `with open`-Blocks auf die Datei zugreifen.
* Mit `print(..., file=outfile)` k√∂nnen wir Informationen in die Datei schreiben.
* Wir k√∂nnen Dateien im `w`-Modus komplett √ºberschreiben, oder im `a`-Modus neue Inhalte anh√§ngen, ohne die vorhandenen Inhalte zu l√∂schen.
* Mit dem Parameter `encoding="utf8"` stellen wir sicher, dass auch Umlaute und andere Zeichen ordnungsgem√§√ü dargestellt werden.

# Weitere Themen dieser Woche
* 04-01: Dictionarys
* 04-03: Dateien lesen