Datenanalyse Praxis - Kommunalwahl 2020

Aktualisiert: 10. Dez 2020

Am 13. September 2020 finden in Nordrhein-Westfalen die Kommunalwahlen statt. Wahlen und Datenanalyse sowie Statistiken gehörten schon immer zusammen, egal ob Prognosen oder Rückschlüsse nach der Wahl, vieles wird analysiert.

Auch wir haben Daten zu den Kandidatinnen und Kandidaten für den Düsseldorfer Stadtrat analysiert und statistische Informationen visualisiert. Unsere kleine Analyse soll einen Einblick in die Datenanalyse mit der Programmiersprache Python und deren Modulen pandas und matplotlib geben.


Datenquelle

Da wir keine eigenen Daten über die Kandidatinnen und Kandidaten vorliegen haben, bedienen wir uns aus Quellen der Stadt Düsseldorf. Diese und viele andere Kommunen, Länder und Staaten, sowie öffentliche Einrichtungen stellen unter den Begriffen Open Government bzw. Open Data viele Daten bereit.

Auf der Webseite https://opendata.duesseldorf.de/dataset/ratswahl-2020-d%C3%BCsseldorf lassen sich die von uns genutzten Daten herunterladen (Download: 19.08.2020). Ähnliche Quellen gibt es auch bei vielen anderen Kommunen, wobei nicht alle die gleichen Daten bereitstellen. Es gibt jedoch immer die Möglichkeit Anfragen für Daten zu stellen.


Datenanalyse und Visualisierung

Mit Hilfe der Python Module pandas (Auswertung) und matplotlib (Grafische Darstellung) haben wir die vorliegenden Daten in einem Jupyter Notebook analysiert und grafisch ausgewertet.

Im folgenden Abschnitt geben wir einen Einblick in die Analyse und zeigen einen Teil der Ergebnisse. Das vollständige Jupyter Notebook findet ihr hier: Jupyter Notebook auf GitHub


Daten einlesen

Die genutzten Daten liegen als CSV-Datei vor und können relativ schnell mit Hilfe von pandas eingelesen werden:

df = pd.read_csv("./Daten/Rats_Kandidatinnen_und_Kandidaten _0.csv", delimiter=";")