Am 13. September 2020 finden in Nordrhein-Westfalen die Kommunalwahlen statt. Wahlen und Datenanalyse sowie Statistiken gehörten schon immer zusammen, egal ob Prognosen oder Rückschlüsse nach der Wahl, vieles wird analysiert.
Auch wir haben Daten zu den Kandidatinnen und Kandidaten für den Düsseldorfer Stadtrat analysiert und statistische Informationen visualisiert. Unsere kleine Analyse soll einen Einblick in die Datenanalyse mit der Programmiersprache Python und deren Modulen pandas und matplotlib geben.
Datenquelle
Da wir keine eigenen Daten über die Kandidatinnen und Kandidaten vorliegen haben, bedienen wir uns aus Quellen der Stadt Düsseldorf. Diese und viele andere Kommunen, Länder und Staaten, sowie öffentliche Einrichtungen stellen unter den Begriffen Open Government bzw. Open Data viele Daten bereit.
Auf der Webseite https://opendata.duesseldorf.de/dataset/ratswahl-2020-d%C3%BCsseldorf lassen sich die von uns genutzten Daten herunterladen (Download: 19.08.2020). Ähnliche Quellen gibt es auch bei vielen anderen Kommunen, wobei nicht alle die gleichen Daten bereitstellen. Es gibt jedoch immer die Möglichkeit Anfragen für Daten zu stellen.
Datenanalyse und Visualisierung
Mit Hilfe der Python Module pandas (Auswertung) und matplotlib (Grafische Darstellung) haben wir die vorliegenden Daten in einem Jupyter Notebook analysiert und grafisch ausgewertet.
Im folgenden Abschnitt geben wir einen Einblick in die Analyse und zeigen einen Teil der Ergebnisse. Das vollständige Jupyter Notebook findet ihr hier: Jupyter Notebook auf GitHub
Daten einlesen
Die genutzten Daten liegen als CSV-Datei vor und können relativ schnell mit Hilfe von pandas eingelesen werden:
df = pd.read_csv("./Daten/Rats_Kandidatinnen_und_Kandidaten _0.csv", delimiter=";")
Die CSV-Datei beinhaltet Informationen zu 703 Kandidatinnen und Kandidaten für den Stadtrat:
Vorname und Name
Akademischer Grad
Jahrgang / Geburtsjahr
Geburtsort
Beruf
Wohnort inkl. PLZ
Partei (inkl. Abkürzung)
Wahlbezirk
Reserveliste Platz
E-Mail Adresse
Verteilung der Kandidatinnen und Kandidaten
In einer ersten Analyse haben wir uns die Verteilung der Personen auf die 16 Parteien (inkl. einer Einzelbewerberin) angeguckt. Diese Verteilung haben wir mit matplotlib grafisch dargestellt.