976401 VU Fundamentals of Data Analytics
Wintersemester 2019/2020 | Stand: 01.10.2019 | LV auf Merkliste setzenÜberblick und Kenntnisse moderner Werkzeuge zur Datenanalyse. Fähigkeit zur selbständigen Durchführung von datenwissenschaftlichen Grundlagenprojekten, einschließlich der Auswahl einer geeigneten datengetriebenen Methode und der Kommunikation der entsprechenden Ergebnisse.
Inhalt:
Woche 1:
- Modulübersicht und R-Einführung.
- Datenerfassung, Web-Scraping und Reinigung.
- Explorative Analyse.
- Tests.
- Lineare Regression.
Woche 2:
- Reproduzierbarkeit, Berichterstattung und Kommunikation:
R/Markdown, Webanwendungen, Dashboards.
- Unüberwachtes Lernen:
Clustering, Hauptkomponentenanalyse und Faktorenanalyse.
- Variablen- und Modellauswahl.
- Verallgemeinerte lineare Modelle (GLM).
- Verallgemeinerte additive Modelle (GAM).
* Woche 3:
- Tutorials.
- Projektpräsentationen.
Jede der Sitzungen beginnt mit einem Vortrag am Vormittag, gefolgt von einer Diskussion. Im Anschluss daran werden die erlernten Methoden in einer angewandten Sitzung mit Hilfe der statistischen Programmierumgebung R (https://www.R-project.org/) auf reale Datenprobleme angewandt. Nach jedem Tag wird eine Hausaufgabe erteilt, die für die nächste angewandte Sitzung vorbereitet werden muss. Die Hausaufgaben werden von den Studenten zu Beginn der angewandten Sitzungen präsentiert. Am Ende des Kurses steht ein datenwissenschaftliches Projekt, das 60% der erreichbaren Punkte abdeckt. Alle Hausaufgaben decken 40% der erreichbaren Punkte ab.
Schriftlich und mündlich
Entsprechende Referenzen werden hauptsächlich in den Folien dargestellt. Empfohlene Lehrbücher sind:
*Yihui Xie, J. J. Allaire, Garrett Grolemund (2018). R Markdown: The Definitive Guide.
Chapman & Hall/CRC. ISBN 9781138359338.
URL: https://bookdown.org/yihui/rmarkdown
* Wickham H, Grolemund G (2017). R for Data Science: Import, Tidy, Transform, Visualize,
and Model Data. 1st Edition, O'Reilly.
* Yihui Xie (2015). Dynamic Documents with R and knitr. 2nd edition.
Chapman and Hall/CRC. ISBN 978-1498716963
URL: http://www.crcpress.com/product/isbn/9781498716963
* Venables, W. N. & Ripley, B. D. (2002) Modern Applied Statistics with
S. Fourth Edition. Springer, New York. ISBN 0-387-95457-0
Voraussetzung(en): Grundkenntnisse aus der statistischen Datenanalyse. Grundkenntnisse in Programmierung mit R ist von Vorteil.
15.10.2019 - 09:00 - 11:30, SR15
22.10.2019 - 09:00 - 11:30, SR 15
29.10.2019 - 09:00 - 11:30, SR15
05.11.2019 - 09:00 - 11:30, SR15
12.11.2019 - 09:00 - 11:30, SR15
26.11.2019 - 09:00 - 11:30, SR15
03.12.2019 - 09:00 - 11:30, SR15
07.01.2020 - 09:00 - 11:30, SR15
28.01.2020 - 09:00 - 11:30, SR15