Bias in Datensätzen und ML-Modellen. Erkennung und Umgang in den DH.

Workshop auf der 7. Jahrestagung des Verbands Digital Humanities im deutschsprachigen Raum (https://dhd2020.de/)

Hashtag: #DHd2020bias

Vortragende

David Lassner

Master Informatik David Lassner, Doktorand an der TU Berlin im Bereich Maschinelles Lernen für Digital Humanities, insbesondere für quantitative Literaturanalyse. “last-name” “at” tu “minus” berlin “dot” de

Stephanie Brandl

Dipl. Math. Stephanie Brandl, Technische Universität Berlin. Forschungsschwerpunkte: Maschinelles Lernen, Natural Language Processing.

Louisa Guy

Louisa Guy, Doktorandin, Le Mans Université. Forschungsinteressen: Digitale Textanalyse, Anwendung von Methoden der Computerlinguistik auf sozialwissenschaftliche Kontexte.

Anne Baillot

Prof. Dr. Anne Baillot, Le Mans Université. Forschungsschwerpunkte: Digitale Philologie, Digital Humanities, Translation Studies.

Zeit und Ort

Montag, 2.3.2020, 13:30-17:00
und Dienstag, 3.3.2020, 9:00-12:30
Raum: Q 0 101

Campusplan

Zeitplan

Montag  
13:30 Begrüßung, Vorstellung, Motivation
13:55 Definition von Bias
14:05 Erkennung von Bias
14:30 Bias verringern
15:00 Kaffeepause
15:30 Praktische Übung 1
17:00 Ende
Dienstag  
09:00 Fazit und Diskussion zum 1. Tag
09:15 Bias in den DH und Autorinnen um 1800
09:45 Twitter Analyse, Quellenkritik und Tutorial zur Twitter API
10:00 Gruppenbildung, Vorbereitung praktische Übung 2
10:30 Kaffeepause
11:00 Praktische Übung Teil 2
12:00 Vorstellung der Gruppenarbeiten und Abschlussdiskussion
12:30 Ende

Kursmaterial

https://github.com/millawell/bias-ml-dh