Wie diskursivieren deutschsprachige literarische Texte die abnehmende Luftqualität im 19. Jahrhundert? Eine Fallstudie

QUADRIGA OER

Dieses interaktive Lehrbuch ist im Rahmen des Projekts QUADRIGA als 3. Fallstudie des Datentyps Text entstanden.

Datenkompetenzzentrum QUADRIGA

QUADRIGA ist das Berlin-Brandenburgische Datenkompetenzzentrum für Digital Humanities, Verwaltungswissenschaften, Informatik und Informationswissenschaft. Es wird gefördert im Rahmen der Richtlinie zur Förderung von Projekten zum Aufbau von Datenkompetenzzentren in der Wissenschaft des Bundesministeriums für Bildung und Forschung. Anhand modellhafter Forschungsfragen werden für die drei Datentypen Bewegtes Bild, Tabelle und Text Fallstudien entworfen, die Forschenden der angesprochenen Fachrichtungen Kompetenzen im Bereich der Datenanwendung disziplinspezifisch näher bringen.

Nutzung dieser OER

Sie können dieses JupyterBook zu Lehr- und Lernzwecken verwenden. Sie können sie zudem teilen und bearbeiten unter der Bedingung der Nennung der Autor:innen und der gleichen Lizenzierung. Weitere Informationen dazu entnehmen Sie bitte den Lizenzhinweisen.

Inhalt der OER

Dieses interaktive Lehrbuch vermittelt Methoden für die automatische Erstellung, Aufbereitung und Analyse eines Textkorpus. Im Zentrum steht die Frage, wie sich die mediale Aufmerksamkeit auf die Spanische Grippe in zeitgenössischen Berliner Zeitungen verändert. Der Fokus des Lehrbuchs liegt auf der Korpuserstellung mittels Optical Character Recognition (OCR) mit pytesseract. Das Lehrbuch ist in sechs Kapiteln aufgeteilt. Es wird zuerst in die Fragestellung und deren Operationalisierung eingeführt, dann werden Methoden des Korpusaufbaus beschrieben. Danach wird in die Methode der OCR sowie in die Nachbereichtung des Outputs eingeführt. Das Textkorpus wird dann mit scrapy lemmatisiert und schlussendlich wird eine diachrone Frequenzanalyse auf dem annotierten Korpus ausgeführt.

Ansprechpartner:innen

QUADRIGA ist ein Verbundprojekt mehrerer Institutionen, das von der Universität Potsdam koordiniert wird. Partner sind die Fachhochschule Potsdam, die Filmuniversität Babelsberg, das Fraunhofer FOKUS, die Freie Universität Berlin, die Humboldt-Universität zu Berlin, die Technische Universität Berlin und die Gesellschaft für Informatik.

Fragen und Feedback zu dieser OER können Sie uns sowohl über GitHub Issues als auch über Email zukommen lassen.

Name		Name	Last commit message	Last commit date
Latest commit History 228 Commits
.github		.github
_static		_static
assets		assets
corpus_analysis		corpus_analysis
corpus_collection		corpus_collection
corpus_processing		corpus_processing
data		data
epilog		epilog
front_page		front_page
introduction		introduction
metadata		metadata
präambel		präambel
quadriga		quadriga
reflection		reflection
research_question		research_question
wordlist		wordlist
.gitattributes		.gitattributes
.gitignore		.gitignore
.python-version		.python-version
.zenodo.json		.zenodo.json
CITATION.bib		CITATION.bib
CITATION.cff		CITATION.cff
Dockerfile		Dockerfile
LICENSE.md		LICENSE.md
README.md		README.md
_config.yml		_config.yml
_toc.yml		_toc.yml
dev-requirements.txt		dev-requirements.txt
metadata.jsonld		metadata.jsonld
metadata.rdf		metadata.rdf
metadata.yml		metadata.yml
postBuild		postBuild
references.bib		references.bib
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Wie diskursivieren deutschsprachige literarische Texte die abnehmende Luftqualität im 19. Jahrhundert? Eine Fallstudie

QUADRIGA OER

Datenkompetenzzentrum QUADRIGA

Nutzung dieser OER

Inhalt der OER

Ansprechpartner:innen

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

License

quadriga-dk/Text-Fallstudie-3

Folders and files

Latest commit

History

Repository files navigation

Wie diskursivieren deutschsprachige literarische Texte die abnehmende Luftqualität im 19. Jahrhundert? Eine Fallstudie

QUADRIGA OER

Datenkompetenzzentrum QUADRIGA

Nutzung dieser OER

Inhalt der OER

Ansprechpartner:innen

About

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages