Aufbau von Sprachressourcen am Beispiel des Deutschen Textarchivs

Workshop

25. Oktober 2013

Akademiegebäude am Gendarmenmarkt, Konferenzraum 2, Jägerstrasse 22/23, 10117 Berlin

Der Workshop vermittelt, auf welche Weise existierende oder neue Sprachressourcen mit den Hilfsmitteln des DTA aufbereitet oder erstellt werden können. Sprachressourcen, die gemäß den DTA-Richtlinien erarbeitet wurden, können im Verbund mit weiteren Korpora über das DTA sowie über die CLARIN-D-Infrastruktur vielfältig ausgewertet und einem größeren wissenschaftlichen Publikum zur Verfügung gestellt werden. Für eine unkomplizierte und verlustfreie Überführung der Daten in CLARIN-D-eigene Formate steht dabei im DTA ein Workflow zur Verfügung.

Aufbau von Sprachressourcen am Beispiel des Deutschen Textarchivs
Aufbau von Sprachressourcen am Beispiel des Deutschen Textarchivs

Zum Abschluss der zweiten Projektphase veranstaltet das DTA am erneut einen Workshop zum Thema „Aufbau von Sprachressourcen am Beispiel des Deutschen Textarchivs“.

 

Im Rahmen des Workshops werden zunächst die DTA-Richtlinien und Verfahren zur Transkription sowie zur Textstrukturierung/Annotation und Erfassung ausführlicher Metadaten gemäß dem DTA-Basisformat behandelt und eingeübt. Darüber hinaus werden Erfordernisse und Möglichkeiten der Qualitätssicherung im Vorfeld der Texterfassung sowie im Anschluss an die Volltext-Digitalisierung mithilfe der kollaborativen Qualitätssicherungsplatform DTAQ vermittelt. Schließlich werden Möglichkeiten der Arbeit mit den DTA-Korpora und ihrer wissenschaftlichen Auswertung vorgestellt. Der Workshop knüpft an die Erfahrungen des Kurationsprojekts 1 der CLARIN-D-Facharbeitsgruppe 1 und des DTA-Erweiterungsmoduls DTAE an.

 

Anmeldung:

Eine Teilnahmegebühr fällt nicht an. Eine Anmeldung zur Teilnahme am Workshop wird bis zum 15. Oktober 2013 erbeten an: dta@bbaw.de.


Weitere Informationen:
DTA (Deutsches Textarchiv)
www.deutschestextarchiv.de 

 

 

9:00–9:30
Einführung zu den DTA-Korpora und -Tools
Matthias Schulz
Christian Thomas


9:30–10:00
Erarbeiten einer verlässlichen Transkription
Matthias Schulz

 

10:00–10:30

Praktische Übung

10:30–11:00 Pause

11:00–11:30
TEI-Textstrukturierung mit dem DTA-Basisformat
Susanne Haaf

 

11:30–12:00 Praktische Übung

12:00–12:30
Erfassung von DTA-/CLARIN-D-kompatiblen Metadaten
Susanne Haaf

Frank Wiegand

 

12:30–13:30 Mittagspause

13:30–14:00

Praktische Übung

14:00–14:30
Arbeiten mit der Qualitätssicherungsumgebung DTAQ
Frank Wiegand

 

14:30–15:00

Praktische Übung



15:00–15:30 Pause

 

15:30–16:15
Arbeiten mit den DTA-Korpora
Christian Thomas

 

16:15–17:00 Praktische Übung

Die Teilnehmenden werden gebeten, für den Workshop einige Vorbereitungen zu treffen, die für die Durchführung der Veranstaltung sehr hilfreich sind.

Bitte bringen Sie einen internetfähigen Laptop mit. WLAN steht im Konferenzraum zur Verfügung; Internet via LAN-Buchse ist ebenfalls verfügbar. Installieren Sie auf Ihrem Laptop den oXygen-XML-Editor. Für den Workshop genügt die Installation der Trialversion, die Sie sich kostenfrei herunterladen können. Sie können uns gern kontaktieren, falls Sie Probleme bei der Installation haben. Sollte eine Installation des oXygen-Editors überhaupt nicht möglich sein, empfehlen wir Ihnen die Installation eines Texteditors, der XML-Dateien mit Syntaxhighlighting darstellen kann.

 

Bitte registrieren Sie sich auf der Qualitätssicherungsplattform des Deutschen Textarchivs DTAQ.

 

Bitte speichern Sie die DTABf-Vorlagendatei. Sie wird für die praktischen Übungen während des Workshops benötigt. Fakultativ können Sie in Vorbereitung auf den Workshop in die Dokumentationen zu den DTA-Richtlinien zur Texterfassung bzw. zum DTA-Basisformat schauen.

 

Schließlich möchten wir Sie bitten, uns zu informieren, falls sich nach Anmeldung herausstellt, dass Sie doch nicht teilnehmen können. In diesem Fall können wir den freigegebenen Platz an mögliche Nachrücker vergeben.
 

© 2024 Berlin-Brandenburgische Akademie der Wissenschaften