Im Wintersemester 2019/20 findet die sechste Reihe des Digital Classicist Seminar Berlin statt. Sie wird vom Zentrum Grundlagenforschung Alte Welt an der Berlin-Brandenburgischen Akademie der Wissenschaften in Zusammenarbeit mit dem Berliner Antike Kolleg durchgeführt. In der Seminarreihe werden Themen behandelt, die die innovative Anwendung moderner digitaler Methoden, Ressourcen und Techniken in den verschiedensten Bereichen einer weitgefassten Altertumswissenschaft betreffen.
Die Sitzungen finden - im zweiwöchigen Turnus - immer dienstags von 16-18 Uhr im Raum 07W04, Unter den Linden 8 (Akademieflügel der Staatsbibliothek), statt.
Weitere Informationen zu diesem Thema unter de.digitalclassicist.org/berlin/seminar2019
Eine Anmeldung ist nicht erforderlich.
Corpus tools for corpus languages: getting the most out of Ancient Greek text data
Winnie Smith
Oxford
In this talk, I propose to discuss ways participants interested in making better use of Greek and Latin text data can productively apply corpus methods to datasets that are not full corpora, covering both
theoretical issues, e.g. - representativeness and generalisability (or: text as a sample of a population VS historical text unevenly sampled by transmission); - remediation (Kichuk, 2007), or how linguistic information changes from papyrus to edition to e-text;
practical problems, e.g. - regularisation (dealing with spelling variants, comparing TEI’s / tag system to a historical spelling regulariser, VARD (Baron and Rayson, 2009)) - encoding issues (specifically, the desirability of incorporating the TEI tag to mark orthographic word division as standard when encoding papyri)
and applications, e.g. - concordancing (for both annotated and unannotated texts); collocations (for POS-tagged texts) - DIY corpus building (or: using LancsBox to get systematic, searchable datasets) - briefly, applications of corpora in learning and teaching Greek.