The Corpus Corporum, a new open Latin text repository and tool

Show full item record

Files in this item

PDF ALMA_2014_72_288_304.pdf 394.6Kb

Pour citer ce document :
URI: http://hdl.handle.net/2042/69525
Title: The Corpus Corporum, a new open Latin text repository and tool
Author: Roelli,Philipp
Abstract: The article presents a new online resource : the Corpus Corporum, an open Latin text repository and tool hosted at the University of Zurich. It is organised as a meta-collection of Latin text corpora from various sources which can be used separately or collectively. Currently there are 125 million words loaded from all epochs during which Latin was used. They can be searched and studied in various ways : for instance as proximity searches, time restricted searches or lemmatised searches. Word frequency lists and concordances can also be generated – all of this on any level between single work and globally. Furthermore the tool is useful for reading texts online as the user can click words to get their grammatical form resolved and dictionary entries about them displayed. The database is fed by root texts in the standardised TEI xml format which are downloadable freely in various formats (if their owners agree). Apart from Latin texts, a few Greek texts and a version of the Hebrew bible are experimentally also loaded into the database. The article explains how this resource works and what texts it currently contains, featuring graphics showing text volume per time. It ends with a few exemplary searches.Dieser Artikel präsentiert eine neue Online-Ressource, das Corpus Corporum, eine frei zugängliche lateinische Textsammlung. Es ist als Metacorpus organisiert, dessen Corpora, die aus verschiedenen Quellen stammen, einzeln oder gesamthaft studiert werden können. Die Plattform enthält momentan rund 125 Millionen Wörter aus allen Epochen, in denen Latein geschrieben wurde. Vielfältige Suchfunktionen werden angeboten, z.B. Umgebungssuchen, zeitliche eingeschränkte Abfragen oder lemmatisierte Suchen. Zudem können Listen von Worthäufigkeiten und Konkordanzen einzelner Wörter generiert werden. Diese Funktionen können auf allen Ebenen, vom einzelnen Text bis zur gesamten Sammlung, ausgeführt werden. Das Tool ist auch nützlich zur schnellen Onlinelektüre, da Wörter durch Anklicken in ihrer grammatischen Form bestimmt werden und in wichtigen Wörterbüchern angezeigt werden. Standardisierte TEI xml Dateien werden in die Datenbank eingespeist, diese und andere Formate können vom Benutzer frei heruntergeladen werden (wenn ihre Eigentümer damit einverstanden sind). Neben lateinischen Texten wurden versuchsweise einige griechische Texte und eine Version der hebräische Bibel in die Sammlung aufgenommen. Der Artikel erklärt die Möglichkeiten und die Funktionsweise dieser neuen Ressource, was für Texte sie momentan enthält (mit Graphiken Textmenge pro Zeit) und endet mit einigen exemplarischen Suchen.
Publisher: Union académique internationale, Belgique
Date: 2014

This item appears in the following Collection(s)

Show full item record





Advanced Search