Korpus Südtirol I 

 

(2005-2008)

Der Grundstein für das Korpus Südtirol wurde im Interreg III-A-Projekt "Korpusbasierte Sprachbeobachtung und Beratung: Untersuchungen zur deutschen Sprache in Südtirol vor dem Hintergrund sprachlicher Entwicklungstendenzen im deutschen Sprachraum" gelegt. Dieses Pilotprojekt wurde von 2005 bis 2008 von der Freien Universität Bozen (FUB), der Europäischen Akademie Bozen (EURAC) und der Universität Innsbruck unter Leitung von Prof. Dr. Johann Drumbl durchgeführt.

Es beinhaltete eine Machbarkeitsstudie zum Aufbau eines umfassenden und nach Textsorten und Dekaden möglichst ausgewogenen digitalen Textarchivs des Südtiroler Schriftdeutschen, wobei das geschriebene Deutsch in Südtirol, das z.B. in Zeitungen, in Südtiroler belletristischen Werken und in Sachtexten zu finden ist, vorrangig behandelt wurde; Dialektumschrift sowie italienisch- oder ladinischsprachiges Material, das in Südtirol publiziert ist, wurde vorläufig nicht eingeschlossen.

Dazu wurden beispielhaft relevante Daten aus verschiedenen Quellen in ein standardisiertes XML-Format konvertiert. Die Auswahl der Daten wurde nach einer im Projekt erstellten umfassenden Bestandsaufnahme für in das Korpus aufzunehmende Quellen und deren Metadaten getroffen. Texte, die bisher nicht in elektronischer Form vorlagen, wurden dabei zunächst digitalisiert. Neben einer strukturellen und linguistischen Annotation auf Wortebene, z.B. der Markierung von Südtirolismen, wurden die Texte mit ausführlichen administrativen und bibliographischen Metadaten angereichert. Eine eigens entwickelte benutzerfreundliche Internetanwendung ermöglicht die Suche in den so archivierten und korpuslinguistisch aufbereiteten Textdaten.

In diesem Teilprojekt wurde ein Korpus mit insgesamt ca. 68 Millionen Textwörtern erstellt. Um ein möglichst repräsentatives Referenzkorpus des geschriebenen Deutsch in Südtirol zu erhalten, wurden vorrangig 'prototypische' und zeitgenössische Beispiele von Südtiroler Texten eingeschlossen; Zweifelsfälle sowie historische Daten oder gesprochene Sprache sind für ein Nachfolgeprojekt vorgesehen. Bei der Arbeit mit Texten wurd das Urheberrecht selbstverständlich berücksichtigt. Verträge mit Verlagen und spezielle Nutzungsbedingungen stellen sicher, dass die Daten korrekt behandelt werden und Texte nicht vollständig rekonstruierbar sind.

 

 

Mitarbeiter der Freien Universität Bozen:

 

Mitarbeiter der Europäischen Akademie Bozen:

  • Stefanie Anstein
  • Stefano Bracco 
  • Sean Crist 
  • Verena Lyding
  • Stefanos Petrakis
  • Marcello Soffritti
  • Isabella Ties

     

Diplomanden und Praktikanten:

  • Alexandra Hagelstein 
  • Nadia Munter
  • Angelika Pedron
  • Romina Robertazzi
  • Markus Stegmayr
  • Barbara Taferner

 

logo_uni_rechteck_mittext_kleinst.gif logo_eurac_ohnetext_tiny.gifunilogo_ibk_klein.jpg

 

Mit freundlicher Unterstützung des Amts für Schulfinanzierung Bozen;
Kofinanzierung im Rahmen der EU-Initiative
Interreg III-A Italien/Österreich

logo1.png logo2.giflogo3.jpglogo4.jpg