Computer- und Korpuslinguistik

 

 

Abel, Andrea; Anstein, Stefanie; Ties, Isabella (2008): Ansätze einer intralingualen kontrastiven Korpuslinguistik – aufgezeigt am Beispiel administrativer Rechtstexte aus Deutschland,  Österreich und Südtirol. In: Heller, D. (Hrsg.): Formulierungsmuster in deutscher und italienischer Fachkommunikation. Intra- und interlinguale Perspektiven; Linguistic Insights 89. Bern: Peter Lang. 243-270.

 

Anstein, Stefanie; Lyding, Verena (2008): Frag das Korpus. Academia Nr. 46, Science Magazine of  the European Academy Bozen-Bolzano, pp. 8-9.

 

Anstein, Stefanie (2009): Vis-À-Vis - a System to Compare Variety Corpora. In: Mahlberg, Michaela; González-Díaz, Victorina; Smith, Catherine (Hrsgg.): Proceedings of the Fifth Corpus Linguistics Conference, http://ucrel.lancs.ac.uk/publications/cl2009.

 

Aston, Guy (Hg.) (2001): Learning with Corpora. Bologna. CLUEB.

 

Baker, Paul; Hardie, Andrew; McEnery, Tony (2006): A Glossary of Corpus Linguistics. Edinburgh: Edinburgh University Press.

Baroni Marco, Evert Stefan (2006): Statistical methods for corpus exploitation. SITLEC, Chapter 38.

 

Baroni, Marco; Kilgarriff, Adam (2006), “Large linguistically-processed Web corpora for multiple languages”. http://clic.cimec.unitn.it/marco/research.html

 

Bates, Elizabeth; Goodman, Judith C. (1997): On the Inseparability of Grammar and the Lexicon: Evidence from Acquisition, Aphasia and Real-Time Processing. In: Language and Cognitive Processes, 12 (5/6), 507-584.

 

Belica, Cyril (2001): „Kookkurrenzdatenbank CCDB. Eine korpuslinguistische Denk- und Experimentierplattform für die Erforschung und theoretische Begründung von systemisch-strukturellen Eigenschaften von Kohäsionsrelationen zwischen den Konstituenten des Sprachgebrauchs“. corpora.ids-mannheim.de/ccdb


Bernardini, Silvia (2000): Competence, capacity, corpora. A study in corpus-aided language learning. Bologna: CLUEB.


Bickel, Hans (2006): Das Internet als linguistisches Korpus. In: Linguistik online 28 (3/2006), S. 71-83.


Botley, Simon P.,  McEnery, Anthony M. and Wilson Andrew (2000): Multilingual Corpora in Teaching and Research. Rodopi: Amsterdam - Atlanta.


Christ Oliver (1995): A Modular and Flexible Architecture for an Integrated Corpus Query System; In: Proceedings of COMPLEX 1994, 3rd Conference on Computational Lexicography and Text Research Budapest, Hungary, July 7-10; pp 23-32.

 

Coluccia, Stefania  (2000): Il linguaggio giuridico in Alto Adige. In Pasinato,  Antonio (a cura di): Heimat . Serie Saggi / Arti e lettere . Roma: Donzelli, S. 379-388.

 

Destro, Alberto; Drumbl, Johann; Soffritti, Marcello (Hrsgg.) (1987):  Tradurre teoria ed esperienze ; atti del convegno internazionale, Bolzano: Provincia autonoma. Ass. all'istruz. e cultura in lingua it.

 

Drumbl, Johann (2004): „Sprachen, Wissenschaften und die 'Kunst des Schreibens'“, in: Roland Benedikter (Hrsg.), Kultur, Bildung oder Geist? Skizzen zur künftigen Gestalt der europäischen Humanwissenschaften. Helmut Reinalter zum 60. Geburtstag, Innsbruck: Studienverlag.

 

Duffner, Rudolf; Näf, Anton (2006): „Digitale Textdatenbanken im Vergleich“, www.linguistik-online.de/28_06/duffnerNaef.html.

 

Evert Stefan, Heid Ulrich, Lezius Wolfgang (2000): Methoden zum Vergleich von Signifikanzmaßen zur Kollokationsidentifikation. KONVENS.

 

Evert Stefan (2004): The Statistics of Word Cooccurrences: Word Pairs and Collocations. Dissertationsschrift, Universität Stuttgart.

http://elib.uni-stuttgart.de/opus/volltexte/2005/2371/pdf/Evert2005phd.pdf

 

Evert Stefan (2005): “The CQP query language tutorial”. Technical report, Institut für Maschinelle Sprachverarbeitung, Universität Stuttgart. www.ims.uni-stuttgart.de/projekte/CorpusWorkbench

Fellbaum, Christiane (Hrsg.) (2007): Collocations and Idioms: Corpus-Based Linguistic and Lexicographic Studies. Continuum Press, Birmingham, UK.

 

Fitschen Arne (2004): Ein Computerlinguistisches Lexikon als komplexes System. Dissertationsschrift, Universität Stuttgart.


Fitzpatrick, Eileen (ed.) (2007). Corpus Linguistics Beyond the Word. Amsterdam: Rodopi.

 

Fraas, Claudia (2001): „Usuelle Wortverbindungen als sprachliche Manifestation von Bedeutungswissen. Theoretische Begründung, methodischer Ansatz und empirische Befunde“, in: Henrik Nikula/Robert Drescher (Hrsg.), Lexikon und Text, Vaasa, 41-66.

 

Gamper, Johann (1999) : Encoding a Parallel Corpus for Automatic Terminology
Extraction. In: Proceedings of EACL.
acl.ldc.upenn.edu/E/E99/E99-1045.pdf.

 

Gamper, Johann; Dongilli, Paolo (1999): Primary Data Encoding of a Bilingual Corpus. In: GLDV 1999.
titus.uni-frankfurt.de /curric/gldv99/paper/gamper/gamperx.pdf

 

Gamper, Johann (2000): Aufbau eines zweisprachigen Textkorpus für Terminologie-Extraktion. In: Veronesi, Daniela (Hrsg.): Linguistica giuridica italiana e tedesca. Padova: Unipress. 307-319.


Gast, Volker (Hg.) (2006). The Scope and Limits of Corpus Linguistics – Empiricism in the Description and Analysis of English. Special issue of Zeitschrift für Anglistik und Amerikanistik 54/2. Würzburg: Königshausen & Neumann.


Geyken, Alexander (2004): Korpora als Korrektiv für einsprachige Wörterbücher, in: Lili. Zeitschrift für Literaturwissenschaft und Linguistik 136: 72-100.


Geyken, Alexander (2006; draft): The DWDS corpus: A reference corpus for the German language of the 20th century. To appear in Fellbaum, Christiane (Ed.) : Collocations and Idioms: Linguistic, lexicographic, and computational aspects. London (Continuum Press).

 

Gilquin, Gaetanelle; Gries, Stefan T. (2009). Corpora and experimental methods: A state-of-the-art review. Corpus Linguistics and Linguistic Theory, 5(1): 1-26.

 

Goldberg, Adele (2003): Constructions: A new theoretical approach to language. In: Trends in Cognitive Science 7, 5, S. 219-224.

 

Goldberg, Adele (2006): Constructions at Work: the nature of generalization in language. Oxford University Press, Oxford.

 

Granger, Sylviane; Hung Joseph and Petch-Tyson, Stephanie (Hrsg.) (2002): Computer Learner Corpora, Second Language Acquisition and Foreign Language Teaching. Language Learning and Language Teaching 6. Amsterdam & Philadelphia: Benjamins.

 

Grefenstette, Gregory; Tapanainen, Pasi (1994): What is a word, What is a sentence? Problems of Tokenization; Rank Xerox Research Centre Grenoble Laboratory.

 

Gries, Stefan T. (2009): What is corpus linguistics? Language and Linguistics Compass 3:1-17.

 

Heid, Ulrich (2001): Collocations in Sublanguage Texts: Extraction from Corpora. In: Wrigth, Sue Ellen / Budin, Gerhard (Hrsgg.): Handbook of Terminology Management. Amsterdam – Philadelphia: John Benjamins. 788-808.

Heid, Ulrich; Ritz, Julia (2005): Extracting collocations and their contexts from corpora. In: Pajzs, Julia et al.  (ed.). Papers in computational lexicography -COMPLEX 2005. Budapest: Linguistics Institute, Hungarian Academy of Sciences. 107 – 121.

 

Heller, Dorothee (2006): L’autore traccia un quadro ... Beobachtungen zur Versprachlichung wissenschaftlichen Handelns im Deutschen und Italienischen. In Ehlich, Konrad; Heller, Dorothee (Hrsgg.): Die Wissenschaft und ihre Sprachen, Bern/Frankfurt...: Lang, 63-85.

 

Hoffmann, Sebastian; Evert, Stefan (2006): "BNCweb (CQP-Edition) - The Marriage of Two Corpus Tools." In: Sabine Braun, Kurt Kohn & Joybrato Mukherjee (Hg.) Corpus Technology and Language Pedagogy: New Resources, New Tools, New Methods.s. Frankfurt am Main: Peter Lang. 177-195.


Hornung, Antonie (2002): Der saure Weg zur tesina oder: Wie italienische Studierende des Deutschen lernen, eine kleine (vor)wissenschaftliche Hausarbeit zu schreiben. In Portmann-Tselikas, Paul; Schmölzer-Eibinger , Sabine (Hrsg.): Textkompetenz. Theorie und Praxis, Neue Perspektiven für das Lernen und Lehren, Innsbruck: Studienverlag, 197- 232.

 

Kermes Hannah (2003): Off-line (and On-line) Text Analysis for Computational Lexicography. Dissertationsschrift, Universität Stuttgart.

 

Kermes Hannah, Heid Ulrich (2003): Using chunked corpora for the acquisition of collocations and idiomatic expressions; Institut für Maschinelle Sprachverarbeitung, Universität Stuttgart.

 

Kilgarriff, Adam; Grefenstette Gregory (2003), “Web as Corpus: Introduction to the Special Issue” www.kilgarriff.co.uk/Publications/2003-KilgGrefenstette-WACIntro.pdf


Kilgarriff, Adam; Rychlý, Pavel; Smrz, Pavel; Tugwell, David. (2004): The Sketch Engine.  Proceedings Euralex.  Lorient.


Klatt, Stefan (2004): A High Quality Partial Parser for Annotating German Text Corpora; Institute for Intelligent Systems – University of Stuttgart. In Fourth International Conference on Language Resources and Evaluation (LREC 2004), Lisbon (Portugal).


Klatt Stefan (2006): A Corpus-based Approach to the Interpretation of Unknown Words with an Application to German. In Fifth International Conference on Language Resources and Evaluation (LREC 2006), Genoa (Italy).


Klein, Wolfgang (2001): Das digitale Wörterbuch der deutschen Sprache des 20. Jahrhunderts. In: Sprache, System und Tätigkeit.

 

Krenn Brigitte; Samuelsson Christer (1997): The linguist's guide to statistics. http://citeseer.ist.psu.edu/krenn97linguists.html

 

Lemnitzer, Lothar; Zinsmeister, Heike (2006): Korpuslinguistik. Tübingen:Gunter Narr Verlag.

 

Lombardi, Alessandra (2004). Collocazioni e linguaggio giuridico. Milano : ISU Università Cattolica.


Ludewig, Petra (2005): Korpusbasiertes Kollokationslernen. (Sprache, Sprechen und Computer, 9). Frankfurt am Main [u.a.]: Lang.


Manning Christopher, Schütze Hinrich (1999): Foundations of Statistical Natural Language Processing. Cambridge, MA: MIT Press.

 

McEnery, Tony; Wilson, Andrew (2001): Corpus linguistics: an introduction. 2. ed. Edinburgh University Press.


Müller, Stefan (2006): Qualitative Korpusanalyse für die Grammatiktheorie: Introspektion vs. Korpora, In Zifonun, Gisela und Kallmeyer, Werner (Hrsgg.): IDS-Jahrbuch 2006.


Näf, Anton; Duffner, Rudolf (Hg.) (2006): Korpuslinguistik im Zeitalter der Textdatenbanken. Linguistik online, 28, 3.

 

Perkuhn, Rainer; Belica, Cyril; Al-Wadi, Doris; Lauer, Meike; Steyer, Kathrin; Weiss, Christian (2005): „Korpustechnologie am Institut für Deutsche Sprache“, in: Johannes Schwitalla/Werner Wegstein (Hrsg.), Korpuslinguistik deutsch: synchron - diachron - kontrastiv. Würzburger Kolloquium 20. - 23.3. 2003, Tübingen: Niemeyer, 57-70.

 

Schmid, Helmut (1994): Probabilistic Part-of-Speech Tagging Using Decision Trees. In: Proceedings of International Conference on New Methods in Language Processing. www.ims.uni-stuttgart.de/projekte/corplex/TreeTagger

 

Schmid Helmut, Fitschen Arne, Heid Ulrich (2004): SMOR: A German Computational Morphology Covering Derivation, Composition, and Inflection. In: Proceedings of the IVth International Conference on Language Resources and Evaluation (LREC 2004), p. 1263-1266, Lisbon, Portugal.

 

Sharoff, Serge (2005): “Creating general-purpose corpora using automated search engine queries”, in wackybook.sslmit.unibo.it/pdfs/sharoff.pdf.

 

Sharoff, Serge (2006): A Uniform Interface to Large-Scale Linguistic Resources. Proceedings of the LREC.


Sinclair, John (1995): Corpus, concordance, collocation. Oxford University Press.

 

Sinclair, John (2004): How to Use Corpora in Language Teaching. John Benjamins, Amsterdam.


Steyer, Kathrin (2004): Kookkurrenz. Korpusmethodik, linguistisches Modell, lexikografische Perspektiven. In: Steyer, Kathrin (Hg.):  Wortverbindungen – mehr oder weniger fest. (Jahrbuch des Instituts für Deutsche Sprache 2003), Berlin/New York: de Gruyter: 87-116.


Tognini Bonelli, Elena (2001): Corpus linguistics at work. Amsterdam: John Benjamins.


Tomasello, Michael (2003): Constructing a Language: A Usage-Based Theory of Language Acquisition. Harvard University Press.

 

Wray, Alison (2002): Formulaic language and the lexicon, Cambridge, UK: Cambridge University Press.

 

Wynne, Martin (Hg.) (2005): Developing Linguistic Corpora: a Guide to Good Practice. Oxford: Oxbow Books. Available online from www.ahds.ac.uk/linguistic-corpora