WebLicht als korpuslinguistisches Analyseinstrument für studentische Forschungsarbeiten

am Beispiel von vorwissenschaftlichen Arbeiten

Autor/innen

  • Andrea Steiner-Cardell

Schlagworte:

Korpuslinguistik, Wissenschaftssprache, WebLicht, Methoden in der Schreibwissenschaft

Abstract

Für die Analyse großer Datenmengen von gesprochener oder geschriebener Sprache bietet das Forschungsfeld der Korpuslinguistik viele Möglichkeiten: Einzelne Elemente natürlicher Sprachen können untersucht werden, aber auch eine Analyse der Gesamtstruktur der Sprache ist möglich. Liegen Sprachdenkmäler in digitalisierter Form vor, so können auch jene Gegenstand einer korpusbasierten Analyse sein. Die Untersuchungen am Korpus führen dazu, dass durch Rückschlüsse neue Theorien gebildet werden und darauf aufbauend neue Erkenntnisse erlangt werden. So auch die korpusbasierte Untersuchung der Autor*innen Cordula Meißner und Franziska Waller, welche versucht haben, das Repertoire an sprachlichen Formulierungen in geisteswissenschaftlichen Fachdisziplinen abzubilden, um so festzustellen, welche Elemente der alltäglichen Wissenschaftssprache angehören und wo Überlappungen zwischen den einzelnen Disziplinen vorkommen.

Liegt der Fokus nun aber nicht auf den Ergebnissen einer solchen Korpusanalyse, sondern vielmehr auf der technischen Umsetzung, gibt es einiges zu beachten: von der Gewinnung der Rohdaten über die Bereinigung und Konvertierung bis hin zur Auszeichnung der Daten mit Metadaten. Exakt jene Schritte werden in nachfolgenden Artikel beleuchtet, wobei es darum geht aufzuzeigen, welche Möglichkeiten das Open-Source-Softwareprogramm WebLicht für die Auseinandersetzung mit linguistischen Fragestellungen bietet und was es dabei zu beachten gilt.

Literaturhinweise

Bubenhofer, N. (2009). Sprachgebrauchsmuster. Korpuslinguistik als Methode der Diskurs- und Kul-turanalyse. Berlin; New York: W. de Gruyter.

CLARIN (n.d.). CLARIN in a nutshell. Abgerufen am 17. Februar 2020 von https://www.clarin.eu/content/clarin-in-a-nutshell.

CLARIN-D AP5 (2012) CLARIN-D User Guide. Weblicht – A service-oriented architecture for linguistic resources and tools Chapter 8. Abgerufen am 24. September 2020 von https://media.dwds.de/clarin/userguide/text/web_services_WebLicht.xhtml.

CLARIN-D mit Schmidt, T., K. Wörner, T. Lehmberg, & H. Hedeland. EXMARaLDA. Abgerufen am 16. März 2020 https://exmaralda.org/de/ueber-exmaralda.

Deml, I. (2015). Gebrauchsnormen der Wissenschaftssprache und ihre Entwicklung vom 18. bis zum 21. Jahrhundert. Dissertation. Universität Regensburg.

Ehrlich, K. (1999). Alltägliche Wissenschaftssprache. Informationen Deutsch als Fremdsprache, hrsg. DAAD, 26 (1). Berlin: De Gruyter. Abgerufen am 24. September 2020 von http://www.daf.de/downloads/InfoDaF_1999_Heft_1.pdf

Graefen, G. (1997). Der Wissenschaftliche Artikel – Textart und Textorganisation. Arbeiten zur Sprachanalyse, 27. Berlin [u.a.]: Peter Lang. Abgerufen am 06. September 2020 von https://www.daf.uni-muenchen.de/media/downloads/wiss_artikel_a4.pdf

Graefen, G., & M. Moll (2011). Wissenschaftssprache Deutsch. lesen – verstehen – schreiben. Ein Lehr- und Arbeitsbuch. Frankfurt am Main, Wien [u.a.]: Lang.

Groebner, V. (2012). Wissenschaftssprache. Eine Gebrauchsanweisung. Konstanz: University Press.

Hirschmann, H. (2019). Korpuslinguistik. Eine Einführung. Stuttgart: J.B. Metzler.

Hirschmann, H. (n.d.) STSS-Tagset gemäß Tiger Annotationsschema. Institut für deutsche Sprache und Linguistik. Humboldt-Universität zu Berlin. Abgerufen am 17. Februar 2020 von https://www.linguistik.hu-berlin.de/de/institut/professuren/korpuslinguistik/mitarbeiter-innen/hagen/STTS_Tagset_Tiger.

Karmasin, M., & R. Ribing (2018). Die vorwissenschaftliche Arbeit von A bis Z. Wien: Facultas.

Lemnitzer, L., & H. Zinsmeister (2015). Korpuslinguistik: eine Einführung. 3., überarb. und erw. Aufl. Tübingen: Narr.

Lenz, S. (2000). Korpuslinguistik. Tübingen: Narr.

Meißner, C. (2014). Figurative Verben in der allgemeinen Wissenschaftssprache des Deutschen. eine Korpusstudie. Tübingen: Stauffenburg-Verlag.

Meißner, C., & F. Wallner (2019) Das gemeinsame sprachliche Inventar der Geisteswissenschaften. Lexikalische Grundlangen für die wissenschaftspropädeutische Sprachvermittlung. Berlin: Erich Schmidt Verlag.

Moll, M., & W. Thielmann (2017). Wissenschaftliches Deutsch: Wie es geht und worauf es dabei an-kommt. Konstanz: UVK.

RStudio (n.d.). Daten veranschaulichen mit ggplot2. Schummelzettel. Abgerufen am 24. Oktober 2020 von https://rstudio.com/wp-content/uploads/2015/06/ggplot2-german.pdf.

Schiller, A., S. Teufel, C. Stöckert, & C. Thielen (1999). Guidelines für das Tagging deutscher Textcor-pora mit STTS. Technischer Bericht, Universitäten Stuttgart und Tübingen. Abgerufen am 12. März 2020 von https://www.ims.uni-stuttgart.de/documents/ressourcen/lexika/TagSets/stts-1999.pdf

The Berkeley NLP Group (n.d.). Abgerufen am 17. Februar 2020 von http://nlp.cs.berkeley.edu/software.shtml.

##submission.downloads##

Veröffentlicht

2020-11-02

Zitationsvorschlag

Steiner-Cardell, A. (2020). WebLicht als korpuslinguistisches Analyseinstrument für studentische Forschungsarbeiten: am Beispiel von vorwissenschaftlichen Arbeiten. Zisch: Zeitschrift für interdisziplinäre Schreibforschung, 3, 28-44. Abgerufen von https://ojs.pzle.univie.ac.at/ojs/index.php/zisch/article/view/34