AMC Logo

Das amc!

Mit aktuell ca. 50 Mio. Artikeln und 12.4 Mrd. Token (9.4 Mrd. running words) gehört das Austrian Media Corpus (amc) zu den größten Textkorpora in deutscher Sprache. Was das amc über seine Größe hinaus einzigartig macht, ist die Tatsache, dass darin die Printmedienlandschaft Österreichs der letzten Jahrzehnte nahezu vollständig abgedeckt wird.

Der Inhalt des amc kann mit dem Schlagwort „journalistische Prosa“ zusammengefasst werden: er umfasst Komplettausgaben von Zeitungen und Zeitschriften, Agenturmeldungen der Austria Presse Agentur (APA) sowie Transkripte von TV-Produktionen (vorwiegend von Nachrichtensendungen).

Das amc kann auf Anfrage genutzt werden, allerdings ausschließlich für Zwecke der wissenschaftlichen Forschung und Lehre  und nur für die Untersuchung sprachwissenschaftlicher Fragestellungen.

Ermöglicht wird das amc durch eine Kooperation zwischen der Austria Presse Agentur (APA) und der Österreichischen Akademie der Wissenschaften (ÖAW), konkret dem Austrian Centre for Digital Humanities and Cultural Heritage (ACDH-CH).
Die APA sammelt die Textproduktion der Printmedien und stellt diese dem ACDH-CH zur Verfügung. Das ACDH-CH ergänzt die Texte mithilfe linguistischer Annotationsverfahren wie Lemmatisierung, Wortartenzuordnung (Part-of-Speech tagging) oder Named Entitiy Recognition.
Anschließend werden die Ergebnisse vom ACDH-CH als amc in der Korpussuchmaschine NoSketch Engine online verfügbar gemacht. Dieses Werkzeug erlaubt die Suche und Auswertung der signifikanten Textmengen im amc und macht das Korpus in Kombination mit den verfügbaren Annotationen erst für die effiziente Bearbeitung quantitativer und qualitativer Forschungsfragen tauglich.

Das amc wird jährlich am Jahresanfang um die Publikationen des soeben abgelaufenen Jahres aktualisiert, d.h. der aktuelle Datenbestand des amc reicht jeweils bis zum Ende des Vorjahrs.

Der Zweck dieser Webseite ist es, Informationen über das amc zu bündeln und als Zugangsportal zum amc zu dienen. Neben Dokumentationen und Publikationen beinhaltet sie eine offene Demo-Version des Korpus sowie die Möglichkeit zur Registrierung und anschließenden Nutzung der Vollversion.