AMC Logo

Das amc!

Mit aktuell ca. 44 Mio. Artikeln und 10 Milliarden Wörtern gehört das Austrian Media Corpus (amc) zu den größten Textkorpora in deutscher Sprache. Was das amc über seine Größe hinaus einzigartig macht, ist die Tatsache, dass darin die Printmedienlandschaft Österreichs der letzten Jahrzehnte nahezu vollständig abgedeckt wird.

Damit eröffnet das amc wertvolle Möglichkeiten für die Forschung in unterschiedlichen wissenschaftlichen Disziplinen, wie zum Beispiel Sprachwissenschaft, Kommunikationswissenschaft oder Zeitgeschichte.
Der Inhalt des amc kann mit dem Überbegriff „journalistische Prosa“ zusammengefasst werden: er umfasst Komplettausgaben von Zeitungen und Zeitschriften, Agenturmeldungen der Austria Presse Agentur (APA) sowie Transkripte von TV-Produktionen (vorwiegend Nachrichtensendungen).

Ermöglicht wird das amc durch eine Kooperation zwischen der Austria Presse Agentur (APA) und der Österreichischen Akademie der Wissenschaften (ÖAW), konkret dem Austrian Centre for Digital Humanities (ACDH).
Die APA sammelt die Textproduktion der Printmedien und stellt diese dem ACDH zur Verfügung. Das ACDH ergänzt die Texte mithilfe linguistischer Annotationsverfahren wie Lemmatisierung, Wortartenzuordnung (Part-of-Speech tagging) oder Named Entitiy Recognition.
Anschließend werden die Ergebnisse vom ACDH als amc in der Korpussuchmaschine NoSketch Engine online verfügbar gemacht. Dieses Werkzeug erlaubt die Suche und Auswertung der signifikanten Textmengen im amc und macht das Korpus in Kombination mit den verfügbaren Annotationen erst für die effiziente Bearbeitung quantitativer und qualitativer Forschungsfragen tauglich.

Das amc wird zumindest jährlich um die Publikationen des abgelaufenen Jahres erweitert, d.h. es sind jeweils die Daten bis zum Ende des Vorjahres verfügbar.

Das amc kann auf Anfrage kostenfrei, jedoch ausschließlich zum Zweck der wissenschaflichen Forschung und Lehre genutzt werden.

Die Absicht dieser Webseite ist es, Informationen über das amc zu bündeln und als Zugangsportal zum amc zu dienen. Neben Dokumentationen und Publikationen beinhaltet sie eine offene Demo-Version des Korpus sowie die Möglichkeit zur Registrierung und anschließenden Nutzung der Vollversion.