Zum Hauptinhalt springen

amc in Zahlen

Auf dieser Seite finden Sie eine quantitative Beschreibung der aktuellen Version. (Archivierte Informationen zu älteren Versionen finden Sie im Versionsarchiv)

Für eine Beschreibung aller hier genannten Attribute und Strukturen vgl. die Annotationsdetails

Für den Umgang mit Trefferzahlen aus Ihren Recherchen beachten Sie unbedingt die Hinweise zum Thema Normalisierung.

aktuellste Version: amc_4.25q1 (bis incl. 2025 Quartal 1 – also bis 2025-03-31)

Anzahl der Token, Words, etc.

Counts
Dokumente51.712.877
Sätze1.065.996.483
Token12.829.197.706
Wörter9.735.231.247

aktuellste LTS-Version: amc_4.24q4LTS (bis incl. 2024-12)

Anzahl der Token, Words, etc.

Counts
Dokumente51.424.098
Sätze1.059.346.562
Token12.746.733.078
Wörter9.670.164.441

Verteilung der Artikel über die Zeit

Die Verteilung der Artikel über die Zeit ist offensichtlich unregelmäßig. Die anfangs monoton steigende Zahl der Artikel pro Jahr kann durch die „Sammlungslogik“ der APA erklärt werden: die Anzahl der in der Datenbank aufgenommenen Medien steigt im Laufe der Jahre sukzessive. In den Anfangsjahren sind nur Artikel der APA selbst vertreten, im Laufe der 1990er Jahre kommen nach und nach neue Medien hinzu.

Verteilung der Artikel auf Medientypen

doc.mediatypeArtikelanzahl
print41.598.079
agentur8.842.240
tv942.854
radio40.925

Verteilung der Artikel auf „Regionen“

Nähere Erläuterungen zur Regioneneinteilung finden sich in den Annotationsdetails

doc.regionArtikelanzahl
agesamt27.283.812
amitte3.614.536
awest4.662.762
aost9.025.250
asuedost5.176.875
spezifisch1.660.863