Image Data and Numbers

amc in Zahlen

Auf dieser Seite finden Sie eine quantitative Beschreibung der aktuellen Version.
(Archivierte Informationen zu älteren Versionen finden Sie im Versionsarchiv)

amc_4.2 (erstellt: 2023-01)

Für eine Beschreibung aller hier genannten Attribute und Strukturen vgl. die Annotationsdetails
Für den Umgang mit Trefferzahlen aus Ihren Recherchen beachten Sie unbedingt die Hinweise zum Thema Normalisierung.

Anzahl der Token, Words, etc.

Counts
Tokens 12.032.705.217
Words 9.112.182.470
Sentences 1.000.638.839
Documents 48.752.417

Verteilung der Artikel über die Zeit

Die Verteilung der Artikel über die Zeit ist offensichtlich unregelmäßig. Die anfangs monoton steigende Zahl der Artikel pro Jahr kann durch die „Sammlungslogik“ der APA erklärt werden: die Anzahl der in der Datenbank aufgenommenen Medien steigt im Laufe der Jahre sukzessive. In den Anfangsjahren sind nur Artikel der APA selbst vertreten, im Laufe der 1990er Jahre kommen nach und nach neue Medien hinzu.

Verteilung der Artikel auf Medientypen

doc.mediatype Artikelanzahl
agentur 8.479.112
print 39.386.468
tv 886.837

Verteilung der Artikel auf „Regionen“

Nähere Erläuterungen zur Regioneneinteilung finden sich in den Annotationsdetails 

Verteilung der <doc> (Artikel) je Region in Tabellenform

doc.region Artikelanzahl
agesamt 25.877.137
aost 8.590.547
asuedost 4.864.031
awest 4.417.523
amitte 3.404.579
spezifisch 1.598.600