Erschließung: Worthäufigkeit
Die Datenbasis für die Worthäufigkeit (Frequenzbarometer) bilden
gegenwartssprachliche Korpora. Diese Angabe erfolgt nur für Wörter,
die insgesamt mindestens fünfmal in folgenden Korpora vorkommen:
Das Frequenzbarometer bildet eine siebenstufige, logarithmische Skala ab.
Ermittelt wird die Frequenz für alle Flexionsformen eines Wortes.
Ausschlaggebend für die Berechnung sind sowohl die absolute
Häufigkeit (Frequenz) des jeweiligen Wortes als auch das Verhältnis dieser
Zahl zur Gesamtgröße des Korpus.
Hinweis
Für Mehrwortausdrücke, Affixe und Einträge, deren Stichwörter aus mehreren
Wörtern bestehen, sowie für bzgl. ihrer Lemmatisierung problematische Wörter
ist diese Angabe nicht verfügbar.
Aufteilung der Skala mit Beispielen
Mit Stand 11.04.2025 beinhaltet das aggregierte zugrundliegende Korpus 52 506 900 969
Tokens. Die nachfolgende Tabelle
listet die sieben Häufigkeitsstufen mit ihren jeweiligen Intervallen und
entsprechenden Beispielen. Beachten Sie, dass die Korpora im DWDS stetig
aktualisiert werden und die aktuellen Zahlen dementsprechend ggfls. im Detail
abweichen können.
| Skalenwert |
Worthäufigkeit |
Beispiel |
Skala |
| von |
bis |
Wort |
Frequenz |
| 0 |
5 |
1 660 |
Kontorsion |
923 |
|
| 1 |
1 661 |
16 604 |
schwurbeln |
3 385 |
|
| 2 |
16 605 |
166 041 |
gutgläubig |
36 645 |
|
| 3 |
166 042 |
1 660 413 |
Bildschirm |
1 104 946 |
|
| 4 |
1 660 414 |
16 604 139 |
Krieg |
4 588 426 |
|
| 5 |
16 604 140 |
166 041 399 |
gut |
97 126 888 |
|
| 6 |
166 041 400 |
52 506 900 969 |
sein |
821 988 852 |
|
Hinweis
Sie können die Werte zur Worthäufigkeit auch mithilfe unserer API
abfragen. In der Lemmadatenbank des DWDS
finden Sie ebenfalls Angaben zur Häufigkeitsklasse. Dort können Sie auch einen kompletten
Datensatz herunterladen.