Halunder vs. Deutsch.
Ein Blick ins Korpus.
84.246 bereinigte Satzpaare, parallel ausgerichtet, aus über 800 Texten zusammengetragen. Wie sieht Halunder im direkten Vergleich zum Deutschen aus?
Was 84.246 Satzpaare wirklich heißen
So viel Halunder, wie in 10 Romanen steht.
Ein durchschnittliches Taschenbuch enthält pro Seite rund 12 Sätze (Literatur-Schnitt, je nach Stil zwischen 10 und 15). Das bereinigte Trainingskorpus von halunder.ai hat 84.246 Satzpaare, das sind grob 7.021 Buchseiten Halunder-Text, jeweils ausgerichtet mit ihrer deutschen Übersetzung.
84.246
Satzpaare
~ 7.021
Buchseiten
~ 10
Romane (∅)
Im Vergleich zu klassischen Romanen
Der kleine Prinz
Saint-Exupéry
1.300
Harry Potter Bd. 1
Rowling
6.000
Effi Briest
Fontane
6.300
Das Parfum
Süskind
7.500
halunder.ai
84.246
Höhe linear proportional zur Satzanzahl. halunder.ai ≈ 11× so viel Text wie „Das Parfum".
Die Zahlen auf dieser Seite stammen aus dem bereinigten Trainingskorpus von halunder.ai, bereinigt durch eine mehrstufige Validierungs-Pipeline mit über 3.000 Schreib- und Grammatik-Regeln.
Der Vergleich soll zeigen, wie Halunder tickt: kurze Funktionswörter, ein Vokalreichtum, der die Wortlänge nach unten zieht.
Datenbasis
84.246 Satzpaare
1,33 Mio. Halunder-Wörter
1,33 Mio. deutsche Wörter
29.223 einzigartige Halunder-Wortformen
33.665 einzigartige deutsche Wortformen
Wörter im Korpus
1.330.685
1.329.642
Beide Seiten praktisch gleichauf. Die Übersetzungen folgen sich Wort für Wort.
Einzigartige Wortformen
29.223
33.665
Deutsch hat mehr Wortformen, vor allem getrieben durch Komposita und stärkere Flexion.
Mittlere Wortlänge
3,9Buchstaben
4,7Buchstaben
Halunder ist im Schnitt rund 0,8 Buchstaben kürzer pro Wort. Vokalreichtum statt Konsonanten-Stapel.
01 · Sprache im Druck
Halunder in der Inselzeitung
Die Monatszeitung „Der Helgoländer" gibt es seit Mitte der 1960er, die einzige durchgängige öffentliche Quelle, in der Halunder über sechs Jahrzehnte erscheint. Wachstum in den 70er- und 80er-Jahren rund um die aktive Sprachpflege, dann ein langsamer Rückzug.
Halunder im „Der Helgoländer“ 1964 bis 2024
Wie viele Halunder-Wörter pro Jahr in der Monatszeitung „Der Helgoländer“ geschrieben wurden.
Halunder-Marker per Wortliste und Halunder-spezifische Buchstaben-Cluster. Jahres-Peak: 1982 mit 5.124 Halunder-Wörtern. Ausgabe-Peak: Januar 1978 mit 985 Halunder-Wörtern in einer einzigen Ausgabe.
Quelle: halunder.ai · Auswertung
02 · Worüber im Halunder gesprochen wird
Die häufigsten Nomen
Funktionswörter (Artikel, Pronomen, Präpositionen, Konjunktionen) und Hilfsverben sind ausgeblendet. Was bleibt, sind die Nomen, also worüber tatsächlich geredet wird. Ganz oben: Mutter und Vater, dann die Insel selbst, das Wasser, die Zeit. Dazu kommen ikonische Insel-Wörter: Lun für „Helgoland", Strun für „Strand", Klok für „Uhr", Foor für „Vater".
Halunder · Top 15 Nomen
Häufigste Substantive und Eigennamen im Halunder. Anzahl der Vorkommen mit deutscher Übersetzung.
Quelle: halunder.ai · bereinigtes Trainingskorpus
03 · Wortlänge
Kurze Halunder-Wörter
Halunder hat seinen Modus bei 2 Buchstaben: mehr als jedes vierte Wort (28,5 %) ist nur zwei Zeichen lang. Deutsch verteilt sich breiter mit Spitze bei 3 Buchstaben (29,4 %) und einer deutlich sichtbaren Schulter zwischen 5 und 7 Zeichen. Wer Halunder spricht, spricht in kurzen Silben.
Wortlängenverteilung
Wie lang sind Wörter in beiden Sprachen? Halunder läuft mit zwei- bis vierbuchstabigen Wörtern, im Deutschen dominiert die Drei-Buchstaben-Marke und längere Komposita verschieben den rechten Rand spürbar.
Quelle: halunder.ai · 1,33 Mio. Halunder-Wörter, 1,33 Mio. deutsche Wörter
04 · Satzlänge
Parallel auf Augenhöhe
Wörter pro Satz: 15,80 auf Halunder, 15,78 auf Deutsch. Praktisch identisch. Das ist gleichzeitig Bestätigung und Limitierung unserer Daten: Die Übersetzungen liegen sehr eng beieinander, weil das Korpus aus echten Parallelsätzen besteht.
Satzlängenverteilung
Wörter pro Satz, gegenübergestellt. Die Verteilungen liegen fast deckungsgleich aufeinander, ein guter Indikator dafür, dass die Übersetzungen im Korpus eng beieinander geblieben sind.
Quelle: halunder.ai · 84.246 Satzpaare