halunder.ai

Halunder vs. Deutsch.
Ein Blick ins Korpus.

84.246 bereinigte Satzpaare, parallel ausgerichtet, aus über 800 Texten zusammengetragen. Wie sieht Halunder im direkten Vergleich zum Deutschen aus?

Was 84.246 Satzpaare wirklich heißen

So viel Halunder, wie in 10 Romanen steht.

Ein durchschnittliches Taschenbuch enthält pro Seite rund 12 Sätze (Literatur-Schnitt, je nach Stil zwischen 10 und 15). Das bereinigte Trainingskorpus von halunder.ai hat 84.246 Satzpaare, das sind grob 7.021 Buchseiten Halunder-Text, jeweils ausgerichtet mit ihrer deutschen Übersetzung.

84.246

Satzpaare

~ 7.021

Buchseiten

~ 10

Romane (∅)

Im Vergleich zu klassischen Romanen

~1.300 Sätze · 100 S.
~6.000 Sätze · 335 S.
~6.300 Sätze · 376 S.
~7.500 Sätze · 320 S.
~84.246 Sätze

Der kleine Prinz

Saint-Exupéry

1.300

Harry Potter Bd. 1

Rowling

6.000

Effi Briest

Fontane

6.300

Das Parfum

Süskind

7.500

halunder.ai

84.246

Höhe linear proportional zur Satzanzahl. halunder.ai ≈ 11× so viel Text wie „Das Parfum".

Die Zahlen auf dieser Seite stammen aus dem bereinigten Trainingskorpus von halunder.ai, bereinigt durch eine mehrstufige Validierungs-Pipeline mit über 3.000 Schreib- und Grammatik-Regeln.

Der Vergleich soll zeigen, wie Halunder tickt: kurze Funktionswörter, ein Vokalreichtum, der die Wortlänge nach unten zieht.

Datenbasis

84.246 Satzpaare
1,33 Mio. Halunder-Wörter
1,33 Mio. deutsche Wörter
29.223 einzigartige Halunder-Wortformen
33.665 einzigartige deutsche Wortformen

Wörter im Korpus

Halunder

1.330.685

Deutsch

1.329.642

Beide Seiten praktisch gleichauf. Die Übersetzungen folgen sich Wort für Wort.

Einzigartige Wortformen

Halunder

29.223

Deutsch

33.665

Deutsch hat mehr Wortformen, vor allem getrieben durch Komposita und stärkere Flexion.

Mittlere Wortlänge

Halunder

3,9Buchstaben

Deutsch

4,7Buchstaben

Halunder ist im Schnitt rund 0,8 Buchstaben kürzer pro Wort. Vokalreichtum statt Konsonanten-Stapel.

01 · Sprache im Druck

Halunder in der Inselzeitung

Die Monatszeitung „Der Helgoländer" gibt es seit Mitte der 1960er, die einzige durchgängige öffentliche Quelle, in der Halunder über sechs Jahrzehnte erscheint. Wachstum in den 70er- und 80er-Jahren rund um die aktive Sprachpflege, dann ein langsamer Rückzug.

Halunder im „Der Helgoländer“ 1964 bis 2024

Wie viele Halunder-Wörter pro Jahr in der Monatszeitung „Der Helgoländer“ geschrieben wurden.

Ansicht:

Halunder-Marker per Wortliste und Halunder-spezifische Buchstaben-Cluster. Jahres-Peak: 1982 mit 5.124 Halunder-Wörtern. Ausgabe-Peak: Januar 1978 mit 985 Halunder-Wörtern in einer einzigen Ausgabe.

Quelle: halunder.ai · Auswertung

02 · Worüber im Halunder gesprochen wird

Die häufigsten Nomen

Funktionswörter (Artikel, Pronomen, Präpositionen, Konjunktionen) und Hilfsverben sind ausgeblendet. Was bleibt, sind die Nomen, also worüber tatsächlich geredet wird. Ganz oben: Mutter und Vater, dann die Insel selbst, das Wasser, die Zeit. Dazu kommen ikonische Insel-Wörter: Lun für „Helgoland", Strun für „Strand", Klok für „Uhr", Foor für „Vater".

Halunder · Top 15 Nomen

Häufigste Substantive und Eigennamen im Halunder. Anzahl der Vorkommen mit deutscher Übersetzung.

Quelle: halunder.ai · bereinigtes Trainingskorpus

03 · Wortlänge

Kurze Halunder-Wörter

Halunder hat seinen Modus bei 2 Buchstaben: mehr als jedes vierte Wort (28,5 %) ist nur zwei Zeichen lang. Deutsch verteilt sich breiter mit Spitze bei 3 Buchstaben (29,4 %) und einer deutlich sichtbaren Schulter zwischen 5 und 7 Zeichen. Wer Halunder spricht, spricht in kurzen Silben.

Wortlängenverteilung

Wie lang sind Wörter in beiden Sprachen? Halunder läuft mit zwei- bis vierbuchstabigen Wörtern, im Deutschen dominiert die Drei-Buchstaben-Marke und längere Komposita verschieben den rechten Rand spürbar.

Quelle: halunder.ai · 1,33 Mio. Halunder-Wörter, 1,33 Mio. deutsche Wörter

04 · Satzlänge

Parallel auf Augenhöhe

Wörter pro Satz: 15,80 auf Halunder, 15,78 auf Deutsch. Praktisch identisch. Das ist gleichzeitig Bestätigung und Limitierung unserer Daten: Die Übersetzungen liegen sehr eng beieinander, weil das Korpus aus echten Parallelsätzen besteht.

Satzlängenverteilung

Wörter pro Satz, gegenübergestellt. Die Verteilungen liegen fast deckungsgleich aufeinander, ein guter Indikator dafür, dass die Übersetzungen im Korpus eng beieinander geblieben sind.

Quelle: halunder.ai · 84.246 Satzpaare