halunder.ai

Halunder vs. Deutsch.
Ein Blick ins Korpus.

84.246 bereinigte Satzpaare, parallel ausgerichtet, aus über 800 Texten zusammengetragen. Wie sieht Halunder im direkten Vergleich zum Deutschen aus?

Was 84.246 Satzpaare wirklich heißen

So viel Halunder, wie in 10 Romanen steht.

Ein durchschnittliches Taschenbuch enthält pro Seite rund 12 Sätze (Literatur-Schnitt, je nach Stil zwischen 10 und 15). Das bereinigte Trainingskorpus von halunder.ai hat 84.246 Satzpaare, das sind grob 7.021 Buchseiten Halunder-Text, jeweils ausgerichtet mit ihrer deutschen Übersetzung.

84.246

Satzpaare

~ 7.021

Buchseiten

~ 10

Romane (∅)

Im Vergleich zu klassischen Romanen

~1.300 Sätze · 100 S.
~6.000 Sätze · 335 S.
~6.300 Sätze · 376 S.
~7.500 Sätze · 320 S.
~84.246 Sätze

Der kleine Prinz

Saint-Exupéry

1.300

Harry Potter Bd. 1

Rowling

6.000

Effi Briest

Fontane

6.300

Das Parfum

Süskind

7.500

halunder.ai

84.246

Höhe linear proportional zur Satzanzahl. halunder.ai ≈ 11× so viel Text wie „Das Parfum".

Die Zahlen auf dieser Seite stammen aus dem bereinigten Trainingskorpus von halunder.ai, bereinigt durch eine mehrstufige Validierungs-Pipeline mit über 3.000 Schreib- und Grammatik-Regeln.

Der Vergleich soll zeigen, wie Halunder tickt: kurze Funktionswörter, ein Vokalreichtum, der die Wortlänge nach unten zieht.

Datenbasis

84.246 Satzpaare
1,33 Mio. Halunder-Wörter
1,33 Mio. deutsche Wörter
29.223 einzigartige Halunder-Wortformen
33.665 einzigartige deutsche Wortformen

Wörter im Korpus

Halunder

1.330.685

Deutsch

1.329.642

Beide Seiten praktisch gleichauf. Die Übersetzungen folgen sich Wort für Wort.

Einzigartige Wortformen

Halunder

29.223

Deutsch

33.665

Deutsch hat mehr Wortformen, vor allem getrieben durch Komposita und stärkere Flexion.

Mittlere Wortlänge

Halunder

3,9Buchstaben

Deutsch

4,7Buchstaben

Halunder ist im Schnitt rund 0,8 Buchstaben kürzer pro Wort. Vokalreichtum statt Konsonanten-Stapel.

01 · Sprache im Druck

Halunder in der Inselzeitung

Die Monatszeitung „Der Helgoländer" gibt es seit Mitte der 1960er, die einzige durchgängige öffentliche Quelle, in der Halunder über sechs Jahrzehnte erscheint. Wachstum in den 70er- und 80er-Jahren rund um die aktive Sprachpflege, dann ein langsamer Rückzug.

02 · Worüber im Halunder gesprochen wird

Die häufigsten Nomen

Funktionswörter (Artikel, Pronomen, Präpositionen, Konjunktionen) und Hilfsverben sind ausgeblendet. Was bleibt, sind die Nomen, also worüber tatsächlich geredet wird. Ganz oben: Mutter und Vater, dann die Insel selbst, das Wasser, die Zeit. Dazu kommen ikonische Insel-Wörter: Lun für „Helgoland", Strun für „Strand", Klok für „Uhr", Foor für „Vater".

03 · Wortlänge

Kurze Halunder-Wörter

Halunder hat seinen Modus bei 2 Buchstaben: mehr als jedes vierte Wort (28,5 %) ist nur zwei Zeichen lang. Deutsch verteilt sich breiter mit Spitze bei 3 Buchstaben (29,4 %) und einer deutlich sichtbaren Schulter zwischen 5 und 7 Zeichen. Wer Halunder spricht, spricht in kurzen Silben.

04 · Satzlänge

Parallel auf Augenhöhe

Wörter pro Satz: 15,80 auf Halunder, 15,78 auf Deutsch. Praktisch identisch. Das ist gleichzeitig Bestätigung und Limitierung meiner Daten: Die Übersetzungen liegen sehr eng beieinander, weil das Korpus aus echten Parallelsätzen besteht.