Januswörter

Begonnen von Wortklaux, 2017-06-14, 22:00:08

Vorheriges Thema - Nächstes Thema

Wortklaux

SOB
ZARG
IGELD
OPFERD
ASTERNE

Kilian

Habe mit einem Skript und dem aspell-Wörterbuch 1515 gefunden. Hier eine Auswahl:

VORNAMENT
ASTEROIDE
HINTERNA
GRIECHER
FLEUCHTE
EMANUELL
ABREGENZ
WESSENZ
VERRATA
SPENDEL
PFLOCKE
PAPPELL
LINSEL
GROLLI

Wortklaux

Sehr schön!
Wenn Du so flink programmieren kannst, kannst Du ja auch mal eine Liste der doppelten Januswörter herausgeben, die ist vielleicht weniger lang.
Mir fällt hier ein:

ESOB
PFLOCKER

Kilian

Was sind doppelte Januswörter – zwei Wörter, wo das erste abzüglich der ersten beiden Buchstaben und das zweite abzüglich der letzten zwei Buchstaben gleich sind? Aber wo ist dann der Witz bei ESOB? Da könnte man ja jede Kombination von Zwei-Buchstaben-Wörtern nehmen (enstprechend kriegte ich erst bei den Januswörtern alle Kombinationen von zwei Buchstaben, weil die als ,,Wörter" in aspell stehen, die habe ich aber schon rausgefiltert).

Wortklaux

Zwei äquivalente Definitionen:
(1) Ein doppeltes Januswort ist eine Buchstabenfolge, die sowohl dann zu einem Januswort wird, wenn man den ersten Buchstaben entfernt, als auch dann, wenn man den letzten entfernt.
(2) Ein doppeltes Januswort ist eine Buchstabenfolge, die immer dann zu einem Wort wird, wenn man von Anfang und Ende zwei beliebige (also entweder die ersten beiden, die letzten beiden oder den ersten und letzten) Buchstaben entfernt.

ESOB ist also nach (1) ein doppeltes Januswort, weil sowohl ESO als auch SOB Januswörter sind. Nach (2) ist es ein doppeltes Januswort, weil ES, SO, und OB Wörter sind.
Dementsprechend bei PFLOCKER: PFLOCKE und FLOCKER sind Januswörter, PFLOCK, FLOCKE und LOCKER sind Wörter.

Wortklaux

Zitat von: Kilian in 2017-06-15, 16:17:06
(enstprechend kriegte ich erst bei den Januswörtern alle Kombinationen von zwei Buchstaben, weil die als ,,Wörter" in aspell stehen, die habe ich aber schon rausgefiltert).

Ich würde überhaupt dazu neigen, nur Buchstabenfolgen Januswörter zu nennen, die selbst keine Wörter sind. Sonst kommt man auf fast triviale Kombinationen wie VERLASSEN oder RÜBERZIEHEN. Aber diesem strengen Maßstab hält mein Doppeljanuswort PFLOCKER schon nicht stand, weil Pflocke als Dativ von Pflock leider ein Wort ist.

Kilian

Ah, verstehe.

Ich hatte auch in meinem Skript nur Grundformen berücksichtigt und ferner bekannte Wortformen rausgefiltert und nicht als Januswörter gezählt.

Jetzt zu den doppelten Januswörtern, da bin ich mal deiner zweiten Definition gefolgt (mit der Einschränkung, dass Januswörter keine Wörter sein dürfen, ist sie nicht mehr genau äquivalent zur ersten – PFLOCKER ist dann z.B. nur nach der zweiten erlaubt) und habe am Ende wiederum bekannte Wortformen rausgefiltert und nicht als doppelte Januswörter gezählt.

Im Ergebnis finde ich sogar mehr doppelte Januswörter als einfache, 2762 nämlich. Eine Auswahl der längsten:

PLEITERN
ZWEITEL
ZWANGEL
TATARIF
STUNTER
RASCHEU
LABORTE
KRASSEL
IMAGENT
GNADELN
BLINDEX
ÜBERGO <- klingt wie ein neues Produkt einer berüchtigten Tech-Compnay

Kilian

Eigentlich bezeichnet das Wort Januswort ja schon etwas ganz anderes. Vielleicht sollten wir hierfür eine andere Bezeichnung finden? Worttreppe oder Wortfächer vielleicht?

Wortklaux

Super! Die doppelten Januswörter (mindestens die von Dir aufgeführten) sind alle irgendwie überraschend, wenn man sie auseinanderfächert.
Dass er mehr doppelte als einzelne gibt, ist ebenfalls überraschend, weil ja jedes doppelte zwei einzelne enthält und nicht jedes einzelne sich zu einem doppelten erweitern lässt. Es kann nur daran liegen, dass sich viele einzelne Januswörter auf vielfache Weise auf doppelte erweitern lassen, so dass sie also in vielen doppelten enthalten sind.
Ob es auch viele dreifache und vierfache Januswörter gibt? Irgendwie kommt es mir vor, dass die Wahrscheinlichkein für die Existenz solcher Wörter sinkt, je mehrfach sie sind. Es sei denn, man lässt zirkuläre Konstruktionen wie ERERERERERERE... oder SOBINURESOBINURESOBINURE... (jeweils aus zweisilbigen Wörtern zusammengesetzt gedacht) zu. Aber auch von denen dürfte es nur sehr wenige geben. Man sollte aber besser von Anfang an die Regel einführen, dass ein elementares Wort nur einmal innerhalb eines mehrfachen Januswortes vorkommen darf.
Den Namen Januswort hatte ich gewählt, weil das Januswort selbst sozusagen zwei Gesichter hat (den ersten und letzten Buchstaben) und weil es das (wie den Janus) nicht wirklich gibt. Wenn man aber ein Gesicht entfernt, bekommt man jeweils etwas mit einem Gesicht, was es wirklich gibt. Aber ich möchte natürlich nicht mit bestehenden Benennungen konkurrieren.

Kilian

Zitat von: Wortklaux in 2017-06-16, 21:15:12
Dass er mehr doppelte als einzelne gibt, ist ebenfalls überraschend, weil ja jedes doppelte zwei einzelne enthält und nicht jedes einzelne sich zu einem doppelten erweitern lässt. Es kann nur daran liegen, dass sich viele einzelne Januswörter auf vielfache Weise auf doppelte erweitern lassen, so dass sie also in vielen doppelten enthalten sind.
Ob es auch viele dreifache und vierfache Januswörter gibt? Irgendwie kommt es mir vor, dass die Wahrscheinlichkein für die Existenz solcher Wörter sinkt, je mehrfach sie sind. Es sei denn, man lässt zirkuläre Konstruktionen wie ERERERERERERE... oder SOBINURESOBINURESOBINURE... (jeweils aus zweisilbigen Wörtern zusammengesetzt gedacht) zu. Aber auch von denen dürfte es nur sehr wenige geben. Man sollte aber besser von Anfang an die Regel einführen, dass ein elementares Wort nur einmal innerhalb eines mehrfachen Januswortes vorkommen darf.

Guter Punkt! Ein Wort mehrmals zu verwenden macht natürlich keinen Spaß, ich habe meinem Programm diese Einschränkung hinzugefügt.

Auch habe ich versucht, Abkürzungen möglichst aus dem Wortschatz rauszuwerfen. Arbeitsdefinition: alles in aspell, in dem mehr als ein Großbuchstabe vorkommt, ist eine Abkürzung. Vielleicht sollte ich das Ganze noch mal mit einer besseren Wortliste ganz ohne Abkürzungen machen, eventuell auch ohne Eigennamen und so.

Ich habe mal die ein- bis vierzehnfachen Januswörter generiert und nach Länge histografiert. (n-fache Januswörter mit b Buchstaben sind aus (b - n)-buchstabigen Einzelwörtern zusammengesetzt, z.B. sind einfache Januswörter mit drei Buchstaben aus zweibuchstabigen Einzelwörtern zusammengesetzt, zweifache Januswörter mit vier Buchstaben sind aus dreibuchstabigen Einzelwörtern zusammengesetzt usw.) Hier die Ergebnisse (der Einfachheit halber habe ich einfach meine Shell-Session hier reinkoporen):

$ ./janus.py 1 | ./lenhist
3 136
4 238
5 322
6 149
7 53
8 13
9 3
11 3
12 2
13 1
$ ./janus.py 2 | ./lenhist
4 433
5 261
6 140
7 25
8 7
$ ./janus.py 3 | ./lenhist
5 1212
6 253
7 66
8 1
$ ./janus.py 4 | ./lenhist
6 3159
7 171
8 14
$ ./janus.py 5 | ./lenhist
7 7936
8 139
9 1
$ ./janus.py 6 | ./lenhist
8 19294
9 137
$ ./janus.py 7 | ./lenhist
9 45037
10 118
$ ./janus.py 8 | ./lenhist
10 100586
11 81
$ ./janus.py 9 | ./lenhist
11 215143
12 88
$ ./janus.py 10 | ./lenhist
12 440697
13 33
$ ./janus.py 11 | ./lenhist
13 861092
14 29
$ ./janus.py 12 | ./lenhist
14 1601526
15 7
$ ./janus.py 13 | ./lenhist
15 2830124
16 3
$ ./janus.py 14 | ./lenhist
16 4732261


Grundsätzlich bestätigen die Ergebnisse deine Intuition: je mehrfacher die Januswörter werden, desto weniger gibt es. Allerdings macht sich das bei den aus zweibuchstabigen Einzelwörtern zusammengesetzten erst sehr spät bemerkbar, ihre Anzahl explodiert zunächst, auch wenn das Wachstum sich irgendwann verlangsamt. Da gibt es einfach zu viele mögliche Kombinationen, auch ohne Zyklen.

Aus dreibuchstabigen Einzelwörtern zusammengesetzte Januswörter gibt es mehr zweifache als einfache, danach fällt ihre Anzahl, wenn auch nicht ganz monoton: bei den neunfachen Januswörtern gibt es noch mal einen kleinen Ausreißer nach oben.

Die längsten aus mehr als zweibuchstabigen Einzelwörtern zusammengesetzten Januswörter, die ich gefunden habe, sind dreizehnfach und ziemlich cool (sie klingen wie ein chemischer Prozess bzw. wie zwei verschiedene chemische Stoffe):

KUHUTALUDOMACHIE
KUHUTALUDOMACHIN
KUHUTALUDOMACHIT

Wortklaux

coolst!
Anscheinend hat aspell "ins" nicht ins Wörterbuch aufgenommen, sonst gäbe es auch das vierzehnfache Januswort
KUHUTALUDOMACHINS

Kilian

Ah, aspell behandelt Präpositionalartikel als Beugungsformen der zugehörigen Präpositionen und nicht als Grundformen, daher standen sie nicht in meiner Wortliste.

Berthold

Zitat von: Wortklaux in 2017-06-17, 14:00:06
coolst!
(...)
KUHUTALUDOMACHINS

Eh urleinwaund; auf seine Art. - Aber dem guten alten Bertl immer wieder einmal vorwerfen, daß er zu abgehobene Themata herschreibt.