Sprache digitalisieren?

Begonnen von Kilian, 2004-12-20, 18:54:39

Vorheriges Thema - Nächstes Thema

Kilian

Nebenan in "Futur II" ist es so gemütlich-adventslaunig geworden, dass ich lieber hier einen bestimmten Diskussionspunkt nochmal aufgreife.

Zitatamarillo schrieb:
Sprache hat - korrigiere mich bitte, wenn nötig - in ihrer Struktur keine oder nur sehr wenig Logik aufzuweisen, deshalb läßt sie sich ja auch nicht digitalisieren

Mein Wissen ist hier nicht sehr tief, aber wenn ich mich nicht täusche, hat Noam Chomsky Formalismen zur Beschreibung von Sprachen entwickelt, die sich sowohl auf Computersprachen als auch auf natürliche Sprachen anwenden lassen - mit ihrer Hilfe lässt sich theoretisch eindeutig bestimmen, ob ein Text grammatisch korrekt ist, oder nicht. Ganz grob aus Aufgeschnapptem rekonstruiert.

Dass das mit natürlichen Sprachen in der Praxis nicht funktioniert, liegt meiner Einschätzung nach nicht daran, dass sie grundsätzlich nicht mit solchen Formalismen modellierbar wären, sondern vielmehr daran, dass aufgrund der vielen Ausnahmen und des nicht systematisch-konstruierten Aufbaus eine ungeheuer komplexe Struktur vorliegt und ein vollständiges, korrektes Modell einer Sprache selbst dann mehr als ein Lebenswerk wäre, wenn Sprachen statisch und eindeutig wären. Aber erstens gibt es z. B. so viele verschiedene Deutschs, wie es Deutschsprecher gibt, und zweitens verändern sich all diese Deutschs laufend. Der quantitative Aufwand wäre einfach zu hoch.

So muss man Abstriche bei der Vollständigkeit machen -

ZitatBislang hat noch kein Computer auch nur einen einzigen sinnvollen Satz zuwege gebracht.

meines Wissens gibt es aber doch schon Chatbots und Übersetzungsmaschinen, die bis zu einem gewissen Level durchaus mit einer gewissen Flexibilität korrekte Sätze produzieren. Die Frage ist hier wahrscheinlich, wo man anfängt, etwas als "selbständig zuwege bringen" zu bezeichnen. Was verstehst du darunter?

NB, ich bin nur munter drauflos schwätzender Laie!  :)

amarillo

ZitatNB, ich bin nur munter drauflos schwätzender Laie!  :)

Genau das ist auch mein Status.
Chomsky sah mittels der "generativen Transformationsgrammatik (!)" die Möglichkeit,  Sprache bis in den kleinsten bedeutungsunterscheidenden Punkt herunterzubrechen.

Dies kann ein Monem sein (z.B. ein diakritisches Zeichen wie die Punkte über oder unter arabischen Buchstaben, die entscheiden, ob es sich nun um ein langes "i" oder um ein "b" handelt)
oder ein Phonem (das kleinste in unserem Sprachraum ist - glaube ich - der Glottisschlag)

Wie dem auch sei, seit den 70ern habe ich mich nicht mehr um diese Dinge gekümmert; ob Chomsky noch weiter an der GTG gearbeitet hat, weiß ich nicht, er ruft schon länger nicht mehr an.

Tja, und wie das mit dem sinnvollen Satz bei Computern gehen soll, weiß ich auch nicht. Wie erwähnt ist der Moment der Spracherzeugung im Hirn so komplex, daß kein Aas weiß, was sich denn abspielt, Sekundenbruchteile, bevor ein Satz geäußert wird. Wenn man manchen Neurologen glaubt, ist Spracherzeugung ein dem Bewußtsein nicht zugänglicher Akt; fragt man weiter, was denn Bewußtsein sei, fangen die Neurologen ganz unbewußt an zu stottern.
Außerdem: wer würde schon einem Neurologen glauben, solanger er nur selbst alle Nadeln an der Tanne hat?

Zur synthetischen Spracherzeugung (aus eigenem Antrieb) ist ein Computer m.E. nicht fähig - was sollte er auch erzählen? Schwänke aus seiner Zeit als Silikonpampe?
Hier gibt es ein schönes Buch: Richard Dawkins: "the Blind Watchmaker". Befaßt sich eigentlich mit Evolution, hat aber auch schöne Abschnitt über Sprache.

Aber dies ist alles nur aus laienhaften Überbleibseln aus einem linguistischen Proseminar herübergerettet.

Ich sehe das so: Sprache ist eine Spezies mit so vielen Individuen, wie es Leute gibt, die sich ihrer bedienen.
Das Leben strebt mit Urgewalt nach Entstehung und Musik.

Kilian

Zitat von: amarillo in 2004-12-20, 19:47:51Tja, und wie das mit dem sinnvollen Satz bei Computern gehen soll, weiß ich auch nicht. Wie erwähnt ist der Moment der Spracherzeugung im Hirn so komplex, daß kein Aas weiß, was sich denn abspielt, Sekundenbruchteile, bevor ein Satz geäußert wird.

ZitatZur synthetischen Spracherzeugung (aus eigenem Antrieb) ist ein Computer m.E. nicht fähig - was sollte er auch erzählen?

An einen so weiten Begriff von Sprache bzw. Sprechen hatte ich gar nicht gedacht. Ich meinte mit Sprache, um es ganz formal zu sagen, mehr ein System, das festlegt, in welcher Weise Zeichen aneinandergereiht werden dürfen (grammatisch korrekt) und in welcher nicht (unsinnige Zeichenkette). Aus eigenem Antrieb ist ein Computer natürlich zu gar nichts fähig.

ZitatHier gibt es ein schönes Buch: Richard Dawkins: "the Blind Watchmaker". Befaßt sich eigentlich mit Evolution, hat aber auch schöne Abschnitt über Sprache.

Wird mir jetzt zum zweiten Mal empfohlen, muss also dringendst auf meine Leseliste. Weißt du zufällig, ob die deutsche Übersetzung gut ist? Wie mir der Online-Katalog gerade mitteilte, hat "meine" Bibliothek nur die da.

ZitatIch sehe das so: Sprache ist eine Spezies mit so vielen Individuen, wie es Leute gibt, die sich ihrer bedienen.

Genau das, was ich meinte, als ich sagte, es gebe so viele verschiedene Deutschs*, wie es Deutschsprecher gibt. :)

* Pluralform © Andreas M. Cramer

caru

also, übersetzungsprogramme à la babelfisch erzeugen höchstens zufällig mal einen satz, der überhaupt verständlich ist, von grammatisch oder gar idiomatisch richtig soviseau zu schweigen. ist jedenfalls meine erfahrung.


bei hinreichend fernliegenden und sich von der muttersprache des lernenden stark unterscheidenden sprachen (sagen wir mal, chinesisch für unsereinen) geht das mit den individuen so weit, daß man bei mehreren sich abwechselnden lehrern den eindruck hat, bei jedem eine andere sprache zu lernen. höchst verwirrend.
(\___/)
(>´x´<)
('.')__('.')

Nijntje - de echte nederlandse konijn

amarillo

Zitat von: Kilian in 2004-12-20, 20:43:30
An einen so weiten Begriff von Sprache bzw. Sprechen hatte ich gar nicht gedacht. Ich meinte mit Sprache, um es ganz formal zu sagen, mehr ein System, das festlegt, in welcher Weise Zeichen aneinandergereiht werden dürfen (grammatisch korrekt) und in welcher nicht (unsinnige Zeichenkette). Aus eigenem Antrieb ist ein Computer natürlich zu gar nichts fähig.

Ich meine, daß Chomsky mit den heutigen Computern durchaus in der Lage sein könnte, eine synthetische Sprache zu entwerfen, die jederzeit alles festgeschriebenen formalen Ansprüchen genügen würde.
Aber: Sprache ist viel enger mit der Musik verwandt,als mit der Mathematik. Jegliche Nuancierung von Intonation, Tonhöhe, Schalldruck, Timbre, etc läßt sich vielleicht in der Musik niederlegen, aber Karajan hat diese Zeichen ja auch anders gelesen, als es Solti tut.

ZitatWird mir jetzt zum zweiten Mal empfohlen, muss also dringendst auf meine Leseliste. Weißt du zufällig, ob die deutsche Übersetzung gut ist? Wie mir der Online-Katalog gerade mitteilte, hat "meine" Bibliothek nur die da.

Ich kenne leider auch nur die Originalfassung, und die ist relativ leicht zu lesen. Dawkins hat nur ein kleines Problem: er kommt nur schwer auf den "Punkt". Er erklärt noch weiter, auch wenn der Dümmste längst kapiert hat.



Das Leben strebt mit Urgewalt nach Entstehung und Musik.

gehabt gehabt

Zitat von: amarillo in 2004-12-20, 21:39:02
Zitat von: Kilian in 2004-12-20, 20:43:30
.


Aber: Sprache ist viel enger mit der Musik verwandt,als mit der Mathematik. Jegliche Nuancierung von Intonation, Tonhöhe, Schalldruck, Timbre, etc läßt sich vielleicht in der Musik niederlegen, aber Karajan hat diese Zeichen ja auch anders gelesen, als es Solti tut.




Also eine Gebrauchsanweisung fuer einen Staubsauger oder
ein Mathematikbuch hat mehr mit  Musik denn mit Mathe zu tun? Oder, was der Feldwebel aud dem Exerzierplatz sagt?

amarillo

#6
Jawoll, gehabt haben, selbst wenn Herr Feldwebel zu Brüllen geruhen.
Ich glaube aber, wenn man statt Sprache "Sprechen " sagt, wird es noch deutlicher.

Dies ist meine Meinung und Beobachtung; wissenschaftlich ist das garantiert nicht wasserdicht. Leute, die nur einen Tick musischen Empfindens (am besten musikalisch) habe, lernen Fremdsprachen viel einfacher, als jene, die einen Beethoven von einem Rodin nicht unterscheiden können. (Ingenieure trifft es hier ganz hart)

Digitale Sprache/Sprechen müßte sich (akustisch wie inhaltlich) anhören wie die Berliner Philharmoniker als midi-Datei.

Das Leben strebt mit Urgewalt nach Entstehung und Musik.

gehabt gehabt

Die Amerikaner nennen die synthetische Musik, die
in Warenhaeusern aus den Lautsprechern schallt Muzac
(nach dem Beruhigungsmittel Prozac).

Ich glaube das nicht, dass Musik und Sprache mehr zusammenhaengen als Musik und Mathe.

Ich habe einen autistischen Sohn, dessen Sprachverstaendnis geringer ist als das eines Hundes, obwohl er 13 Jahre alt ist. Er versteht vielleicht ein Dutzend Woerter, er spricht nicht. Seine sozialen faehigkeiten sind eindeutig besser als seine sprachlichen aber immer noch sehr reduziert. Aber er hat eine ausgesprochene Affinitaet zu Musik und Rhythmus. Er sieht Musik aber auch nicht alsKommunikationsmittel, sondern sie gefaellt ihm einfach. Es muessen andere Mechanismen im Gehirn fuer beides zustaendig sein.

Wenn du meinst, dass Musik aehnlich komplex sein kann wie Sprache und auch aehnlich komplex in ihrem sozialen Kontext, besonders wenn es sich nicht nur um eine Reproduktion handelt sondern um Improvisieren in Gruppen, dann stimme ich zu.

amarillo

Jetzt muß ich doch noch einmal auf den ollen Ckomsky zurückkommen (dann ist's auch genug - versprochen).
Er beschrieb Sprache als ein System von Kodierung und Dekodierung (das Modell war recht komplex, ich beschränke mich auf das, waß ich noch davon weiß).
Demnach ist es völlig egal, welchen Code ich verwende, das können visuelle, akustische, olfaktorische oder wie auch immer geartete Signale sein, solange nur der Rezipient über die nötigen Werkzeuge zur Dekodierung verfügt.
Nun habe ich überhaupt keine Ahnung von Autismus, oder davon wie ein Hirn überhapt tickt.
Daß Dein Filius auf Musik "anspricht", heißt doch - nach Chomsky - daß der Junge einen Code empfängt. Vielleicht kann er diesen sogar dekodieren. Dann wäre ja nur der Code zwischen ihm und den Rezipienten seiner eigenen Signale gestört. Ihr habt nicht dasselbe Code-System.

Der Mensch ist zunächst im Erlernen und Reproduzieren der Sprache auf die Akustik angewiesen (lesen kommt später), deshalb diese starke Anlehnung an die Musik.

Wie sagte ein kluger Kopf: hätte ich zu wählen zwischen Blindheit und Taubheit, würde ich ohne zu zögern auf meine Augen verzichten. Blindheit trennt mich von den Dingen, Taubheit von den Menschen.

Sprache und Musik haben nun einmal sehr ähnliche Kodierunssysteme. Mathe mag auch eine Sprache sein, tickt aber  ganz anders.
Das Leben strebt mit Urgewalt nach Entstehung und Musik.

gehabt gehabt

Wenn ein taubes Kind zuerst die Gebaerdensprache lernt, so steht es doch spaeter, wenn es schreiben gelernt hat, einem Hoerenden in seiner Kommunikationsfaehigkeit in nichts nach.

Ich denke, aber ich bin kein Experte, dass es zu Anfang nicht darauf ankommt, ob man die Kommunikation mit akustischen, optischen oder haptischen Signalen erlernt. Das Gehirn ist wohl flexibel genug, sich darauf einzustellen. Das Sprechen hat halt den Vorteil, dass es im Dunkeln und ueber eine gewisse Distanz verstanden wird. Und unser Sprechanismus ist hinreichend flexibel, um auch subtile Details, wie Ironie etc..., kodieren zu koennen (noch besser, wenn man das Gesicht des Sprechenden sieht). Die Emotikons (Emotiken?) sind nur ein schwacher Abklatsch davon.

amarillo

Das mag durchaus richtig sein, aber auch taube Kinder leben nun einmal in einer Welt der Akustik - selbst wenn ihnen die Dekodierungswerkzeuge zunächst einmal genommen sind. Die Codesender sind - sofern nicht auch taub - aus einer anderen Welt. Natürlich gibt es ein Aufeinanderzugehen und Verstehen, Gott sei's gedankt.

Ob die Gebärdensprache den Nuancenreichtum des Sprechens erreicht, weiß ich nicht.
Das Leben strebt mit Urgewalt nach Entstehung und Musik.

caru

ironischer, witziger, liebevoller, tadelnder etc. unterton sind ganz bestimmt auch in der gebärdensprache präsent, nämlich im gesichtsausdruck - während die sinntragenden bewegungen alle mit den händen gemacht werden, denen also wenig freiheit für gestische ausdruckskraft bleibt (die gebärden lassen sich nicht sehr stark abwandeln, ohne einen anderen sinn zu kriegen).
sicher, sprechsprache ist ein subtiles kommunikationsmittel auch im dunkeln über größere distanz, sofern es still genug ist - aber auch gebärdensprache funktioniert über einige distanz, selbst bei straßenlärm, sofern das licht zum sehen reicht. hat beides seine vorteile.
irgendwo hab ich mal über ein (pazifisches?) inselvolk gelesen, bei dem alle kinder von anfang an sprech- und gebärdensprache lernen - eben, weil beides seine vorteile hat. taubstumm zu sein ist dort viel weniger hinderlich als bei uns zulande.

in wien gibts eine dame, die zwischen deutsch und gebärdensprache dolmetscht. sie ist von kind auf zweisprachig: eltern beide taubstumm, geschwister und sonstige verwandte aber hörend; mit den eltern hat sie immer nur in gebärdensprache geredet, und wenn die eltern etwas nicht verstehen sollten, haben sie und ihre geschwister einfach normal miteinander gesprochen (erzählt sie bei interviews gelegentlich schelmisch).
die frau hat die unwahrscheinlichste mimik, die man sich vorstellen kann; vermutlich ist sie jederzeit fähig, jeden beliebigen gemütszustand so auszudrücken, daß er bei einem gehörlosen  zuschauer ankommt. allerdings ist ihre zweisprachigkeit (in unserer kultur) ein einigermaßen seltener ausnahmefall.
(\___/)
(>´x´<)
('.')__('.')

Nijntje - de echte nederlandse konijn

amarillo

Als ich gestern gegen 13 Uhr kurz heimkam - es herrschte n Temperaturen von -3 Grad, aber die Sonne schien - sang ein Vogel auf dem Dach des Hauses. Von einer Sekunde zur anderen hatte ich den kompletten Frühling im Kopf, und das 3 Tage vor Weihnachten.
Besser kann ich das Thema Kodierung - Dekodierung auch nicht erläutern.
Das Leben strebt mit Urgewalt nach Entstehung und Musik.

Kilian

Zitat von: amarillo in 2004-12-20, 21:39:02Ich meine, daß Chomsky mit den heutigen Computern durchaus in der Lage sein könnte, eine synthetische Sprache zu entwerfen, die jederzeit alles festgeschriebenen formalen Ansprüchen genügen würde.

"Eine synthetische Sprache"? Du meinst, nach den Vorgaben einer vorhandenen, natürlichen Sprache (genauer: nach den Vorgaben einer Grammatik, also eines Modells, das eine existierende natürliche Sprache beschreibt) Text zu synthetisieren? Ja, das funktioniert in einem gewissen beschränkten Umfang - siehe z. B. Übersetzungsmaschinen.

Natürlich gibt es tausend Gründe, warum diese Dinger so viel weniger leisten als menschliche Übersetzer. Das menschliche Gehirn ist viel komplexer und leistungsfähiger als Computer. Menschen sind um Galaxien flexibler beim Verstehen und Verfassen von Texten als irgendeine Programmierung es heute vermöchte. Vor allem ist die Arbeit eines menschlichen Übersetzers in ganz hohem Maße nicht nur von seinen "reinen" Sprachkenntnissen, sondern auch vom bewussten Verstehen des Textes beeinflusst, ein Punkt, wo Computer als Datenverarbeitungsmaschine natürlich gänzlich die Waffen streckt.

ZitatAber: Sprache ist viel enger mit der Musik verwandt,als mit der Mathematik.

Ich behaupte sogar, dass Musik enger mit Mathematik verwandt ist als Sprache. In der Mathematik gibt es ein eindeutiges Beschreibungssystem (Formeln etc.) für eindeutige Sachverhalte. Mathematische Sachverhalte sind so abstrakt, dass sie sich exzellent modellieren lassen. So genau und vollständig, wie eine Formel den Sachverhalt wiedergibt, den sie beschreibt - das gibt's, glaube ich, sonst nirgends. In der Musik haben wir auch ein relativ einfaches Beschreibungssystem - Noten, Taktstriche, das ganze Zeichenarsenal ist überschaubar, und eine Handschrift Beethovens kann ohne besonderen (musikalischen) Informationsverlust in einem Notensatzprogramm als digitale Partitur reproduziert werden, und Änderungen innerhalb dieses Beschreibungssystems lassen sich prima von Computern erledigen, z. B. Transponieren. Wenn es allerdings an die Umsetzung des Beschreibenden ins Beschriebene, also an das Spielen der Musik geht, eröffnen sich unendliche Interpreationsmöglichkeiten. Noten sind also, was das Beschreiben von Musik angeht, nur ein unterster Rohbau, für die Realisierung ist in höchstem Maße der eigene Beitrag des Interpreten gefordert. Ähnlich ist es in der Sprache - es ist eine Riesenleistung des Menschen, z. B. aus ein paar Schriftzeichen aus Papier eine Bedeutung herauszuverstehen, die sprachlichen Zeichen mit den Vorstellungen von Realität zu verknüpfen, die sie beschreiben. Im Gegensatz zur Notenschrift ist aber hier auch das Beschreibungssystem in sich höchst komplex und uneindeutig - man denke an stilistische, idiomatische Nuancen, an Dialekte, an Sprachebenen, an grammatische Zweifelsfälle, an unterschiedliche Konstruktionen und Formulierungsmöglichkeiten, Synonyme, Homonyme etc. etc. etc.

Damit sind wir natürlich schon weit über das hinaus, was ich am Anfang dieses Threads mit "Sprache digitalisieren" meinte - nämlich, eine komplette Sprache so digital zu modellieren, dass ein Computer binäre Entscheidungen zwischen "grammatisch richtig" und "grammatisch falsch" treffen könnte.

caru

wir könnens auch so sagen: mathematik, musik und sprache haben sehr viel miteinander zu tun, sie unterscheiden sich aber in der komplexität.

mathematik ist für die meisten menschenhirne schwierig - nicht weil sie so komplex ist, sondern so abstrakt, so weit vom täglichen erleben des naiven menschenhirns. computer tun sich da leicht - weil sie eben überhaupt nichts erleben, sondern nur rechnen.

musik ist komplexer, steht uns näher, kann sogar dinge des täglichen erlebens nachahmen - nachtigallenschlag, wellenplätschern usw. - aber sie tut das in einer immerhin noch reichlich abstrakten form, und daher läßt sie sich leicht mathematisieren und ohne großen schaden durch den computer drehen. ja, man kann sogar auf rein mathematischer basis musik komponieren.

sprache in allen ihren ausprägungen ist wohl das komplexeste ausdrucksmittel des menschen. und so kann man wohl die einzelne sprachliche äußerung mathematisch analysieren, aber nie aufgrund bloßer mathematischer strukturen eine sprachliche äußerung kreieren - oder auch nur feststellen, ob sie sinnvoll, grammatisch oder idiomatisch richtig ist: praktisch alle äußerungen in einer sprache sind in jeder anderen sprache blanker unsinn.
sogar das system einer einzigen sprache wirft ständig neues aus, das über die kombination von bestehendem hinausgeht. abgesehen davon, daß sprachen interagieren - früher nur in unmittelbarer geographischer nähe, heute dank vielfältigster kommunikationsmittel weltweit. welcher 'puter soll da mithalten?
(\___/)
(>´x´<)
('.')__('.')

Nijntje - de echte nederlandse konijn