Wenn Computer schmutzige Witze lernen …

Technik

Technik
© Philip Lange
04.05.2011

Schmutzige Witze beruhen oft auf Zweideutigkeiten der Sprache. Ein Problem für den Computer. Kein Wunder, dass er nicht über deine Witze lacht. Doch das könnte sich bald ändern.

Computer verfügen heute über ein sehr breit gefächertes Spektrum an Features und Funktionen, ein ausgeprägter Sinn für Humor gehört aber sicher nicht dazu. Dies könnte sich jedoch schon bald ändern: Computerwissenschafter der University of Washington haben das erste Softwareprogramm entwickelt, das es versteht, aus Wörtern und Sätzen eine bestimmte Art von Zweideutigkeit herauszulesen, die für das Erzählen von vordergründig schmutzigen Witzen mit sexuellem Anstrich erforderlich ist.

"Wir haben es hier mit einem sehr schwierigen natürlichen Problem der sprachlichen Verständigung zu tun", erklären Chloé Kiddon und Yuriy Brun, Graduate-Studenten der Fakultät für Computer Science & Engineering an der University of Washington gegenüber dem New Scientist. Wenn es darum geht, einem Softwareprogramm beizubringen, was lustig ist und was nicht, würden vor allem Zweideutigkeiten ein Problem darstellen. Diese müssten automatisch erkannt und auf ihren potenziell humorvollen Gehalt hin analysiert werden, fassen die beiden Computerwissenschafter den technischen Aspekt und die zentrale Herausforderung ihrer Arbeit zusammen.

"Sexiness-Wert" und Fun-Faktor

Um ihr Ziel zu erreichen, mussten sich die findigen Programmierer zunächst ausgiebig mit der Analyse von Texten beschäftigen. Für diese Zwecke wurden insgesamt 1,5 Mio. Sätze mit erotischen Inhalten und rund 57.000 Zitate aus Standard-Literaturwerken gesichtet und ausgewertet. Dabei wurde jedem einzelnen der darin enthaltenen Hauptwörter, Adjektive und Verben ein bestimmter "Sexiness-Wert" zugeordnet, der Aufschluss über deren humoristisches Potenzial bei einer zweideutigen Verwendung gibt. Beispielsweise wurden die Wörter "Stange" oder "heiß" mit einem sehr hohen Wert eingestuft.

Das entwickelte System, das Kiddon und Brun "Double Entendre via Noun Transfer" - kurz "DEviaNT" - getauft haben, sollte anschließend selbst dazu in der Lage sein, beliebige Sätze entsprechend ihres möglichen Fun-Faktors zu erkennen und zu werten. Dabei erzielte die Software sehr erfolgreiche Ergebnisse: Den Forschern zufolge konnte das tatsächliche Humorpotenzials in rund 70 Prozent der getesteten Fälle korrekt eingeschätzt werden. "Hätten wir gleichmäßigere Datensätze zur Verfügung gehabt, hätten wir auch 99,5 Prozent erreichen können", sind die Computerwissenschafter überzeugt.

Weiterentwicklung bereits gesichert

Ob die derzeit noch in der Entwicklung befindliche Technologie jemals als eigenständiges Produkt oder als Teil einer übergeordneten Softwarelösung zur Texterkennung in den Handel kommen wird, lässt sich zum jetzigen Zeitpunkt noch nicht sagen. Kiddon und Brun haben zumindest bereits angekündigt, ihr System weiterentwickeln zu wollen: "Diese Technik kann generalisiert werden, um verschiedene Formen von Zweideutigkeiten und Humor zu erkennen."

(pte/pb)

17
Kommentare insgesamt

Robert F.
05.05.2011 10:09
reg. Mitglied
Grundlagenarbeit schadet ja eigentlich nie... aber wer bezahlt diese in diesem speziellen Fall eigentlich?

MichBeck
05.05.2011 11:49
Moderator
ist doch eine wichtige Arbeit auf dem Wege zur künstlichen intelligenz.. auch Humor ist dann von nöten

Mr P.
05.05.2011 13:45
Gast
find ich cool, auch wenn ich mit einem computer sicher nicht über zweideutige wortgruppen reden werde. das macht doch keinen spaß

  ?.
05.05.2011 14:51
Gast
kann den Sinn dahinter nicht verstehen... wer kauft sowas?

Mr P.
05.05.2011 15:02
Gast
die usa weiß nicht wohin mit den ganzen steuergelder und der kriegsbeute

  ?.
05.05.2011 15:14
Gast
die usa is bald pleite ^^

Mr P.
05.05.2011 15:24
Gast
ich sag nur tesla^^

MichBeck
05.05.2011 16:39
Moderator
ihr kapiert den sinn dahinter scheinbar nicht.. die komplexeste form der kommunikation ist der Humor.. d.h. wenn du einen Computer entwickeln willst, der wirklich halbwegs intelligent reagiert, musst du faktoren wie ironie, sarkasmus etc. mit berücksichtigen.. dazu gehört eben auch die eine oder andere Form des Humors..

Mr P.
05.05.2011 18:32
Gast
ja natürlich is das wichtig. aber mal ehrlich, willst du einen computer der witze über dich reißt?? das problem an der ganzen sache is, das man dem computer auch beibringen muss, wann aus humor ernst wird. alos wann er sich seine witze lieber klemmen sollte. das is extrem komplex, das dauert noch jahre bis man diese verhaltensformen einem toten gegenstand beibringen kann

  ?.
06.05.2011 08:37
Gast
"ihr kapiert den sinn dahinter scheinbar nicht.. die komplexeste form der kommunikation ist der Humor.. d.h. wenn du einen Computer entwickeln willst, der wirklich halbwegs intelligent reagiert, musst du faktoren wie ironie, sarkasmus etc. mit berücksichtigen.. dazu gehört eben auch die eine oder andere Form des Humors.. "

erzähl nich....

*ironie off*

die frage ist: wer braucht solch sinnlose scheisse? computernerds die keine freunde haben oder was?
17
Kommentare insgesamt
weitere Nachrichten aus der Kategorie „Technik“:
Atari, fast schon vergessene Games-Legende, meldet sich zurück. Allein in diesem Jahr sollen zwischen zehn und 15 neue Titel erscheinen. » mehr lesen
Die Stiftung Museum Autovision präsentiert den Nachbau eines Gefährts, das älter ist als der erste Motorwagen und schon damals mit E-Antrieb bewegt wurde. » mehr lesen