in Artificial Intelligence, IT stuff, Javascript, PHP, Programming

Über den Stand der KI im Allgemeinen und den 24hour:chatbot im Besondern

Von Deep Thought bis Watson, von Skynet bis ARIIA, Künstliche Intelligenz weckt Hoffnungen und Ängste in den Menschen. Doch wie steht es um die Forschung? Sind wir auf dem richtigen Weg? Und vielleicht noch viel wichtiger: Ist es möglich einen halbwegs intelligenten Chatbot in nur 24 Stunden zu programmieren?

Fangen wir mit dem praktischen Beispiel an: Unter https://projects.haukeluebbers.de/24hours/chatbot/ ist seit etwa einem Monat ein Chatbot zu finden, den ich in 24 Stunden programmiert habe. Also ja, es ist möglich. Wenn man Intelligenz wohlwollend definiert. Chatbots faszinieren mich schon länger. Warum? Ich habe vor 2 Jahren an der Chatterbox Challenge mit B.I.L.L. teilgenommen, und obwohl ich nur den vorletzten Platz belegt habe, hat es einen Mordsspaß gemacht:

BILL steht für Biomechanical Immediate Learning Lifeform. Biomechanical ist gelogen, da der Chatbot aus einem PHP und MySQL Backend und einem Javascript-Frontend besteht, aber Immediate Learning stimmt, da BILL “Zuweisungen” wie “Germany is in Europe” erkannte und dann auf Fragen wie “Where is Germany?” oder “What is in Europe” korrekt antworten konnte. Damals glaube ich an die Weisheit der Massen und ging davon aus, dass BILL in weniger als 2 Jahren die Weltherrschaft an sich reißen würde – daraus ist bis heute (leider?) nichts geworden, BILL beschimpft seine Gesprächspartner gerne, ist ziemlich homophob geworden und spricht eine Mischung aus Englisch, Deutsch und Spanisch.

Soviel zur Schwarmintelligenz des Internets.

Mein neuer 24-Stunden Chatbot kann im wesentlichen das selbe, aber besteht zu 99% aus Javascript (Ajax und ein 200 Bytes PHP-Code sorgen für die Aufzeichnung der Gespräche).

Das heißt, dass die Gesprächsdaten nicht in einer MySQL-Datenbank landen, wie es bei BILL der Fall war, sondern im localStorage, einem klasse HTML5-Feature, dass am ehesten vergleichbar mit lecker Cookies ist. Daraus resultiert natürlich, dass der Chatbot nur Sachen sagt, die er von dem aktuellen Gesprächspartner gelernt hat. Der Bot sollte also “kindersicher” sein ;)

Doch was kann er? Am besten wird dies wohl mit einem Gesprächsauszug deutlich:

Bot: Hi there!
You: hello
Bot: I like hello ^^
You: do you like hello?
Bot: all the time, do you?
You: yeah, its a great word
Bot: k, interesting :P
You: do you like hello?
Bot: yeah, it is a great word
You: what makes 23-12?
Bot: 23-12 makes 11
You: correct
Bot: I like correct ^^
You: me too
Bot: Could you tell me more about this “too”-thing :D
You: too is at the end of the sentence
Bot: Do you like sentenceing?
You: what is too?
Bot: i think too is at the end of the sentence
You: whats his name?
Bot: i dont know. what is his name?
You: chuck
Bot: okay, i you think so ^^
You: whats his name?
Bot: i think his name is chuck
Das klingt alles ziemlich *chrm* schlau, aber zeigt auch das große Problem, vor dem weltweit jeder KI-Forscher steht: Wie gehts weiter?
Watson ist ein perfektes Beispiel. Das Programm wurde von IBM entwickelt und konnte mit der gesamten Wikipedia im Rücken die “Weltmeister” im Spiel Jeopardy! schlagen, bei dem etwas komplexere Fragen als bei Wer wird Millionär gestellt werden. Es gibt keine vorgeschlagenen Antworten, man kriegt eine Antwort und muss die Frage herausfinden etc.
Ist Watson jetzt intelligent? Nein, das Programm sucht in der Frage nach Stichwörtern und teilt sie in eine Kategorie ein, die angibt, wie die Antwort formuliert werden muss (“Wo ist …” oder “Wer ist …”) und gibt dann eine Antwort ein, die laut Wikipedia und anderen Nachschlagewerken die höchste Stichwortrate hat.
Das ist ohne Zweifel ein herausragendes Stück Software, aber nicht wirklich intelligent.
Um künstliche Intelligenz zu erschaffen, muss man zunächst den Begriff der Intelligenz definieren: Bis vor einigen Jahren glaubte man noch, einen Intelligenz-Quotienten mittels einfacher IQ-Tests zu ermitteln. Diese fragten meist Lösungen auf mathematische, logische und geometrische Problemstellungen ab. Gefragt waren also mathematisches und räumliches Denken. Darin sind uns Computer allerdings gnadenlos überlegen:  Ein menschliches Gehirn ist nicht primär aufs Rechnen ausgelegt, da ein Säbelzahntiger sich von der Herleitung von Pi nicht beeindrucken lässt. Prozessoren machen allerdings den ganzen Tag nichts anderes, als Bits hin und her zu schieben, und haben einen klaren Vorteil. Trotzdem würde niemand behaupten, dass sie deswegen intelligenter sind als Menschen.
Am allerwenigsten Howard Gardner: Er stellte bereits in den 1980 Jahren die Theorie der multiplen Intelligenzen auf: Während in IQ-Tests meistens nur die bildlich-räumliche und die logisch-mathematische Intelligenz abgefragt wird, sieht Gardner auch die sprachlich-linguistische, die musikalisch-rhythmische, die körperlich-kinästhetische und die interpersonale bzw. soziale Intelligenz.
Je nach “Gebiet der Intelligenz”, das man betrachtet, ist die Forschung unterschiedlich weit voran geschritten:
  • sprachlich-linguistische Intelligenz: Es gibt inzwischen relativ brauchbare automatische Übersetzungen. Diese basieren aber einfach nur auf gewaltigen Datenbanken, teilweise auf dem Internet, in denen Wörter oder Satzteile in verschiedenen Sprachen abgelegt sind. Intelligent ist das nicht wirklich. Auch die meistens Chatbots basieren entweder auf den Eingaben der Nutzer oder den Eingaben ihrer Programmierer.
  • musikalisch-rhythmische Intelligenz: An der University of California haben Forscher ein Analyse Programm entwickelt, dass sich bei der Auswahl von Musik für den nutzer nicht nur auf aufgezeichnetes Nutzerverhalten oder per Hand zugeordnete Kategorien wie Rock oder Pop verlässt, sondern den Takt, die Geschwindigkeit und Tonhöhe analysiert. Das Problem: Kreativ werden, also z.B. ein eigenes Musikstück komponieren wird kompliziert.
  • körperlich-kinästhetische Intelligenz: Ich bin ein begeisterter Robo-Cup-Zuschauer. Der letzte fand vom 5. bis 11. Juni 2011 in Istanbul statt und man konnte erneut einige Fortschritte der körperlich-kinästetischen Intelligenz beobachten (mein Highlight 2011: hier @ 4:10). Doch trotz aller Fortschritte erscheint das Ziel des RoboCups, nämlich 2050 gegen den amtierenden Menschen-Fußball-Weltmeister anzutreten (ob Frauen oder Männer wurde übrigens nicht angegeben), noch in weiter Ferne. Trotzdem sehe ich in der körperlich-kinästetischen Intelligenz noch die größten Fortschritte bzw. das größte Potenzial in den nächsten Jahren voran zu kommen.
  • interpersonale bzw. soziale Intelligenz: Hier ist es an der Zeit eine Grundsatzfrage zu stellen: Um welche sozialen Interaktionen geht es hier? Die Kommunikation zwischen Robotern funktioniert, jedenfalls wenn sie über geeignete Sende/Empfangseinheiten verfügen und das gleiche Protokoll sprechen. Signale werden aufgefangen, ausgewertet und daraus Schlüsse gezogen, die bestenfalls in Handlungen enden. Soweit, so logisch. Schwieriger wird es, wenn man die Roboter/Mensch-Kommunikation, bzw. das Roboter/Mensch-Verständnis betrachtet. Das Problem ist hierbei nicht nur der Roboter, sondern auch der Mensch, jedenfalls in Europa. Teilweise trauen die Menschen den Robotern nicht, fühlen sich durch die mathematische Überlegenheit bedrohnt, sehen eine Vertechnisierung der Menschheit. In Japan ist man da weiter, Roboter sind “sozial akzeptiert”, werden vielleicht in den nächsten Jahren körperliche Arbeiten in der Altenpflege übernehmen, so dass für die eigentlichen Pfleger mehr Zeit für wirklich wichtige Dinge wie Gespräche mit den zu Pflegenden bleibt. Doch es gibt eine andere Gruppe, die Roboter akzeptiert, mehr sogar noch als andere Menschen: Autisten, bzw. besonders autistische Kinder. Die Roboter scheinen mit ihrer kühlen Art, ihrer (noch) körperlichen Einfachheit eine beruhigende Wirkung auf die Kinder zu haben, die mit Menschen, die für sie teilweise so verwirrend sind, nicht so gut klarkommen. Unvergessen bleibt auch der erste “Chatbot” ELIZA, ein Programm, entwickelt von Joseph Weizenbaum, dass Aussagen eines Menschen zu einer Frage umstellt und so der Person Stück für Stück mehr Informationen entlockt und Zusammenhänge offenbart, die der Person eventuell garnicht klar waren, ähnlich einem Therapeuten – nur durch zu Fragen umgestellten Aussagen. Was auf den ersten Blick nach sozialer Intelligenz aussieht, ist in Wahrheit nur Show, wenn auch eine effektive.

Was schließe ich nun aus dem Ganzen?

Bisher wird versucht Teile der menschlichen Intelligenz nach zu programmieren. Dies bringt zunächst schnelle Fortschritte, und wenn man bedenkt, dass die menschliche Evolution ewig gebraucht hat, um komplexe Sprachen hervor zu bringen, kommen die Programme zunächst gut voran. Das Problem ist, dass es immernoch Menschen sind, die jede neue Funktion programmieren müssen. Selbstständig wird die erschaffende “Intelligenz” auf diese Weise nie.

Eine andere Möglichkeit wäre es, eine “Evolution im Schnelldurchlauf” zu simulieren. Es braucht dazu eine virtuelle Umgebung, ein “mutierendes Programm“, das, ähnlicher einer DNA, zufällig verändert wird oder mit anderen Programmcodes, die sich auch als effektiv erwiesen haben in allen möglichen Variationen “vermischt” wird. Eine Schwierigkeit ist dabei bereits angeklungen: Wie wertet man die Effektivität eines Programmes aus? Man könnte sie in bereits existierenden virtuellen Welten wie Word of Warcraft oder einem Counter-Strike-Match auf “echte, menschliche Intelligenzen” loslassen und die Reaktionen auswerten. Wie reagieren sie, wenn das Programm Wörter und Sätze, die vor 5 Minuten über TeamSpeak kamen wiederholt? Und was wird bei bestimmten Sätzen von dem Programm erwartet? Der Roboter lernt auf ähnliche Art und Weise wie ein Baby. Voraussetzung bleibt natürlich, dass sein Backend bzw. die Datenbanken flexibel genug sind, alle möglichen Eindrücke, ob auditiv oder visuell, speichern und verknüpfen zu können. Hiermit könnte man die sprachliche und soziale Intelligenz überprüfen.

Bei der körperlich-kinästhetische Intelligenz wird ein ähnliches Verfahren bereits geprobt. Außerdem ist hier die Auswertung einfacher: Weiterentwickelt wird, was möglichst schnell und sicher von A nach B kommt, der Rest wird verworfen. Programmen wie diesen kann man z.B. zwei Stäbe und ein Gelenk vorgeben, das sich rhythmisch zusammenzieht. Das Programm setzt diese Bauteile in allen möglichen Variationen zusammen und simuliert eine realistische Umgebung, die Naturgesetze und setzt die Mutationen darin aus. Was sich nicht bewegt, wird herausgeschmissen, was als erstes am Ziel ist hat gewonnen und darf sich “fortpflanzen”. IT-Evolution.

Ob dies der richtige Weg ist, kann noch niemand sagen. Vielleicht wird die Menschheit das Interesse an einer echten künstlichen Intelligenz verlieren, und stattdessen weiter “dumme” Maschinen bauen, die perfekt an eine bestimmte Aufgabe, z.B. entweder den Boden putzen oder den Tisch abräumen, aber niemals beides, angepasst sind… ich fänds schade ;)

Write a Comment

Comment

  1. Bills Erfahrung musste ich mit meinen Motbot auch machen: man kann ihn lernen und lernen lassen und zum Schluss ist nur eine lustige Beleidigungsmaschine entstanden.

    Gruss
    Mot

  2. Ich denke, die größte Gefahr für die Menschen sind Kriege mit atomaren, chemischen oder, besonders, biologischen Waffen, bzw. Unfälle mit diesen.
    Asimiv hat sich schon vor knapp 70 Jahren mit diesem Thema beschäftigt und die 3 Robotergesetze entwickelt.
    Das Problem sind an dieser Stelle nur wieder “wir”, die Menschen, die als allererstes an Kampfroboter/Drohnen denken, um die Verluste der eigenen Seite zu minimieren bei gleichzeitiger Maximierung der Feuerkraft…
    Ich muss gerade an den Action-Film “Eagle Eye” denken, in dem ein intelligenter Regierungscomputer die US-Regierung stürzen will, da ihr Handeln im Ausland das Leben von amerikanischen Bürgern bedroht.
    Aber wenn man die Robotergesetze implementiert und den Selbsterhaltungstrieb und die “emotionalen” Reaktionen eindämmt, sehe ich da kein großes Gefahrenpotential.

  3. ernsthaft, intelligente computer als wünschenswert?
    die größte gefahr für den menschen sind asterioide und konkurrenz für unser intelligenzmonopol auf der erde.
    besonders dann, wenn die ki der intelligenz des menschen nachempfunden ist *schauder*