Forschung: vom Cheat- zum Lernprogramm
Chatbots wie ChatGPT oder Bard sind schon in der Lage, Hausarbeiten oder Hausaufgaben zu gewünschten Themen zu schreiben. Prof. Dr. Jochen L. Leidner FRGS erklärt im Interview, wie das Projekt VoLL-K.I. mit maschinellem Training lieber Lern-Methoden gestaltet. Er ist eines der Mitglieder des in Gründung befindlichen Coburg Center for Responsible Artificial Intelligence Research (CRAI) der Hochschule Coburg und forscht und lehrt unter anderem über Sprachverarbeitung und maschinelles Lernen an der Fakultät für Wirtschaftswissenschaften.
Die sogenannte KI ist inzwischen in aller Munde, dabei ist nicht alles, was wir derzeit verwenden, echte Künstliche Intelligenz?
Prof. Dr. Jochen Leidner: Aus meiner Sicht ist der Begriff „KI“ unglücklich. Solange wir keine Ahnung haben, wie menschliche Intelligenz funktioniert, können wir auch schlecht Nachbildungen im Sinne eines wissenschaftlichen Modells erreichen. Es sollen menschliche Funktionsweisen, auf einer abstrakteren Ebene nachgebildet werden. Aus Sicht von Ingenieuren und Informatikern ist das weniger wichtig. Da möchte ich dann nur eine Technik oder Methode entwickeln, die nützlich ist und mir hilft, praktisch anliegende Probleme zu lösen.
Was genau sind ChatGPT oder Bard?
Das sind sogenannte Sprachmodelle. Sie sind dazu gedacht, nicht die Intelligenz oder einen ganzen Menschen, sondern lediglich die Sprache zu modellieren: Die Abfolge von Wörtern (Syntagmatik, wie der Linguist sagt) beziehungsweise deren Austauschbarkeit (Paradigmatik) stehen im Vordergrund.
Im Wesentlichen ermöglicht das dem Computer einen Textanfang zu geben, der dann gemäß statistischem Muster und mit einer Prise Zufallsauswahl fortgeführt wird. Oder sie präsentieren dem Computer einen Satz, in dem Wörter fehlen, die das Sprachmodell mit einer Liste der häufigsten Wörter und zugehörigen Wahrscheinlichkeiten.
Diese Modelle wurden mit Milliarden von Texten trainiert: Von eingescannten Büchern, die gesamte Wikipedia und beträchtliche Teile des Internets. Dabei stellten die Entwickler fest, dass nicht nur Sprache abgebildet wird, sondern auch beträchtliches Wissen, welches nun in den Modellen enthalten ist und abgerufen werden kann. Das wird bereits in der nahen Zukunft die Art und Weise der Internet-Suche verändern. Noch sind sie aber primitiv, kurzsichtig und ohne Gedächtnis, Willen oder Gewissen. Das wollen Forscher jedoch ändern.
Sie sind Mitbegründer des KI-Zentrums der Hochschule Coburg, das voraussichtlich im April 2024 fertig werden soll. Wird dort an solchen Werkzeugen geforscht werden?
Ja, natürlich. Wir sind aktiv daran beteiligt und ich bin in genau diesem Bereich seit 1996 in Forschung, Entwicklung und Beratung aktiv. Im März dieses Jahres haben wir ein Sprachmodell in Dublin auf Europas führender Suchmaschinenkonferenz vorgestellt, welches 60-minütige Meetings inhaltlich zusammenfassen kann. Es kann diese sogar auf Wunsch um 10 Prozent der Originallänge oder gar auf fünf Punkte reduzieren. Auch Fragebeantwortungssysteme habe ich in der Vergangenheit schon oft gebaut.
Es ist gut, ein Forschungszentrum zu haben, das sich dediziert mit dem Thema K.I. befasst. Wir sind der bayerischen Staatsregierung für die großzügige Unterstützung dieses Projekts am alten Güterbahnhof sehr dankbar. Dort wollen wir dann auch Geistwissenschaftler:innen einladen, denn große Ideen entstehen oft im Austausch mit passionierten Gleichgesinnten. Europa muss seine Ressourcen über bayerische und deutsche Grenzen hinaus bündeln, um international gegenüber der Forschungskonkurrenz aus den USA und China aufholen zu können.
Für viele Menschen ist KI ein willkommenes Mittel, um ihre Arbeit zu vereinfachen. An der Wirtschafts-Uni in Prag wurden Bachelorarbeiten unlängst abgeschafft. Übernimmt Künstliche Intelligenz bald unser Lernen?
Ich möchte gerne allen nahelegen, diese Systeme nicht durch Ihre verwendete Sprache zu „vermenschlichen“. Meine Kollegin Emily Bender in Washington hat einmal den Begriff „stochastic parrot“ also statistischer Papagei dafür geprägt, das ist nicht schlecht, denn die Technologie, so eindrucksvoll sie uns zunächst erscheint, hat kein „ich“.
Wie können solche Werkzeuge zum Lernen eingesetzt werden? Damit befasst sich ihr Projekt VoLL-KI.
„VoLL-KI“ ist ein vom BMBF und vom Freistaat gefördertes Projekt im Verbund der Universitäten Erlangen und Bamberg sowie der Hochschule Coburg. Es befasst sich mit dem Thema „Von Lernenden Lernen“, wobei sich das erste „Lernen“ auf die Studierenden bezieht und das zweite „Lernen“ auf die Computer. Wir wollen eine Toolbox liefern, mit der jede Organisation selbst entscheiden kann, wie sie diese einsetzen möchte, um zu lehren. Das soll zu einer positiveren und nachhaltigeren Veränderung führen. Die Coburger Teilprojektleitung untersteht Dieter Landes, Jens Grubert, Florian Mittag und mir.
In meinem Teilprojekt geht es darum, einen Chatbot zu entwickeln, der Studierenden der künstlichen Intelligenz hilft, selbstständiger zu lernen - also KI-Methoden selbst auf das Lernen von KI-Methoden anzuwenden. Natürlich können sie diesen Chatbot dann Fragen zu Vorlesungen oder eigenen Lösungen stellen. Die Frage ist, wie man das nötige Domänenwissen mit Allgemeinwissen sinnvoll integriert. Modelle wie ChatGPT geben falsche Antworten und klingen dabei noch sehr selbstsicher. Das ist natürlich nicht akzeptabel für Studierende, die ein Recht auf qualifiziertes Wissen haben.
Wie werden diese Modelle trainiert?
Dazu werden bald freiwillige Tester benötigt. Indem wir die Software kostenlos bereitstellen, hoffen wir, möglichst viele zu erreichen und das System im operativen Betrieb ständig verfeinern zu können, zum Beispiel durch Datenspenden und Feedbacks. Das bringt die Forschung voran und im Idealfall endet diese Spirale nie.
Wie viel davon wird hier an der Hochschule erforscht oder eingesetzt?
Wir arbeiten an Applikationen für automatische Erkennung von Nachrichten-Bias, Online-Hassreden und vielem mehr. Dazu trainieren wir unsere eigenen Modelle für verschiedene Aufgaben, sowohl von Grund auf als auch in Form von Weiterentwicklung bereits existierender Angebote. Das nennt man „Vortrainieren“ beziehungsweise. „Feintuning“.
Es wird immer nötig sein, die Computer zu kontrollieren und dazu müssen wir die Funktionsweise hinter der Anwendung verstehen, wie bei einem Taschenrechner. Als Professor bin ich daran interessiert, dass meine Studierenden lernen, wie Dinge funktionieren und sie von dieser Technologie nicht abhängig werden.
Mein Doktorand Michael Reiche hat ausprobiert, wie gut Studierende ohne viel technisches Vorwissen, aber mit einem Sprachmodell ausgestattet, selbst maschinelle Lernsoftware entwickeln und einsetzen können. Das Ergebnis war: Ein Team aus Menschen und Maschine kann überraschend viel in kurzer Zeit erreichen, aber leider bei geringem Lerneffekt.
Wie und wo sollen Ihre Ergebnisse eingesetzt werden?
Innerhalb von wenigen Jahren werden diese Modelle überall „drin“ sein. Es ist enorm spannend, das Gebiet von 1993 bis 2023 verfolgen zu dürfen - beim Anfang der Physik war ja niemand dabei, der heute noch lebt. Wir hoffen auf die Kreativität unserer Studierenden und der Betriebe in der Region. Gerne unterstützen wir sie mit unserer Expertise auf dem Weg zur positiven und verantwortungsvollen Nutzung von K.I. Unser Blick bleibt dabei ganzheitlich; das heißt, wir beziehen nachdrücklich auch ethische und soziale Gesichtspunkte in Forschung, Lehre und Transfer mit ein.
Das Interview führte Andreas Wolf aus dem Team IMPETUS, das zum Ziel hat, Impulse zu setzen, um die Hochschule Coburg besonders attraktiv für potenzielle Professorinnen und Professoren zu machen.