Wikipedia vs. KI: Das Duell der Giganten - wissenschaft.de | Bild der Wissenschaft
BDW PlusTechnik & Digitales
Das Duell der Giganten
Innerhalb kurzer Zeit war aus einem Riesen ein Zwerg geworden. Im Januar 2001 startete das Wikipedia-Projekt für ein frei zugängliches Web-Portal mit Informationen zu allen Wissensgebieten. Nur wenige Jahre später, 2005 und 2006, erschien die letzte gedruckte Ausgabe des Brockhaus, der jahrzehntelang ein Synonym für…
Letzter kostenloser Artikel3/3
von STEFAN MEY
Innerhalb kurzer Zeit war aus einem Riesen ein Zwerg geworden. Im Januar 2001 startete das Wikipedia-Projekt für ein frei zugängliches Web-Portal mit Informationen zu allen Wissensgebieten. Nur wenige Jahre später, 2005 und 2006, erschien die letzte gedruckte Ausgabe des Brockhaus, der jahrzehntelang ein Synonym für das gesammelte Weltwissen gewesen war.
Seit der Veröffentlichung des auf Künstlicher Intelligenz (KI) basierenden sogenannten Großen Sprachmodells ChatGPT im November 2022 gibt es nun eine neue, frei übers Internet zugängliche Anlaufstelle für Wissensfragen aller Art. Statt Wikipedia zu konsultieren, fragt man einen Chatbot und erhält die Antwort in der beauftragten Länge und im gewünschten Format. Droht Wikipedia deshalb das gleiche Schicksal wie dem Brockhaus – von einem Wissensproduzenten der nächsten Generation irrelevant gemacht zu werden?
Pluspunkte bei der Benutzerfreundlichkeit
Derzeit lassen Wikipedia-Statistiken noch keinen Rückgang der Zugriffe auf die Online-Enzyklopädie erkennen. Doch glaubt man Martin Huschens, Professor für Wirtschaftsinformatik an der Hochschule Mainz, wird das nicht so bleiben: „Perspektivisch gehe ich davon aus, dass die Nutzung von Wikipedia als Online-Nachschlagewerk zurückgehen wird“, meint Huschens. „Denn die Nutzerfreundlichkeit auf Anfragen basierender Anwendungen ist um einiges höher als die von Wikipedia.“ Damit meint der Forscher KI-Systeme wie ChatGPT. Und: „Da dem Output auch weitestgehend getraut wird, gibt es für Nutzer nur noch wenige Gründe, auf Wikipedia zurückzugreifen“, ist der Mainzer Wissenschaftler überzeugt.
An vielen Universitäten wird zum Verhältnis von Künstlicher Intelligenz und Wikipedia geforscht. Die größte Sprengkraft hat eine technisch eher schlichte Studie aus Mainz. Für ihre Untersuchung haben Huschens und seine Kollegen getestet, wie Nutzer durch eine KI beziehungsweise durch Wikipedia generierte Inhalte im Vergleich bewerten. Dazu haben sie in einem ersten Schritt von vier englischsprachigen Artikeln die einführenden Absätze extrahiert. Im zweiten Schritt ließen sie die Sprachmodell-Version ChatGPT 3.5 in der jeweils gleichen Länge einen Lexikoneintrag erstellen.
Beide Texte haben die Forscher zufällig unterschiedlichen Layouts zugeordnet: entweder dem Layout eines Wikipedia-Artikels, dem eines ChatGPT-Screenshots oder einer Textseite. In einer Online-Umfrage ließen Huschens und sein Team rund 600 Studienteilnehmer unter anderem die Verlässlichkeit, Korrektheit und Vollständigkeit der vorgesetzten Texte bewerten.
Vergleichbar hohe Glaubwürdigkeit
So konnten die Wissenschaftler testen, wie die tatsächlich von Wikipedia oder ChatGPT stammende Version eines Textes bei den Nutzern ankommt und wie sich das vorgebliche Wissen über die Quelle auswirkt. Das überraschende Ergebnis: „Interessant und beunruhigend zugleich ist die Tatsache, dass die Probanden keinen Unterschied zwischen menschen- und maschinengenerierten Texten machen“, berichtet Martin Huschens. Den von Menschen und den von einer Maschine erstellten Text bewerteten die Studienteilnehmer als gleichermaßen korrekt und glaubwürdig.
Mehr aus Technik & Digitales
Weitere aktuelle Artikel aus der Rubrik Technik & Digitales.
Auch das vorgebliche Wissen, dass ein Text durch eine Künstliche Intelligenz generiert worden ist, sorgte nicht für ein negatives Urteil: „In unserer Studie reagierten die Probanden auch nicht kritisch, wenn wir die Fakten im Screendesign von ChatGPT präsentierten, obwohl man mit Kenntnis der Funktionsweise solcher Modelle durchaus kritisch sein sollte“, sagt der Wirtschaftsinformatiker.
Schwindet aufgrund der Konkurrenz durch die Künstliche Intelligenz das Publikum der Online-Enzyklopädie, könnte das zu einem schleichenden Niedergang und mittelfristig zu zwei Entwicklungen führen: Weniger Menschen spenden für die Infrastruktur hinter Wikipedia. Und eine geringere Zahl von begeisterten Lesern wird zu regelmäßigen Autoren, die neue Artikel für das Online-Lexikon schreiben sowie bestehende Artikel ergänzen, aktualisieren oder Fehler darin korrigieren.
Innerhalb des Wikipedia-Projekts nimmt man die Künstliche Intelligenz ernst. Das Online-Lexikon ist ein komplexes, multinationales Gebilde. Hauptamtliche Strukturen – die in den USA ansässige globale Mutterorganisation Wikimedia Foundation sowie Ländervereine wie Wikimedia Deutschland – stellen die technische Infrastruktur bereit, machen Strategieplanungen und unterstützen die Arbeit und Vernetzung der verschiedenen Sprach-Communitys. Für die veröffentlichten Inhalte zuständig sind mehr als 300 einzelne Communitys, die für jede Wikipedia-Version in einer bestimmten Sprache eigenständig agieren.
Verseuchtes Online-Lexikon?
Bislang gibt es keine klaren Regeln zum Umgang mit Künstlicher Intelligenz. In den Communitys und hauptamtlichen Strukturen wird noch um die richtige Position dazu gerungen. Vor allem kursiert in dem Projekt die Sorge, dass Wikipedia durch „Halluzinationen“ verunreinigt wird – Aussagen, die ein KI-basierter Chatbot auf Nutzerfragen liefert, die aber nicht auf Fakten gründen, sondern frei erfunden sind. Der im Wikipedia-Projekt unter einem Pseudonym auftretende Autor Wortulo – im bürgerlichen Leben ein pensionierter Psychologieprofessor in der Schweiz – macht sich zusammen mit anderen Unterstützern des Online-Lexikons Gedanken über den Umgang mit Künstlicher Intelligenz.
Eine generative KI – der Kern von Großen Sprachmodellen wie ChatGPT – erfindet mitunter Wissen, Quellen und Personen. „Fake Facts“ nennt der Mainzer Wirtschaftsinformatiker Martin Huschens dieses Phänomen in Analogie zu den bekannten Fake News, die etwa in sozialen Medien oder über Nachrichtenportale verbreitet werden. Diese Eigenschaft könnte bei einer unreflektierten Nutzung von KI-Systemen zum Problem werden, meint Wortulo: „Wenn Halluzinationen ungeprüft übernommen werden, landen erfundene Fakten auch in der Wikipedia.“ Der Autor fordert daher: „Wir müssen aufgrund der Fehleranfälligkeit aktueller KI-Technologie alles dafür tun, dass nur menschlich kuratiertes und überprüftes Wissen in der Wikipedia steht und das auch so bleibt.“
Für Diskussionen innerhalb des globalen Mitmachprojekts hat eine viel beachtete Studie der Princeton University gesorgt. Ein Forscherteam der angesehenen US-amerikanischen Universität hatte der KI-Detektor-Software GPTZero fast 3.000 englischsprachige Wikipedia-Artikel vorgesetzt, die im August 2024 verfasst worden waren. Bei 5,36 Prozent der Artikel meldete GPTZero: „vollständig KI“ – abzüglich einer von den Forschern geschätzten Quote von einem Prozent an fälschlicherweise als positiv eingestuften Beiträgen.
Putztruppe und Arbeitsgruppe
In der englischsprachigen Wikipedia-Community hat sich eine Gruppe mit dem kämpferisch klingenden Titel „WikiProject AI Cleanup“ gebildet. Die etwa 120 Mitglieder dieser selbst ernannten Putztruppe tragen Wissen zu Künstlicher Intelligenz (englische Abkürzung: AI) zusammen und fahnden nach Artikeln mit Fehlinformationen, die durch Künstliche Intelligenz verschuldet sind.
Wortulo ist im deutschen Pendant aktiv, der etwas bescheidener auftretenden Arbeitsgruppe „Wikiprojekt Wikipedia & KI“. Er gehört nicht zu den Autoren, die Künstliche Intelligenz verdammen. Er selbst nutzt zum Bearbeiten und Erstellen von Wikipedia-Artikeln KI-Tools wie die Suchmaschine Perplexity, um zusätzliche Aspekte oder interessante Quellen aufzuspüren. Doch natürlich müsse am Ende stets ein Mensch schauen, ob alles stimmt, weil die Halluzinationen meist sehr gut formuliert seien, mahnt Wortulo.
Innerhalb des Wikipedia-Projekts sorgt man sich um die Auswirkungen von Künstlicher Intelligenz, aber es gibt auch eine Aufbruchsstimmung. In Diskussionen innerhalb der Community sowie in Interviews von Vertretern der hauptamtlichen Strukturen werden verschiedene Möglichkeiten genannt, wie Künstliche Intelligenz der Wikipedia dienen könnte.
Zum Grundprinzip von Wikipedia gehört, dass Fakten mit Einzelnachweisen belegt sein müssen. Meist handelt es sich bei den Quellen um journalistische Artikel oder wissenschaftliche Studien. KI-Werkzeuge könnten, wenn das nicht der Fall ist, verlässliche Quellen identifizieren und sie den Autoren der Beiträge vorschlagen.
Ein Bot gegen Online-Vandalismus
Die Wikipedia-Mutterorganisation Wikimedia Foundation hat einen Bot namens „Automoderator“ entwickelt, der auf Basis von Künstlicher Intelligenz selbstständig Vandalismus erkennt – zurzeit allerdings noch mit durchwachsenem Erfolg. Außerdem könnten KI-Übersetzungen kleinen Sprach-Communitys mit nur wenigen aktiven Nutzern helfen, zu mehr Inhalten zu gelangen. Und: Ein Einstiegsassistent könnte Neulingen unter den Wikipedia-Autoren helfen, sich in dem Wirrwarr der Regeln, Rollen und Umgangsformen des Projekts zurechtzufinden.
Vor allem aber könnte Künstliche Intelligenz einen großen Nachteil von Wikipedia ausgleichen: die mitunter mangelhafte Benutzerfreundlichkeit. An einem sogenannten digitalen Stammtisch – einem Vernetzungsformat der deutschsprachigen Community – hat die Sprach- und Bildungsforscherin Sabine Manning, die auch Herausgeberin des Infoportals „Einfache Sprache“ ist, Ende November 2024 eine Präsentation zu den Potenzialen von KI für die Wikipedia veröffentlicht. Sie hält die fehlende Verständlichkeit des Online-Lexikons für ein ernsthaftes Problem. Einige Artikel enthielten lange und komplizierte Sätze sowie viele Fachbegriffe, die nicht sofort erklärt werden. Um das zu vermeiden, könnten Autoren Entwürfe mithilfe von KI-Tools optimieren, die auf einen schlechten Stil hinweisen und auf Wunsch Texte in einfachere Sprache verwandeln.
Darüber hinaus könnte die Technologie beim Lesen assistieren: KI-Bots „übersetzen“ komplizierte und lange Wikipedia-Artikel in leichter verständliche Sprache, kürzen die Beiträge auf eine vorgegebene Länge, extrahieren gezielt bestimmte Informationen oder fassen das über mehrere Lexikon-Artikel hinweg verstreute Wissen zu einem Thema zusammen.
Bei einem geschickten Einsatz von Künstlicher Intelligenz wären somit zwei Entwicklungen denkbar: Die Relevanz von Wikipedia sinkt, was mittelfristig vielleicht zu weniger Autoren führt. Doch die wären dank einer KI-Unterstützung in der Lage, schneller und verständlicher zu schreiben und Texte effektiver zu bearbeiten.
Partnerschaft statt Konkurrenz
Dass generative Künstliche Intelligenz dem nichtkommerziellen Wikipedia-Projekt nicht schadet, müsste im Interesse der KI-Anbieter selbst liegen. Denn die Großen Sprachmodelle sind auf verlässlich kuratiertes Wissen angewiesen, um sich zu trainieren.
An den Inhalten von publizistischen und wissenschaftlichen Texten sowie Büchern haben sich die Anbieter in den frühen Wildwestzeiten des KI-Trainings freigiebig und unentgeltlich bedient. Aber das wird künftig nicht mehr möglich sein. Wikipedia-Inhalte hingegen stehen unter einer freien Lizenz, die auch kommerzielle Nutzungen erlaubt. Das bedeutet: Wenn das Wikipedia-Projekt aufgrund einer Abwärtsspirale weniger und schlechtere neue Inhalte produzieren sollte, werden der Künstlichen Intelligenz in Zukunft weniger und schlechtere, kostenlos nutzbare Trainingsdaten zur Verfügung stehen. KI ist daher auf eine weiterhin sorgfältig aufbereitete Wikipedia angewiesen. Künstliche Intelligenz und Wikipedia sind somit nicht nur Gegner, sondern auch Schicksalsgenossen und Partner.
Autor Wortulo stellt für diese Verbindung der beiden konkurrierenden Wissenssysteme eine mögliche Minimalforderung in den Raum: dass KI die Verwendung von Wikipedia transparent machen soll. „Wir müssen damit leben, dass unsere Artikel in anderen Systemen auftauchen“, sagt er. „Unsere Politik sollte sein zu fordern, dass KI-Anbieter die Beiträge von Wikipedia dauerhaft sichtbar machen.“
Bei Wikipedia sei er aktiv, weil die gemeinschaftliche Arbeit an den Inhalten Sinn stifte und Spaß mache, sagt der pensionierte Professor, für den die Wikipedia zum intellektuellen Schlacht- und Arbeitsfeld geworden ist. In der Projektgruppe zum Umgang mit Künstlicher Intelligenz engagiere er sich, um die Online-Enzyklopädie für die Herausforderungen der intelligenten Techniken zu wappnen. Wortulo betont: „Ich will dafür Sorge tragen, dass das Wikipedia-Projekt, das ich so sehr liebe, auch in Zukunft noch existiert.“
Eines scheint gewiss: Zumindest in eine Falle wird Wikipedia nicht tappen – dass das Projekt die digitale Entwicklung verschläft. Das nichtkommerzielle Wissensprojekt nimmt die wachsende Bedeutung der Künstlichen Intelligenz ernst.
Menschen orientieren sich bei Entscheidungen an den Erfahrungen anderer. Dieses als „Social Proof“ bekannte psychologische Phänomen…
Technik & Digitales
Künstliche Intelligenz: Umwelt-Fußabdruck größer als gedacht?
3. Juni 2026
Der KI-Boom bringt immer leistungsstärkere KI-Modelle hervor, immer mehr Menschen nutzen die Technologie. Einem neuen Bericht zufolge…
BDW PlusTechnik & Digitales
Wie Roboter für das Leben lernen
2. Juni 2026
Damit Roboter sinnvoll handeln können, reicht es nicht, Texte und Bilder aus dem Internet zu nutzen. KI-Roboter brauchen außerdem perfekte…