Contact
QR code for the current URL

Story Box-ID: 1147445

Orgabrain GmbH Trierer Straße 256 56072 Koblenz, Germany http://www.orgabrain.com
Contact Mr Prof. Götz Piwinger +49 261 28757065
Company logo of Orgabrain GmbH
Orgabrain GmbH

Was ChatGPT ad Absurdum führen könnte

Ein System frisst seine eigene Daten

(PresseBox) (Koblenz, )
von Götz Piwinger

ChatGPT steht für „Chat Generative Pre-trained Transformer“ und wurde im November 2022 veröffentlicht. Es nutzt Sprachmodelle – derzeit das Chat-3.5 –, die mit riesigen Mengen von Daten trainiert wurden, sogenannte Large Language Models (LLM). 175 Milliarden Parameter und 800 Gigabyte an Speicherkapazität wurden dafür verwendet. GPT basiert auf Daten bis 2021. Es kann derzeit keine Fragen beantworten, die sich auf Daten danach beziehen.

ChatGPT nutzt mehrere neuronale Netze. Diese Dienste haben unterschiedliche Aufgaben - unter anderem auch, rassistische oder nicht angemessene Passagen auszulassen. Sie verfügen über PPO-Modelle (Proximal Policy Optimization) zur “Überwachung” und Reward Modellen zur “Belohnung” guter Ergebnisse, die wiederum in das PPO-Modell gefüttert werden.  Es ist, als würde die Ausgabe der Daten von sehr vielen künstlichen Gehirnen geprüft und danach erst freigegeben. Das geht erstaunlich schnell und braucht entsprechend sehr hohe Rechenzentrumskapazitäten. Aus diesem Grund kann GPT nicht kostenfrei bleiben. Ähnliche (aktuellere) Systeme, wie “Bloom” bleiben zwar in der Nutzung ohne Berechnung, stellen aber dafür die Datacenter-Nutzung mit circa 40 €/h in Rechnung. Soweit zur grundsätzlichen Technologie.

Vereinfacht gesagt, sucht GPT Antworten aus dem Big Data Pool bis 12/2021 und stellt diese sehr schön in menschlich anmutenden Sätzen zusammen. Damit kommen wir zur Frage, was mit diesen Ergebnissen passiert! Angenommen, die GPT-Sätze finden Einzug in journalistische Artikel, in Blogs, Bücher etc. Dann finden die Ausgabedaten aus 2021 ihren Weg in den Datenbestand von 2022 und 2023. Es hat einen guten Grund, warum der Daten bezug immer in einem bemerkenswerten Abstand zur Gegenwart gehalten wird. Denn wenn die AI-Systeme auch auf Echtzeitdaten zugreifen könnten, würde die KI ihre eigenen Ausscheidungen verspeisen, was zu einer unheilvollen Mega-Rekursion - einer Art Implosion- führen würde. Umso kleiner der Abstand zwischen Datenpool und Ausgabezeitpunkt wird, desto mehr verfälschen die AI-Systeme ihre Ergebnisse selbst, weil die eigenen Ausgaben quasi wieder als Eingabe im System landen.

Es ist anzunehmen, dass mit äußerstem Hochdruck an neuronalen Netzen gearbeitet wird, die diesen Effekt verhindern sollen. Doch hier funkt der Mensch dazwischen. Denn die wenigsten Menschen geben sich die Blöße, ein KI-Ergebnis 1:1 zu übernehmen, sondern verändern Inhalte und Formulierungen mit ihrem persönlichen Stil. Diese Ergebnisse können von der KI nicht als Ausgabe einer KI erkannt werden und landen somit im Big Data Pool, dem Futtertrog der AI-Systeme! Es ist aus meiner Perspektive derzeit nicht abschätzbar, welche Zeiträume vergehen werden, bis sich die ausgegebenen Informationen dadurch immer ähnlicher und damit zunehmend einheitlich werden, aber eines ist dabei heute schon klar: Die Arbeit der Rechenzentren und damit der Energieverbrauch wird schlagartig exponentiell explodieren. Die beigefügte Grafik stammt aus einer KI, dieser Text (noch) nicht.

Orgabrain GmbH

ORGABRAIN unterstützt Unternehmen beim digitalen Kulturwandel mit modernen Verfahren und wegweisenden IT-Lösungen für:

+ CORPORATE LEARNING
+ KNOWLEDGE MANAGEMENT
+ KOMPETENZ MANAGEMENT
+ WERTE MANAGEMENT
+ TALENT MANAGEMENT

www.orgabrain.com
www.kowex.de

ORGABRAIN GmbH
New Work Solutions
Trierer Str. 256
D-56072 Koblenz

The publisher indicated in each case (see company info by clicking on image/title or company info in the right-hand column) is solely responsible for the stories above, the event or job offer shown and for the image and audio material displayed. As a rule, the publisher is also the author of the texts and the attached image, audio and information material. The use of information published here is generally free of charge for personal information and editorial processing. Please clarify any copyright issues with the stated publisher before further use. In case of publication, please send a specimen copy to service@pressebox.de.
Important note:

Systematic data storage as well as the use of even parts of this database are only permitted with the written consent of unn | UNITED NEWS NETWORK GmbH.

unn | UNITED NEWS NETWORK GmbH 2002–2024, All rights reserved

The publisher indicated in each case (see company info by clicking on image/title or company info in the right-hand column) is solely responsible for the stories above, the event or job offer shown and for the image and audio material displayed. As a rule, the publisher is also the author of the texts and the attached image, audio and information material. The use of information published here is generally free of charge for personal information and editorial processing. Please clarify any copyright issues with the stated publisher before further use. In case of publication, please send a specimen copy to service@pressebox.de.