Der ausbleibende Nutzen von LLMs

https://borretti.me/article/thoughts-llm-agents

Ein paar ganz interessante Gedanken zum Thema LLMs von Fernando Borretti:

But they can’t carry out complex tasks: very soon you run up against the limits of the context window. LLMs are like a tireless 120 IQ polymath with anterograde amnesia who forgets everything after ~10m of activity.

Fernando Borretti „Thoughts on LLM Agents“

Wer hin und wieder mit LLM-basierten Tools (wie etwa ChatGPT) herumspielt, stößt recht schnell und regelmäßig an die vielfältigen Grenzen, die diese Technik (zumindest bislang?) hat. Vor allem die „Halluzinations“-Problematik, also mit scheinbarem Selbstvertrauen ausgegebene Fehlinformationen, sind ein Problem. Aber auch sonst ist der Firnis, mit dem die LLMs so etwas wie (sprachliche) Intelligenz vortäuschen oft nur hauchdünn.

It is well known that LLM-written text has lower entropy than human-written text. So maybe there’s something analogous to a thermodynamic limit, where the complexity of the LLM completion and the complexity provided by the architecture taken together are insufficient to reach criticality and get self-sustaining output.

Entropie ist im Zusammenhang mit Texten (vereinfacht ausgedrückt) ein Maß für deren (Un)vorhersagbarkeit. Modelle wie GPT erlauben es, bis zu einem gewissen Grad, die Entropie des Outputs zu erhöhen (OpenAI nennt das in der API temperature). Doch damit steigt auch die Menge der „Halluzinationen“.

Borretti argumentiert, dass eigentlich Agents, also eine Art spezialisierte Subroutinen, die vom LLM gesteuert werden, die aussichtsreichste Möglichkeit darstellen, die Technik trotz dieser Probleme nutzbringend einzusetzen. Bislang allerdings fehle es an solchen wirklich guten Agents. Ob sie in den kommenden Jahren kommen, bleibt abzuwarten.


Du kannst entweder direkt hier auf der Seite kommentieren oder über eine ActivityPub-fähige Plattform wie Mastodon an der (vermutlich außerordentlich regen) Diskussion teilnehmen. Kopiere dazu die Adresse dieses Beitrags in die Suche deiner Instanz. Ja, das ist momentan noch ein bisschen komplizierter als es sein müsste, aber kommt Zeit, kommt Rat.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert