Darkwood Blog Blog
  • Artikel
de
  • en
  • fr
Anmeldung
  • Blog
  • Artikel

🚀 Ich habe ein LLM nachgebaut… mit Pixeln.

der 26. April 2026

Große Sprachmodelle (LLMs) basieren auf abstrakten Konzepten: Wahrscheinlichkeitsverteilung, autoregressive Generierung, großskalige Optimierung.

Diese Mechanismen sind schwer direkt zu beobachten.

Ein alternativer Ansatz besteht darin, diese Konzepte in ein visuelles und deterministisches System zu projizieren, wodurch wir ihre Dynamik untersuchen können.

Diese Arbeit ist von einer ersten Demonstration inspiriert, die auf Twitter geteilt wurde: Allen erklärt-Thread

Ziel ist es, einen pädagogischen Prototyp zu entwickeln, der Folgendes leistet:

  • stellt eine sequentielle Generation dar
  • einen Optimierungsprozess beobachten
  • Vergleich verschiedener Trainingsprogramme

Systemarchitektur

Der Prototyp ist in PHP (Symfony 8) implementiert und basiert auf vier Hauptkomponenten:

  1. Zellulärer Automat (Spiel des Lebens)
  2. Lambda-Sprache (AST JSON)
  3. Genetischer Algorithmus
  4. Streaming-Pipeline (NDJSON + SSE)

Vollständiger Quellcode: llm-game-of-life

Darstellung: von Text zu Raster

Ein LLM modelliert eine Verteilung:

[ P(x_1, x_2, ..., x_n) ]

aufgeschlüsselt in:

[ \prod_{t=1}^{n} P(x_t \mid x_{ ]

In diesem Prototyp wird diese Struktur transponiert:

| LLM | Prototyp | | -------------- | ---------- | | Token | Zelle | | Sequenz | Raster | | Generation | Rahmen | | Modell | Programm | | Inferenzschleife | Simulation |

Jeder Frame entspricht einem Generationsschritt.

Der SSE-Ablauf erzeugt eine Sequenz:

frame₀ → frame₁ → frame₂ → …

gleichbedeutend mit einer selbstregressiven Generation.

Modell: Programm statt Netzwerk

Im Gegensatz zu herkömmlichen LLMs werden keine neuronalen Netze verwendet.

Das Modell ist als Programm in einer Mini-Lambda-Sprache definiert und wird als AST-JSON-Datei dargestellt:

{
  "type": "sequence",
  "nodes": [
    { "type": "birth", "x": 1, "y": 1 },
    { "type": "next" }
  ]
}

Dieses Programm fungiert als Übergangsfunktion im Raster.

Dieser Ansatz ersetzt:

  • die Gewichte eines Modells → nach Anweisungen
  • die Schichten → durch explizite Transformationen

Optimierung: Genetischer Algorithmus

Die Schulung basiert auf einer Vielzahl von Programmen.

Jede Generation folgt:

  1. Fitness-Test
  2. Auswahl
  3. Crossover
  4. Mutation
  5. Elitismus

Dieses Verfahren ersetzt den Gradientenabstieg.

Unbeaufsichtigtes Training

Der unüberwachte Modus maximiert eine Fitnessfunktion basierend auf:

  • Entropie (Diversität)
  • Bewegung (Variation zwischen den Einzelbildern)
  • Lebensdauer

Zielsetzung:

[ \text{Fitness} = f(\text{Entropie}, \text{Bewegung}, \text{Lebensdauer}) ]

Dieses Programm ist vergleichbar mit Vortraining:

  • Fehlen des Ziels
  • Erkundung des Lösungsraums

Beaufsichtigtes Training

Der überwachte Modus führt ein Ziel ein:

  • Gleiter
  • Blinker
  • Block

Fitness wird immer mehr zu:

[ \text{Fitness} = -d(\text{Frame}, \text{Ziel}) + \lambda \cdot \text{Strafe} ]

Oder :

  • (d) ist der Abstand zwischen Gittern
  • Die Strafe begrenzt die Größe der Programme

Dieser Modus entspricht der Feinabstimmung.

Einstellungen und Auswahl

Es kann ein Vergleichsmechanismus eingeführt werden:

  • Zwei Programme erzeugen zwei Sequenzen
  • eine Präferenz wird angewendet
  • Die Auswahl bevorzugt die Besten

Dieses Diagramm stellt eine Vereinfachung von RLHF / DPO dar:

[ max \log P(\text{bevorzugt}) - \log P(\text{abgelehnt}) ]

Generation und Streaming

Die Ergebnisse werden im NDJSON-Format erzeugt und über SSE verbreitet:

  • Jeder Abschnitt = ein Frame
  • Jeder Strom entspricht einer Generation

Canvas-basierte Visualisierungsschnittstelle:

  • Matrix-Rendering
  • Echtzeitanzeige
  • Metriken (Fitness, Generation, Seed)

Präsentationsfolien: Slidewire-Präsentation

Benchmark und Reproduzierbarkeit

Das System beinhaltet eine Benchmark-Pipeline:

  • deterministischer Samen
  • doppelte Hinrichtung
  • Sequenz-Hash

Kennzahlen:

  • Dauer (duration_ms)
  • Speicher (peak_memory_mb)
  • Endgültige Fitness
  • Reproduzierbarkeit

Grenzen

Dieser Prototyp ist nicht dazu gedacht, ein echtes LLM nachzubilden:

  • ohne Transformator
  • keine Tokenisierung
  • kein probabilistisches Modell
  • kein Farbverlauf

Dies ist eine rechnerische Analogie, die nützlich ist für:

  • eine Optimierungsdynamik beobachten
  • eine sequentielle Generation visualisieren
  • verschiedene Lernmethoden vergleichen

Abschluss

Moderne LLMs basieren auf Mechanismen, die sich nur schwer direkt erfassen lassen.

Die Übertragung dieses Konzepts in ein visuelles System ermöglicht uns Folgendes:

  • Generation beobachtbar machen
  • um die Optimierung zu realisieren
  • die grundlegenden Konzepte isolieren

Dieser Ansatz ersetzt keine bestehenden Modelle, sondern bietet ein Instrument zur konzeptionellen Erkundung.

  • Quelle des Twitter-Beitrags: https://x.com/allen_explains/status/2044757995549319172?s=12
  • Der Quellcode des Projekts: https://github.com/matyo91/llm-game-of-life
  • Die Präsentationsfolien: https://github.com/matyo91/slidewire

Ressourcen

Welche Prinzipien können wir anwenden, um LLM-basierte Software zu entwickeln, die tatsächlich gut genug ist, um sie produktiv einzusetzen? https://github.com/humanlayer/12-factor-agents

  • AIE Miami Keynote & Talks mit OpenCode, Google DeepMind, OpenAI und mehr! : https://www.youtube.com/watch?v=6IxSbMhT7v4
  • AIE Miami Tag 2 mit Cerebras, OpenCode, Cursor, Arize AI und mehr! : https://www.youtube.com/watch?v=DeM_u2Ik0sk
  • Wie KI die Softwareentwicklung verändert: Ein Gespräch mit Gergely Orosz, @pragmaticengineer: https://www.youtube.com/watch?v=CS5Cmz5FssI
  • Microsoft auf der ICLR 2026: Deep Learning, LLM Reasoning, Generative Modelle: https://www.linkedin.com/pulse/microsoft-iclr-2026-deep-learning-llm-reasoning-generative-h74se/
  • ASUS DGX Spark: KI auf dem Schreibtisch – Nie wieder Token‑Kosten! | Live-Modellvergleich: https://www.youtube.com/watch?v=dP4zE-DTWAg
  • 🟣 [VIRTUELLES GIPFELTAG 1/5] Wie Sie mithilfe von KI 99 % der Menschen übertreffen: https://www.youtube.com/watch?v=yzhg9Ks859I Bereit, Ihre eigene Agentur zu gründen? : https://hermes-agent.org/fr/
  • PaperClip + Agent Hermès, das ist der Wahnsinn! : https://www.youtube.com/watch?v=PUaZ5o8u0wY
  • 30-minütiger Workshop mit dem Schöpfer von Claude Code, in dem Sie mehr über Vibe-Coding lernen: https://x.com/heyamit_/status/2046489651775713498?s=46 Was junge Menschen von der Personalabteilung erwarten: Warum der Generationenansatz ein irreführendes Konzept ist: https://www.insign.fr/en/insights/young-workforce-expectations-generational-approach-an-intellectual-scam

Site

  • Sitemap
  • Kontakt
  • Impressum

Network

  • Hello
  • Blog
  • Apps
  • Photos

Social

Darkwood 2026, alle Rechte vorbehalten