Business & Wachstum

80 % Produktionscode. Von KI geschrieben. Mit denselben alten Review-Gewohnheiten geprüft.

7. Juni 2026Amir Behrouzi8 Min. Lesezeit

KI
Industrie
Anthropic
Engineering
Policy

Infografik AI isn't the future. It's already writing the future: 80 %+ Anthropic-Code, 8× Merge/Tag vs. 2024, Vergleich 2024 human-led vs. 2026 AI-assisted (52×), Warnung Self-Improving-Loop, fünfstufiges Playbook

Anthropic—das Unternehmen hinter Claude—hat soeben interne Zahlen veröffentlicht, die die meisten Labore privat halten. Die Schlagzeile lautet rekursive Selbstverbesserung. Die Fußnote für Ihren Schreibtisch: Generation skalierte. Verification nicht.

In einem Juni-2026-Bericht When AI Builds Itself sagt Anthropic, dass seine Codebasis jetzt überwiegend von Claude geschrieben wird. Ingenieure mergen ungefähr achtmal so viel Code pro Tag wie 2024. Das Unternehmen behauptet noch keine Sci-Fi-Autonomie. Es warnt, die Kurve habe sich steiler gebogen als die meisten Institutionen planten—und bittet die Branche um einen glaubwürdigen Pause-Knopf vor der nächsten Kurve.

Die Zahlen, die Anthropic endlich veröffentlichte

Das sind keine Marketing-Folien. Es sind operative Metriken des Teams, das Claude baut:

**Über 80 % des gemergten Produktionscodes** bei Anthropic stammte im Mai 2026 von Claude—gegen niedrige einstellige Werte vor Claude Code im Februar 2025
**8× tägliches Merge-Volumen** pro Ingenieur in Q2 2026 vs. 2024, nach zwei Wendepunkten: Modelle, die Code ausführen (2025), und autonome Modelle über längere Horizonte (2026)
**52× Speedups beim Trainingscode** in einem internen Benchmark im April 2026 (Mythos Preview) vs. ~3× mit Opus 4 im Mai 2025—ein erfahrener Forscher braucht vier bis acht Stunden für 4× bei derselben Aufgabe

Zusammen ist das Bild nicht „Claude tippte schneller“. Es ist Claude, der mehr der Schleife zwischen Intent, Experiment und Merge schließt—Menschen setzen Ziele und reviewen, aber ein kleinerer Anteil der Tastendrücke.

Was rekursive Selbstverbesserung wirklich bedeutet

Rekursive Selbstverbesserung ist das Szenario, in dem ein KI-System seinen Nachfolger mit wenig menschlichem Input entwirft und baut—jede Generation hebt die nächste. Anthropic ist explizit: Diese volle Schleife ist **noch nicht** passiert.

Passiert ist etwas Engeres und dennoch Bedeutsames:

KI schreibt den Großteil der Software beim Unternehmen, das Claude ausliefert
KI führt Experiment-Schleifen in festen Zielen aus—Trainingscode umschreiben, benchmarken, wiederholen—schneller als erfahrene Forscher bei definierten Aufgaben
Menschliche Rollen verschieben sich vom Tippen zu Dirigieren, Reviewen und Auswählen, welche Probleme automatisiert werden

Das ist nicht die Singularität. Es ist eine Produktionslinie, in der das schnellste Werkzeug auf der Bank auch das Produkt ist—und die Steigung der Verbesserung bei internen Aufgaben in zwölf Monaten zunahm.

Warum Anthropic eine koordinierte Pause fordert

Jack Clark und Marina Favaro vom Anthropic Institute argumentieren, die Welt sollte die **Option** haben, Frontier-KI-Entwicklung zu verlangsamen oder vorübergehend zu pausieren, damit Alignment-Forschung und gesellschaftliche Institutionen aufholen.

Ihre Sorge ist kumulatives Risiko: Werden Alignment-Fehler häufiger, aber weniger verstanden, verlieren Teams die Fähigkeit, Ausfälle zu diagnostizieren, bevor sie skalieren. Eine Pause funktioniert nur, wenn sie verifizierbar und global ist—sonst gewinnt der vorsichtigste Akteur nicht, sondern der unvorsichtigste zieht vor, während andere bremsen.

Ob Sie das alarmistisch oder überfällig finden—der Policy-Appell zählt für Käufer: Der Hersteller eines der meistgenutzten Coding-Assistenten sagt öffentlich, die aktuelle Geschwindigkeit überholt Governance-Design.

Was dies nicht ist

Skeptiker haben in einem Punkt recht: Mehr KI-geschriebener Code bei Anthropic beweist vor allem, dass Claude ein starkes Engineering-Tool in einem Labor mit Leitplanken ist—not dass Maschinen über Nacht autonom Nachfolger spawnen.

Verwechseln Sie **Beschleunigung bei begrenzten Aufgaben** nicht mit **unkontrolliertem rekursivem Gewinn**. Der Wert des Berichts ist die Trendlinie und das Eingeständnis des Labors, dass diese Trendlinie steiler wird.

Was Web-Teams mit dieser Nachricht tun sollten

Die meisten Agenturen und Produktteams trainieren keine Frontier-Modelle. Sie erben dennoch Second-Order-Effekte: schnelleres Codegen, längere autonome Sessions, Anbieter mit Features für Speed-Narrative.

Praktische Antworten sind langweilig—und das ist der Punkt:

**Agent-Output wie Vendor-Code behandeln:** Auth, PII, Zahlungen und Env reviewen, auch wenn Generation effortless wirkt
**Generation von Verification trennen**—derselbe Split, als KI den Engpass vom Schreiben zum Reviewen verschob
**Dokumentieren, wer Rollback besitzt**, wenn eine Agent-Session dutzende Dateien merged
**Hype-Kurven ignorieren; eigene Kurven tracken:** Incident-Rate, Review-Zeit, ob Juniors Diffs ohne Chat erklären können

Wenn Ihr Team bereits die Fun-and-Friction-Mischung agent-gestützter Web-Arbeit spürt, ist das die human-scale Version von Anthropics Graph. Der Unterschied: Sie spüren Prod um 2 Uhr nachts; sie auf Zivilisationsmaßstab.

Fazit

Anthropics Warnung vor rekursiver Selbstverbesserung ist kein Trailer für Robot Takeover. Es ist ein Statusbericht von der Frontier: KI ist bereits Hauptautor der Software, die KI baut, und das Unternehmen, das Ihren Coding-Assistenten liefert, glaubt, die nächste Phase kommt schneller als unsere Pause-Mechanismen.

Nutzen Sie die Schlagzeile für Strategie, nicht Panik. Halten Sie menschliche Verification bei allem, was Kunden berührt. Zweite Meinung gewünscht, wo Agent-Speed hilft oder Ihren Review-Loop überholt? Schreiben Sie uns.

Previous← Niemand hat die Architektur Ihrer Software gewählt. Das wird teuer.NextKI-Agenten machen Webentwicklung wieder spaßig. Das könnte das Warnsignal sein. →

← All articles