Claude-Ausfall: Der grosse KI-Blackout, der unser digitales Kartenhaus offenbarte
Lassen Sie mich Ihnen meinen Montagmorgen schildern. Kaffee in der Hand, bereit, einen Stapel Berichte zu bewältigen, startete ich Claude, um Hilfe bei der Analyse dichter Finanzdaten zu bekommen. Und dann... nichts. Nur das digitale Äquivalent eines Besetztzeichens. Tausende von uns starrten auf Fehlermeldungen, aktualisierten die Seite wie wild und verspürten diese besondere Art moderner Panik, wenn der Roboter nicht antwortet. Claude war down, und für ein paar Stunden konnten die Hälfte der Wissensarbeiter in London genauso gut versuchen, ihre Steuererklärung mit Feder und Tinte zu machen.
Inzwischen haben Sie wahrscheinlich schon die Nachlese gehört. Gegen Mittag (MEZ) begannen die Systeme von Anthropic, "gehäufte Fehler" zu melden. Inoffiziellen Berichten aus der Branche zufolge waren weltweit Tausende betroffen. Für eine Plattform, die sich als durchdachte, auf Sicherheit bedachte Alternative im KI-Wettrennen positioniert, war das ein peinlicher Moment. Aber während die Fachpresse damit beschäftigt ist, die Behebung des Ausfalls zu verfolgen, interessiert mich mehr, was er uns über das Kartenhaus verrät, das wir bauen. Das war nicht nur ein kleiner Server-Ausrutscher; es war ein Einblick in eine Zukunft, die weitaus zerbrechlicher ist, als uns die Chatbot-Anbieter glauben machen wollen.
Die 'Bad Actors' in der Maschine
In der Welt der anspruchsvollen Fertigung gibt es ein Konzept, das jeder Werksleiter in- und auswendig kennt: den Bad Actor. Das ist genau die eine Maschine am Fließband – ein unberechenbarer Kartonierer, ein alterndes Förderband – die für übermäßig viel Ausfallzeit verantwortlich ist. Sie können eine Fabrikhalle voller glänzender neuer Ausrüstung haben, aber wenn dieser eine Bad Actor streikt, kommt der gesamte Betrieb zum Stillstand. Achtzig Prozent Ihrer Probleme rühren von zwanzig Prozent Ihrer Anlagen her.
Und jetzt schauen Sie sich unsere digitale Infrastruktur an. Wir haben diese riesigen, prachtvollen Serverfarmen gebaut und diese wundersamen Modelle trainiert. Aber das Claude-down-Ereignis vom Montag schreit geradezu danach, dass wir noch nicht herausgefunden haben, wie wir die Bad Actors in unserer KI-Lieferkette identifizieren, geschweige denn beheben können. War es ein einzelner Fehlerpunkt? Ein kaskadierender Softwarefehler? Ehrlich gesagt ist das "Warum" weniger wichtig als das "Was": Ein Kernstück der globalen kognitiven Infrastruktur hat bewiesen, dass es so einfach ausgeschaltet werden kann wie eine Glühbirne. Wir vertrauen diesen Systemen alles an, von der Codegenerierung bis zur Investitionsanalyse, und dennoch steckt ihre Betriebszuverlässigkeit immer noch in der Garagenband-Startup-Phase.
Die Geschichten, die wir uns erzählen
Das bringt mich zu etwas, das mir seit einiger Zeit im Kopf herumgeht, teilweise inspiriert durch ein erneutes Lesen von Paul Murrays brillantem Roman The Mark and the Void: A Novel. Falls Sie ihn nicht kennen: Es ist eine schonungslose, urkomische Abrechnung mit der Finanzkrise, angesiedelt in einer Investmentbank in Dublin während der Todeszuckungen des Keltischen Tigers. Die Genialität des Buches liegt darin, wie es die Fiktionen seziert, an die wir kollektiv zu glauben beschließen – die Erzählungen, dass der Markt rational sei, dass die Modelle solide seien, dass das System stabil sei. Jeder wusste, dass die Blase da war, aber sie tanzten weiter, bis die Musik aufhörte.
Ist das nicht genau die Situation, in der wir uns mit der KI befinden? Wir schreiben diesen Chatbots fast mythische Eigenschaften zu. Wir erzählen uns, sie seien die ultimativen Adventures of Egg Box Dragon – jenes magische Geschöpf aus Richard Adams' Kinderbuch, das alles finden konnte, was verloren war. Wir werfen Claude, ChatGPT und Konsorten Probleme zu, erwarten, dass sie Antworten aus dem digitalen Äther hervorzaubern, überzeugt von ihrer Allmacht. Aber wenn der Strom ausfällt, wenn die "gehäuften Fehler" in die Höhe schnellen, bleiben wir mit der unbequemen Wahrheit zurück: Es gibt keine Magie. Es ist nur Code, und Code kann kaputtgehen. Der Drache ist aus Pappe und grün angemalt.
Es gibt noch eine weitere literarische Parallele, die treffend erscheint. In Dominic Smiths The Electric Hotel verfolgen wir Aufstieg und Fall eines Stummfilmpioniers, Claude Ballard. Er ist ein Mann, der von der Magie des Kinos verzehrt wird, nur um zu erleben, wie seine Kunstform – und sein Meisterwerk – durch Zeit, Vernachlässigung und ein einziges verheerendes Feuer zerstört werden. Der Roman ist eine eindringliche Meditation über die Zerbrechlichkeit von Kunst und Erinnerung. Und hier sind wir, ein Jahrhundert später, und bauen eine weitere Form des elektrischen Traums, genauso anfällig für einen einzigen Fehlerpunkt. Unsere digitalen Erinnerungen, unsere KI-gestützte Arbeit – puff. Weg, bis es irgendeinem Ingenieur in einem Rechenzentrum irgendwo gelingt, den Projektor neu zu starten.
Die Geister der zukünftigen Weihnacht
Dieser Ausfall zwingt auch zu einer Abrechnung mit dem "Service", den diese Plattformen bieten. Ich musste unwillkürlich an das alte Kinderbuch Claude the Dog: A Christmas Story denken, in dem der titelgebende Hund all seine Weihnachtsgeschenke an einen heruntergekommenen Freund verschenkt. Es ist eine Geschichte über Großzügigkeit und den wahren Geist des Gebens. Aber in unserem Zusammenhang, wenn Claude ausfällt, gibt es nicht; es nimmt. Es nimmt unsere Zeit, unsere Produktivität, unser Vertrauen. Wir haben uns so sehr auf diese digitalen Krücken verlassen, dass wir diejenigen sind, die humpeln, wenn sie uns plötzlich weggezogen werden.
Für die Unternehmen, die diese APIs überstürzt in ihre Kernabläufe integriert haben, war Montag eine kalte Dusche. Wenn Sie Ihren Kundendienst-Bot, Ihre interne Datenanalyse oder Ihr Code-Repository auf einer Plattform aufgebaut haben, die ohne Vorwarnung verschwinden kann, wer ist dann jetzt der Bad Actor? Ist es der fehlerhafte Server oder der CTO, der annahm, "die Cloud" sei einfach inhärent zuverlässig?
Das ist die unbequeme Realität, der sich die Branche stellen muss:
- Belastbarkeit ist keine Selbstverständlichkeit: Wir behandeln KI-Verfügbarkeit wie Elektrizität, aber im Moment ist sie eher wie ein Premium-Kabelkanal. Wenn es regnet, fällt er aus.
- Die Erzählung ist brüchig: Wir müssen aufhören, KI zu mythologisieren, und anfangen, sie wie kritische Infrastruktur zu behandeln. Das bedeutet Redundanzpläne, Offline-Ausweichmöglichkeiten und eine gesunde Portion Skepsis.
- Der wahre Wert ist verborgen: Die Unternehmen, die die nächste Phase dieses Rennens gewinnen werden, sind nicht unbedingt die mit den ausgefallensten Modellen, sondern diejenigen, die Zuverlässigkeit garantieren können. Die Plattform, die läuft, wenn andere ausfallen, wird die sein, der die Unternehmen tatsächlich vertrauen.
Wenn sich diese Woche die Märkte öffnen, werden sich die Gespräche um Anthropics Reaktionszeit und deren Statusseiten-Updates drehen. Aber das kluge Geld – die Leute, die die Lehren von 2008 gezogen haben – wird die härteren Fragen stellen. Sie werden in ihren eigenen operativen Risikobewertungen nach dem The Mark and the Void suchen. Sie werden die Bad Actors in ihrem Tech-Stack identifizieren, bevor diese Darsteller den gesamten Maschinenpark zum stillen, eingefrorenen Stillstand bringen.
Vorerst sind die Lichter wieder an. Claude beantwortet wieder Anfragen, als ob nichts gewesen wäre. Aber wir haben hinter den Vorhang geschaut. Wir haben die Leere gesehen. Und sie sah einem "504 Gateway Time-out"-Fehler an einem grauen Londoner Morgen verdammt ähnlich.