Warum wir ein eigenes KI-Cluster in Aachen bauen

Datensouveränität war nie das Problem

Wenn wir mit Mittelständlern über KI sprechen, kommt der gleiche Satz fast immer in den ersten zehn Minuten: "Unsere Daten dürfen die Firma nicht verlassen." Manchmal aus Compliance, oft aus Bauchgefühl, immer aus guten Gründen.

Bisher war die ehrliche Antwort: "Dann wird das schwierig. KI-Modelle laufen in US-Hyperscaler-Clouds. Lokale Hardware ist zu teuer für das, was Sie damit täglich tun."

Das stimmt seit ein paar Monaten nicht mehr.

Was sich geändert hat

Open-Source-Modelle wie Llama 3.1 und Qwen3 sind inzwischen auf Aufgabenniveau mit GPT-4 unterwegs, jedenfalls für die Sachen, die Mittelständler tatsächlich brauchen: Dokumente verstehen, E-Mails klassifizieren, Wissen durchsuchen, Maschinendaten interpretieren. Eine NVIDIA Blackwell-GPU kostet nicht mehr das Jahresgehalt eines Werkstudenten und sie verarbeitet pro Sekunde mehr, als ein Sachbearbeiter pro Stunde tun könnte.

Die Mathematik kippt gerade. Ein eigener GPU-Server amortisiert sich im Mittelstand schneller, als die meisten denken, sobald die ersten zwei oder drei Use Cases laufen.

Warum wir es gebündelt machen

Trotzdem ist das Letzte, was ein Mittelständler braucht, ein eigener Server-Schrank, den jemand pflegen muss. Stromverbrauch, Klimatisierung, Hardware-Tausch, Sicherheits-Updates, Modell-Aktualisierungen. Das ist eigene IT-Abteilung-Niveau, und genau das wollen die meisten nicht.

Deswegen bauen wir in der Euregio Aachen ein gemeinsames Cluster. Die GPU-Kapazität, die ein einzelner Betrieb bei tagsüberhandelt 12 Stunden Nutzung nicht annähernd auslastet, teilen sich mehrere Betriebe. Jeder bekommt vertraglich garantierte Kapazität, dedizierte Daten-Isolation und einen festen Ansprechpartner. Aber die Hardware-Last verteilt sich, und damit die Kosten.

Das Cluster steht im NetAachen-Rechenzentrum. Deutscher Boden, deutscher Rechtsraum, kein US-Data-Privacy-Framework.

Was nachts passiert

Bei klassischen KI-APIs zahlt man pro Token. Jede Iteration kostet, also wird gespart. Auf einer eigenen Infrastruktur ist das anders: die Hardware läuft sowieso. Tagsüber arbeiten Ihre Leute mit der KI, nachts entwickelt sie sich weiter, ohne zusätzliche Kosten.

Wir nutzen die Zeit für die Dinge, die in der klassischen Beratung in einem Sechs-Monats-Pilotprojekt steckenbleiben: neue Use Cases werden entwickelt, bestehende werden gegen reale Daten verfeinert, Sicherheitsprüfungen laufen automatisch durch. Am Morgen liegen Ergebnisse auf dem Tisch, mit denen man weiterarbeiten kann.

Die Frage ist dadurch nicht mehr, ob ein Feature funktioniert. Die Frage wird, wie viele Iterationen man ihm geben will.

Wer dabei sein sollte

Wir starten Q3 2026 mit einer begrenzten Zahl von Plätzen, weil wir wissen wollen, mit wem wir das aufbauen. Mittelständische Fertigung, Produktion, Engineering-Dienstleister, Industrie-Service. Firmen, die wissen, was sie produzieren, und ahnen, wo KI in ihrem Betrieb den größten Hebel hätte.

Was wir mitbringen: GPU-Kapazität, eine Plattform die mit Ihnen wächst, einen Ingenieur der den ersten Use Case mit Ihnen produktiv bekommt, und nächtliche Weiterentwicklung als festen Bestandteil. Was Sie mitbringen: Ihre Prozesse, Ihre Daten, Ihre Probleme.

Wenn das nach einem Format klingt, mit dem Sie etwas anfangen können, sprechen Sie uns an. Wir machen ein Readiness-Gespräch, schauen uns Ihre Lage an und prüfen, ob es passt. Beide Richtungen.