Was wir gelernt haben, was wir gemessen haben und wohin wir gehen — ein transparenter Einblick in den Aufbau einer agentischen KI-Plattform für eine der anspruchsvollsten Branchen.
1. Warum wir hier angefangen haben
Das Ingenieurwesen und Bauwesen befindet sich an einem unbequemen Schnittpunkt: hochreguliert, dokumentenintensiv und rechtlich haftbar für jede Zahl, die in eine technische Einreichung einfließt. Eurocodes umfassen tausende Seiten. Technische Zulassungen verweisen auf Tabellen, Grafiken und Anhänge auf eine Weise, die einfache Suchen scheitern lässt. Leistungsverzeichnisse erfordern toleranzbasierte Abgleiche mit Produktkatalogen. Architektenpläne erfordern geometrisches Denken, um Mengen korrekt zu extrahieren.
Als wir uns den verfügbaren KI-Werkzeugen für diese Branche ansahen, fanden wir überall dieselbe Antwort: allgemeines Retrieval auf Basis eines Cloud-Sprachmodells. Schnell zu demonstrieren. Unzuverlässig in der Produktion. Und architektonisch unvereinbar mit der einen Anforderung, die jedes Ingenieurbüro teilt.
"Die Daten dürfen das Netzwerk nicht verlassen. Das ist keine Präferenz — es ist eine berufliche und rechtliche Anforderung. Diese Lücke ist es, die Norma von Lumen-IT schließen soll."
2. Was Sovereign AI in der Praxis bedeutet
Sovereign AI ist ein architektonisches Bekenntnis, kein Feature. Jede Designentscheidung folgt aus vier unveränderlichen Grundsätzen:
Keine Anfrage, kein Dokumentfragment, kein Zwischenergebnis verlässt die Infrastruktur des Kunden. Auf Netzwerkebene durchgesetzt, nicht nur durch Richtlinien.
Jede Komponente kann vom eigenen Team des Kunden geprüft, ersetzt oder erweitert werden. Wenn Lumen-IT morgen aufhören würde zu existieren, läuft das System weiter.
Vortrainierte Modelle werden in jede Kundeninstanz deployed. Kundendokumente beeinflussen das Retrieval — sie beeinflussen niemals die Modellgewichte.
Keine proprietäre API mit nutzungsbasierter Preisgestaltung. Keine Migrationskosten. Keine Abhängigkeit von den Roadmap-Entscheidungen eines Dritten.
Für ein Büro, das vertrauliche Ausschreibungsunterlagen, proprietäre Produktspezifikationen oder Tragwerksbeurteilungen von Kunden verwaltet, sind das keine Einschränkungen — das ist die einzig akzeptable Architektur.
3. Warum einfache Q&A-Systeme versagen
Früh in der Entwicklung haben wir eine Hypothese schnell validiert: Ein Standard-Retrieve-and-Answer-Muster produziert plausibel klingende Ausgaben, die bei der Präzision versagen. Ein Ingenieur, der nach Schubwiderstand gemäß EC2 fragt, braucht keinen plausiblen Absatz — er braucht die richtige Formel, die richtigen Variablen, die richtigen nationalen Anhangswerte und eine Quellenangabe, die er verifizieren kann.
Wir haben eine überwachte agentische Pipeline gebaut, bei der jeder Schritt eines Ingenieurs-Workflows von einem spezialisierten Agenten übernommen wird — und bei der kein Output den Ingenieur ohne obligatorische menschliche Freigabe erreicht:
Bevor ein Output den menschlichen Review-Schritt erreicht, prüft ein automatisiertes Qualitäts-Gate die Antwort auf Konsistenz und Vollständigkeit. Nur Outputs, die diese Prüfung bestehen, werden weitergeleitet. Generische KI-Tools haben keinen vergleichbaren Schritt — Antworten gelangen ohne Verifikation direkt vom Modell zum Nutzer.
Jeder freigegebene Output trägt ein vollständiges Protokoll: welche Quellen mit Dokumentname und Seitenzahl zitiert wurden, welcher Ingenieur freigegeben hat und wann. Exportierbar für die Aufnahme in technische Einreichungen.
4. Wie wir 97% Genauigkeit messen
Genauigkeitsbehauptungen ohne Methodik sind Marketing. Unser April-2026-Benchmark umfasste 75 Fragen über 5 strukturierte Testrunden, manuell von Fachexperten anhand von Ground-Truth-Antworten bewertet. Der Test umfasste Eurocode-Q&A, Formel-Retrieval, LV-Abgleich und absichtliche Out-of-Scope-Fallen zur Messung der Halluzinationsresistenz.
Wir veröffentlichen die Methodik, weil die Zahl nur so glaubwürdig ist wie die Methode dahinter.
5. Die Hardware-Realität
Der häufigste Einwand gegen On-Premise-KI sind Hardwarekosten — und er basiert auf einem Kategoriefehler. Die Annahme ist, dass On-Premise-KI denselben Rechenaufwand erfordert wie ein Frontier-Cloud-Modell. Das stimmt nicht.
Wir betreiben Small Language Models, die mit einer strukturierten Domänenwissensbasis kombiniert werden. Diese enthält alle relevanten Daten, Dokumentbeziehungen und Normquerverweise. Das Modell muss den Eurocode nicht "kennen" — es schlussfolgert über verifizierte, strukturierte Inhalte. Dieser Ansatz liefert Domänengenauigkeit zu einem Bruchteil des Rechenaufwands großer Allzweckmodelle. Domänenspezifisches Fine-Tuning ist der logische nächste Schritt — bereits auf unserer Roadmap.
Eine Workstation-GPU im mittleren Preissegment. Kein Rechenzentrum. Kein H100-Cluster. Keine Cloud-Credits, die sich monatlich aufaddieren. Eine einmalige Hardwareinvestition statt laufender Abonnementkosten.
6. Was wir in Live-Deployments bewiesen haben
Zwei Kunden-Deployments sind seit Mitte 2026 in Produktion. Unterschiedliche Branchen, unterschiedliche Workflow-Profile — beide validieren die Kernarchitektur.
Technische Zulassungsanalyse (Querverweise zwischen Zulassungstabellen und Produktionsbedingungen), LV-Spezifikationsabgleich mit Produktkatalog mittels Toleranzlogik und Mengenermittlung aus Architektenplänen mit automatischem Abzug von Öffnungen.
● Live — ProduktionEurocode-Q&A mit Formel-Rendering und Diagramm-Extraktion. Quellenangaben bis zu Dokumentname, Abschnitt und Seitenzahl. Normversions-Tracking — jede Antwort kennzeichnet, welche Version der Norm verwendet wurde.
● Live — ProduktionIn beiden Fällen ist der primäre Wert nicht Geschwindigkeit — es ist Reproduzierbarkeit und Nachvollziehbarkeit. Dieselbe Frage zweimal gestellt ergibt dieselbe Antwort mit denselben Quellen.
7. Was wir als Nächstes bauen
Wir sind transparent darüber, was live ist und was geplant ist. Kunden, die Infrastrukturentscheidungen treffen, verdienen genaue Informationen.
| Funktion | Beschreibung | Status |
|---|---|---|
| Agentische Pipeline | Überwachter Multi-Agent-Workflow mit Reflexions-Guard und verpflichtender menschlicher Freigabe | ● Live |
| Strukturiertes Wissens-Retrieval | Domänen-Knowledge-Graph mit Querverweislogik über Eurocodes, Zulassungen und technische Dokumente | ● Live |
| LV-Abgleich | Deterministische Toleranzlogik für den Abgleich von LV-Positionen mit Produktkatalogen | ● Live |
| Planmengenermittlung | Mengenextraktion aus Architektenplänen mit geometrischem Abzug von Öffnungen | ● Live |
| Audit-Trail | Vollständiges Output-Protokoll mit Ingenieur-Freigabe, Zeitstempeln und PDF-Export | ● Live |
| NVI-Engine | Eliminiert halluzinierte Normwerte aus haftungsrelevanten Workflows | ◎ Geplant — Q3 2026 |
| Normversionierung | Automatische Kennzeichnung, wenn Antworten auf abgelöste Normversionen verweisen, mit Änderungsfolgenabschätzung | ◎ Geplant |
| Multi-Dokument-Suche | Einheitliche Suche über Eurocodes, Prüfnormen, Inspektionsberichte und BIM-Daten | ◎ Geplant |
Die NVI-Engine ist die Funktion, nach der wir am häufigsten gefragt werden. Wenn sie live ist, löst sie das größte verbleibende Risiko bei KI-gestützter Normkonformität. Entwicklungsbeginn Q3 2026.
Haben Sie einen ähnlichen Anwendungsfall?
Wir arbeiten aktiv mit Ingenieur- und Bauunternehmen zusammen, die erkunden möchten, was Sovereign AI für ihre spezifischen Workflows leisten kann. Wenn Ihr Team mit Normkonformität, Zulassungsanalyse, LV-Verarbeitung oder Planmengenermittlung arbeitet — lassen Sie uns sprechen.
Wir nehmen derzeit nicht breit onboard. Wir wählen eine kleine Anzahl von Early-Access-Partnern für Q3 aus, die mitgestalten, was wir als Nächstes bauen.
Gespräch starten Kontakt

