Critical Thinking & Reflection

Facility Management: AI » Strategie » Einführung von KI im FM » Critical Thinking & Reflection

Critical Thinking und Reflection im Einsatz von KI im Facility Management — Critical Thinking & Reflection mit KI im Facility Management

Im Facility Management sind KI-Ausgaben kein „fertiges Ergebnis“, sondern zunächst nur ein Entwurf mit unbekannter Beleglage. Das ist im FM besonders kritisch, weil FM den Betrieb von Gebäuden und Services mit unmittelbarer Wirkung auf Sicherheit, Verfügbarkeit, Komfort, Kosten, Nachhaltigkeit und das Kerngeschäft trägt. Wer KI-Antworten in diesem Umfeld ungeprüft übernimmt, verschiebt operative, rechtliche und reputative Risiken nicht auf die KI, sondern auf die eigene Organisation.

Kritisches Denken im Umgang mit KI

Kritische Bewertung von KI-Ergebnissen im FM
Eine feste Review-Methodik für FM
Auswahl und Einsatz

Warum FM KI-Ergebnisse nicht unkritisch übernehmen darf

FM ist kein bloßes Backoffice. Es integriert Menschen, Orte und Prozesse im gebauten Umfeld und soll Lebensqualität und Produktivität des Kerngeschäfts verbessern; zugleich fordert das FM-System nach ISO eine wirksame, effiziente und nachhaltige Leistungserbringung, die Anforderungen interessierter Parteien und anwendbare Vorgaben erfüllt. Darum sind Fehlentscheidungen im FM selten „nur inhaltliche Fehler“, sondern oft Betriebsfehler mit unmittelbarer Wirkung auf Gebäude, Anlagen, Nutzer und Geschäftsabläufe.

Operativ ist das Risiko hoch, weil KI in FM typischerweise in genau den Prozessen ansetzt, die schnell in Störungen oder Fehlsteuerung umschlagen: Ticket-Triage, Instandhaltungsplanung, Priorisierung von Mängeln, Dienstleistersteuerung, Statuskommunikation, Energie- und Regelungsvorschläge oder Sicherheitsbegehungen. Offizielle Hinweise zu generativer KI betonen, dass Modelle halluzinieren, Missverständnisse produzieren und Antworten stets überprüft werden müssen; für arbeitsschutznahe Risikobeurteilungen empfiehlt die Forschung deshalb vertrauenswürdige, unternehmensspezifische Daten, Nachvollziehbarkeit und Human-in-the-Loop statt Vollautomatik.

Im FM verschärft sich dieses Risiko durch Daten- und Dokumentenrealität: Vorschriften ändern sich, Verträge werden nachverhandelt, Wartungsintervalle werden angepasst, technische Bulletins werden aktualisiert. NotebookLM arbeitet ausdrücklich mit einer statischen Kopie importierter Quellen; verbundene Apps in Gemini können laut Hilfetext sogar aus einer älteren E‑Mail antworten, obwohl bereits eine neuere existiert. Ein formal „sauber“ wirkender KI-Output kann damit auf veraltetem Material beruhen.

Rechtlich ist unkritische Übernahme im FM besonders gefährlich, weil Betreiberverantwortung, Vertragsklarheit und Dokumentationspflichten nicht an die KI delegiert werden können. Die überarbeitete GEFMA-190 betont die fortgeltenden Grundsätze der Betreiberverantwortung unter aktueller Rechtslage; zugleich empfiehlt GEFMA für Vergabe und Vertrag bewusst die abgestimmte gemeinsame Nutzung von Leistungsbeschreibung und Mustervertrag, um Widersprüche und Lücken zu vermeiden. Wenn KI in diesem Umfeld unzutreffende Pflichten, Fristen oder Leistungsgrenzen erfindet oder falsch zusammenfasst, landet das Risiko bei Betreiber, Auftraggeber oder Dienstleister — nicht beim Modell.

Hinzu kommt der regulatorische Maßstab: Die FAQ der Europäischen Kommission zum AI Act machen klar, dass Deployers ein ausreichendes Niveau an AI Literacy sicherstellen müssen und dass dies Transparenz und menschliche Aufsicht ausdrücklich verstärkt; bloß auf Nutzungsanleitungen zu vertrauen, sei in vielen Fällen nicht ausreichend. Für FM bedeutet das praktisch: Wer KI produktiv einsetzt, braucht nicht nur Tool-Zugang, sondern formelle Review-Kompetenz, Freigabewege und dokumentierte Nutzungskontexte.

Reputativ sind die Risiken ebenfalls erheblich, weil viele FM-Anwendungen außenwirksam sind: Rückmeldungen an Nutzer, Mieter, Besucher, interne Stakeholder, Auditoren oder Auftraggeber. Öffentliche Fälle zeigen, dass schlechte KI-Auskunft nicht als „harmloser Botfehler“ wahrgenommen wird, sondern als Organisationsversagen. Besonders wichtig ist: Disclaimers allein entschärfen das Problem nicht zuverlässig. In einem prominenten Fall stellte das Gericht fest, dass eine Organisation angemessene Sorgfalt hätte walten lassen müssen, um die Richtigkeit ihres Chatbots sicherzustellen.

Schließlich gibt es Vertraulichkeits- und Beweisrisiken. Reuters berichtete 2026 über gerichtliche und anwaltliche Warnungen, dass Chats mit öffentlichen KI-Systemen unter Umständen in Verfahren offengelegt werden können. Für FM ist das relevant, sobald Mitarbeitende Störungsberichte, Vertragskonflikte, Incident-Narrative, Preisdetails oder personenbezogene Sachverhalte in unpassende KI-Umgebungen kopieren.

Eine feste Review-Methodik für FM

Die zweckmäßige Grundregel lautet: Jeder KI-Output bleibt im Status Entwurf, bis der Review abgeschlossen ist. Diese Entwurfslogik ist keine Vorsichtsfloskel, sondern die konkrete Umsetzung von Human Oversight, TEVV und nachvollziehbarer Betreiberpraxis.

Quellenverifikation. Zuerst wird nicht die Formulierung geprüft, sondern die Belegkette. Bei jeder tragenden Aussage sind Quelle, Dokumenttyp, Version, Datum, Geltungsbereich und Eigentümer des Dokuments zu kontrollieren. Bei kuratierten Systemen muss zusätzlich geklärt werden, ob die Quelle wirklich live ist oder nur als Kopie vorliegt. Bei grounded Systemen ist außerdem wichtig, dass „Grounding“ nicht die Echtheit der zugrundegelegten Fakten garantiert; die Dokumentation zu RAG weist ausdrücklich darauf hin, dass inline bereitgestellte „fact text“ nicht auf Authentizität geprüft werden. Im FM ist daher nicht nur die Antwort, sondern bereits der Quellensatz review-pflichtig.
Annahmen explizieren lassen. Als zweiter Schritt muss das Modell seine Annahmen nennen: Welche Normenversion wurde implizit unterstellt? Welcher Vertragsstand? Welches Asset? Welche Betriebszeiten? Welche Risikoklasse? Welche Definition von „kritisch“? Das Ziel ist, verdeckte Voraussetzungen sichtbar zu machen. Google empfiehlt dafür strikt geerdetes Arbeiten auf bereitgestelltem Kontext und klare Instruktionen, keine externe Information einzuführen; falls die Antwort nicht explizit im Kontext steht, soll das Modell dies sagen. Für FM ist das essenziell, weil viele Fehlentscheidungen nicht aus offener Halluzination, sondern aus stiller Lückenschließung entstehen.
Gegenargumente und Gegenfälle erzeugen. Danach wird die Antwort aktiv gechallengt. Das Modell soll die stärkste alternative Interpretation, die günstigste bzw. ungünstigste Risikoannahme und den wahrscheinlichsten Gegenbeleg liefern. Das ist keine Spielerei, sondern inhaltlich eng mit NIST-Empfehlungen verbunden, die für Erklärbarkeit und Validierung unter anderem ausdrücklich counterfactual prompts nennen. Im FM ist dieses Gegenlesen besonders wertvoll bei Verträgen, SLA-Ausnahmen, Wartungsintervallen, Gewährleistungsgrenzen, Sicherheitsbewertungen und Eskalationsentscheidungen.
Zweitprompt-Verifikation. Der vierte Schritt ist ein separater Verifikationslauf, nicht bloß ein „Bist du sicher?“. Die Google-Dokumentation empfiehlt bei unsicheren Themen eine split-step verification: Erst wird mit hoher Sicherheit verifiziert, dass Information oder Fähigkeit überhaupt vorhanden ist; nur dann folgt die eigentliche Antwort. Für FM heißt das zum Beispiel: erst prüfen, ob im hochgeladenen Leistungsverzeichnis tatsächlich eine Reaktionszeit und eine Ausnahmeklausel enthalten sind; erst danach formulieren, was vertraglich gilt.
Menschliche Freigabe. Der letzte Schritt ist verpflichtend, sobald eine Antwort sicherheitsrelevant, vertragsrelevant, compliance-relevant, vergaberelevant oder extern wirksam ist. Die arbeitswissenschaftliche Literatur aus Deutschland beschreibt KI in solchen Kontexten ausdrücklich als Co-Pilot; die finale Verantwortung verbleibt beim Menschen. Genau diese Schwelle muss im FM sauber gesetzt werden: KI darf vorbereiten, strukturieren, warnen und vergleichen — aber kritische Entscheidungen nicht im Alleingang freigeben.
Dokumentation und Nachweis. Jeder produktive KI-Review sollte protokolliert werden: Ziel des Prompts, Modell, Datum, verwendete Quellen, Annahmen, Gegenargumente, Reviewer, Freigabeentscheidung und gegebenenfalls Eskalation. NIST empfiehlt explizit Dokumentenaufbewahrung für Test, Evaluation, Validation und Verification sowie Provenienz- und Transparenzmethoden. Ohne diesen Audit Trail ist FM-seitige Nachvollziehbarkeit gegenüber Revision, Auftraggeber, Rechtsabteilung oder Auditoren unnötig schwach.

Auswahl und Einsatz von Werkzeugen

Für FM sollte die Präferenz klar bei spezialisierten oder kuratierten Angeboten liegen, wenn Entscheidungen oder Kommunikation Konsequenzen haben. Bevorzugt werden sollten Systeme, die erstens auf einen definierten Korpus oder klar abgegrenzte Live-Quellen zugreifen, zweitens claim-nahe Belege oder Support Scores liefern, drittens No-Answer-Verhalten bei fehlender Evidenz zeigen, viertens Admin- und Datenkontrollen für Unternehmenseinsatz bieten und fünftens in FM-nahe Prozessumgebungen passen. Kuration ist kein Luxus, sondern Risikoreduktion.

Critical Thinking & Reflection