Von der Idee zum laufenden System: was eine Woche wirklich leistet
Aus einem Gespräch wurde in wenigen Tagen ein live laufendes KI-System, das Märkte scannt und Betriebe bewertet. Warum nicht das Tool die Leistung ist, sondern die Architektur-Entscheidungen dahinter.

Vor kurzem saß ich mit einem befreundeten Berater zusammen. Er erzählte von einem Problem, das viele Hersteller im Mittelstand kennen: Sie wollen ihr Vertriebspartner-Netz ausbauen, aber die Suche nach passenden Betrieben ist Handarbeit. Wochenlanges Googeln, Listen kaufen, Adressen abtelefonieren, und am Ende weiß niemand, warum Betrieb A vielversprechender sein soll als Betrieb B.
Die Frage lag auf dem Tisch: Kann KI das nicht besser?
Eine Woche später lief das System. Live, nicht als Folie.
Was das System tut
Man gibt eine Branche, eine Region und ein Suchprofil ein. Das System durchsucht den Markt, findet Betriebe, entfernt Dubletten, liest die Web-Auftritte, bewertet jeden Betrieb nach den hinterlegten Kriterien und liefert eine priorisierte Liste. Zu jedem Treffer steht ein Satz, warum er auf der Liste steht und an welcher Position.
Aus Wochen Handarbeit werden Stunden Rechenzeit plus ein Gespräch über die Ergebnisse. Das ist keine Zukunftsvision, das läuft. Wer es sehen will: die Demo ist öffentlich und rechnet live einen Beispielmarkt durch, etwa Wärmepumpen-Fachbetriebe in Oberösterreich.
Warum nicht das Tool die Leistung ist
Jetzt der Punkt, der mir wichtig ist. Die naheliegende Lesart wäre: Die KI hat das gebaut, beeindruckend, was die Technik heute kann. Diese Lesart ist falsch, und zwar auf eine Art, die für Mittelständler entscheidend ist.
Die Bausteine sind verfügbar. Web-Suche per Schnittstelle, Dienste, die Webseiten maschinenlesbar machen, Sprachmodelle, die Texte bewerten, Workflow-Werkzeuge, die alles verbinden. Nichts davon ist geheim. Trotzdem entsteht daraus nicht von selbst ein verlässliches System.
Die eigentliche Arbeit waren Entscheidungen. Drei Beispiele:
Was bleibt fix, was wird variabel. Das System hat ein festes Skelett: finden, entdoppeln, anreichern, bewerten, ranken. Variabel sind nur die Suchbegriffe, die Signale für die Anreicherung und die Bewertungslogik. Ein neuer Markt ist damit eine Stunde Konfigurationsarbeit, kein Neubau. Diese Trennung fällt nicht vom Himmel, sie ist eine Architektur-Entscheidung.
Wo die KI urteilt und wo nicht. Für die Masse der Kandidaten reicht ein schnelles, günstiges Modell, das grob vorsortiert. Erst die engere Auswahl bekommt das stärkere Modell und das ausführliche Urteil. Wer das nicht trennt, zahlt entweder zu viel oder bekommt schlechte Ergebnisse.
Was passiert, wenn etwas schiefgeht. Live-Läufe können scheitern, Quellen ändern sich, Dienste haben Aussetzer. Das System rechnet asynchron, meldet Zwischenstände und hat für den Demo-Fall einen abgesicherten Rückfall. Verlässlichkeit ist kein Feature, das man dazubucht, sie wird konstruiert.
Keine dieser Entscheidungen steht in einem Tool-Handbuch. Genau das ist der Unterschied zwischen einem Experiment, das einmal funktioniert, und einem System, das man jemandem hinstellen kann.
Was das für den Mittelstand bedeutet
In vielen Betrieben, mit denen ich spreche, ist KI bisher ein Experimentierfeld. Einzelne Mitarbeiter probieren Dinge aus, es gibt beeindruckende Einzelmomente, aber nichts, das trägt. Der Engpass ist fast nie das Werkzeug. Der Engpass ist die Frage, wie aus Werkzeugen ein Ablauf wird, der zur eigenen Arbeitsweise passt und auch im November noch läuft.
Dafür braucht es keine Großprojekte und keine zwölf Monate. Es braucht einen klar geschnittenen Anwendungsfall, ein paar harte Architektur-Entscheidungen und die Disziplin, klein anzufangen. Eine Woche von der Idee zum laufenden System ist nicht bei jedem Thema realistisch. Aber Wochen statt Quartale sind es fast immer, wenn der Schnitt stimmt.
Was dieses System nicht ist
Es ist kein Produkt von der Stange und soll keines werden. Kein Selbstbedienungs-Werkzeug, in das jeder beliebige Kriterien eintippt. Die Liste allein ist wenig wert. Wertvoll wird sie durch das, was davor und danach passiert: das Marktverständnis, das in die Bewertungslogik einfließt, und das Urteil darüber, was die Ergebnisse bedeuten. Das Skelett ist wiederverwendbar, das Urteil ist es nicht.
Wenn Sie sich fragen, wie so ein Schnitt für Ihr Thema aussehen könnte: Genau dieses Gespräch ist der richtige erste Schritt. Nicht die Tool-Frage, sondern die Frage, welcher Anwendungsfall bei Ihnen den Unterschied macht.