Entwicklung eines KI-Assistenten-Prototyps zur automatisierten Lead-Identifikation und -Qualifizierung
(Wenn Sie Videoinhalte bevorzugen, sehen Sie sich bitte die kurze Videozusammenfassung dieses Artikels unten an.)
Das Wichtigste
- Die Kombination aus strukturierten Gesprächsskripten und der Anpassungsfähigkeit von LLMs ermöglicht eine skalierbare, natürliche Lead-Qualifizierung, ohne „robotisch“ zu wirken.
- Ein KI-Assistent kann den ICP-Fit präzise bewerten, indem er relevante Geschäftsdaten aus frei formulierten Gesprächen extrahiert und validiert.
- Die Beachtung der Nutzerintention und das Erkennen von Desinteresse sind entscheidend für eine ethische und effektive KI-gestützte Ansprache.
- Produktionsreife KI-Leadgenerierung erfordert nicht nur leistungsfähige Modelle, sondern auch durchdachtes Prompt-Design, Validierungslogik und konsequente Kostenkontrolle.
Die Gewinnung potenzieller Kunden für Softwareentwicklungsdienstleistungen ist selten eine einfache Aufgabe. In der Praxis bedeutet sie häufig, Chats, Foren und soziale Netzwerke manuell zu beobachten, vielversprechende Gespräche zu identifizieren und potenzielle Kontakte anschließend einzeln mit ähnlichen Einleitungsnachrichten anzusprechen. Dieser Prozess ist zeitaufwendig, repetitiv und kaum skalierbar.
In diesem Artikel erläutere ich, wie ich einen funktionsfähigen Prototyp eines KI-gestützten Assistenten namens SaMio entwickelt habe, der die frühzeitige Lead-Identifikation und -Qualifizierung für Softwareentwicklungsanbieter automatisiert und dabei Gespräche natürlich, respektvoll und kontextsensitiv gestaltet.
Die Herausforderung: Manuelle Lead-Identifikation skaliert nicht
Der Ausgangspunkt war ein sehr typischer Workflow aus der Praxis.
Ein Mitarbeiter eines Unternehmens überwacht kontinuierlich Chats und soziale Plattformen, um Personen zu identifizieren, die möglicherweise an Softwareentwicklungsdienstleistungen interessiert sind. Wird eine solche Person gefunden, ähnelt der nächste Schritt klassischer Kaltakquise – nur über moderne Messenger statt per Telefon. Die Ansprache folgt dabei meist einem festen Muster: Begrüßung, einige qualifizierende Fragen und anschließend entweder ein konkretes Angebot oder ein höflicher Rückzug.
Die Probleme dieses Ansatzes lagen auf der Hand:
- Dieselben Einleitungsnachrichten mussten immer wieder manuell formuliert werden.
- Gespräche verliefen selten strikt linear entlang eines Skripts.
- Personen konnten jederzeit ablehnen, nicht reagieren oder das Thema wechseln.
- Es war schwierig, konsistent zu bewerten, ob eine Person tatsächlich dem Ideal Customer Profile (ICP) entsprach.
Ziel war es daher, diesen Prozess zu automatisieren, ohne daraus eine robotische Spam-Maschine zu machen und ohne Menschen zu verärgern.
SaM Solutions ist seit 1993 auf dem deutschen IT-Markt aktiv und bietet professionelle Softwareentwicklung für Kunden aus allen Branchen.
Die Grundidee: Skriptbasierter Ablauf und Anpassungsfähigkeit von LLMs
Anstatt Gespräche vollständig frei zu improvisieren, habe ich mit einem strukturierten, skriptbasierten Ansatz begonnen.
Im Kern von SaMio steht eine definierte Gesprächslogik, die aus folgenden Elementen besteht:
- initialen Begrüßungsnachrichten,
- einer Abfolge qualifizierender Fragen,
- abschließenden Erfolgs- oder Abbruchnachrichten.
Jeder Frageschritt verfolgt ein konkretes Validierungsziel, zum Beispiel die Identifikation der Branche, der Unternehmensgröße oder der Rolle der Person im Unternehmen. Die Anzahl der Fragen ist flexibel und kann je nach geschäftlichen Anforderungen erweitert werden.
Ein statisches Skript allein würde jedoch niemals natürlich wirken. Reale Gespräche sind unordentlich: Menschen antworten indirekt, stellen themenfremde Fragen oder präzisieren frühere Aussagen. Genau hier wird KI unverzichtbar.
Das Gespräch menschlich wirken lassen
Um Dialoge natürlich wirken zu lassen, habe ich ein Large Language Model (LLM) angebunden, das sich an den Kommunikationsstil und den Kontext des Gegenübers anpasst.
SaMio versendet dabei nicht einfach vordefinierte Nachrichten, sondern:
- wählt passende Varianten aus dem Skript aus,
- interpretiert frei formulierte Antworten der Nutzer,
- extrahiert relevante Informationen aus diesen Antworten,
- passt Tonfall und Gesprächstempo an den Verlauf der Unterhaltung an.
Wenn jemand plötzlich über das Wetter spricht oder das Thema wechselt, kann der Assistent natürlich reagieren und das Gespräch bei passender Gelegenheit behutsam wieder zurückführen.
Gleichzeitig muss der Assistent klare Grenzen erkennen. Lehnt eine Person das Gespräch ab oder signalisiert deutliches Desinteresse, respektiert der Assistent diese Entscheidung und beendet den Dialog, ohne weiter nachzusetzen.
Dieses Gleichgewicht – anpassungsfähig zu sein, ohne aufdringlich zu wirken – war eines der wichtigsten Designziele.
Qualifizierungs- und Validierungslogik
Im Verlauf des Gesprächs sammelt SaMio die Antworten auf die qualifizierenden Fragen. Wichtig dabei:
- Die Antworten werden separat gespeichert und können später aktualisiert werden, falls der Nutzer zusätzliche Informationen liefert.
- Das System vermeidet es, dieselbe Frage mehrfach zu stellen.
- Jede Antwort fließt in eine Gesamtbewertung ein, wie gut die Person zum definierten Ziel-ICP passt.
Sobald alle relevanten Daten gesammelt sind oder das Gespräch auf natürliche Weise zu einem Ende kommt, bewertet der Assistent das Ergebnis.
Passt der potenzielle Kunde zum ICP, wählt der Assistent eine von mehreren Erfolgsmeldungen aus. Diese sind zurückhaltende, nicht aufdringliche Vorschläge, z. B. ein kurzes Demo-Angebot, das Teilen eines Leitfadens oder das Zeigen konkreter Beispiele.
Passt die Person nicht oder lehnt eine weitere Diskussion ab, wählt der Assistent eine höfliche, wertschätzende und respektvolle Absage aus.
Post-Conversation-Automatisierung
SaMio hört nach der Konversation nicht auf zu arbeiten. Nach dem Ende des Gesprächs:
- wird automatisch eine Zusammenfassungs-E-Mail mit den Ergebnissen des Dialogs versendet,
- wird der gesamte Gesprächsverlauf in der Datenbank für spätere Auswertungen gespeichert,
- werden relevante Daten mit Google Sheets synchronisiert, sodass die Lead-Verfolgung ohne manuelle Eingaben stets aktuell bleibt.
Dies gewährleistet Transparenz, Nachvollziehbarkeit und eine einfache Übergabe an Vertriebs- oder Marketingteams.
Beispiel einer Zusammenfassungstabelle
| Name | Benutzer | Position | Firma | Größe | Branche | Datum | Letztes Update |
|---|---|---|---|---|---|---|---|
| Yena Polrix | Ypolrix_po | Benutzer ist Product Owner | N/A | ca. 300 Personen | Composable-Commerce-Sektor | 22.11.2025 | 22.11.2025 |
| Luma Qentari | lqentari_77 | Benutzer ist Tech Strategy Lead | N/A | fast 1000 Mitarbeitende | Cloud-Automation | 19.10.2025 | 10.01.2026 |
| Nira Solven | nsolven_vp | Benutzer ist Direktor des Unternehmens | N/A | über 1200 Personen | Enterprise-Platform-Services | 10.12.2025 | 10.12.2025 |
Technische Entscheidungen und Architektur
Anfangs habe ich mit einem lokalen LLM (Gemma) experimentiert. Zwar erschien dieser Ansatz aus Kosten- und Datenschutzsicht attraktiv, zeigte aber schnell seine Grenzen.
Das Modell hatte Schwierigkeiten, mehrdeutige Antworten korrekt zu interpretieren. Reagierte ein Nutzer themenfremd, aber ohne das Gespräch abzulehnen, konnte das Modell häufig nicht sinnvoll adaptieren und weitermachen.
Daraufhin wechselte ich zu GPT-4o-mini, gehostet auf Azure. Dieses Modell bot deutlich bessere Stabilität in der Konversation und ein zuverlässigeres Kontextverständnis.
Eine weitere zentrale Herausforderung war die Kontrolle von Gesprächsabweichungen. Da cloudbasierte Modelle kostenpflichtige Tokens verbrauchen, war es nicht möglich, den Assistenten lange, irrelevante Gespräche führen zu lassen. Es galt, sorgfältig abzuwägen zwischen:
- Zulassen von natürlichem Small Talk,
- Sanftes Zurückführen des Gesprächs auf das Thema,
- Vermeidung unnötiger Token-Verbräuche,
- Vermeidung offensichtlichen „Bot-Verhaltens“.
Hier spielt Prompt-Engineering eine wichtige Rolle, um Grenzen zu definieren und gleichzeitig Flexibilität zu erhalten.
Technologie-Stack
Der Prototyp wurde aufgebaut mit:
- Azure,
- Docker,
- .NET,
- PostgreSQL
Das Ergebnis: Ein funktionsfähiger, produktionsreifer Prototyp
SaMio ist ein voll funktionsfähiger Prototyp, der:
- natürliche, adaptive Gespräche führt,
- Leads basierend auf echten Antworten qualifiziert,
- die Grenzen der Nutzer respektiert,
- Follow-ups und Berichte automatisiert,
- Daten zuverlässig speichert und synchronisiert.
Am wichtigsten ist: SaMio zeigt, wie LLM-basierte Assistenten über einfache Chatbots hinausgehen und zu praktischen Werkzeugen für echte Geschäftsprozesse werden können, wenn sie mit strukturierter Logik, Validierungsregeln und durchdachten Einschränkungen kombiniert werden.
Fazit
Dieses Projekt hat eindrücklich gezeigt, dass erfolgreiche KI-Systeme selten „reine KI“ sind. Der eigentliche Mehrwert entsteht an der Schnittstelle von strukturierten Geschäftsskripten, menschlichen Kommunikationsmustern und sorgfältig kontrollierten Sprachmodellen.
Für Softwareentwicklungsanbieter eröffnet dieser Ansatz neue Möglichkeiten für skalierbare, respektvolle Lead-Generierung, ohne Authentizität oder Vertrauen zu gefährden.
Wer ähnliche Automatisierungsherausforderungen untersucht, sollte sich eine einfache Erkenntnis zu Herzen nehmen: Beginnen Sie mit realen menschlichen Arbeitsabläufen und lassen Sie die KI diese verbessern – nicht blind ersetzen.


