Wer regelmäßig mit KI arbeitet, kennt die Situation: Eine Anfrage an die KI ist schnell formuliert, das Ergebnis bleibt jedoch hinter den Erwartungen zurück. Die Antwort ist zu allgemein, wichtige Informationen fehlen oder die Aufgabe wird anders interpretiert als beabsichtigt. Oft wird dann die Leistungsfähigkeit des Modells infrage gestellt. Tatsächlich liegt die Ursache jedoch häufig an anderer Stelle.
Die Qualität von KI-Ergebnissen hängt nicht nur vom verwendeten Modell ab. Sie wird auch maßgeblich durch die Informationen beeinflusst, die einem Modell zur Verfügung gestellt werden. Fehlender Kontext, unklare Anforderungen oder widersprüchliche Anweisungen können selbst leistungsfähige Systeme zu wenig hilfreichen Ergebnissen führen.
Die gezielte Gestaltung solcher Eingaben wird als Prompt Engineering bezeichnet. Obwohl moderne Sprachmodelle viele Ungenauigkeiten ausgleichen können, bleibt dieser Ansatz insbesondere für anspruchsvolle Anwendungen und automatisierte Prozesse relevant.
Dieser Beitrag beleuchtet die Grundlagen des Prompt Engineerings und zeigt anhand bewährter Methoden und Frameworks, wie sich die Qualität von KI-Ergebnissen gezielt verbessern lässt.
Die Sprache der KI verstehen
Prompt Engineering bezeichnet die gezielte Gestaltung von Eingaben an ein KI-Modell, um möglichst präzise und nützliche Ergebnisse zu erhalten. Um zu verstehen, warum die Formulierung dabei eine Rolle spielt, hilft ein kurzer Blick auf die Funktionsweise eines Sprachmodells.
Vereinfacht gesagt erzeugt ein Sprachmodell seine Antworten, indem es Wort für Wort das wahrscheinlichste nächste Token vorhersagt, also Wörter oder Wortbestandteile, basierend auf dem Prompt und dem bisherigen Output. Dabei werden nicht alle Teile des Prompts gleich gewichtet: Ein sogenannter Attention-Mechanismus sorgt dafür, dass relevante Informationen stärkeren Einfluss auf die Antwort haben. Für die Praxis bedeutet das: Wichtige Informationen und klare Anweisungen sollten prominent im Prompt stehen, vage oder widersprüchliche Formulierungen hingegen können die Qualität der Antwort spürbar verschlechtern.
Mit der breiten Verfügbarkeit großer Sprachmodelle, insbesondere ab 2022, gewann die gezielte Gestaltung von Prompts schnell an Bedeutung. Es geht dabei nicht nur darum, verständliche Texte zu schreiben, sondern Anfragen so zu strukturieren, dass Sprachmodelle sie optimal verarbeiten können.
Warum gutes Prompting auch bei leistungsfähigen Modellen wichtig bleibt
Moderne Sprachmodelle sind deutlich robuster geworden. Sie können die Intention hinter einer Anfrage oft auch dann ableiten, wenn ein Prompt unvollständig oder unpräzise formuliert ist. Dazu tragen unter anderem interne Denkschritte bei, die das Modell vor der Antwort durchläuft, sowie die Einbeziehung des bisherigen Gesprächsverlaufs. Auch können Modelle bei unklaren Anweisungen gezielt nachfragen und so das Ergebnis gemeinsam mit dem Nutzer verbessern.
Im direkten Gespräch mit einem Chatbot ist ein unpräziser Prompt deshalb meist kein großes Problem. Fehlen wichtige Informationen oder entspricht die Antwort nicht den Erwartungen, können Nutzer ihre Anfrage konkretisieren, zusätzlichen Kontext liefern oder einen neuen Ansatz wählen. Das gewünschte Ergebnis entsteht häufig erst im Verlauf mehrerer Interaktionen. Die Folgen eines ungenauen Prompts bleiben dadurch meist begrenzt, auch wenn zusätzliche Nachfragen und Korrekturen Zeit kosten können.
Anders sieht es aus, wenn Prompts Teil einer Anwendung oder eines automatisierten Workflows sind. Hier wird ein Prompt nicht einmalig genutzt, sondern häufig hunderte oder tausende Male auf unterschiedliche Eingaben angewendet. Gleichzeitig gibt es in der Regel keinen Nutzer, der Ergebnisse überprüft, Rückfragen beantwortet oder Fehler korrigiert.
Dadurch steigen die Anforderungen an die Qualität eines Prompts. Die erzeugten Ergebnisse müssen konsistent sein, definierte Ausgabeformate einhalten und möglichst ohne manuelle Nachbearbeitung auskommen. Je stärker Sprachmodelle in Anwendungen und Geschäftsprozesse integriert werden, desto wichtiger wird es, Prompts so zu gestalten, dass sie zuverlässig und reproduzierbar funktionieren.
Genau deshalb bleibt Prompt Engineering trotz leistungsfähiger Modelle ein wichtiger Faktor für den erfolgreichen Einsatz von KI.
Bewährte Frameworks für bessere Prompts
Um Prompts zielgerichtet zu gestalten, kann man sich an etablierten Frameworks orientieren. Diese geben vor, welche Aspekte bei der Formulierung berücksichtigt werden sollten, ohne jeden Prompt übermäßig komplex zu machen.
AUTOMAT
Das AUTOMAT-Framework, welches 2024 von Maximilian Vogel beschrieben wurde, strukturiert Prompts anhand von sieben Elementen:
- Act as a: Welche Rolle das Modell einnehmen soll
- User Persona and Audience: An welche Zielgruppe sie sich die Antwort richtet
- Targeted Action: Welche konkrete Aufgabe das Modell ausführen soll
- Output Definition: In welchem Format das Ergebnis ausgegeben werden soll
- Mode, Tonality, Style: Welche Sprache, Tonalität und Stil verwendet werden sollen
- Atypical Cases: Wie mit Sonderfällen oder unerwarteten Eingaben umgegangen werden soll
- Topic Whitelisting: Auf welche Themen sich die Antwort beschränken soll
Insbesondere die letzten beiden Punkte sind in automatisierten Workflows relevant, da sie helfen können, unerwartete Eingaben kontrolliert zu verarbeiten.
CO-STAR
CO-STAR wurde 2023 von Sheila Teo entwickelt und umfasst sechs Elemente:
- Context: Alle relevanten Hintergrundinformationen zur Aufgabe
- Objective: Das Ziel, das mit der Anfrage erreicht werden soll
- Style: Der gewünschte Schreib- oder Darstellungsstil
- Tone: Die gewünschte Tonalität der Antwort
- Audience: Die Zielgruppe, für die die Antwort erstellt wird
- Response: Das gewünschte Format der Ausgabe
Beide Frameworks liefern eine nützliche Checkliste, welche Informationen ein guter Prompt enthalten sollte. Dabei gilt: Nicht jede Anfrage erfordert alle Elemente. Bei einfachen Aufgaben reichen oft wenige gezielte Angaben, während komplexe oder automatisierte Anwendungen von einer vollständigeren Ausarbeitung profitieren.
Ergänzende Strategien für effektivere Prompts
Frameworks geben eine Gesamtstruktur vor. Ergänzend dazu gibt es eine Reihe von Strategien, die sich je nach Aufgabe gezielt einsetzen lassen.
Few-Shot Learning bedeutet, dem Modell im Prompt konkrete Beispiele mitzugeben, anhand derer es das gewünschte Ergebnis, Format oder den Stil ableiten kann. Das ist besonders hilfreich, wenn Erwartungen schwer in Worte zu fassen sind.
Chain of Thought beschreibt die Anleitung des Modells, Zwischenschritte explizit darzustellen, bevor es zur Antwort kommt. Dies erhöht die Qualität bei komplexen oder mehrstufigen Aufgaben. Modernere Modelle führen solche Denkschritte oft automatisch aus und müssen nicht explizit dazu aufgefordert werden.
Formatting and Delimiters bezeichnet die klare Strukturierung des Prompts, etwa durch Überschriften, Abschnitte oder Trennzeichen. Das hilft dem Modell, die Aufgabe besser zu verarbeiten, und zwingt gleichzeitig dazu, die eigenen Gedanken geordnet zu formulieren.
Role Prompting meint die Zuweisung einer Rolle an das Modell, zum Beispiel „Du bist ein erfahrener Projektmanager". Wie bereits in den Frameworks beschrieben, hilft das dabei, Tonalität, Perspektive und Tiefe der Antwort zu steuern.
Task Decomposition bezeichnet das Aufteilen einer komplexen Aufgabe in klare Einzelschritte. Das reduziert Fehler und macht die Ergebnisse nachvollziehbarer.
Self-Critique schließlich bedeutet, das Modell anzuweisen, seine eigene Antwort zu überprüfen und zu verbessern, zum Beispiel durch einen abschließenden Hinweis wie „Überprüfe deine Antwort auf Vollständigkeit und Fehler". Das ist ein einfacher Weg, die Qualität ohne zusätzlichen Aufwand zu erhöhen.
Praxisbeispiele
Um den Unterschied zwischen einem durchdachten und einem intuitiv formulierten Prompt zu verdeutlichen, betrachten wir folgenden Alltagsfall: Ein Projektleiter muss einer externen Designagentur mitteilen, dass die gelieferten Website-Entwürfe nicht den Erwartungen entsprechen – und das so, dass die langjährige Geschäftsbeziehung nicht darunter leidet.
Der intuitiv formulierte Prompt:

Das Ergebnis ist eine funktionale, höfliche E-Mail und auf den ersten Blick durchaus brauchbar. Bei genauerem Hinsehen zeigen sich aber die Schwächen: Die Kritik bleibt vage. Formulierungen wie „nicht konsistent mit der Positionierung unseres Unternehmens" oder „zielgruppengerechte Ansprache" sagen der Agentur nicht, was konkret geändert werden soll. Eine Deadline fehlt vollständig, und der Ton ist förmlicher als es eine zweijährige Partnerschaft erfordern würde. Wer diese E-Mail erhält, weiß am Ende nicht viel mehr als vorher.
Der durchdachte Prompt:

Das Ergebnis ist eine E-Mail, die direkt verwendbar ist. Die beiden Kritikpunkte werden konkret benannt, die Deadline ist klar gesetzt, und der Ton trifft die richtige Balance zwischen Direktheit und Wertschätzung. Die Agentur weiß genau, was geändert werden soll und bis wann.
Der Unterschied liegt nicht darin, dass der erste Prompt „falsch" ist. Im direkten Gespräch mit einem Chatbot könnte man das Ergebnis durch Nachfragen schrittweise verbessern.
Im folgenden Szenario ist dies jedoch nicht möglich, da der Prompt Teil eines Workflows ist: Anhand einer Kundenanfrage über ein Online-Kontaktformular soll automatisch ein Angebot generiert werden.
Als Grundlage dient folgende Kundenanfrage:
„Wir sind ein mittelständisches Logistikunternehmen mit ca. 120 Mitarbeitern und suchen eine Lösung zur Automatisierung unserer Rechnungsverarbeitung. Aktuell wird alles manuell erfasst, was sehr zeitaufwendig ist. Wir würden das gerne bis Ende des Jahres umgestellt haben. Bitte schicken Sie uns ein Angebot."
Bei dem Prompt handelt es sich somit um eine Vorlage, die im Rahmen des Workflows mit dem Text der Anfrage sowie zusätzlichen Informationen aus der Kundendatenbank befüllt wird.
Der intuitiv formulierte Prompt:
Erstelle ein Angebot für einen Kunden. Wir sind Beispiel GmbH, ein Beratungsunternehmen für KI-gestützte Automatisierungslösungen.
- Kundenanfrage: {{Kundenanfrage}}
- Leistung: {{Leistung}}
- Umfang: {{Umfang}}
- Termin: {{Termin}}
- Preis: {{Preis}}


Wie schon im vorherigen Beispiel sieht das Ergebnis auf den ersten Blick beeindruckend aus. Allerdings zeigt sich, dass das Modell die Projektphasen eigenständig ergänzt hat, ohne dass diese Teil der Vorgabe waren. Auch den Ton und das Format der Ausgabe hat das Modell selbst bestimmt. Das erstellte Angebot kann so zwar als Vorlage genutzt werden, benötigt aber eine sorgfältige Prüfung und Überarbeitung, damit sichergestellt ist, dass der Stil zum Unternehmen passt und die genannten Leistungen inhaltlich korrekt sind.
Der durchdachte Prompt:
Du bist ein erfahrener Vertriebsmitarbeiter bei Beispiel GmbH, einem Beratungsunternehmen für KI-gestützte Automatisierungslösungen im Bereich Finanz- und Dokumentenprozesse.
- KONTEXT: Ein potenzieller Neukunde hat folgende Anfrage gestellt: {{Kundenanfrage}}
Weitere relevante Informationen:
- Angefragte Leistung: {{Leistung}}
- Geschätzter Umfang: {{Umfang}}
- Wunschtermin des Kunden: {{Termin}}
- Preis: {{Preis}}
AUFGABE: Erstelle einen Angebotsentwurf, der:
- die Anfrage des Kunden kurz aufgreift
- unsere Lösung klar und konkret beschreibt
- den Preis transparent ausweist
- die Gültigkeit des Angebots nennt (30 Tage ab dem heutigen Datum, berechne das Ablaufdatum eigenständig)
- mit einem konkreten nächsten Schritt abschließt
TON: Professionell und verbindlich, aber persönlich. Kein Fachjargon, den ein branchenfremder Kunde nicht versteht.
FORMAT: Fließtext mit Einleitung, Leistungsbeschreibung, Preisangabe und Abschluss. Maximal 250 Wörter.


Durch die Rollenzuweisung, die genaue Aufgabendefinition sowie die Eingrenzung des Outputformats hat das Modell einen knappen, persönlichen Fließtext erzeugt, der die Anfrage des Kunden direkt aufgreift, die Lösung verständlich beschreibt und mit einem konkreten nächsten Schritt abschließt.
Wird das Angebot vollautomatisch versendet, entscheidet der Prompt allein über das Ergebnis. Ein Output, der selbst erfundene Projektphasen enthält oder im falschen Ton formuliert ist, erreicht den Kunden ohne jede Prüfung und hinterlässt im schlimmsten Fall einen unprofessionellen ersten Eindruck. Selbst wenn das generierte Angebot vor dem Versand manuell geprüft wird, zahlt sich der durchdachte Prompt aus. Ein Entwurf, der Ton, Format und Inhalt bereits trifft, erfordert deutlich weniger Aufwand bei der Überarbeitung als eines, das grundlegend umstrukturiert werden muss. Bei hohem Anfrageaufkommen summiert sich dieser Unterschied schnell zu einer spürbaren Zeit- und Kostenersparnis.
Fazit
Wer KI effektiv einsetzen will, kommt früher oder später an einem Punkt an, an dem die Qualität des Prompts den Unterschied macht. Im direkten Gespräch mit einem Chatbot fällt ein unpräziser Prompt kaum ins Gewicht, weil man jederzeit nachbessern kann. In automatisierten Workflows sieht das anders aus: Hier entscheidet der Prompt allein über die Qualität des Outputs, ohne die Möglichkeit einzugreifen. Schwächen im Prompt bleiben dadurch nicht auf eine einzelne Antwort beschränkt, sondern können sich über viele Ausführungen hinweg vervielfachen und sich dadurch auf nachgelagerte Prozesse auswirken.
Frameworks und Strategien wie die hier vorgestellten bieten eine gute Grundlage. Den größten Unterschied macht aber oft eine einfache Frage vor dem Schreiben: Was muss das Modell wissen, um diese Aufgabe wirklich gut zu erledigen? Beim Verfassen des Prompts kann man sich auch direkt von einem Chatbot unterstützen lassen.
Der Prompt ist dabei allerdings nur ein Teil der Antwort. Moderne KI-Systeme greifen auf zahlreiche weitere Kontextinformationen zurück, darunter Gesprächsverläufe, externe Datenquellen, definierte Rollen und verfügbare Werkzeuge. Wie sich dieser größere Kontext gezielt gestalten lässt, zeigt unser nächster Beitrag zum Thema Context Engineering.