Watermelon-Leitfaden
Optimiere deine Arbeitsabläufe mit KI
Nutze die Kraft der KI und schöpfe das volle Potenzial deiner KI-Agenten aus.
Inhaltsverzeichnis

Wie erstelle ich ein gutes Dataset?
Der Aufbau deines KI-gestützten digitalen Assistenten beginnt mit einem guten Dataset. Damit dein KI-Agent deine Kunden wirklich versteht, musst du ihm beibringen, welche Fragen sie stellen und wie sie das tun.
Beginne am besten mit einer Liste häufig gestellter Fragen. Vielleicht hast du diese bereits auf deiner Website veröffentlicht. Es lohnt sich auch, dein Kundendienst-Team zu befragen – sie wissen genau, was häufig gefragt wird.
In dieser Liste wirst du schnell Überschneidungen feststellen – denn viele Kunden stellen dieselbe Frage auf unterschiedliche Weise oder stellen verschiedene Fragen mit derselben Absicht. Deshalb ist es sinnvoll, diese Fragen zu gruppieren – das ist die Basis deines Datasets.
Das Besondere an deinem KI-Agenten ist seine Fähigkeit, viele verschiedene Formulierungen derselben Frage zu verstehen. Um ihm dafür den nötigen Kontext zu geben, nutzt du die häufig gestellten Fragen und ergänzt sie um Varianten. Die Fragegruppen, die du gerade erstellt hast, bilden den Startpunkt.
Ein gutes Dataset enthält eine Kundenfrage und mindestens zwei Varianten dieser Frage – also unterschiedliche Formulierungen mit derselben Bedeutung. Ein Beispiel:
Frage: Kann ich einen Termin mit euch vereinbaren?
Variante 1: Ich möchte gerne einen Termin planen.
Variante 2: Wie kann ich ein Treffen vereinbaren?
In diesem Beispiel geht es darum, einen Termin zu machen. Jede Variante nutzt andere Wörter und Satzlängen. Wichtig ist hier der Ausdruck „Termin machen“ – dieser wird durch Synonyme wie „Treffen vereinbaren“ und „Termin planen“ ergänzt.
Dank dieser Synonyme lernt dein KI-Agent, dass unterschiedliche Wörter dieselbe Absicht ausdrücken – und erkennt zukünftige neue Kombinationen automatisch. Wenn also jemand eine andere Version derselben Frage stellt, erkennt der Agent die Absicht und antwortet korrekt.
Wir empfehlen, für jede Frage mindestens zwei Varianten zu erstellen. Je mehr, desto besser! Ideal sind vier bis fünf Varianten pro Frage – das gibt deinem Agenten genügend Kontext für ein tieferes Verständnis.