Watermelon Guide
Maak een automatiseringsslag met AI
Gebruik de kracht van AI en haal het meeste uit jouw chatbot.
Inhoudsopgave
Hoe je een goede dataset creëert
Het bouwen van jouw eigen digitale assistent met AI-ondersteuning begint met het maken van een goede dataset. Als je wilt dat je chatbot je klanten echt begrijpt, moet je jouw chatbot leren welke vragen je klanten stellen en hoe ze die stellen.
Daarom is het verstandig om te beginnen met het maken van een lijst van de meest gestelde vragen. Misschien heb je die al op je website staan, denk bijvoorbeeld aan je FAQ’s, maar het is ook een goed idee om met je klantenservice te overleggen of er nog vragen zijn die klanten vaak aan hen stellen.
Zodra je eenmaal een lijst met vragen hebt, is er een grote kans dat je een flinke overlap ziet in de gestelde vragen. Er zijn namelijk veel verschillende manieren waarop mensen dezelfde vraag kunnen stellen of er worden verschillende vragen gesteld, die wel dezelfde bedoeling hebben. Daarom is het handig om deze vragen te groeperen, dit zal goed van pas komen in de volgende stap.
Het ding wat je AI-chatbot zo’n krachtige tool maakt, is het vermogen dat je chatbot in staat zal zijn om honderden verschillende variaties te begrijpen waarop iemand zijn vraag kan stellen. Om je chatbot de juiste context te geven om deze variaties te begrijpen, gaan we de chatbot de meest gestelde vragen leren, plus een paar variaties op die vragen. In de vorige stap heb je vergelijkbare vragen in groepen ingedeeld en deze vragen vormen het begin van je dataset.
Een goede dataset bestaat uit een vraag die je klanten zouden kunnen stellen en tenminste twee variaties op die vraag. De varianten zijn verschillende manieren waarop je klanten de vraag zouden kunnen formuleren. Zie hier een voorbeeld van een goede dataset:
Vraag: Kan ik een afspraak inplannen?
Variant 1: Ik wil graag een afspraak maken.
Variant 2: Hoe krijg ik een meeting?
In het bovenstaande voorbeeld gaat het over het inplannen van afspraken. Zoals je kan zien, hebben we drie verschillende manieren geschreven om dezelfde vraag te stellen. Wat deze dataset goed maakt, is dat we in elke variant verschillende woorden en zinslengtes gebruiken. In dit voorbeeld hebben we een belangrijke zin om de intentie over te brengen. Namelijk: 'maak een afspraak'. Voor deze belangrijke zin hebben we verschillende synoniemen gebruikt zodat de chatbot het in de juiste context kan plaatsen. In plaats van alleen 'maak een afspraak' te typen, gebruiken we ook de woorden: 'afspraak inplannen' of ‘krijg een meeting'.
Door deze synoniemen in te voeren, kan de chatbot leren dat deze woorden dezelfde intentie overbrengen en zijn opgedane kennis gebruiken om automatisch meer combinaties van verschillende woorden te leren. Wanneer iemand nu een andere variatie op dezelfde vraag intypt, zal de chatbot de intentie herkennen en deze kunnen koppelen aan het juiste antwoord.
Bij het samenstellen van je dataset raden we je aan om voor elke vraag minstens twee varianten te bedenken. Op die manier heeft je chatbot genoeg context om context te analyseren en hier van te leren. Maar als je nog meer variaties kan bedenken, dan zal het voor je chatbot alleen maar makkelijker zijn om zijn kennis uit te breiden. Een ideale dataset bestaat uit één vraag met vier of vijf verschillende variaties.