- Přehledy IS
- APS (20)
- BPM - procesní řízení (22)
- Cloud computing (IaaS) (10)
- Cloud computing (SaaS) (33)
- CRM (51)
- DMS/ECM - správa dokumentů (20)
- EAM (17)
- Ekonomické systémy (68)
- ERP (77)
- HRM (27)
- ITSM (6)
- MES (32)
- Řízení výroby (36)
- WMS (29)
- Dodavatelé IT slueb a řeení
- Datová centra (25)
- Dodavatelé CAD/CAM/PLM/BIM... (39)
- Dodavatelé CRM (33)
- Dodavatelé DW-BI (50)
- Dodavatelé ERP (71)
- Informační bezpečnost (50)
- IT řeení pro logistiku (45)
- IT řeení pro stavebnictví (26)
- Řeení pro veřejný a státní sektor (27)
ERP systémy
CRM systémy
Plánování a řízení výroby
AI a Business Intelligence
DMS/ECM - Správa dokumentů
HRM/HCM - Řízení lidských zdrojů
EAM/CMMS - Správa majetku a údrby
Účetní a ekonomické systémy
ITSM (ITIL) - Řízení IT
Cloud a virtualizace IT
IT Security
Logistika, řízení skladů, WMS
IT právo
GIS - geografické informační systémy
Projektové řízení
Trendy ICT
E-commerce B2B/B2C
CAD/CAM/CAE/PLM/3D tisk![]() | |
| Přihlaste se k odběru newsletteru SystemNEWS, který kadý týden přináí výběr článků z oblasti podnikové informatiky | |
![]() | |
Budoucnost hlasových asistentů?
Synergie, personalizace a analytika v přímém přenosu
Zhruba před dvěma roky vtrhly na trh LLM velké jazykové modely, jako například OpenAI. A větina firem tak zkusila touto technologií nahradit tradiční konverzační stromy svých virtuálních asistentů. Proč je lepí usilovat spíe o synergii těchto dvou cest ne o pouhé nahrazení jedné technologie tou druhou? A jak se vlastně dívat na budoucnost hlasových asistentů dnes v druhé polovině roku 2024?

Vzít klasické skripty virtuálních asistentů postavené na stromové struktuře a nahradit je generativní umělou inteligencí? Ké by to bylo tak jednoduché! Tento přechod má toti své nevýhody například náklady na provoz. Pokud provozujete GPT na vlastní infrastruktuře, potřebujete velmi výkonné servery. A kdy si tuto slubu kupujete od poskytovatele v cloudu, stojí vás nemalé peníze. Navíc se můe stát, e GPT bude reagovat nepřesně nebo pomalu. Proto je rozumnějí vydat se cestou synergie a skloubit skriptovaný dialog s velkým jazykovým modelem. Kadá tato technologie má toti své výhody. A díky jejich spojení tak můete těit z obou dvou najednou.
Představte si, e se na virtuálního asistenta obrátí zákazník, kterému se podařilo si zablokovat kartu. V tomto případě je ideální pouít tradiční konverzační strom pro určení poadavku. Abychom zkrátka zjistili, o jaký problém se jedná. Klasický skript se toti hodí na jednoduí otázky či small talk. Je to zkrátka rychlejí i levnějí. Naopak na sloitějí otázky dává smysl nasadit velké jazykové modely. Jsou toti schopné lépe porozumět kontextu, reagovat na různé scénáře, nabídnout relevantnějí odpověď a celkově vést přirozenějí dialog.
Agent assist systémy jako předstupeň voicebotů
Velké jazykové modely vám jetě také pomůou s dalí věcí s pomocí lidským operátorům, takzvaným Agent Assistem. Jedná se o systém, který v reálném čase radí operátorovi, na co se má během hovoru se zákazníkem zaměřit a na co nemá zapomenout. S klasickými technologiemi je velice obtíné vytvořit produkt, který by dokázal ohlídat vechny potřebné body, ale přitom by poskytoval i relevantní rady. Díky generativní AI, která rozumí celému kontextu dialogu, je mnohem jednoduí takového asistenta vytvořit. Agent Assist tedy sám nemluví, ale naslouchá a poskytuje rady operátorovi v reálném čase. S tímto řeením se zároveň vyhnete problémům s halucinacemi, kdyby náhodou umělá inteligence začala generovat nesmyslné odpovědi. Agent Assist toti funguje spíe jako nástroj, který pouze pomáhá operátorovi. A ten je stále tím filtrem, který kontroluje, co sám zákazníkovi řekne.
Řada firem se chce pustit do automatizace, ale voiceboti pro ně stále představují příli velký kalibr. Zkrátka se do toho bojí jít naplno, co u je v dnení době zbytečné. Agent Assist systémy jsou tak skvělým řeením pro firmy, které mají obavy z moných halucinací generativní AI a zároveň si uvědomují limity klasických stromových dialogů. Pokud se tedy bojíte jet na autopilota, tedy automatizovat celý proces od začátku do konce prostřednictvím voicebota či chatbota, zvolte raději cestu kopilota. Pomůe vám, ale poslední slovo budete mít vy.
Voiceboti míří k real-time analytice a větí personalizaci
Vyuívat voicebota jako kopilota láká v poslední době čím dál tím více firem. Kam jetě směřuje oblast hlasových technologií vedle kombinace konverzační a generativní AI? Pojďme se podívat na dalí trendy v oblasti voicebotů.
1. Analytika voicebotů v přímém přenosu
Budoucnost se bude rozhodně ubírat směrem od klasické call centrové analytiky, která se často označuje jako post-call analytics či offline analytics. Tradiční call centra dnes pracují tak, e nejprve přepíí hovory a následně je zpětně analyzují. Brzy bude probíhat analytika, přepisy a rady pro operátory v reálném čase. A vy můete tak rovnou sledovat, jestli se uivatelé v dialogu neztrácejí a zda voicebot neříká něco, co by je zmátlo. Kdy takový hovor nastane, lze ho jednodue přepojit na ivého operátora, který navíc můe dohlíet na více voicebotů současně. To se u dnes děje u chatbotů. Ale u voicebotů je tento postup teprve novinkou. Obrovskou výhodou je, e lze stejnou technologii vyuít i na hovory se skutečnými agenty.
2. Virtuální avataři zaívají návrat
Tím, jak se technologie posouvají, firmy začínají znovu zkouet 2D a 3D avatary. Proč? Pokud máte virtuálního asistenta, který dobře konverzuje hlasem díky generativní AI, dává smysl mu dodat tvář. V minulosti avataři tak úspění nebyli, ale teď se k nim firmy znovu vracejí. Je to zkrátka dalí krok, jak zase posunout firemní komunikaci o kousek dál.
3. Personalizovaná komunikace pro lepí uivatelský záitek
U dnes existuje monost přizpůsobit rychlost a styl řeči tomu, kdo právě voicebotovi volá. Pokud je to například starí člověk, tak se daná technologie automaticky přepne do módu, kdy mluví voicebot nahlas a pomaleji. S personalizací souvisí i vyuití dat o uivatelích. Pokud technologie ví, se kterým zákazníkem zrovna hovoří, dovede mu přizpůsobit obsah hovoru. Třeba kdy uivatel bude potřebovat vyřeit svůj tarif, voicebot bude hned vědět, o který se přesně jedná. Jeho číslo si toti snadno dohledá v databázi, kde budou informace o tarifu uvedené.
4. Rozpoznávání emocí a naladění se na stejnou vlnu
Ač v dnení době probíhá analýza emocí stále a po přepisu z řeči na text, OpenAI nedávno představilo demo nové technologie, díky které dovede voicebot pracovat s celou akustickou křivkou. Dokáe tedy měnit jak barvu, tak intonaci celého hlasu. I kdy je to zajímavý pokrok, stále se tato technologie příli nerozířila. Pro reálné vyhodnocování akustických signálů v reálném čase toti potřebujete vysoký výkon, co samozřejmě není zadarmo. Proto se firmy zatím smířily s klasickou sentimentální analýzou textu, která je sice levnějí, ale chybí v ní zásadní informace. Převodem řeči na text se toti ztrácí akustické vlastnosti hlasu, jakými jsou například tón či intonace. Analýza emocí také nemusí být úplně nejpřesnějí. Kvůli rozdílům v kvalitě signálu můe být procentuální úspěnost pouze 5060 %. Rozpoznáváte sice emoce na základě tónu, barvy, frekvence a hlasitosti, ale pokud se ve více ne polovině případů spletete, je výsledek podobný náhodnému odhadu. Nabízeným řeením je tedy kombinace analýzy sentimentu a emocí, které pomyslnou laku úspěnosti společně posouvají výe.
5. Voicebot, který ví o firmě první poslední
RAG neboli Retrieval-Augmented Generation je řeení, které lze aplikovat u hovorů i na chatu. Funguje tak, e vytvoříte asistenta, který má na pozadí znalostní bázi dané firmy. Kdy se uivatel zeptá, systém hezky zformuluje odpověď a zároveň drí kontext. Díky RAG lze tak nahradit tradiční FAQ asistenty, které jsou postaveny na statických skriptech. S RAG a technologiemi jako vektorové databáze a sémantické vyhledávání je toti moné vyhledávat v rozsáhlých databázích dokumentů a to i ve stovkách tisíc souborů nebo dokonce scrapovat webové stránky.
Co se bude dít dál?
I přes vechny nové technologie v oblasti hlasových asistentů je stále třeba se vypořádat s několika výzvami. Třeba s minimalizací latence reakce systému musí být co nejrychlejí, aby uivatel nemusel čekat na odpovědi od voicebota. Pokud systém nemá odpověď hned, měl by reagovat konverzačně, například Rozumím, vydrte, na to se podívám do systému. Tím uivateli naznačí, e otázku zpracovává, a přitom na pozadí můe procházet relevantní informace nebo dokumenty, jak je to běné u RAG botů. Dalí výzvou je kvalita hlasu, která musí být opravdu perfektní a přirozená. Technologie by měla dokázat správně zachytit emoce a reagovat adekvátně, a u jde o natvaného, nebo spokojeného zákazníka. Klíčové je, aby voicebot hovořil plynule a uivatel neměl pocit, e se zasekl nebo neví, jak odpovědět. A to je teprve jen pička ledovce.
A u půjdou trendy jakýmkoliv směrem, jedno je jasné. Hlasoví asistenti rozhodně změní celkovou roli zákaznických slueb. Firmy by vak měly myslet na to, e pokud se implementace umělé inteligence provede patně, technologie rozhodně není samospásná. Kdy AI nasadíte bezhlavě a očekáváte, e vyřeí vechno sama, můe paradoxně zákaznický záitek jetě zhorit. Firma pak můe mít pocit, e jim technologie nepomohla. Kdy ale implementace umělé inteligence proběhne správně, budou spokojeni vichni. Firmy i zákazníci, kteří tak dostanou prvotřídní servis.
![]() |
Martin Čermák Autor článku je spoluzakladatel a CTO společnosti Vocalls. |





















