Parla con Scarlett, la nuova interfaccia vocale digiterà per te

Guido Mazza

di Guido Mazza

Grazie ai recenti progressi in ambito computazionale e allo sviluppo di nuovi algoritmi di deep learning orientati all’evoluzione della speech tecnology, è stato possibile osservare la diffusione di una nuova forma di interazione tra persone e computer basata su interfaccia vocale.

Il percorso, caratterizzato dalla maturazione di un vasto insieme di tecnologie collegate, ha condotto, su larga scala, alla diffusione dei cosiddetti assistenti vocali, strumenti in grado di sintetizzare tali evoluzioni in un oggetto di design. Quest'ultimo consente all'utente, in particolare alla sua voce, di interagire con funzioni cloud che permettono di realizzare compiti e azioni nel mondo che ci circonda.

Amazon Alexa Echo Dot.

La domotica è solo uno degli esempi di ambiti in cui le interfacce conversazionali operano quotidianamente. I campi di applicazione sono numerosi: sia nel mondo enterprise, con sistemi logistici che supportano comandi vocali o chatbot per il customer service, che nel lifecare, con servizi volti all'assistenza e in grado di leggere, eventualmente tradurre, un libro semplicemente fotografandone la copertina.

In molti casi, l’analisi del linguaggio naturale rende la tecnologia più accessibile e consente di risolvere esigenze di un numero sempre maggiore di utenti, che diventano sempre più consapevoli del potenziale della propria voce nell'interazione con dispositivi elettronici. Studi condotti da team AWS su Alexa (l’assistente vocale integrato nei dispositivi Amazon Echo), hanno mostrato come

le interfacce conversazionali evolvono più rapidamente rispetto alle precedenti tecnologie comparabili, quali periferiche di input, tastiere e touchscreen.

Evidenze che consolidano l’opinione di chi sostiene che la naturalezza del linguaggio rappresenti uno degli aspetti caratterizzanti delle applicazioni del prossimo futuro.


Perchè Scarlett ha imparato ad ascoltare.

Uno dei nostri obiettivi è portare queste meravigliose tecnologie, sempre più solide e affidabili, al servizio degli utenti che utilizzano Scarlett per risolvere esigenze reali e percepite nella propria operatività quotidiana.

Attraverso la collaborazione con Daniele di AGIC abbiamo avuto l’opportunità di raccogliere il suo feedback.

“In un numero sempre maggiore di interventi ci viene richiesto, soprattutto a causa delle doverose precauzioni del periodo, di adoperare guanti in lattice durante le manutenzioni. I guanti non ci consentono di utilizzare il touchscreen del tablet e diventa impossibile raccogliere appunti in tempo reale. Soprattutto per interventi lunghi e che possono durare anche un paio di giorni, compilando tutto l’intervento alla fine ci capita di perdere informazioni e dettagli utili per la rendicontazione.”

Questo è solo uno degli scenari nei quali possiamo applicare tecniche di speech recognition ogni giorno, attraverso l’esperienza d'uso più naturale possibile per gli utenti, già abituati a utilizzare tool di registrazione audio nei più diffusi servizi di messaggistica.

E così che in un recente aggiornamento di Scarlett, l’app abilita l’interfaccia vocale per  la detenzione dei principali campi descrittivi e note del report, sfruttando algoritmi di analisi del linguaggio naturale e modelli conversazionali, su sistemi operativi iOS e Android.

Scarlett ascolta la descrizione del report di intervento

In sole due settimane di utilizzo della nuova funzionalità in versione beta, Daniele ha potuto constatare come, dettare la descrizione di ciò che avviene durante l’intervento, consente a lui e ai suoi compagni di squadra di ottenere una prima bozza del report più dettagliata che facilita le successive fasi di lavoro.

Una volta liberi dai guanti, infatti, i tecnici del team AGIC hanno la possibilità di concludere la prova, certificando il report con la firma del cliente, velocizzando fino al 30% la fase di compilazione in caso di interventi lunghi o su più giorni.


Naturalmente,

Stiamo solamente scalfendo la superficie di ciò che è possibile fare.

La dettatura vocale nella redazione del report non è che l’inizio del percorso che porterà allo sviluppo di un’interfaccia pienamente conversazionale, in grado di supportare gli utenti nella compilazione degli interventi e guidandoli attraverso un’esperienza del tutto nuova.

Inserire reportistica di intervento non sarà mai stato così facile e, come dimostrato in molti ambiti, rappresenterà una grande opportunità per rendere il servizio sempre più accessibile.

Nel frattempo siamo pronti a raccogliere feedback su quanto introdotto fino ad ora per migliorare la funzionalità. Tu ne hai? Saremo lieti di ascoltarti (noi stavolta)!