Nuance: la fabbrica della voce
maggio 2012
↓ scarica pdf
archivio >>
CORRIERE ECONOMIA 28 maggio 2012
Le interfacce vocali entrano a pieno titolo nel mondo dell’hitech. Con una crescita costante dei dispositivi da comandare con la voce: dai tablet agli smartphone, ma anche applicazioni per auto, console per videogame e tivù. A dare nuovo impulso ai “controller vocali” è stato l’arrivo di
Siri. Il software Apple a bordo dell’iPhone 4S, attraverso cui interrogare il telefonino con la voce. Purtroppo per ora disponibile in inglese, francese e tedesco, non in italiano.
Invece, ad attivare assistenti personali nella nostra lingua, sono i dispositivi con sistema operativo Google Android. Il risultato? Negli ultimi dodici mesi oltre
400 milioni di smartphone nel mondo, tra Apple e Android, accettano la voce come opzione di controllo. Serve per comporre Sms senza tastiera, dettare testi e spedire e-mail. Dunque la tecnologia è ormai matura per entrare nella fase due. La possiamo definire «Comandi vocali 2.0», quella in cui la macchina risponde alle nostre richieste direttamente con il linguaggio naturale. Come avveniva con Hal9000, il calcolatore “quasi infallibile” di 2001 Odissea nello Spazio, il celebre film di Kubrick.
A mettere a punto le nuove interfacce naturali sono gli esperti
Nuance nei laboratori di Burlington, a pochi chilometri da Boston. «Gli assistenti virtuali di nuova generazione, vedranno la luce nei prossimi mesi». Spiega a Corriere Economia il Cto (Chief technology officer) Vlad Sejnoha, responsabile della ricerca e sviluppo: «si tratta di un’importante evoluzione che avvicinerà il linguaggio naturale dell’uomo a quello digitale di computer e dispositivi mobili».
Un’interazione complessa in cui l’umano chiede al dispositivo elettronico un’informazione. Questa viene prima contestualizzata all’interno della frase e poi elaborata con un motore di ricerca sul cloud. Dopo pochi secondi arriva la risposta vocale tramite un sintetizzatore vocale
text to speech. La prima parte di questo processo, cioè la richiesta di informazioni con comandi vocali fa già parte della nostra vita quotidiana. Lo scorso anno ne abbiamo fatte 2 miliardi. Numerose le applicazioni per Pc e smartphone.
Ad esempio conoscere le previsioni meteo, chiedere informazioni su negozi e ristoranti. Ma anche gestire appuntamenti e dettare messaggi, interrogando i nominativi della rubrica telefonica. Nuance che impiega nel mondo 11 mila tra esperti informatici, di linguistica e matematica, è leader nella dettatura vocale di testi su computer e dispositivi mobili. Il software
Dragon Dictate consente di usare la voce per dettare documenti alla velocità di 120 parole al minuto, con un’accuratezza nel riconoscimento delle parole superiore al 99%. Nel settore automobilistico TomTom è stata tra le prime aziende ad usare la voce per il controllo dei navigatori.
E sono oltre
70 milioni nel mondo le auto di produttori come Toyota, Hyunday, VolksWagen, Bmw, Mercedes e Fiat già equipaggiate con comandi vocali per attivare climatizzatore, cambiare stazioni radio e musica del lettore Mp3. Ford ha annunciato due settimane fa il lancio in Europa (in autunno) di Sync. Un sistema vocale, sviluppato con Nuance, in grado di spedire Sms, controllare e-mail e dispositivi di intrattenimento di bordo. Col vantaggio di aumentare la sicurezza del guidatore che non si distrae per gestire tastiere e controlli manuali.
E per il futuro? Diversi i settori a cui stanno lavorando gli esperti dell’azienda bostoniana, che nel 2011 ha fatturato
1,4 miliardi di dollari. A partire dalla ricerca avanzata di contenuti web. «Come ad esempio chiedere con la voce spezzoni di film, spartiti di canzoni e opere teatrali – spiega ancora Vlad Sejnoha – da cercare tra milioni di file negli archivi digitali di Internet». Ma anche l’introduzione di tutor vocali per corsi di formazione online, con la partecipazione di docenti virtuali.
Ma l’obiettivo finale degli esperti di Boston è ambizioso. «Stiamo lavorando a un
traduttore multilingue almeno una ventina, italiano incluso, capace di rispondere a frasi di senso compiuto». Google ha già qualcosa di simile, si chiama “Conversation”. Ma siamo ai primi tentativi e le risposte sono spesso in linguaggio ”maccheronico”. Nuance invece sta sperimentando un translator universale, top secret la data di rilascio.