Apple lavora al futuro del riconoscimento vocale

Siri, l’assistente vocale di Apple introdotto con iPhone 4S, è spesso oggetto di miglioramenti e aggiornamenti, al fine di migliorare l’esperienza utente e di renderla sempre più hands-free. Basti ricordare che CarPlay affonda le sue radici nel progetto Siri Eyes Free introdotto con iOS 6 (e supportato dalla Opel Adam) e che con il futuro iOS 8 sarà possibile attivarlo semplicemente col comando vocale “Hey Siri” (alla stregua di Ok Google, in rollout da oggi anche in Italia), purché iPhone e iPad siano connessi alla rete elettrica, magari chiedendo il riconoscimento di una canzone grazie alla integrazione con Shazam.

siri-ios-8

Il funzionamento di Siri si basa sulla registrazione vocale del comando impartito dall’utente che verrà poi inviata ai server di Apple che la interpretano e inducono il nostro device a compiere l’azione richiesta. Per il riconoscimento vocale, Apple ha deciso di collaborare con Nuance (l’azienda che sviluppa, fra tutti, Dragon Naturally Speaking) poiché priva di un team capace di provvedere in autonomia alla sua implementazione, ma sembra che, nel corso degli ultimi tre anni, stia provvedendo a risolvere la problematica in completa autonomia.

Già nel 2011, quando si diffusero rumors in tal senso, il co-fondatore di Siri aveva dichiarato che Apple avrebbe potuto sostituire il software fornito da Nuance senza alcun problema, qualora avesse potuto provvedere da sola al riconoscimento vocale.

Successivamente, nel 2013, è stata acquisita una nuova azienda, la Novauris, che opera nello stesso campo di Nuance. Nel marzo dello stesso anno, fu assunto a Cupertino Larry Gillick, che opera oggi come Chief Speech Scientist nel team che si occupa dello sviluppo di Siri e che, fino a poco tempo prima, era impiegato in Nuance come vice presidente per la ricerca.

Qualora Apple riuscisse nell’intento di creare un team ad hoc per il riconoscimento vocale all’interno del team di Siri, potrebbe, innanzitutto, svincolarsi da Nuance e superare i limiti della loro tecnologia, quale, ad esempio, la registrazione del comando e il successivo invio ai server, introducendo la trasmissione in streaming e il contestuale riconoscimento del comando, al fine di ottimizzare i tempi. Inoltre, un notevole sforzo dovrebbe essere fatto sull’ottimizzazione del riconoscimento anche in caso di accenti dialettali particolarmente marcati che, spesso, Siri rifiuta di interpretare correttamente.

La strada per creare il miglior assistente vocale è ancora irta e impervia, ma si spera che il lancio di Ok Google anche nel resto del mondo possa motivare Apple a lavorare ancora più alacremente alla propria tecnologia.

Elio Franco

Editor - Sono un avvocato esperto in diritto delle nuove tecnologie, codice dell'amministrazione digitale, privacy e sicurezza informatica. Mi piace esplorare i nuovi rami del diritto che nascono in seguito all'evoluzione tecnologica. Patito di videogiochi, ne ho una pila ancora da finire per mancanza di tempo.

Commenti controllati Oltre a richiedere rispetto ed educazione, vi ricordiamo che tutti i commenti con un link entrano in coda di moderazione e possono passare diverse ore prima che un admin li attivi. Anche i punti senza uno spazio dopo possono essere considerati link causando lo stesso problema.