Sottotitoli automatizzati su YouTube, con Google speech-to-text
Google attiva finalmente un nuovo servizio per i video caricati su YouTube: la sottotitolazione automatizzata con il sistema di riconoscimento vocale Google speech-to-text (utilizzato durante le ultime elezioni presidenziali negli States: YouTube offriva un motore di ricerca che consentiva di ricercare qualsiasi parola in tutti i video della campagna, e già in uso in Google VoiceMail).
Vint Cerf, vice presidente e chief Internet evangelist di Google, presenterà nei prossimi giorni a Washington questo nuovo utilizzo della tecnologia di trascrizione automatica del parlato sviluppata da Google.
Già dal 2006 Google Video, e successivamente Youtube, consentono di caricare file di sottotitolazione, ma il lavoro manuale di trascrizione del parlato e di sincronizzazione del testo col parlato richiede molto tempo, infatti i video sottotitolati su Youtube sono ancora molto pochi (circa 100.000).
Gli ingegneri di Google hanno avviato il servizio di sottotitolazione automatica col riconoscimento vocale nel canale YouTube Education e in altri canali sempre con contenuti didattici (ad esempio il canale dell'Università della California UC Berkeley), per i video in lingua inglese.
Il servizio è presentato nel blog ufficiale di Google. Di seguito il video dimostrativo.
Proviamo a trascrivere e sincronizzare in modo automatico un video del canale UC Berkeley. Nell'immagine che segue, nella prima parte si nota il comando per trascrivere il parlato (in pochi secondi avviene la trascrizione automatica e sono visibili i sottotitoli), nella seconda parte attiviamo la traduzione automatica in italiano (servizio già attivo da tempo derivato da Google Translate), e possiamo seguire l'oratore nel suo discorso con sottotitoli in italiano (traduzione approssimativa ma che consente di comprendere la lezione). Tutto in pochi secondi.

Sempre limitatamente alla lingua inglese, è anche possibile utilizzare il sistema di speech recognition per applicare il timing (la sincronizzazione del testo col parlato) alla trascrizione realizzata manualmente e caricata su YouTube.
Un inizio molto promettente, di una tecnologia che rivoluzionerà l'attuale situazione della sottotitolazione su Web.




© 2007