AGI – Grazie all’intelligenza artificiale, una donna britannica affetta da Sla è tornata a parlare con la propria voce dopo 25 anni senza riuscire a farlo. Il ‘miracolo’ è stato reso possibile anche grazie al ritrovamento di una clip audio di otto secondi appena udibile, tratta da un vecchio video amatoriale degli anni ’90 in cui la donna parlava.
È questa la storia accaduta a Sarah Ezekiel, un’artista 59enne rimasta senza voce dopo che le è stata diagnosticata la Sla all’età di 34 anni, mentre era incinta del suo secondo figlio, 25 anni fa. La patologia, che danneggia progressivamente alcune parti del sistema nervoso, può causare debolezza dei muscoli della lingua, della bocca e della gola, portando alcuni malati a perdere completamente la parola. Negli anni successivi alla diagnosi, Ezekiel, originaria del nord di Londra, è riuscita a utilizzare un computer e una tecnologia di generazione vocale per comunicare, sebbene con una voce che non assomigliava per niente alla sua.
È stata anche in grado di continuare la sua carriera di artista utilizzando un cursore del computer per creare le sue immagini. Tuttavia i suoi due figli, Aviva ed Eric, sono cresciuti senza sapere come un tempo parlasse la madre. Negli ultimi anni, gli esperti sono stati sempre più in grado di utilizzare la tecnologia per creare versioni computerizzate della voce originale di una persona. Ma la tecnica richiedeva generalmente registrazioni lunghe e di buona qualità, e anche in questo caso tendeva a produrre voci che, pur assomigliando a quelle del paziente, erano “molto piatte e monotone”, ha affermato Simon Poole della societa’ britannica di comunicazione medica Smartbox.
Le persone che si prevede perderanno la capacità di parlare a causa di patologie come la Sla sono attualmente incoraggiate a registrare la propria voce il prima possibile, come un modo per preservare la propria “identità” e la capacità di comunicare. Ma prima dell’avvento degli smartphone, avere registrazioni adatte a cui attingere era molto meno comune. Quando Ezekiel è riuscito a trovare solo una clip molto breve e di scarsa qualità, Poole ha detto di aver avuto un “colpo di fulmine”. La clip, tratta da un video amatoriale degli anni ’90, durava solo otto secondi, era ovattata e con il rumore di fondo di un televisore. Poole si è rivolto alla tecnologia sviluppata dagli esperti di intelligenza artificiale vocale di New York, ElevenLabs, in grado non solo di produrre una voce basata su pochissimi dati, ma anche di farla sembrare più simile a quella di un vero essere umano.
Ha utilizzato uno strumento di intelligenza artificiale per isolare un campione vocale dalla clip e un secondo strumento, addestrato su voci reali per riempire i vuoti, per produrre il suono finale. Il risultato, con grande gioia di Ezekiel, era molto vicino all’originale, completo del suo accento londinese e del leggero difetto di pronuncia che un tempo odiava. “Le ho inviato dei campioni e mi ha risposto via email dicendo che quasi piangeva quando l’ha ascoltata”, ha detto Poole. “Ha detto di averla fatta ascoltare a un’amica che la conosceva da prima che perdesse la voce ed e’ stato come riavere la propria voce”, ha aggiunto.
Secondo la Motor Neurone Disease Association del Regno Unito, otto malati su 10 soffrono di difficoltà vocali dopo la diagnosi. Ma i tempi, l’altezza e il tono delle attuali voci generate al computer “potrebbero essere piuttosto robotici”. “Il vero progresso di questa nuova tecnologia di intelligenza artificiale è che le voci sono davvero umane ed espressive, e restituiscono davvero quell’umanità a una voce che prima suonava un po’ computerizzata”, ha affermato Poole. Personalizzare una voce era un modo per preservare l'”identità” di una persona, ha aggiunto. “Soprattutto se si contrae una patologia in eta’ avanzata e si perde la voce, essere in grado di parlare con la propria voce originale è davvero molto importante, piuttosto che usare una voce preconfezionata”, ha affermato.