giovedì 28 gennaio 2016

La posizione dell’italiano

Le interfacce vocali implicano una notevole quantità di lavoro informatico. Ogni lingua richiede un trattamento diverso, e le lingue trattate bene sono quindi poche.
 
Sulle circa 6.000 lingue che si stima siano oggi parlate nel mondo, quelle che dispongono di una qualunque forma di supporto sono poche decine. Per fortuna, l’italiano è tra queste.
 
Sarebbe sorprendente che non lo fosse, in fin dei conti. Nella classifica mondiale redatta da Ethnologue, l’italiano è solo ventunesimo per numero di parlanti madrelingua, ma quasi tutte le lingue che lo precedono sono collegate a comunità con un peso economico minore rispetto all’Italia, secondo diverse classifiche.
 
È chiaro che le dimensioni dei PIL non sono l’unico fattore su cui ragionano gli sviluppatori: contano sicuramente le dimensioni del mercato dei dispositivi elettronici di riferimento, la presenza di fasce di pubblico economicamente interessanti, eccetera. Resta il fatto che delle venti lingue che precedono l’italiano come numero di parlanti, tredici hanno, per dirla un po’ grezzamente, meno soldi alle spalle: hindi, arabo, bengalese, russo, punjabi, giavanese, coreano, telugu, maratto, turco, tamil, vietnamita e urdu. Sono quindi solo sette le lingue che, rispetto all’italiano, possono vantare contemporaneamente un maggior numero di parlanti madrelingua e un maggior prodotto interno lordo delle comunità corrispondenti: il cinese mandarino, lo spagnolo, l’inglese, il giapponese, il tedesco, il francese e il portoghese.
 
Nella pratica questo significa che l’italiano si trova spesso nel gruppetto di testa delle lingue per cui sono sviluppate tecnologie vocali. Per esempio Microsoft Skype Translator ha introdotto il supporto vocale nel dicembre 2014 per l’inglese e lo spagnolo, nel maggio 2015 per il cinese mandarino e l’italiano, e a fine 2015 per francese e tedesco (nell’interfaccia vedo oggi segnato anche il portoghese, ma non trovo indicazioni in proposito nella documentazione esterna). L’assistente digitale Siri di Apple è partito con il sistema operativo iOS 5.0 supportando inglese, francese e tedesco, più, poco dopo, il giapponese, ma con il passaggio a iOS 6, ha incluso l’italiano assieme al mandarino, al cantonese, al coreano e allo spagnolo.
 
A questa posizione solida si aggiungono altri fattori positivi: la qualità delle descrizioni linguistiche e degli strumenti informatici disponibili (grammatiche, dizionari, corpus elettronici…) e la parentela stretta con le altre lingue indoeuropee e, soprattutto, romanze. Tutti vantaggi che lingue come il vietnamita o il tamil non hanno.
 
Sembra quindi molto probabile che nei prossimi decenni l’italiano possa mantenere la sua posizione di testa nel mercato delle interfacce vocali. A meno, beninteso, che l’economia italiana non si contragga tanto da far scivolare il relativo mercato linguistico più in basso in queste classifiche!
 

martedì 26 gennaio 2016

Presentazione

   
Sezione dell'immagine "sonogram 1.jpg", utente Bob di FlickrBenvenuti! Questo blog tratterà di interfacce vocali per la lingua italiana.
 
Visto che l’etichetta non è di uso comune, mi sembra importante chiarire subito che cosa sono le “interfacce vocali”. Sono i sistemi che permettono ai dispositivi informatici di interagire con gli esseri umani attraverso la voce, voce intesa come il linguaggio naturale degli esseri umani – e non, per esempio, la musica o gli effetti sonori.
 
Oggi molti dispositivi informatici hanno sofisticate capacità di trattamento della voce. Possono cioè ricevere comandi e fornire risposte attraverso questo canale. Tali capacità restano certo limitate, rispetto a quelle esibite normalmente dagli esseri umani: al di là delle difficoltà contingenti, un problema strutturale è che i dispositivi informatici non sono in grado di pensare, mentre il linguaggio naturale richiede spesso su una comprensione non meccanica dei messaggi da parte degli interlocutori.
 
Tenuto conto di questi limiti, tuttavia, le capacità attuali di questi dispositivi sono a volte tanto sofisticate da sorprendere, e sono anche di estremo interesse per i linguisti. Inoltre sono migliorate molto negli ultimi anni ed è probabile che il loro ruolo nella vita di tutti i giorni stia per diventare di estrema importanza. Mi sembra però che al momento manchi, sia tra il pubblico generale sia tra gli addetti ai lavori, una consapevolezza più ancora dell’esistenza che delle potenzialità di questi strumenti.
 
Questo blog nasce dal mio bisogno di aggiornarmi in proposito. Sull’argomento ho tenuto nello scorso semestre (settembre-dicembre 2015) una parte del mio corso di Linguistica italiana II per la laurea magistrale in Informatica umanistica dell’Università di Pisa. In quel semestre, il corso era dedicato in generale a “scritto e parlato”, ma una buona parte delle lezioni è stata dedicata appunto a presentare e studiare le novità di questi dispositivi. Il blog parte da questa base, e spero possa registrare diverse cose interessanti! Oltre che fungere da supporto, in alcuni casi, per i corsisti interessati a scrivere relazioni o fare ricerche su questo argomento.