La nuova rivoluzione di Meta si chiama “Seamless M4T“. La società di Mark Zuckerberg sta per lanciare un chatbot per tradurre da parlato a parlato il tempo reale, fino a 35 diversi idiomi. Con l’intelligenza artificiale, dunque, si può superare anche la barriera delle lingue tra persone di diverse parti del mondo. La chatbot combina diverse tecnologie di AI e coinvolge per ora “solo” 35 idiomi ma, come spiegato dall’azienda di Palo Alto, da testo scritto a parlato Seamless M4T arriva a coprire fino a 100 lingue. Si tratta di una straordinaria semplificazione per le interazioni tra utenti di tutto il mondo nel metatarso dove la chatbot sarà messa presto a disposizione di tutti gli utenti.
Il modello avanzato che traduce e trascrive in modo efficiente il parlato in tante lingue è stato presentato martedì dalla società partecipante di Facebook. Per Zuckerberg questo strumento giocherà un ruolo cruciale nel favorire le interazioni tra gli utenti di diverse parti del mondo all’interno del metatarso e sostiene che abbracciare un ecosistema di intelligenza artificiale aperto è un vantaggio strategico per Meta. Infatti, l’azienda può guadagnare di più sfruttando gli sforzi collettivi della comunità per creare strumenti incentrati sull’utente per le sue piattaforme sociali, piuttosto che perseguire un modello che fa pagare l’accesso a queste risorse.
SEAMLESS M4T, I DATI DI ADDESTRAMENTO USATI DA META
Seamless M4T è accessibile al pubblico per scopi non commerciali, quindi Meta porta avanti la tendenza a rilasciare modelli di intelligenza artificiale per lo più gratuiti durante l’anno in corso. Come altri operatori del settore, la società non è però immune a questioni legali relative ai darti di partenza usati per l’addestramento dei suoi modelli, come dimostra la causa intentata da alcuni scrittori. Ma come spiegato in un documento di ricerca dei ricercatori di Meta, i dati di addestramento audio del modello SeamlessM4T sono stati ricavati da un ampio bacino di “audio grezzo”, proveniente da un archivio pubblico. Le specifiche di questo archivio, però, non sono state rese note.
Per quanto riguarda i dati testuali, il documento di ricerca afferma che sono stati ottenuti da set di dati strutturati nell’anno precedente, attingendo contenuti da Wikipedia e da fonti online correlate. Di fatto, il recente rilascio di Seamless M4T da parte di Meta rappresenta un passo significativo verso la realizzazione di una comunicazione interlinguistica senza soluzione di continuità. Ma l’azienda, insieme ai suoi concorrenti, dovrà affrontare le complessità dell’uso dei dati di formazione all’interno del quadro giuridico se vuole ottenere un successo a lungo termine.