Apple ha annunciato Mgie, un nuovo modello basato sull’intelligenza artificiale, open source, che modifica le immagini attraverso le istruzioni scritte dall’utente. Come riferito da Wired, si tratta del risultato di una ricerca in collaborazione fra Cupertino e l’università della California, basato sul principio dell’editing guidato delle immagini, e in grado di sfruttare i modelli linguistici multimodali di grandi dimensioni (Mllm).



“Le indicazioni degli esseri umani sono talvolta troppo brevi perché i metodi attuali possano recepirle e seguirle. Gli Mllm hanno capacità promettenti per quanto riguarda la comprensione cross-modale e la generazione di risposte visive attraverso modelli linguistici di grandi dimensioni. […] Mgie impara a ricavare istruzioni efficaci e offre una guida chiara”, hanno fatto sapere gli autori della stessa ricerca. Ma come funziona Mgie? Prima di tutto l’AI di Apple estrapola le istruzioni dalle richieste testuali dell’utente. Se ad esempio scriviamo “rendi l’erba più verde”, il modello “aumenterà la saturazione del colore nella regione dell’erba del 20%”. Secondariamente l’IA di Apple utilizzerà i modelli multimodali di grandi dimensioni per rappresentare graficamente la modifica richiesta, cercando di cogliere l’essenza delle istruzioni e manipolando l’immagine in ogni suo pixel.



APPLE PRESENTA MGIE, NUOVO MODELLO IA PER L’EDITING DELLE FOTO: COSA PUÒ FARE

Mgie può regolare il colore, la temperatura, la dimensione e l’orientamento di un’immagine, ma anche l’illuminazione e intervenire ad un livello più profondo, cambiando ad esempio l’espressione di un ritratto, modificando lo sfondo, rimuovendo degli elementi, opzioni che si possono applicare all’intera foto a ad un’area specifica.

Wired precisa che il nuovo modello di intelligenza artificiale di Apple è disponibile su GitHub in modalità open source, ed è presente anche un manuale che spiega come utilizzare al meglio lo stesso. In ogni caso al momento si tratta semplicemente di un progetto di ricerca e non è ben chiaro se Apple intenda incorporare il “programma” nei suoi servizi o nei suoi dispositivi: non ci resta che attendere i prossimi sviluppi.