Un nuovo esperimento condotto interamente sulle immagini ha appena portato ad una conclusione notevole: ora esiste una intelligenza artificiale capace di ricostruire le immagini e di ricolorarle da zero. La progettazione di un algoritmo così complesso ha ovviamente richiesto molto più tempo del previsto, ma è anche vero che i risultati che ne sono scaturiti non sono stati affatto deludenti. Quali sono gli esiti finali?
Sentiamo tutti i giorni della nascita di nuove tecnologie che possano essere originali agli occhi di ognuno di noi, ma non sempre riteniamo che sia così facile riuscirci in fin dei conti. Tuttavia, dovremo cambiare del tutto la nostra prospettiva dopo l’ultima scoperta dei ricercatori di Tencent, i quali hanno realizzato un nuovo modello di intelligenza artificiale per il restauro di vecchie foto. Si basa interamente su una rete generativa avversaria chiamata GAN, acronimo di Generative Adversarial Network.
La particolarità è che integra anche un modulo che dà la priorità ai visi e migliora l’immagine di partenza per ottenerne una finale decisamente diversa. Dobbiamo tutto al nuovo modello GFP-GAN, con GFP che sta per “Generative Facial Prior” praticamente. La GAN usata per la creazione dei volti, ricollegandoci al discorso di prima, è la StyleGAN2 di Nvidia, dunque si tratta di una rete che prevede un apprendimento automatico basato su un generatore di volti e di un determinatore dei visi creati con successo. Ma come funziona?
Questa ricostruzione con le GAN presuppone che la foto in bassa risoluzione, o anche sfocata in tal caso, produca un’immagine ricreata in alta risoluzione che, nella sua versione in bassa risoluzione, sia simile a quella originale, proprio come si vede in questo esempio tratto dalla GAN Pulse. Chiaramente una persona ricostruita non sarà la stessa di prima, bensì risulterà essere del tutto diversa, inoltre i pixel che servono a restaurare la foto sono inventati secondo un criterio preciso. Ciò, invece, porta anche a dei risultati che non hanno nulla a che fare con i tratti somatici dell’individuo ritratto in origine.
La soluzione di Tencent non si è limitata soltanto a questo, ma ha anche aggiunto il GFP che agisce prima del lavoro svolto dalla GAN. Parliamo di un modello che con una foto originale compie un restauro intermedio in modo tale da dare alla GAN un’immagine che sia più facile da interpretare, oltretutto la verifica finale della foto tiene conto dell’esame di caratteristiche fondamentali del viso come gli occhi e la bocca.
Comunque sia, il modello GFP-GAN ha ancora dei punti deboli sulla nitidezza delle immagini, tant’è che ci possono essere ancora delle diversità non indifferenti nell’identità finale. Pare che allo stato attuale i risultati migliori si ottengano sulle immagini con volti in primo piano e che la nitidezza migliore interessi più di ogni altra cosa i tratti somatici.