Il Papa e il Dalai Lama bevono il caffè...
Ciò che è vero da molto tempo, perché da tempo sei in grado di manipolare le immagini con Photoshop, diventa ancora più evidente con l'intelligenza artificiale: non fidarti di un'immagine che non hai falsificato tu stesso. Ecco perché va detto proprio qui all'inizio: tutte le immagini di questo notiziario sono state generate utilizzando l'intelligenza artificiale.
L'AI (Intelligenza Artificiale) o in tedesco KI (Intelligenza Artificiale) è sulla bocca di tutti. Sono stato preso dalla curiosità e ho portato qualcosa con me A metà viaggio esperimenti, uno degli strumenti principali per convertire la descrizione di un'immagine in una foto. Inserisci una descrizione dell'immagine quanto più dettagliata possibile in inglese e il sistema la utilizza per generare quattro varianti di un'immagine. A quanto pare la fonte sono cinque miliardi di foto che circolano su Internet. Al momento il tutto si trova ancora nel vuoto giuridico perché, ad eccezione di un fornitore, gli strumenti utilizzano immagini sulle quali non hanno alcun diritto d'uso. Questo non è (ancora) un problema per gli esperimenti, ma cosa succede se un'azienda o un marchio utilizza immagini generate dall'intelligenza artificiale in cui una o più immagini originali sono ancora chiaramente visibili? È solo questione di tempo prima che i tribunali debbano affrontare la questione se un'immagine generata dall'intelligenza artificiale sia un'opera completamente nuova o se debba essere pagato un canone agli autori delle foto utilizzate.
A seconda del soggetto, le immagini o almeno alcune parti di esse sembrano ancora molto artificiali. A volte non tutto è corretto, ad esempio osserva più da vicino le lancette nell'ultima immagine (clicca sull'immagine per una visualizzazione ingrandita e completa). Sono abbastanza sicuro che questo migliorerà in futuro e la mia conoscenza limitata della generazione di immagini AI probabilmente avrà anche un impatto sulla qualità dell'immagine.
Perché il Papa e il Dalai Lama?
Mi sono preso la libertà – e mi perdoni – di utilizzare il Papa e il Dalai Lama come punto di partenza per questo articolo. Volevo creare un'immagine che potesse esistere così. Questo mi è valso le critiche di un caro amico che stimo molto. Perché dice giustamente che questa immagine potrebbe diffondersi ulteriormente su Internet, e ad un certo punto l'immagine viene presa così fuori contesto che le persone non sanno più che si tratta di un'immagine generata dall'intelligenza artificiale. Ha suggerito di etichettare l'immagine come foto AI, ma sfortunatamente l'IA è molto capace di eliminare qualsiasi annotazione in un'immagine. Le ultime versioni di Adobe Photoshop mostrano quanto siano diventati spaventosi e affascinanti i programmi di editing delle immagini in questo settore. Un altro conoscente ha pensato che l'idea con i due leader spirituali fosse molto buona e ha suggerito di creare un'immagine simile con Putin e Zelenskyj - come contributo al processo di pace... Questo feedback mostra il grande pericolo di questa tecnologia. Nessuno sa più cosa è reale e cosa non lo è. Al momento, le immagini generate dall'intelligenza artificiale sembrano ancora un po' artificiali e qua e là, come accennato in precedenza, presentano piccoli errori. Pertanto, dopo un esame più attento, è spesso possibile determinare se l'immagine è una fotografia reale o un'immagine AI. Ma secondo me è solo questione di tempo prima che le immagini generate dall’intelligenza artificiale non possano più essere distinte da una fotografia originale.
Cosa comporta questo per noi come società?
Quando parlo con gli amici delle immagini generate dall'intelligenza artificiale o mostro loro come utilizzare l'intelligenza artificiale per generare foto, provo due emozioni: fascino e frustrazione. Affascinante perché è emozionante poter descrivere una scena a parole e l'intelligenza artificiale ne genera un'immagine. Il limite è il cielo (o la propria immaginazione): un detto banale che si rivela vero anche qui. Prendiamo le ali della tecnologia per volare sempre più in alto. Ma dopo averci pensato un po’, spesso con i miei interlocutori si verifica l’effetto Icaro: si scontrano. Quindi formulano frasi del tipo “Ora non posso più fidarmi di una foto”. I programmi di editing delle immagini hanno già ridotto notevolmente la convinzione che la foto sia un riflesso della realtà. E mi sembra che l'intelligenza artificiale distrugga completamente ciò che era rimasto di fede. In una società già sconvolta dagli eventi degli ultimi anni e dalla tesa situazione mondiale, questa nuova tecnologia aumenta ulteriormente l’incertezza. A causa dell’abuso di gruppi estremisti, anche i valori assoluti sono disapprovati, ma ora che tutto sta diventando relativo, sentiamo una perdita perché sembra non esserci più nulla a cui aggrapparsi. Forse è un po' drammatico, e le immagini basate sull'intelligenza artificiale sono forse solo un pezzo del mosaico in tutta questa rete di incertezza, ma mi sembra che questa generazione artificiale di immagini improvvisamente renda l'incertezza più tangibile e reale. Come società ci troviamo di fronte a sfide importanti e la tecnologia – che porta con sé anche molti aspetti positivi, che qui dovrebbero essere esplicitamente menzionati – non può certo essere fermata. Non dobbiamo perdere l’autenticità come persone e come società. Molto è stato e viene scritto su questo argomento, e ciò sfida ognuno di noi ad affrontare la questione dell’autenticità. È interessante notare che l’industria della fotografia ha visto arrivare questo sviluppo e ha lanciato un’entusiasmante iniziativa:
Credenziali del contenuto
Credenziali del contenuto è un'organizzazione che, a quanto ho capito, fornisce al file RAW nella fotocamera un codice che consente di riconoscere il file originale come originale non modificato. Ciò significa che puoi dimostrare in qualsiasi momento se un'immagine è stata manipolata o meno. In futuro, i fotografi avranno la possibilità di aggiungere il codice delle credenziali del contenuto alle loro immagini quando scattano le foto. La prima azienda a incorporare credenziali di contenuto in una fotocamera è Leica con la Leica M11P. Come funziona il tutto puoi scoprirlo qui.
I risultati del mio esperimento
Essendo una persona curiosa e aperta che lavora nella pubblicità e nella fotografia, questa tecnologia è sicuramente abbastanza importante da perseguire. L’arte sta nel formulare il cosiddetto “prompt”. "Prompt" è il nome della descrizione dell'immagine inserita. I miei primi tentativi con la generazione di immagini basata sull'intelligenza artificiale mi hanno mostrato che anche piccoli cambiamenti nel testo possono avere un grande impatto sull'immagine. Il "prompting" è una sorta di linguaggio di programmazione in cui descrivi le immagini. Il nocciolo della questione è che a volte hai un'immagine in testa e poi l'intelligenza artificiale genera qualcosa di completamente diverso. Puoi caricare le tue immagini come modello di stile su Midjourney, ma il mio primo test con un'immagine caricata ha mostrato che lo stile dell'immagine è stato adottato in una certa misura, ma per il resto non ho riconosciuto la mia foto nella versione generata dall'intelligenza artificiale ( il che sicuramente la questione del copyright è molto positiva per gli utenti...).
Ecco i primi risultati dei miei esperimenti con Midjourney:
Nessuna di queste immagini è reale. Sono tutti lavori che l'IA ha creato in base al mio input.
E un ringraziamento speciale a Christian Habermeier, che mi ha introdotto al mondo di metà viaggio.