L’intelligenza artificiale (IA) ossia l’intelligenza delle macchine cerca di simulare l’intelligenza umana attraverso i sistemi informatici. Può essere applicata a molte attività, come la visione artificiale, il riconoscimento vocale, la robotica e i videogames. È stata utilizzata per compiti semplici in alcuni settori, come l’automazione industriale e il data mining (l’estrazione di informazioni utili da grandi quantità di dati) e può anche essere integrata in dispositivi come smartphone o tablet.
Oggi molti strumenti grafici e artistici si basano sull’intelligenza artificiale e professionisti del settore e appassionati ne fanno uso per i loro progetti. Midjourney è uno di questi.

Che cos’è Midjourney?

Midjourney è una tecnologia basata sull’intelligenza artificiale in grado di creare immagini inedite a partire da descrizioni testuali così come altri programmi IA, come per esempio DALL-E di OpenAI o Imagen di Google. Questi sistemi informatici basati su IA sono stati “addestrati” ad elaborare miliardi di immagini e testi per restituire un risultato artistico.

Midjourney landscape
Un esempio di paesaggio futuristico elaborato da Midjourney.

Come accedo a MidJourney?

Le modalità per accedere al servizio di Midjourney sono due: attraverso l’applicazione web ufficiale oppure utilizzando il Midjourney Bot sul server Discord ufficiale. Entrambe raggiungibili dalla homepage del sito ufficiale, rispettivamente cliccando sul pulsante “Sign in” o “Join the beta”.
Grazie a quest’ultimo si potrà accedere al server Discord ufficiale di Midjourney dove sarà possibile usufruire di un periodo di prova gratuita quantificabile in base allo sforzo di calcolo che si richiede al sistema di Midjourney; si parla di circa 25 utilizzi del programma (jobs) intesi come l’invio del comando per la richiesta di creazione delle immagini, variazioni, ingrandimenti o richieste di alta definizione in termini di qualità delle immagini.
Al termine del periodo free-trial Midjourney invierà all’utente una comunicazione per chiedere se è interessato a sottoscrivere uno dei piani di abbonamento. Qui è possibile prendere visione delle informazioni ufficiali dei piani di abbonamento di Midjourney.

Come funziona Midjourney?

Il funzionamento di Midjourney è molto semplice: si descrive la scena che si vuole visualizzare attraverso del testo nell’apposito campo di input (preferibilmente in lingua inglese), si invia la richiesta a Midjourney e il sistema restituisce quattro immagini in una griglia 2×2, quattro interpretazioni dell’intelligenza artificiale di quello che si vuole far rappresentare alla macchina.

Griglia 2x2 di Midjourney
Griglia 2×2 di Midjourney. “Space Man in Mars’s forest”.

Per richiedere al sistema di creare delle immagini, dopo aver fatto l’accesso al server Discord di Midjourney, è necessario selezionare uno dei canali “#newbies” nell’elenco della colonna di sinistra della schermata. Apparirà così la sezione dedicata alla creazione delle immagini che si presenta come una comune chat di Discord, nella quale l’utente e altri utenti connessi in quel momento possono inviare il testo di input.
Nel campo di input, in basso, è necessario digitare un primo comando: “/imagine“, “immagina” in inglese. Subito dopo aver digitato il segno “/”, sopra al campo del testo, apparirà un elenco di comandi tra cui “imagine”; è possibile selezionarlo oppure continuare a digitare la parola per intero e schiacciare la barra spaziatrice su tastiera. In entrambi i casi verrà creato il campo del “prompt” nel quale si può aggiungere tutto ciò che si desidera venga generato dal bot.

Come dovrebbe essere la struttura base della richiesta all’interno del prompt? Dopo “/imagine prompt:” potremmo avere una prima parte facoltativa che richiama una o più immagini, perché oltre a lavorare sui testi Midjourney considera anche altre immagini di partenza, seguita dal testo descrittivo dell’immagine da creare ed infine la terza componente riguardante i parametri tecnici.

struttura del prompt in Midjourney

Non c’è da preoccuparsi troppo se questa formula può risultare tediosa, in realtà l’ intelligenza artificiale è in grado di dar vita a delle immagini anche con semplici indicazioni: il prompt dell’immagine qui sotto è “robot gigante a Londra”.

Midjourney - Robot gigante per le strade di Londra
Midjourney – Robot gigante per le strade di Londra

Ovviamente, più si è esaustivi con il prompt e maggiori saranno le possibilità di ricevere da parte del sistema una rappresentazione fedele di quello che si è immaginato.

Ad aiutare la comunità degli appassionati di Midjourney nella stesura del prompt perfetto ci hanno pensato diversi appassionati tra cui il creatore di un documento automatizzato che attraverso una schermata intuitiva permette all’utente di produrre un insieme di parole chiave e parametri tecnici completo senza alcuna fatica. Si tratta Prompter, un foglio di calcolo di Google condiviso dall’autore Shane McGeehan da copiare sul proprio account Google.

Una piccola precisazione: abbiamo provato Prompter, sembra sicuro e utile, sul sito dell’autore sono presenti tutte le informazioni, ma non scaricare niente se non sei sicuro, ci sono tante altre strade per scrivere un buon prompt!

Un’altra risorsa, presente sul web, che consente di compilare dei prompt molto efficaci è Promptomania. La sua peculiarità e anche il suo aspetto più interessante è l’ampia libreria di parametri tecnici ed artistici messi a disposizione e che, una volta selezionati, aggiornano mano a mano e in automatico il prompt da inserire in Midjourney.
Oltre alla possibilità di indicare immagini di riferimento e descrizioni testuali, si può infatti scegliere con un semplice click quale stile pittorico di un particolare artista del passato imitare, quale luce e quali colori usare per l’immagine, decidere il tipo di inquadratura agendo sulla camera ed aggiungere molti altri dettagli che influenzeranno profondamente il risultato dell’ elaborazione.
Una volta impostati tutti i valori il prompt è pronto per essere copiato ed utilizzato in Midjourney.

promptmania
La pagina di PromptMania dedicata a Midjournay.

Torniamo ai comandi di Midjourney Bot: oltre a “/imagine”, utile per inviare la richiesta di creazione dell’immagine, sono molto utili il comando “/info” per visualizzare i crediti o “jobs” non ancora utilizzati, il comando “/settings” per impostare i parametri di base che influenzeranno sia la resa qualitativa dell’immagine sia il consumo dei crediti e il comando “/help” che farà apparire un elenco di informazioni utili per approfondire la conoscenza del sistema. Anche gli altri comandi potrebbero risultare interessanti, conviene leggere almeno una volta la breve descrizione presente sotto ad ogni voce di comando.

Le impostazioni di Midjourney Bot. Visualizza la guida ufficiale.

Dopo aver inviato il testo di input, entro un minuto, la griglia delle quattro immagini 2×2 con le quattro proposte dell’intelligenza artificiale sarà visibile all’interno della chat Discord, assieme a quelle degli altri utenti connessi.
Sotto alla griglia 2×2, verranno visualizzate due file di pulsanti:
U1, U2, U3 e U4, nella riga superiore, si riferiscono rispettivamente all’upscaling (ingrandimento di circa 1024×1024 pixel + ulteriori dettagli) dell’immagine in alto a sinistra, in alto a destra, in basso a sinistra e in basso a destra.
V1, V2, V3 e V4, nella riga inferiore, sono i pulsanti per creare delle varianti simili per stile generale e composizione all’immagine scelta, sempre seguendo l’ordine di posizione così come avviene per “l’upscaling”.

Midjourney varianti immagine
Midjourney può elaborare delle varianti a partire da un’immagine scelta.

Midjourney al momento della stesura di questo articolo è in versione Beta, quindi rispetto alle informazioni presenti in questi paragrafi, considera che alcuni parametri inseribili nel prompt potrebbero risultare in disuso e che potrebbe essere aggiunta qualche nuova funzione al sistema IA, così come qualcuna potrebbe essere eliminata.

Come utilizzare Midjourney nel flusso di lavoro?

Imparare a conoscere molto bene le impostazioni e i comandi che il sistema informatico dell’IA mette a disposizione e studiare quali elementi, parole chiave e parametri funzionano meglio in un prompt, permette all’utente di realizzare immagini quasi perfette andando a mitigare non poco la natura “naïf” del sistema. Ma non è semplice. Nonostante le immagini prodotte dall’intelligenza artificiale sorprendano per la fantasia nella composizione e nei colori, per la quantità di dettagli in una singola illustrazione, per la capacità di simulare quasi alla perfezione lo stile di un pittore rinascimentale o più stili artistici contemporaneamente, allo stato attuale necessitano ancora dell’intervento umano per risultare complete. Purtroppo non è raro notare imperfezioni anatomiche nel caso siano presenti dei personaggi, elementi dissonanti in alcune aree dell’immagine e dettagli simili e ripetuti in molte creazioni.
Inoltre, nei casi di creazioni più vicine al realismo, è possibile riscontrare delle incoerenze nella fisica della luce, che si traducono in effetti randomici sui colori, sulle aree illuminate e su quelle in ombra.
Nonostante questo, Midjourney può essere utilizzato all’interno del flusso di lavoro di un’artista percorrendo almeno due strade:
◆ le creazioni di Midjourney come ispirazione per realizzare un nuovo elaborato, attraverso una qualsiasi altra tecnica;
◆ l’elaborazione del materiale creato con Midjourney per creare un progetto finito con il photobashing, ossia la tecnica di fondere fotografie, elementi di grafica 3D, digital painting e in questo caso anche le immagini proposte dall’intelligenza artificiale.

La creatività umana all’interno di Midjourney

L’intelligenza artificiale di Midjourney crea l’immagine per noi, allora qual è il nostro contributo artistico nella realizzazione dell’illustrazione?
Ritengo si trovi proprio nella comunicazione con l’intelligenza artificiale il contributo umano: nella capacità di sintetizzare chiaramente e in parole chiave un concetto ancora inespresso visivamente. Solo comprendendo il funzionamento del sistema informatico si potrà quindi dialogare efficacemente con l’intelligenza artificiale e, in fase di input, guidare il programma nella realizzazione di un’immagine.

Midjourney futuristic landscape
Midjourney – Un cielo ad acquarello in mix con delle costruzioni fotografiche.

Midjourney penalizza gli artisti?

Tutt’altro, l’intelligenza artificiale applicata all’arte è uno strumento molto potente che può aiutare l’artista proponendo molteplici suggestioni utili a dare ispirazione, aggiungere varietà stilistica al lavoro e fornire velocemente diverse varianti del medesimo concept.

Midjourney - Automobile Steam Punk
Midjourney – Automobile Steampunk in stile vecchio documento.

Probabilmente, nei prossimi anni, l’intelligenza artificiale compirà passi da gigante in tutti i settori e in quello artistico produrrà immagini di qualità sempre maggiore nella resa stilistica, nella complessità dei dettagli e nella coerenza concettuale. È possibile che in futuro diverse persone faranno uso di IA come Midjourney per ottenere delle immagini per i propri progetti, anche chi sino ad oggi, si sarebbe rivolto ad un professionista artistico perché non in grado di realizzare immagini in autonomia. Questa eventualità potrà certamente avere un qualche impatto sul lavoro di illustratori, disegnatori, fotografi e simili, diminuendo di fatto le opportunità professionali, ma opporsi alla tecnologia, sentendosi minacciati da questa non è la strada da percorrere. L’artista dovrebbe infatti imparare a conoscere le novità tecnologiche presenti nel suo tempo e decidere se trarne vantaggio o meno.

Midjourney - distopic landscape
Midjourney – La veduta di una città distopica

Se ci pensiamo bene, qualcosa di simile è accaduto con l’ampia diffusione dei computer e dei relativi programmi di grafica, digital painting ed elaborazione 3D: alcuni artisti hanno deciso di usufruire dei nuovi strumenti digitali per velocizzare il proprio flusso di lavoro e ottenere maggiore varietà nei propri elaborati, mentre altri hanno continuato e continuano ad utilizzare gli strumenti tradizionali.
Quindi chiediamoci: “L’artista digitale porta via il lavoro a quello tradizionale?” Si e no, la risposta dipende dalle tante variabili relative al singolo progetto: la richiesta di uno stile ben preciso, la preferenza per una tecnica rispetto ad un’altra, a volte può semplicemente colpire un certo segno espressivo, ecc…

La via da perseguire, per l’artista, è quella che permette di mostrare la propria personalità, la propria anima artistica, indipendentemente dagli strumenti utilizzati, siano questi digitali o tradizionali. Solo in questo modo è possibile distinguersi dagli altri e dalle macchine e quindi farsi notare professionalmente.

Questioni di Copyright

A chi appartengono le immagini create con Midjourney? È possibile vendere la creazione realizzata con l’ IA? I termini di servizio di Midjourney specificano che le immagini prodotte, pur riconoscendone la paternità all’autore, diventano di dominio pubblico nel caso di un account free. Nella chat di discord infatti sono presenti le immagini e i prompt di tutti gli utenti presenti e pertanto chiunque può utilizzare la creazione o il prompt di qualcun altro senza essere perseguibile legalmente, non è però possibile utilizzare l’opera per guadagnarci.

È solo in caso di account a pagamento che Midjourney concede il permesso di utilizzare la creazione per scopi commerciali e la possibilità di generare le immagini in uno spazio personale, in modalità privata, lontano dagli occhi degli altri utenti. Anche in questo caso, però, se qualcuno riutilizzasse la stessa opera, non sarebbe perseguibile legalmente, perché la normativa degli Stati Uniti riguardo i diritti d’autore non permette di richiedere il copyright per creazioni generate da IA. Recentemente lo U.S. Copyright Office ha respinto, ancora una volta, una richiesta di copyright per un’opera d’arte generata dall’intelligenza artificiale, perché ritiene che manchi la “paternità umana” necessaria per reclamare il copyright.

Qualora si utilizzasse una creazione di Midjourney per rielaborarla attraverso il photobashing, l’overpainting digitale o attraverso una tecnica tradizionale, verrebbe riconosciuto il diritto d’autore, a patto che “l’intervento post creazione” sia evidente, “pesante” e che permetta di far notare una differenza sostanziale con l’immagine originale.

In ogni caso, se si sceglie di destinare le immagini generate con l’IA a scopi commerciali, è sempre importante verificare che non siano presenti nella creazione altri materiali coperti da copyright; Midjourney utilizza infatti un sistema di intelligenza artificiale addestrato su set di dati pubblici molto grandi per produrre i suoi asset e, nonostante sia difficile che tali risorse possano essere involontariamente simili a materiali protetti da copyright o marchi di fabbrica, questo potrebbe comunque accadere.

sala comune castello immaginario
Midjourney – La sala comune di un castello immaginario

Conclusioni

Personalmente trovo molto affascinante la collaborazione tra l’intelligenza umana e quella artificiale, tra l’infinita immaginazione di un essere umano e il tentativo della macchina di risultare all’altezza della nostra fantasia attraverso l’elaborazione di una quantità immensa di dati.
Midjourney, così come le altre tecnologie simili di intelligenza artificiale in campo artistico, è uno strumento molto potente e utile per l’artista che può trarne vantaggio velocizzando e aggiungendo varietà al proprio lavoro. Questo non significa però che l’aspirante artista possa permettersi di farsi sostituire completamente dal lavoro automatico di una macchina pensando di poter evitare lo studio delle discipline fondamentali dell’arte e senza allenarsi con costanza nelle tante applicazioni artistiche tra cui scegliere. Le tecnologie cambiano nel tempo, possono migliorare o scomparire per far posto ad altro ed è quindi meglio avere solide basi artistiche, per non rimanere spiazzato.
Ma per chi non ha avuto modo di migliorare le proprie capacità artistiche o non sente alcuna necessità di essere un professionista dell’arte, per i non appassionati di applicazioni artistiche/IA o per i non artisti cosa offre Midjourney? Offre la sensazione gratificante di visualizzare sullo schermo, con poche parole digitalizzate, la propria immaginazione; offre ore di intrattenimento grazie alla sua peculiarità ludica “vediamo che succede se scrivo così?”. Semplicemente si offre di essere un’esperienza molto divertente!

Previous articleFestival del Disegno Fabriano