Openai rivela Dall-E 3, un generatore di immagini basato su Chatgpt, Dall-E 3: Fusion tra Chatgpt e la generazione di immagini che scuoteranno Midjourney
Dall-E 3: La fusione tra Chatgpt e la generazione di immagini che scuoteranno Midjourney
Contents
- 1 Dall-E 3: La fusione tra Chatgpt e la generazione di immagini che scuoteranno Midjourney
- 1.1 Openai rivela Dall-E 3, un generatore di immagini basato su Chatgpt
- 1.2 CHATGPT mobilitato per la composizione di richiesta
- 1.3 Proteggere i personaggi pubblici
- 1.4 Rispetta la proprietà intellettuale
- 1.5 Dall-E 3: La fusione tra Chatgpt e la generazione di immagini che scuoteranno Midjourney
- 1.6 A cui hanno generato le immagini ?
- 1.7 Bing Cat ha anche diritto a Dall-E 3
Integrando Dall-E su Chatgpt, Openi rafforza la sua posizione di leader nel mondo dell’IA generativa. Chatgpt e Dall-e 3, insieme, promettono di respingere i confini di AI.
Openai rivela Dall-E 3, un generatore di immagini basato su Chatgpt
L’ultima versione del modello si basa su GPT per facilitare la creazione di immagini complesse e coerenti.
Openi, la società dietro il GPT essenziale, ha appena rivelato il suo ultimo modello generativo fino ad oggi. E questa volta, è di nuovo l’immagine che è sotto i riflettori; Le truppe di Sam Altman hanno rivelato la terza versione del generatore di immagini Dall-E. Promette Più tonalità, dettagli e complessità.
Il primo punto evidenziato da Openi è l’accuratezza di richiesta. Anche i migliori generatori del momento, come Midjourney o Dreamstudio, soffrono di un problema comune: hanno tendenza a ignorare alcune parole della richiesta testuale.
Per ottenere i migliori risultati, è quindi necessario Impara empiricamente a comunicare con l’algoritmo. Ciò implica fare molti test sul vocabolario e si svolge per trovare coloro che hanno maggiori probabilità di essere interpretati correttamente. Questo è un esercizio che può essere delicato quando l’utente attende un risultato molto specifico, da cui il termine ” ingegneria rapida »».
CHATGPT mobilitato per la composizione di richiesta
Con Dall-E 3, Openi vuole porre fine a questo stato di cose. “” I moderni sistemi di testo a immagine tendono a ignorare parole o descrizioni, che costituiscono l’utente per apprendere il prompt prominiddetto. Dall-E 3 rappresenta un grande passo avanti nella nostra capacità di generare immagini che aderiscono esattamente al testo fornito “Indica l’azienda.
E per fare questo, l’azienda ha già lo strumento perfetto: Chatgpt. La nuova versione del modello di diffusione 3 è ” Costruito nativo »Intorno al chatbot. Ora funge da intermediario per Interpretare ogni dettaglio della richiesta. Il modello di lingua può anche aiutare l’utente a generare richiesta estremamente dettagliato in modo che Dall-e capisca esattamente cosa ci si aspetta da lui senza usare tecniche di ingegneria rapida Avanzate.
E se il risultato iniziale non è adatto, non lo fa. Basta andare di nuovo da Chatgpt per rivendicare cambiamenti precisi in termini di colore, forma, stile, un dettaglio particolare … in altre parole, Openai ha messo i piccoli piatti in quelli più grandi per offrire un grado di controllo massimo con Un minimo di sforzo e competenza tecnica.
Negli esempi proposti da Openi, si noti anche che Dall-E 3 è in grado di generare testi coerenti. Questo è qualcosa che i generatori di immagini hanno avuto molti problemi a fare finora. Ad esempio, l’ultima versione di Midjourney produce sempre abbastanza … risultati esotici quando viene chiesto di impegnarsi in questo esercizio.
Proteggere i personaggi pubblici
La società ha ancora imposto una serie di limiti su questa terza versione. Ad esempio, gli ingegneri hanno consolidato le garanzie già presenti su Dall-E e Dall-E 2 che impediscono all’utente di generare contenuto ” violento, adulto o odioso »».
Inoltre, Dall-E 3 è progettato per rifiutare le richieste che menzionano esplicitamente un personaggio pubblico. L’obiettivo è impedire che venga utilizzato a scopo di propaganda o di disinformazione.
Rispetta la proprietà intellettuale
L’altro punto importante di questo aggiornamento è che Optai sembra aver preso atto delle numerose critiche che sono state affrontate ai vari generatori di immagini sulla proprietà intellettuale. Dall-e va rifiuta le richieste che gli chiedono di imitare lo stile di un artista vivente. Questo dovrebbe chiudere la porta a numerosi tentativi contraffatti.
D’altra parte, questo sistema di protezione sarà sicuramente imperfetto. La precisione di questa terza versione è una spada a doppio taglio. In teoria, un utente sufficientemente percettivo può sempre ottenere un risultato abbastanza vicino. Dovrai solo essere in grado di descrivere lo stile dell’artista mirato in modo molto preciso senza esplicitamente nome.
Openi offre anche due soluzioni che consentono un artista di rifiuta che il suo lavoro sia usato per allenare Dall-e. Il primo è compilare il modulo a questo indirizzo. Ma se stai cercando di proteggere un gran numero, come quelli che tieni sul tuo portafoglio online, l’ideale è vietare l’accesso al crawler Gptbot. Per fare questo, basta seguire le istruzioni disponibili su questo indirizzo.
Ciò limiterà notevolmente la capacità di Dall-E 3 di imitare le opere in questione. Almeno, se non sono già stati passati alla bobina. Ed è purtroppo impossibile determinare in pratica, poiché i dati di origine non sono mantenuti dopo essere stati integrati nel modello.
Dall-E3 sarà lanciato ufficialmente il prossimo ottobre per i clienti di Chatgpt Plus e Chatgpt Entreprise Offerte.
Dall-E 3: La fusione tra Chatgpt e la generazione di immagini che scuoteranno Midjourney
Openi, la società madre della madre, non deve più essere presentata. Dopo averci offerto Chatgpt, ora annuncia la capacità di quest’ultimo di generare immagini precise, grazie alla fusione di Dall-e e Chatgpt in Dall-E.
Frandroid, Per coloro che seguono, usa uno strumento di generazione di immagini: Midjourney. Se questo strumento si è rivelato essere potente e innovativo nel mondo della generazione di immagini, anche Dall-e di Openai era in pista, con un corso altrettanto impressionante. E il nuovo opus Rischio Dall-E 3 Bene per cambiare la situazione.
Secondo le dimostrazioni condivise da Openai, è chiaro che Dall-E 3 si distingue dai suoi predecessori e concorrenti. Laddove Midjourney eccelle nella restituzione fotorealistica, ma richiede ancora molte manipolazioni, Dall-E 3 promette una generazione di immagini molto più efficiente e meno errata. Un’impresa notevole, soprattutto considerando il fatto che questo è un grande anticipo rispetto a Dall-E.
Inoltre, questo nuovo strumento sembra aver sviluppato una competenza specifica per gestire il testo nelle immagini, superando le capacità di alcuni dei suoi concorrenti come la diffusione stabile XL e Deepfloyd. In particolare, Openi evidenzia la sua capacità di produrre immagini convincenti di lettere, figure e persino mani umane (una vera difficoltà per questi strumenti).
Dall-E 3 // Fonte: Openai
Dall-E 3 // Fonte: Openai
Dall-E 3 // Fonte: Openai
Dall-E 3 // Fonte: Openai
Dall-E 3 // Fonte: Openai
Dall-E 3 // Fonte: Openai
Dall-E 3 // Fonte: Openai
Dall-E 3 // Fonte: Openai
Integrando Dall-E su Chatgpt, Openi rafforza la sua posizione di leader nel mondo dell’IA generativa. Chatgpt e Dall-e 3, insieme, promettono di respingere i confini di AI.
I chatbot non saranno solo in grado di conversare in modo quasi umano, ma anche a immaginare e creare immagini da semplici descrizioni. Non vediamo l’ora di testare.
Se vuoi testare Dall-E 3, sarà disponibile per gli utenti di Chatgpt Plus e Enterprise. Il che è molto più facile da usare di Midjourney … dove hai bisogno di un cliente discord.
A cui hanno generato le immagini ?
La questione del copyright collegato alle immagini generate dall’IA è attualmente un argomento caldo. I regolamenti attuali suggeriscono che le immagini IA stanno entrando nel dominio pubblico. Tuttavia, Openi dichiara chiaramente che la proprietà delle immagini prodotte da Dall-E 3 ritorna ai loro creatori. E questo è un altro dibattito nel settore.
Bing Cat ha anche diritto a Dall-E 3
Questo giovedì 21 settembre, Microsoft ha tenuto una conferenza per annunciare il prossimo arrivo di Copilot, ma anche la nuova gamma Surface. Parallelamente, la società ha comunicato all’arrivo del modello Dall-E 3 in Bing Image Creator. Come promemoria, questo è lo strumento di creazione di immagini di chat bing. Secondo Microsoft, Bing Image Creator ” Comprende anche ciò che stai chiedendo, che ti consente di ottenere immagini più precise. »»
Microsoft dice anche che vai oltre aggiungendo ” Una filigrana digitale invisibile a tutte le immagini generate dall’IA in Bing, compresa l’ora e la data della loro creazione. “Difficile sapere quanto sarà potente questa filigrana, né come possiamo controllare la sua presenza o no, ma questo è un primo passo.
Per seguirci, ti invitiamo a scaricare la nostra applicazione Android e iOS. Puoi leggere i nostri articoli, file e guardare i nostri ultimi video di YouTube.