Index
Te midde van die bommas tendens van die anime-stylfoto's het jy dalk gewonder: hoe werk die Klets GPT maak beelde in die styl van Studio Ghibli? Hy kon nie voorheen nie? Wel ... dit blyk dat die nuwe generatiewe beeldvermoë van OpenAI Dit is regtig nuut en het alles te doen met 'n groot verandering in hoe die maatskappy se kunsmatige intelligensie-model werk. Verstaan in hierdie teks hoe die Klets GPT daarin geslaag om die kuns van te herhaal Studio Ghibli en die belangrikste verskille in vergelyking met ander modelle.
Hoe skep ChatGPT Ghibli-styl beelde?
Om te verstaan hoe die Klets GPT begin om beelde te genereer soos dié wat in geskep is tendens do Studio Ghibli, is dit nodig om te weet wat die belangrikste veranderinge teweeggebring word deur OpenAI in die model GPT-4o, lees hieronder.
Wat het verander in die GPT-4o-model?
Die generering van beelde in die GPT-4o is gebaseer op argitektuur Transformator, wat patrone ontleed en teksbeskrywings met visuele elemente assosieer. Anders as "diffusiemodelle", wat met 'n ewekansige beeld begin en dit progressief verfyn, is die GPT-4o neem 'n outoregressiewe metode aan en bou die beeld in opeenvolgende stappe, wat visuele samehang en getrouheid aan die verlangde styl verbeter.
Soos die akkuraatheid en weergawe van teks binne beelde verbeter, en die vermoë om gedetailleerde aanwysings te verstaan en te volg verbeter, Klets GPT het sy vermoë vergroot om die aantal afsonderlike voorwerpe in 'n enkele toneel te bestuur (tot 20, in vergelyking met voorheen tussen 5 en 8 voorwerpe) en kan die korrekte verhoudings tussen hulle handhaaf.
In vergelyking met vorige modelle soos die DALL-E3, wat gebruik pyplyne (stel van stappe of prosesse) apart vir verskillende tipes media, die GPT-4o neem 'n verenigde benadering aan, wat vinniger reaksies en beelde moontlik maak wat meer ooreenstem met tekstuele opdragte, wat die behoefte aan veelvuldige intermediêre prosesse uitskakel. Dit beteken dat die model die nuanses van opdragte wat deur gebruikers verskaf word beter kan interpreteer, om te verseker dat die visuele uitvoer meer in lyn is met die oorspronklike bedoeling.
Al hierdie krag kom met 'n omstrede probleem: met 'n groter vraag na grafiese verwerking as gevolg van die ontploffing van mode op die internet, OpenAI wat nodig is om die bruikbaarheid van die instrument vir 'n paar dae te beperk, veral vir gratis gebruikers van Klets GPT, want hulle GPU's was “gesmelt”, volgens die maatskappy se uitvoerende hoof, Sam Altman. Ten spyte van die ongerief, is die generering van gevorderde beelde reeds deur die maatskappy vrygestel vir gebruikers van die gratis plan, soos aangekondig deur die uitvoerende hoof.
Hoe maak die opdatering Ghibli-styl beelde moontlik?
Maar wat beteken dit alles vir KI se vermoë om die estetika van vas te vang Studio Ghibli? Dit blyk dat met die nuwe opdatering, die GPT-4o Dit begin stylpatrone beter verstaan, uit massiewe voorbeelde van beelde, en leer om hierdie eienskappe te herhaal op grond van opdragte wat deur die gebruiker verskaf word.
Alhoewel die OpenAI het nie uitdruklik vermeld of hul opleidingdatastel spesifieke kunswerke insluit nie Studio GhibliSoos Chihiro se reis ou Die Seun en die Kraanvoël – oor 'n gaping wat die reproduksie van ateljeestyle van dié van lewende kunstenaars onderskei – die model se vaardigheid in die replisering van die ateljee-estetika dui sterk daarop dat hy aan 'n groot aantal voorbeelde van die films en verwante style blootgestel is.
Deur hierdie uitstalling het die GPT-4o leer die belangrikste visuele kenmerke wat die styl van definieer Studio Ghibli, insluitend: die gevoel van handgetekende animasie, wat dikwels aan tradisionele papieranimasie herinner; agtergronde wat 'n gevoel van verwondering en rustigheid oproep; ekspressiewe karakters wat tipies groot, emosionele oë vertoon; 'n sagte, natuurlike kleurpalet oorheers deur pastel, sagte skakerings; gedetailleerde omgewings wat dikwels fantasie-elemente met realisme meng
Daarbenewens het die GPT-4o Dit kan ook beelde as insette verwerk, wat gebruikers in staat stel om bestaande beeldmateriaal te transformeer of as 'n basis te gebruik om nuwe inhoud te genereer. Op hierdie manier hoef gebruikers nie al die besonderhede te sê oor die artistieke styl wat hulle wil reproduseer nie, maar hoef gebruikers ook nie hulself of die foto wat hulle wil herskep te beskryf nie, eenvoudig 'n foto in die klets in te voeg en die KI te vra om dit met die animasiestyl te reproduseer – soos jy kan sien in ons artikel oor Hoe om Ghibli-stylprente met ChatGPT te maak, met vinnige wenke.
Kan ander AI's Studio Ghibli se styl weergee?
Skep nuwe beelde met behulp van chatbots is nie 'n onlangse nuwigheid, maar die kapasiteit bereik deur die opdatering van die Klets GPT in die ontleding en weergee van die besonderhede wat deur die prompt voorgestel word, vervang hulle die KI OpenAI voor sy vernaamste mededingers, soos Tweeling, doen Google, GrokVan XAi e medevlieënierVan Microsoft, in terme van beeldgenerering.
Sien die verskil tussen dieselfde beeld omskep in 'n tekening met 'n lyn geïnspireer deur Studio Ghibli volg dieselfde opdrag:
Crie uma imagem, inspirada nessa foto, com base no estilo do Studio Ghibli
Benewens die beter vaslegging van die besonderhede van die oorspronklike beeld, is een van die grootste vooruitgang in generatiewe beeldvorming GPT-4o Dit is duidelik in die vermoë om die logo en letters op die hemp weer te gee, wat baie moeilik is in ander modelle.
Terwyl die Grok slaag op 'n manier daarin om kenmerke van die styl van te herskep Studio Ghibli, al ly dit aan die detail van die beeld, die Tweeling gaan heeltemal teen die grein, wat lei tot generiese kuns. Dit is die moeite werd om te onthou dat die Google belê reeds in 'n opdatering van die generatiewe beelde van Tweeling, wat die skepping van komplekse beelde en fotoredigering moontlik maak – gereedskap wat kan deur AI Studio getoets word. Die medevlieënierVan Microsoft, het versuim om op die versoek te reageer.
Het jy reeds die instrument getoets om die Studio Ghibli-tendens? Vertel ons in die kommentaar.
Kyk ook
Teks hersien deur Alexandre Marques op 01/04/2025.
Bronne: Die Times of India, Hindustan Times, Ekonomiese tye
Ontdek meer oor Showmetech
Teken in om ons jongste nuus per e-pos te ontvang.