Google esitteli Imagen-hermoverkon
Miscellanea / / May 24, 2022
Ja se tekee sen vähintään yhtä hyvin kuin DALL-E 2.
Google ilmoitti Imagen on hermoverkko, joka muuntaa tekstikyselyn kuviksi. Se on suora kilpailija DALL-E2 OpenAI: sta - joka toimii jopa paremmin joissakin skenaarioissa.
Tekstikyselyn tunnistamiseen hermoverkko käyttää suuria kielimalleja - niihin perustuvat myös luonnolliset puheenkäsittelyalgoritmit, kuten GPT-3.
Järjestelmä toimii kolmessa vaiheessa. Ensimmäinen piirtää pienen 64 x 64 pikselin kuvan, jota jalostetaan, kunnes hermoverkko pystyy muuttamaan sen vastaamaan paremmin alkuperäistä pyyntöä. Kuva skaalataan sitten 256 x 256 pikseliin ja Imagen tarkentaa yksityiskohtia. Kolmannessa vaiheessa sama toistetaan jo lopullisen koon - 1024 x 1024 pikselin - kankaalle.
Tutkimuksen tekstissä todetaan, että Imagen selviytyy monimutkaisista kyselyistä paremmin kuin DALL-E 2. Esimerkiksi haulle "Panda tekee latte art" DALL-E 2 palautti yksinomaan latte art pandoilla, kun taas Googlen hermoverkko onnistui tuottamaan enimmäkseen oikeita tuloksia:
Mutta Google myöntää myös, että mikään näistä hermoverkoista ei pystyisi käsittelemään kyselyä "ratsastusastronautti": molemmat laittavat itsepäisesti astronautin hevosen selkään, eivätkä päinvastoin. Molemmilla on selvästi tilaa kasvaa.
Riippumattomien katsojien arviointitulokset osoittavat, että Imagen ylittää DALL-E 2:n tarkkuuden ja osuvuuden suhteen. Ja vaikka tätä vertailua voidaan pitää subjektiivisena, tällaiset tulokset ovat silti vaikuttavia, kun otetaan huomioon DALL-E 2 on toistaiseksi ollut saavuttamaton ihanne, jota muut samankaltaiset hermoverkot eivät pystyneet vastaamaan. määränpäähän.
Joka tapauksessa Imagen on toistaiseksi kokeellinen projekti, johon tavalliset käyttäjät eivät pääse käsiksi. Ei ole selvää, kuinka kauan kestää, ennen kuin Google luo sen pohjalta avoimen pääsyn palvelun.
Lue myös🧐
- Uusi hermoverkko Paint Transformer muuttaa valokuvan maalausobjektiksi
- Tulevaisuuden polaroid: NVIDIA: n uusi hermoverkko muuttaa 2D-kuvat 3D-malleiksi
- Sber lanseerasi ruDALL-E-hermoverkon, joka luo kuvauksen mukaisia kuvia
Viikon paras tarjous: alennukset AliExpressistä, Lamodasta, Mixitistä ja muista myymälöistä