2023-07-27 16:26:09來源:新智元
就在剛剛,Stability AI正式發(fā)布了下一代文生圖模型——SDXL 1.0。
要知道,SDXL 0.9也就才發(fā)布一個月拐點彎。
而據(jù)官博介紹,這次的1.0版本是StabilityAI的旗艦版生圖模型,也是最棒的開源生圖模型。
(資料圖片)
殺手小貓
cchahao
幽靈騎士
SDXL 1.0別的不說,生圖模型最重要的當(dāng)然就是生圖質(zhì)量。
從官博中統(tǒng)計的數(shù)據(jù)可以看出,和其它模型相對比,用戶更青睞1.0版本生成的圖像。
該結(jié)果來自StabilityAI在Discord上進行的這幾代Stable Diffusion模型的偏好測試。
可以看到,上圖中縱軸是偏好比例,橫軸則是各代SDXL或SD模型。一個月前的0.9版本偏好率是24.4%,低于1.0新版26.2%的偏好。
雖然差距沒那么明顯,但該說不說,新模型就得比老模型強。
StabilityAI表示,SDXL幾乎可以生成任何藝術(shù)風(fēng)格的高質(zhì)量圖像,是實現(xiàn)一頂一逼真效果的最佳模型。
它可以生成各具特色的圖像,而不需要模型賦予任何特定的感覺,這樣子才能確保風(fēng)格的絕對自由。
參數(shù)方面,SDXL 1.0在色彩的鮮艷度和準(zhǔn)確度方面做了很好的調(diào)整,對比度、光照和陰影都比SDXL 0.9更好,新版本生成的圖片全部采用原生的1024x1024分辨率。
此外,SDXL 還能生成圖像模型難以渲染的概念,如手和文字,還有各種物體的空間排列組合。
比如下面這四個圖片。
同時,除了圖片生成質(zhì)量的上調(diào),prompt的設(shè)定也變得更加方便。
現(xiàn)在,1.0版本的SDXL只需幾個字的prompt就可以生成出復(fù)雜、細(xì)致、美觀的圖像。
以往,用戶可能需要在prompt中加入「杰作」這類字眼,才能獲得滿意的高質(zhì)量圖像,現(xiàn)在不用了。
而且還有個小細(xì)節(jié)——prompt中細(xì)微的差別也能敏銳識別的。
比方說當(dāng)「The Red Square」大寫的時候,指的是景點「紅場」,小寫的「red square」,指的是紅色的正方形。
現(xiàn)在SDXL都可以一步到位的領(lǐng)會意思了。
最大的開放式圖像模型從模型的參數(shù)規(guī)模上看,SDXL 1.0是目前開放式圖像模型中參數(shù)數(shù)量最多的。
官方表示,這次采用的是全新的架構(gòu),基礎(chǔ)模型的參數(shù)規(guī)模達到35億,同時還有一個66億參數(shù)大小的細(xì)化模型。
完整模型由一個用于潛在擴散的專家混合管道組成:
第一步,基礎(chǔ)模型先生成(噪聲)潛變量。
第二步,用專門用于最終去噪步驟的細(xì)化模型對其進行進一步處理。這里要注意的是,基礎(chǔ)模型也可以作為獨立模塊使用。
這種兩階段的架構(gòu)可確保圖像生成的穩(wěn)健性,而不會影響速度或者使用過多的計算資源。
SDXL 1.0可以在配備 8GB VRAM 的消費級GPU上運行,也可以在就緒的云上運行。
有了SDXL 1.0,根據(jù)自定義數(shù)據(jù)對模型進行微調(diào)比以往此前的版本都要容易。
自定義LoRA或是檢查點的生成不需要太多的數(shù)據(jù)處理。Stability AI目前正在利用專門用于SDXL的T2I/ControlNet 來構(gòu)建下一代的特定任務(wù)結(jié)構(gòu)、樣式和組成控制。
官方表示,這些功能目前處于測試預(yù)覽階段。
其實從6月份開始,Stability AI一直在預(yù)覽SDXL 1.0的功能,還發(fā)布過一個僅用于研究的版本,目的就是展示該模型的全新功能。
官方表示,和之前的SDXL模型相比,SDXL 1.0的增強功能包括改進過后的圖像提煉過程,可以生成更鮮艷的色彩、光照和對比度。
SDXL 1.0還引入了微調(diào)功能,使用戶能夠輕松創(chuàng)建高度定制的圖像。
使用方法而想要使用最新的SDXL 1.0也非常簡單。
1. 在Clipdrop上體驗SDXL 1.0。
別忘了,下面還有很多風(fēng)格樣式可選。
2. 在Stability AI的GitHub頁面獲取SDXL 1.0的權(quán)重和相關(guān)源代碼。
3. 在Stability AI平臺上通過API使用SDXL 1.0。
4. 在AWS Sagemaker和AWS Bedrock上獲取SDXL 1.0。
5. 可以加入Stable Foundation Discord進行SDXL模型的實時測試。
6. DreamStudio也提供SDXL 1.0用于圖像生成。
關(guān)鍵詞:
就在剛剛,StabilityAI正式發(fā)布了下一代文生圖模型——SDXL1 0。要知道
「程序合成」或「代碼生成」任務(wù)的目標(biāo)是根據(jù)給定的描述生成可執(zhí)行代碼
HTML5可以在文檔中使用MathML元素,對應(yīng)的標(biāo)簽是 。MathML是數(shù)學(xué)標(biāo)記
以ChatGPT為代表的大型語言模型(LLM)在各項任務(wù)上的高效表現(xiàn)彰顯了其
什么是CloudReady?CloudReady是一個基于谷歌的ChromiumOS開源代碼倉庫
隨著ChatGPT風(fēng)靡全球,其開發(fā)商OpenAI就接連不斷地面臨著越來越多的質(zhì)
一、數(shù)據(jù)中心用電量十分驚人以愛爾蘭為例,過去幾年,愛爾蘭家庭的電力
射孔概念股有哪些?7月12日相關(guān)股票股價查詢,中海油服(601808):7月1
7月11日,安徽省六安市中級人民法院對安徽財經(jīng)大學(xué)黨委原常委、原副校
中國網(wǎng)財經(jīng)7月12日訊記者張增艷新疆火炬日前公告稱公司因收購國能燃?xì)?
“小朋友,沒有家長帶領(lǐng)不能獨自游泳哦!”7月10日下午6點,縣義工協(xié)會
人工智能正在革新數(shù)據(jù)轉(zhuǎn)換工具,提高效率、準(zhǔn)確性和實時處理。高效的數(shù)
問題定義為了獲取最近一年內(nèi)有訂單的用戶信息,可以使用以下的三種寫法
本文經(jīng)AI新媒體量子位(公眾號ID:QbitAI)授權(quán)轉(zhuǎn)載,轉(zhuǎn)載請聯(lián)系出處。C
1感知方案:純視覺VS多傳感器融合汽車實現(xiàn)自動駕駛首先需要能夠“看見