圖像生成模型 —— 生成式 AI 的常用子集 —— 可以解析并理解書面語言,然后將文字轉(zhuǎn)換為幾乎任何風(fēng)格的圖像。
Black Forest Labs 的一系列新模型代表了圖像生成領(lǐng)域的前沿技術(shù) —— 現(xiàn)在可在 PC 和工作站上試用 —— 在 GeForce RTX 和 NVIDIA RTX GPU 上的運(yùn)行速度最快。
流暢的功能
FLUX.1 AI 是由 Black Forest Labs 開發(fā)的文本生成圖像模型套件。這些模型基于 Diffusion Transformer(DiT)體系架構(gòu)而構(gòu)建,以便大參數(shù)量的模型保持高效運(yùn)行。Flux 模型在擁有 120 億個(gè)參數(shù)的模型上進(jìn)行訓(xùn)練,以生成高質(zhì)量圖像。
DiT 模型屬于高效的計(jì)算密集型模型 —— NVIDIA RTX GPU 對(duì)于處理這些新模型至關(guān)重要,其中最大規(guī)模的模型如果不進(jìn)行重大調(diào)整,將無法在非 RTX GPU 上運(yùn)行。Flux 模型現(xiàn)在支持 NVIDIA TensorRT 軟件開發(fā)套件,該套件可將這些模型的性能提升高達(dá) 20%。用戶可以在 ComfyUI 中借助 TensorRT 試用 Flux 和其他模型。
Flux 的優(yōu)勢(shì)
FLUX.1 在生成高質(zhì)量、多樣化的圖像方面表現(xiàn)卓越,其出色的指令遵循性意味著 AI 能夠準(zhǔn)確理解并執(zhí)行指令。提示依從性較高,意味著生成的圖像與文本提示描述的元素、風(fēng)格和情緒高度匹配。提示依從性較低會(huì)導(dǎo)致圖像可能部分或完全偏離給定的指令。
FLUX.1 以能夠精確渲染人體解剖結(jié)構(gòu)(包括手部和人臉等具有挑戰(zhàn)性的復(fù)雜特征)而著稱。FLUX.1 還顯著改進(jìn)了在圖像中生成易讀文本的過程,解決了文本轉(zhuǎn)圖像模型的另一個(gè)常見挑戰(zhàn)。這使得 FLUX.1 模型非常適合需要精確文本表示的應(yīng)用,例如宣傳材料和書籍封面。
FLUX.AI 具有三種變體,可為用戶提供最適合其工作流的選擇,而不會(huì)犧牲質(zhì)量:
FLUX.1 pro:為企業(yè)用戶提供最高質(zhì)量的模型;可通過應(yīng)用編程接口訪問。
FLUX.1 dev:FLUX.1 pro 的免費(fèi)精華版本,仍然具有較高質(zhì)量。
FLUX.1 schnell:運(yùn)行速度最快的模型,非常適合本地開發(fā)和個(gè)人使用;具有寬松的 Apache 2.0 許可證。
dev 和 schnell 模型為開源版本,Black Forest Labs 在流行平臺(tái) Hugging Face 上提供對(duì)其關(guān)鍵功能的訪問。這一做法得到社區(qū)廣泛認(rèn)可。
得到社區(qū)廣泛認(rèn)可
自發(fā)布以來,F(xiàn)lux 模型的 dev 和 schnell 變體已在 Hugging Face 上被下載 200 多萬次。
FLUX.1 的強(qiáng)大功能受到用戶廣泛贊譽(yù),稱其能夠生成具有非凡細(xì)節(jié)和逼真度、視覺效果令人驚艷的圖像,并且可以處理復(fù)雜的提示,而無需調(diào)整大量參數(shù)。
此外,F(xiàn)LUX.1 還善于處理各種藝術(shù)風(fēng)格,并能夠快速高效地生成圖像,因此是完成個(gè)人和專業(yè)項(xiàng)目不可或缺的重要工具。