環(huán)球微動態(tài)丨研究人員嘗試用穩(wěn)定擴散方法壓縮圖像 結果竟然優(yōu)于JPEG

來源:cnBeta.COM

上周,瑞士軟件工程師 Matthias Bühlmann 發(fā)現(xiàn) —— 流行的圖像合成模型“Stable Diffusion”,可實現(xiàn)較現(xiàn)有的 JPEG 或 WebP 格式更高的位圖圖像壓縮比、且視覺偽影也更少。即便如此,Stable Diffusion 也不是那么完美。作為一種 AI 圖像合成模型,其通常根據(jù)文本描述(所謂的“提示”)而生成圖像。

訪問:


(資料圖片)

Parallels Desktop 18 今年首次促銷:限時75折

用鋸齒彩塊來描繪的圖像壓縮概念(via ArsTechnica)

AI 模型通過研究從互聯(lián)網上提取的數(shù)百萬張圖像來學習這種能力,在訓練過程中,模型在圖像和相關詞之間建立了統(tǒng)計關聯(lián)。

然后對每張圖像的關鍵信息添加更小的“表示”和賦予“權重”,后者代表了 AI 圖像模型所掌握的數(shù)學值。

當穩(wěn)定擴散分析、并將圖像“壓縮”為權重形式時,它們就處在了所謂的“潛在空間”中 —— 它們以一種模糊潛力的形式存在,且能夠在解碼時于圖像中復現(xiàn)。

這項研究中用到的 Stable Diffusion 1.4,其權重文件大小約為 4GB —— 代表了該 AI 模型掌握的數(shù)億張圖像的知識。

使用穩(wěn)定擴散壓縮圖像的示例

盡管大多數(shù)人使用了帶文本提示的穩(wěn)定擴散,但 Bühlmann 還是斬斷了文本編碼器、而是強制通過穩(wěn)定擴散圖像編碼器來處理。

該過程將低精度的 512×512 圖像、轉換為更高精度的 64×64 潛在圖像空間表示。此時圖像存在的數(shù)據(jù)量較原始文件小得多,但仍可將之解碼擴展回 512×512 圖像、并獲得相當良好的結果。

測試期間,Bühlmann 發(fā)現(xiàn)使用穩(wěn)定擴散壓縮的新圖像,可在更高的壓縮比(更小的文件大小)下,主觀上看起來較 JPEG 或 WebP 更佳。

以這張美洲鴕的照片為例,其原始文件大小為 768 KB 。盡管 JPEG / WebP 格式分別可壓縮到 5.68 和 5.71 KB,但穩(wěn)定擴散方法可進一步壓縮到 4.98 KB 。

與對照的圖像壓縮格式相比,穩(wěn)定擴散似乎具有更多可分辨的細節(jié)、以及明顯更少的壓縮偽影。

不過 Bühlmann 也指出了現(xiàn)階段的一個很大局限性 —— 它不太適合面容或文本,且在某些情況下會讓解碼圖像中的細節(jié)特征產生“幻象”。

這些特征可能在源圖像中并不存在,更別提解碼需要動用高達 4GB 的穩(wěn)定擴散權重文件、以及額外的解碼時間。

即便如此,這種非常規(guī)穩(wěn)定擴散用例,還是較實際的解決方案更加有趣,甚至有望開辟圖像合成模型的未來新用途。

感興趣的朋友,可移步至 Google Colab 查看 Bühlmann 的示例代碼,或在有關 Towards AI 的帖子中找到實驗中的更多技術細節(jié)。

關鍵詞: 人工智能 研究人員嘗試用穩(wěn)定擴散方法壓縮圖像

推薦

直播更多》

關閉

資訊更多》

焦點

中文日韩亚洲欧美制服| 亚洲一区无码中文字幕| 国产av无码专区亚洲av桃花庵 | 亚洲一区在线视频| 亚洲综合网美国十次| 久久精品国产亚洲av麻豆| 亚洲国产精品无码专区在线观看| 国产亚洲情侣一区二区无码AV| vvvv99日韩精品亚洲| 无码专区一va亚洲v专区在线| 国产精品亚洲精品爽爽| 亚洲av无码成人精品国产| 亚洲JIZZJIZZ妇女| www亚洲精品久久久乳| 亚洲AV无码AV吞精久久| 国产亚洲欧美在线观看| 国产成人亚洲午夜电影| 亚洲不卡AV影片在线播放| 亚洲?V乱码久久精品蜜桃| 亚洲av无码不卡私人影院| 亚洲国产av无码精品| 久久精品国产亚洲精品| 国产亚洲精品成人AA片新蒲金| 亚洲综合AV在线在线播放| 亚洲人成伊人成综合网久久久 | 91亚洲性爱在线视频| 亚洲欧洲精品久久| 亚洲精品亚洲人成在线播放| 亚洲成A人片在线播放器| 亚洲欧美日韩久久精品| 爱爱帝国亚洲一区二区三区| 亚洲国产精品不卡毛片a在线| 亚洲一区日韩高清中文字幕亚洲| 国产成人综合亚洲亚洲国产第一页 | 777亚洲精品乱码久久久久久| 亚洲精品**中文毛片| 在线综合亚洲中文精品| 亚洲精品无码不卡在线播放| 一区二区三区亚洲视频| 久久伊人亚洲AV无码网站| 亚洲国产精品嫩草影院在线观看|