WikiEdge:ArXiv-2409.02919/questions

出自WikiEdge

< WikiEdge:ArXiv-2409.02919

於 2024年9月5日 (四) 11:03 由 David（對話 | 貢獻）所做的修訂（Saved page by David）

(差異) ←上個修訂 | 最新修訂 (差異) | 下個修訂→ (差異)

跳至導覽跳至搜尋

作者面對的領域研究問題是如何提高預訓練擴散模型在生成更高解像度圖像時的性能，特別是在4K及以上解像度時，解決對象重複和結構偽影問題。具體問題包括：

- 單一提示在多尺度生成中的不足：現有模型在進行高解像度圖像生成時，使用單一提示進行整體內容描述，導致在細節和局部結構生成上存在局限性。
- 高解像度圖像生成中的模式重複問題：在多區域融合生成過程中，由於全局控制的整合，導致對象重複現象嚴重。
- 結構失真問題：現有方法在進行局部細節生成時，無法準確保持全局結構的準確性，導致生成的圖像在局部結構上出現錯誤。

取自 "http://zh.wikiedge.org/index.php?title=WikiEdge:ArXiv-2409.02919/questions&oldid=969"