WikiEdge:ArXiv-2409.02919/questions

出自WikiEdge
跳至導覽 跳至搜尋
編輯

作者面對的領域研究問題是如何提高預訓練擴散模型在生成更高解析度圖像時的性能,特別是在4K及以上解析度時,解決對象重複結構偽影問題。具體問題包括:

    • 單一提示在多尺度生成中的不足:現有模型在進行高解析度圖像生成時,使用單一提示進行整體內容描述,導致在細節和局部結構生成上存在局限性。
    • 高解析度圖像生成中的模式重複問題:在多區域融合生成過程中,由於全局控制的整合,導致對象重複現象嚴重。
    • 結構失真問題:現有方法在進行局部細節生成時,無法準確保持全局結構的準確性,導致生成的圖像在局部結構上出現錯誤。