WikiEdge:ArXiv-2409.02919/questions

来自WikiEdge
跳转到导航 跳转到搜索
编辑

作者面对的领域研究问题是如何提高预训练扩散模型在生成更高分辨率图像时的性能,特别是在4K及以上分辨率时,解决对象重复结构伪影问题。具体问题包括:

    • 单一提示在多尺度生成中的不足:现有模型在进行高分辨率图像生成时,使用单一提示进行整体内容描述,导致在细节和局部结构生成上存在局限性。
    • 高分辨率图像生成中的模式重复问题:在多区域融合生成过程中,由于全局控制的整合,导致对象重复现象严重。
    • 结构失真问题:现有方法在进行局部细节生成时,无法准确保持全局结构的准确性,导致生成的图像在局部结构上出现错误。