WikiEdge:ArXiv-2409.02919/terms
跳至導覽
跳至搜尋
這篇文章的術語表如下:
- 高分辨率圖像生成(High-Resolution Image Generation):指使用預訓練擴散模型生成具有高像素密度的圖像的過程。
- 分層提示(Hierarchical Prompts):一種在圖像生成過程中引入的方法,通過全局和局部提示同時提供指導,以增強圖像的細節和結構質量。
- MLLM(Multimodal Language-Imagery Model):多模態語言圖像模型,用於生成與圖像內容相關的詳細描述。
- 去噪擴散模型(Denoising Diffusion Model):一種生成模型,通過逐步去除噪聲來生成數據,通常用於圖像合成。
- 頻率分解(Noise Decomposition):在圖像生成過程中,將噪聲分解為低頻和高頻空間成分,以便分別進行去噪處理。
- Stable Diffusion(SD):一種流行的文本到圖像生成模型,特別適用於生成高分辨率圖像。
- 潛在擴散模型(Latent Diffusion Model, LDM):一種擴散模型,其生成過程發生在潛在空間中,用於生成高質量的圖像。
- 超分辨率(Super-Resolution):一種圖像處理技術,用於提高圖像的分辨率,使其看起來更清晰。
- Frechet Inception Distance(FID):一種評估生成圖像質量的指標,通過比較生成圖像和真實圖像在特徵空間中的分布差異來計算。
- Kernel Inception Distance(KID):另一種評估生成圖像質量的指標,與FID類似,但使用不同的統計方法來計算分布差異。