WikiEdge:ArXiv-2409.02919/terms
跳转到导航
跳转到搜索
这篇文章的术语表如下:
- 高分辨率图像生成(High-Resolution Image Generation):指使用预训练扩散模型生成具有高像素密度的图像的过程。
- 分层提示(Hierarchical Prompts):一种在图像生成过程中引入的方法,通过全局和局部提示同时提供指导,以增强图像的细节和结构质量。
- MLLM(Multimodal Language-Imagery Model):多模态语言图像模型,用于生成与图像内容相关的详细描述。
- 去噪扩散模型(Denoising Diffusion Model):一种生成模型,通过逐步去除噪声来生成数据,通常用于图像合成。
- 频率分解(Noise Decomposition):在图像生成过程中,将噪声分解为低频和高频空间成分,以便分别进行去噪处理。
- Stable Diffusion(SD):一种流行的文本到图像生成模型,特别适用于生成高分辨率图像。
- 潜在扩散模型(Latent Diffusion Model, LDM):一种扩散模型,其生成过程发生在潜在空间中,用于生成高质量的图像。
- 超分辨率(Super-Resolution):一种图像处理技术,用于提高图像的分辨率,使其看起来更清晰。
- Frechet Inception Distance(FID):一种评估生成图像质量的指标,通过比较生成图像和真实图像在特征空间中的分布差异来计算。
- Kernel Inception Distance(KID):另一种评估生成图像质量的指标,与FID类似,但使用不同的统计方法来计算分布差异。