WikiEdge:ArXiv-2409.02919/terms

来自WikiEdge

< WikiEdge:ArXiv-2409.02919

跳转到导航跳转到搜索

这篇文章的术语表如下：

高分辨率图像生成（High-Resolution Image Generation）：指使用预训练扩散模型生成具有高像素密度的图像的过程。
分层提示（Hierarchical Prompts）：一种在图像生成过程中引入的方法，通过全局和局部提示同时提供指导，以增强图像的细节和结构质量。
MLLM（Multimodal Language-Imagery Model）：多模态语言图像模型，用于生成与图像内容相关的详细描述。
去噪扩散模型（Denoising Diffusion Model）：一种生成模型，通过逐步去除噪声来生成数据，通常用于图像合成。
频率分解（Noise Decomposition）：在图像生成过程中，将噪声分解为低频和高频空间成分，以便分别进行去噪处理。
Stable Diffusion（SD）：一种流行的文本到图像生成模型，特别适用于生成高分辨率图像。
潜在扩散模型（Latent Diffusion Model, LDM）：一种扩散模型，其生成过程发生在潜在空间中，用于生成高质量的图像。
超分辨率（Super-Resolution）：一种图像处理技术，用于提高图像的分辨率，使其看起来更清晰。
Frechet Inception Distance（FID）：一种评估生成图像质量的指标，通过比较生成图像和真实图像在特征空间中的分布差异来计算。
Kernel Inception Distance（KID）：另一种评估生成图像质量的指标，与FID类似，但使用不同的统计方法来计算分布差异。

取自“http://zh.wikiedge.org/index.php?title=WikiEdge:ArXiv-2409.02919/terms&oldid=972”