查看“WikiEdge:ArXiv速递/2025-05-12”的源代码
←
WikiEdge:ArXiv速递/2025-05-12
跳转到导航
跳转到搜索
因为以下原因,您没有权限编辑该页面:
您请求的操作仅限属于该用户组的用户执行:
用户
您可以查看和复制此页面的源代码。
== 摘要 == * '''原文标题''':Step1X-3D: Towards High-Fidelity and Controllable Generation of Textured 3D Assets * '''中文标题''':Step1X-3D:面向高保真与可控纹理3D资产生成的框架 * '''发布日期''':2025-05-12 16:56:30+00:00 * '''作者''':Weiyu Li, Xuanyang Zhang, Zheng Sun, Di Qi, Hao Li, Wei Cheng, Weiwei Cai, Shihao Wu, Jiarui Liu, Zihao Wang, Xiao Chen, Feipeng Tian, Jianxiong Pan, Zeming Li, Gang Yu, Xiangyu Zhang, Daxin Jiang, Ping Tan * '''分类''':cs.CV *'''原文链接''':http://arxiv.org/abs/2505.07747v1 '''中文摘要''':摘要:尽管[[生成式人工智能]]在[[文本]]、[[图像]]、[[音频]]和[[视频]]领域取得了显著进展,但由于[[数据稀缺]]、[[算法限制]]和[[生态系统碎片化]]等根本性挑战,[[3D生成]]领域仍相对欠发达。为此,我们提出了[[Step1X-3D]]这一开放框架,通过以下方式应对这些挑战:(1) 严格的[[数据筛选]]流程处理超过500万个资产,创建包含200万个高质量资产的数据集,具有标准化的[[几何]]和[[纹理]]属性;(2) 采用两阶段原生[[3D架构]],将混合[[VAE]]-[[DiT]][[几何生成器]]与基于[[扩散模型]]的[[纹理合成]]模块相结合;(3) 完整开源[[模型]]、[[训练代码]]和[[适配模块]]。在几何生成方面,混合[[VAE]]-[[DiT]]组件通过采用基于[[感知器]]的[[潜在编码]]和[[锐利边缘采样]]来保持细节,生成[[TSDF]]表示。基于[[扩散模型]]的[[纹理合成]]模块则通过[[几何条件约束]]和[[潜在空间同步]]确保跨视图一致性。[[基准测试]]结果表明,该框架性能达到[[最先进水平]],超越现有开源方法,同时与[[专有解决方案]]的质量相当。值得注意的是,该框架独特地桥接了[[2D]]和[[3D生成]]范式,支持将[[2D控制技术]](如[[LoRA]])直接迁移到[[3D合成]]中。通过同步提升[[数据质量]]、[[算法保真度]]和[[可复现性]],[[Step1X-3D]]旨在为可控[[3D资产]]生成的开放研究树立新标准。
返回
WikiEdge:ArXiv速递/2025-05-12
。
导航菜单
个人工具
创建账号
登录
命名空间
项目页面
讨论
不转换
不转换
简体
繁體
大陆简体
香港繁體
澳門繁體
大马简体
新加坡简体
臺灣正體
查看
阅读
查看源代码
查看历史
更多
搜索
导航
首页
最近更改
随机页面
MediaWiki帮助
工具
链入页面
相关更改
特殊页面
页面信息