查看“WikiEdge:ArXiv-2409.02852v1/summary”的源代码
←
WikiEdge:ArXiv-2409.02852v1/summary
跳转到导航
跳转到搜索
因为以下原因,您没有权限编辑该页面:
您请求的操作仅限属于该用户组的用户执行:
用户
您可以查看和复制此页面的源代码。
<div style="float: right;">[{{fullurl:WikiEdge:ArXiv-2409.02852v1/summary|action=edit}} 编辑]</div> 这篇论文探讨了[[k-最小值草图]](KMV)的压缩极限。KMV数据草图算法存储由数据集中的项目生成的k个最小哈希键。研究表明,基于对键进行排序并编码连续差值的压缩方法可以在期望存储节省中为每个键提供O(log n)位,其中n是数据集中唯一值的数量。此外,论文还展示了对于任何形式的压缩,O(log n)期望每位节省是k个最小n个随机值的最佳选择——编码方法是编码KMV草图的所有方法中接近最优的。作者提出了一种实用的压缩方法,展示了其计算效率高,并证明了其在实践中的平均节省与基于熵的理论最小值相差约5%。验证了该方法优于现成的压缩方法,并使用真实和合成数据展示了其实用性。论文还讨论了大数据背景下草图压缩的重要性,以及KMV草图的灵活性和准确性。最后,论文总结了未来的研究方向,包括探索其他压缩方法和改进现有方法。
返回
WikiEdge:ArXiv-2409.02852v1/summary
。
导航菜单
个人工具
创建账号
登录
命名空间
项目页面
讨论
不转换
不转换
简体
繁體
大陆简体
香港繁體
澳門繁體
大马简体
新加坡简体
臺灣正體
查看
阅读
查看源代码
查看历史
更多
搜索
导航
首页
最近更改
随机页面
MediaWiki帮助
工具
链入页面
相关更改
特殊页面
页面信息