查看“WikiEdge:ArXiv-2409.02852v1/abs”的源代码
←
WikiEdge:ArXiv-2409.02852v1/abs
跳转到导航
跳转到搜索
因为以下原因,您没有权限编辑该页面:
您请求的操作仅限属于该用户组的用户执行:
用户
您可以查看和复制此页面的源代码。
<div style="float: right;">[{{fullurl:WikiEdge:ArXiv-2409.02852v1/abs|action=edit}} 编辑]</div> * '''标题''':Key Compression Limits for $k$-Minimum Value Sketches * '''中文标题''':$k$-最小值草图的密钥压缩极限 * '''发布日期''':2024-09-04T16:22:58+00:00 * '''作者''':Charlie Dickens, Eric Bax, Alexander Saydakov * '''分类''':cs.DS, cs.IT, math.IT * '''原文链接''':http://arxiv.org/abs/2409.02852v1 '''摘要''':$k$-最小值([[kmv]])数据草图算法存储通过对数据集中的项目进行哈希生成的$k$个最小哈希键。我们表明,基于键的排序和编码连续差异的压缩方法可以在预期存储节省中提供每个键$O(\log n)$位的节省,其中$n$是数据集中唯一值的数量。我们还表明,对于$n$个随机值的$k$个最小值,$O(\log n)$位的预期节省是任何形式压缩的最优值——该编码方法在所有编码[[kmv]]草图的方法中是近乎最优的。我们提出了一种实用的压缩方法,表明其计算效率高,并展示其在实践中的平均节省与基于熵的理论最小值相差约5%。我们验证了我们的方法优于现成的压缩方法,并展示了其在使用真实和合成数据时的实用性。
返回
WikiEdge:ArXiv-2409.02852v1/abs
。
导航菜单
个人工具
创建账号
登录
命名空间
项目页面
讨论
不转换
不转换
简体
繁體
大陆简体
香港繁體
澳門繁體
大马简体
新加坡简体
臺灣正體
查看
阅读
查看源代码
查看历史
更多
搜索
导航
首页
最近更改
随机页面
MediaWiki帮助
工具
链入页面
相关更改
特殊页面
页面信息