查看“WikiEdge:ArXiv-2409.02852v1/questions”的源代码
←
WikiEdge:ArXiv-2409.02852v1/questions
跳转到导航
跳转到搜索
因为以下原因,您没有权限编辑该页面:
您请求的操作仅限属于该用户组的用户执行:
用户
您可以查看和复制此页面的源代码。
<div style="float: right;">[{{fullurl:WikiEdge:ArXiv-2409.02852v1/questions|action=edit}} 编辑]</div> 作者面对的是大数据环境下[[数据草图算法]]的存储效率问题。具体问题包括: # 存储成本问题:在大规模数据处理中,数据草图算法虽然减少了计算负担,但存储草图本身仍然需要一定的存储空间,这在[[企业级应用]]中可能导致显著的成本。 # 压缩效率问题:现有的[[数据草图压缩]]方法可能没有充分利用数据的统计结构,导致压缩后的数据尺寸没有达到理论上的最优压缩率,即接近草图算法定义的随机过程的熵下界。 # 压缩与功能保留的平衡问题:在追求数据草图的高效压缩的同时,需要保证压缩方法不会损失草图算法的准确性和合并性,以支持大数据流的精确查询和分析。
返回
WikiEdge:ArXiv-2409.02852v1/questions
。
导航菜单
个人工具
创建账号
登录
命名空间
项目页面
讨论
不转换
不转换
简体
繁體
大陆简体
香港繁體
澳門繁體
大马简体
新加坡简体
臺灣正體
查看
阅读
查看源代码
查看历史
更多
搜索
导航
首页
最近更改
随机页面
MediaWiki帮助
工具
链入页面
相关更改
特殊页面
页面信息