WikiEdge:ArXiv-2409.02852v1/terms
跳转到导航
跳转到搜索
- k-最小值草图(k-Minimum Values Sketches):一种数据草图算法,存储由数据集中的项目生成的最小的k个哈希键。
- 数据草图(Data Sketch):用于大数据集分析的算法,通过减少计算负担来处理大量数据。
- 哈希函数(Hash Function):一种算法,将任意大小的输入数据映射到固定大小的输出(哈希值)。
- 熵(Entropy):在信息论中,熵是度量随机变量不确定性的量。
- 概率计数(Probabilistic Counting):一种用于数据流中独特元素计数的算法,通过概率模型来估计总数。
- 压缩(Compression):减少表示信息所需的存储空间的过程。
- 基数估计(Cardinality Estimation):估计数据集中不同元素数量的过程。
- 超日志日志(HyperLogLog):一种用于估算大数据集中元素数量的算法,以较小的空间复杂度提供近似计数。
- 最小值草图(MinCount Sketch):一种数据草图,用于存储数据流中最小的k个哈希值。
- 合并(Mergeability):草图算法的一个特性,允许将多个草图合并为一个,以便于对大量数据进行分析。