WikiEdge:ArXiv-2409.02852v1/terms

来自WikiEdge
跳转到导航 跳转到搜索
编辑
  • k-最小值草图(k-Minimum Values Sketches):一种数据草图算法,存储由数据集中的项目生成的最小的k个哈希键
  • 数据草图(Data Sketch):用于大数据集分析的算法,通过减少计算负担来处理大量数据。
  • 哈希函数(Hash Function):一种算法,将任意大小的输入数据映射到固定大小的输出(哈希值)。
  • (Entropy):在信息论中,熵是度量随机变量不确定性的量。
  • 概率计数(Probabilistic Counting):一种用于数据流中独特元素计数的算法,通过概率模型来估计总数。
  • 压缩(Compression):减少表示信息所需的存储空间的过程。
  • 基数估计(Cardinality Estimation):估计数据集中不同元素数量的过程。
  • 超日志日志(HyperLogLog):一种用于估算大数据集中元素数量的算法,以较小的空间复杂度提供近似计数。
  • 最小值草图(MinCount Sketch):一种数据草图,用于存储数据流中最小的k个哈希值
  • 合并(Mergeability):草图算法的一个特性,允许将多个草图合并为一个,以便于对大量数据进行分析。