WikiEdge:ArXiv-2409.02852v1/terms
跳至導覽
跳至搜尋
- k-最小值草圖(k-Minimum Values Sketches):一種數據草圖算法,存儲由數據集中的項目生成的最小的k個哈希鍵。
- 數據草圖(Data Sketch):用於大數據集分析的算法,通過減少計算負擔來處理大量數據。
- 哈希函數(Hash Function):一種算法,將任意大小的輸入數據映射到固定大小的輸出(哈希值)。
- 熵(Entropy):在資訊理論中,熵是度量隨機變量不確定性的量。
- 概率計數(Probabilistic Counting):一種用於數據流中獨特元素計數的算法,通過概率模型來估計總數。
- 壓縮(Compression):減少表示信息所需的存儲空間的過程。
- 基數估計(Cardinality Estimation):估計數據集中不同元素數量的過程。
- 超日誌日誌(HyperLogLog):一種用於估算大數據集中元素數量的算法,以較小的空間複雜度提供近似計數。
- 最小值草圖(MinCount Sketch):一種數據草圖,用於存儲數據流中最小的k個哈希值。
- 合併(Mergeability):草圖算法的一個特性,允許將多個草圖合併為一個,以便於對大量數據進行分析。