HyperLogLogGo 语言对 HyperLogLog 和 HyperLogLog++ 算法的实现

联合创作 · 2023-09-30 23:31

该项目是 Go 语言对 HyperLogLog 和 HyperLogLog++ 算法的实现。

HyperLogLog paper: http://algo.inria.fr/flajolet/Publications/FlFuGaMe07.pdf

HyperLogLog++ paper: http://research.google.com/pubs/pub40671.html

算法比较

对于小基数,HyperLogLog ++算法的错误要低得多。这是因为它对少量数据集使用不同的数据表示形式。使用该库生成的数据显示出N <10000的差:

N <10000

HyperLogLog ++还具有偏差校正功能,可帮助抵消原始HyperLogLog算法中的估计误差。再次使用此库生成的数据,可以在此处看到此更正:

N <80000

浏览 3
点赞
评论
收藏
分享

手机扫一扫分享

编辑 分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

编辑 分享
举报