HyperLogLogGo 语言对 HyperLogLog 和 HyperLogLog++ 算法的实现
该项目是 Go 语言对 HyperLogLog 和 HyperLogLog++ 算法的实现。
HyperLogLog paper: http://algo.inria.fr/flajolet/Publications/FlFuGaMe07.pdf
HyperLogLog++ paper: http://research.google.com/pubs/pub40671.html
算法比较
对于小基数,HyperLogLog ++算法的错误要低得多。这是因为它对少量数据集使用不同的数据表示形式。使用该库生成的数据显示出N <10000的差:
HyperLogLog ++还具有偏差校正功能,可帮助抵消原始HyperLogLog算法中的估计误差。再次使用此库生成的数据,可以在此处看到此更正:
评论