机器学习-数理统计与参数估计P16请教


由于Hash映射成整数是指数级衰减的,“最大整数为10”这一条件可近似考虑成“整数10
曾经出现”,继续近似成“整数10出现过一次”。针对这段话,第一次近似还好理解,第二次近似“继续近似成“整数10出现过一次””,觉得很难理解,难道整数10出现过2次不可以吗?
已邀请:

邹博 - 学而时习之

赞同来自: clyyuanzi


为了表述方便,原问题的截图如下:
集合Hash问题.png

呵呵,我的意思是:根据题意,因为整数10出现一次的概率是2^(-10),所以如果整数10曾经出现过,则它极有可能是仅仅出现过一次——因为出现两次的概率是2^(-20),相对于2^(-10)可以忽略。
事实上,整数10出现的概率是:2^(-10)+2^(-20)+2^(-30)+...≈(2^(-10))

要回复问题请先登录注册