两次遍历即可,第一遍分批把ip读入内存,hash 到100个桶里面,平均每个桶100m,所以相同的IP会被hash到同一个桶里,第二遍分别读一个桶进内存,统计top100IP即可