1.一个文件中去重后的ip地址数目? 如果问的是linux命令:就(sort后uniq -c,前提是内容只有ip,否则要先grep -oE筛选出ip) ------------------------- ~/Desktop cat ip.txt 127.0.0.1 128.0.0.1 128.0.0.1 129.0.0.1 129.0.0.1 129.0.0.1 129.0.0.1 126.0.0.1 ~/Desktop sort ip.txt | uniq -c 1 126.0.0.1 1 127.0.0.1 2 128.0.0.1 4 129.0.0.1 ----------------------- 如果问的是大文件统计ip次数,那就要考虑内存 分而治之一开始各位1000个文件,然后用hash去统计子文件里的 ip=>次数(如果重复率低,所有内容的hash可能也会塞满内存,然后hash内容写入到新的文件里)。最后合并子文件(记得合并相同ip)