场景题让我想起了我之前hdfs用map-reduce的经历,当时我是搜索记录按网址访问次数排序,不过这道场景题有点像top-k问题,就是每次读几百个M数据,然后找出里面的访问次数最多的ip然后合并