我有点疑惑,在第三题中,需要取出前100的词频,那么需要取出每个文件的前100放在一起再进行比较出前100才对(极端情况下可能top100全在同一个文件),这样5000*100*16byte/1000/1000 = 8M ,内存放不下啊😮