。。大数的问题,你应该计算一下这个数组整体大小,然后询问数据是否重复,如果重复,先对文件hash,然后保存不同文件。维持一个1万的小顶堆,遍历效率是o(nlogn)