第一个问题排序二分?第二个应该是多个机器,哈希函数分文件找到各自的topk排序或者放到大根堆里