海量数据的场景题CSDN有很多整理,比如两个10T大文件找公共url、找100T数据频率的topK