hash的结果要保证每个小文件中不包含相同的词