最后一题是典型的倒排,一般用在IR系统里面。优化存储的话可以用一个开源的分布式数据库,个人理解哈