你好
我的思路是这样的:(简单版)
1 爬取金融大鳄的blog文本,下载历史股票数据
2 对这些文本进行sentiment analysis
3 给文本贴label  positive为1,negative为0 (意思就是1的时候,如果预测准确,股票应该涨)
4把这些1 0 1 0 1 0数据画折线图(横轴是时间) 与历史股票涨跌图放在一起比对,如果有相关性,可以根据每天对新的文本的sentiment analysis进行预测。 
5如果plot出来之后没有相关性,告诉导师别****淡了 ,还是直接用timeseries预测更靠谱。
6 如果有还不错的相关性。(肉眼可见的相关)就做一个ensemble model 整合每日的blog sentiment analysis 结果和timeseries预测结果。