大数据算法感觉离不开spark、hive以及多进程这些内容