1 增强学习中value_based和policy_based,model_based和model_free的区别
2 SGD,adaGred,adadelta,adam的原理,区别,改进,适用情况
3 parameter server的原理,改进,计算,设计一个更合理的分布式架构