1.讲一下skip-gram怎么做的
2.skip-gram中有哪些对softmax计算的优化
3.LSTM中用到了哪些激活函数?为什么用sigmoid而不用relu
4.讲一下KL散度
5.L1为什么可以做到特征稀疏
6.XGBoost怎么处理类别特征?
7.讲一下项目中的Graph Embedding算法有哪些?
8.为什么逻辑回归中不用平方损失函数而用交叉熵?
基本都是扣简历,回答得很烂……