刚笔完,很标致的数据挖掘题。选择25个,特征工程、预处理和模型都有问,混了几道概率计算和linux;问答4个,类别不平衡+过拟合/欠拟合、基于内存推荐系统、RF和GBDT、LR在CTR中的应用+正则化和特征离散化。

整体不难,但是很数据挖掘,另外没编程,SQL也没有。