1. bagging和boosting(集成学习)2. xgboost和lightgbm的涉及哪些参数,防止过拟合怎么调参3. sql执行计划,追问spark的rdd是什么,rdd是否可变,spark是否惰性运算等4. sql优化是否了解,平常怎么做sql优化的5. transformer原理6. 用过哪些深度学习模型7. pandas的细节(numpy,df.a.values是np.array类型,底层是c语言实现),使用loc和不适用loc的区别8. IV,平常怎么做特征选择的9. k折检验,sklearn中k折检验提供的是什么方法,提供的两种k折检验方法的区别10. 什么是l1,l2正则...