2 一般来说小表join大表就把小表broadcast 出去,即mapjoin 。但是你这里说维表也挺大,可能需要走shuffle hash join. Join 过程中过滤好null 和空串的情况,如果还是会倾斜就需要具体分析. 倾斜不大就不用管了嘛,倾斜太大可以考虑对于这部分单独处理,使用加盐等策略