好奇怪,我在做A.join(B,Seq('c'))的时候遇到了比较严重的数据倾斜,我对B做了广播,但是从UI上看还是发生了shuffle不知道为什么,而且不论我对A如何重分区,都没有解决数据倾斜的问题,字段c确实分布非常不均,有几个KEY数据量占了99%,最后实在不行我就用map join彻底避免shuffle,但是感觉还有很多不懂的地方