1 正常sprkui会在scan和exchange都有数据显示,前者是条数,后者是存储。 如果不显示说明这个阶段没有数据。
2 stats size 是逻辑上基于读取表存储估算的可能广播的数据大小 data size 是执行期间,根据shuffle指标数据得到的真实处理的数据大小 这里分别对应两个广播阈值参数:spark.sql.autoBroadcastJoinThreshold 和 spark.sql.adaptive.autoBroadcastJoinThreshold