试卷: 阿里云大数据专业ACP认证模拟考试练习题
[单选题]
某 BI 系统构建在大数据计算服务上,某数据分析员在分析订单的地域分布时,需要把订单表 order(占用存储空间约 10G)与地域维表 region(占用存储空间 100M)关联起来,两张表的结构如下: create table order( order_id string, region_id string, order amt bigint); create table region(region_id string, region_name string) 在运行时发现由于订单大量集中在上海地区,数据的倾斜导致整体运行时间较长,运行的 SQL 语句如下: select region_name, sum(order_amt)amt from order t1 join region t2 on t1.region_id=t2.region_id; 此时可以考虑通过______优化 SQL 的运行效率。
|