文档首页
全部产品
MPP云数仓
前言
概述
阅读对象
词汇表
产品简介
产品概述
产品优势
使用模式及场景
管理员快速入门
账户系统
账户系统
租户
用户
用户组
用户组角色
数据中心
数据中心
创建数据中心
数据中心配置
数据中心配置
创建数据中心配置
对象存储区域
对象存储区域
创建对象存储区域
对象存储区域配置
对象存储区域配置
创建对象存储区域配置
配额管理
配额管理
配额类型
创建配额
初始化租户
初始化租户
前置条件
初始化租户步骤
终端用户快速入门
选择集群类型
创建数据仓库集群
开始使用数据仓库集群
最佳实践
数据模型
堆存储和追加优化存储
行式存储和列式存储
压缩
分布
内存管理
分区
索引
资源队列
ANALYZE
VACCUM
加载
安全
加密
运维操作
基础环境巡检
磁盘空间检查
检查内容
检查方法
人工巡检
网络检查
检查内容
检查方法
人工巡检
服务状态检查
检查内容
检查方法
人工巡检
常用运维操作
MPP管理控制台服务停止
MPP管理控制台服务启动
MPP集群启动
MPP集群停止
常见问题
创建集群失败的处理
集群操作失败的处理
租户端
大数据
MPP云数仓
最佳实践
分布
分布
最近更新时间: 2019-10-25 08:04:45
为所有表定义分布策略:要么定义分布键,要么使用随机分布,不要使用缺省分布方式。
优先选择可均匀分布数据的单个字段做分布键。
不要选择经常用于 WHERE 子句的字段做分布键。
不要使用日期或时间字段做分布键。
分布键和分区键不要使用同一字段。
对经常执行 JOIN 操作的大表,优先考虑使用关联字段做分布键,尽量做到本地关联,以提高性能。
数据初始加载后或者每次增量加载后,检查数据分布是否均匀。
尽可能避免数据倾斜