阿里数据库开发规范:谁还敢说你的数据库设计的“烂”
数据库设计" title="数据库设计">数据库设计几个规范:
数据库命名规范、数据库基本设计规范、数据库索引设计规范、数据库字段设计规范、数据库SQL开发规范、数据库操作行为规范
数据库命名规范
1、所有数据库对象名称必须使用小写字母并用下划线分割
不同的数据库名 DbName dbname
不同的表名 Table table tabLe
2、所有数据库对象名称禁止使用MySQL保留关键字
select id,username,from,age from tb_user from是关键字 ,但是可以用单引号括起来
3、数据库对象的命名要见名识义,并且最好不要超过32个字符
例如 用户数据库mc_userdb 用户账号表 user_account
4、临时库表必须以tmp为前缀并以日期为后缀
5、备份库、备份表必须以bak为前缀并以日期为前缀
6、所有存储相同数据的列名和列类型必须一致
比如两张表中有相同的数据,那么他们列名和列类型必须是一致的
数据库基本设计规范
1、所有表必须使用Innodb存储引擎,mysql 5.6后默认存储引擎,支持事务,行级锁,更好的恢复性,高并发下性能更好
2、数据库和表的字符集统一使用UTF8,避免由于字符集转换产生的乱码
mysql中utf8字符集汉字占3个字节,ASCII码占用1个字节
3、所有表和字段都需要添加注释,使用comment从句添加表和列的备注
4、尽量控制单表数据量的大小,建议控制在500万以内,500万并不是mysql数据库的限制,
mysql最多可以存储多少万数据?目前没有做限制,这种限制取决于存储设置和文件系统
可以用历史数据归档,分库分表等手段来控制数据量大小
5、谨慎使用mysql分区表
分区表在物理上表现为多个文件没在逻辑上表现为一个表
谨慎选择分区键,跨分区查询效率可能更低
建议采用物理分表的方式管理大数据
6、尽量做到冷热数据分离,减小表的宽度
mysql限制最多存储4096列,为了是减少磁盘IO,保证热数据的内存缓存命中率,利用更有效的利用缓存,避免读入无用的冷数据
经常使用的列放在一个表中
7、禁止在表中建立预留字段
预留字段的命名很难做到见名识义
预留字段无法确认存储的数据类型,所以无法选择合适的类型
对预留字段类型的修改,会对表进行锁定,修改字段类型的成本往往大于增加
8、禁止在数据库中存储图片、文件等二进制数据
9、禁止在线上做数据库压力测试
10、禁止从开发环境,测试环境直连生产环境数据库
索引设计规范
索引对数据库的查询性能来说非常重要,查询、更新,禁止滥用索引
1、限制每张表上的索引数量,建议单张表索引不超过5个
索引并不是越多越好的,索引可以提高效率同样可以降低效率
索引可以增加查询效率,但同样也会降低插入和更新的效率
2、禁止给表中的每一列都建立单独的索引
3、Innodb是按照主键索引的顺序来组织表的
4、每个Innodb表必须有一个主键
不使用更新频繁的列作为主键,不使用多列主键
不使用uuid、MD5、hash,字符串列作为主键
主键建议使用主键自增
常见的索引列建议:
select、update、delete语句的where从句中的列
包含在order by、group by 、destinct中的字段
多表join的关联列
如何选择索引列的顺序:
联合索引是从做到右的顺序来实现的
1、区分度最高的列放在联合索引的最左侧
2、尽量把字段长度小的列放在联合索引的最左侧
3、使用最频繁的列放到联合索引的左侧
5、避免建立冗余索引和重复索引
重复索引:如 primary key(id)、index(id)、unique index(id)
冗余索引:如 index(a,b,c) index(a,b) index(a)
6、对于频繁的查询优先使用覆盖索引
覆盖索引:就是包括了所有查询字段的索引
优点:避免Innodb表进行索引的二次查找,可以把随机IO变为顺序IO加快查询效率
7、尽量避免使用外键
不建议使用外键约束,但一定在表与表之间的关联键上建立索引
外键可用于保证数据的参照完整性,但建议在业务端实现
外键会影响父表和子表的写操作从而降低性能
数据库字段设计规范
1、优先选择符合存储需要的最小的数据类型
将字符串转化为数字类型存储
对于非负数据采用无符号整形进行存储
signed int -2147483648-2147483648
unsigned int 0-2147483648
有符号比无符号多出一倍的存储空间
varchar(n) n代表字符数,不是字节数,varchar(255)=765个字节
过大的长度会消耗更多的内存
2、避免使用textBLOB数据类型
建议textBLOB列分离到单独的扩展表中
textBLOB类型只能使用前缀索引
3、避免使用enum数据类型
修改enum需要使用alter语句
enum类型的order by操作效率低,需要额外操作
禁止使用数值作为enum的枚举值
4、尽可能把所有列定义为not null
索引null列需要额外的空间来保存,所以要占用更多的空间
进行比较和计算时要对null值做特别的处理
5、禁止字符串存储日期型的数据
缺点1:无法用日期函数进行计算和比较
缺点2:用字符串存储日期要占用更多的空间
使用timestamp或datetime类型存储时间,timestamp存储空间更小
6、财务的相关金额使用decimal类型
decimal类型为精准浮点数,在计算时不会丢失精度
float、double非精准浮点数
数据库SQL开发规范
1、建议使用预编译语句进行数据库操作
好处:只传参数,比传递SQL语句更高效
相同语句可以一次解析,多次使用,提高处理效率
2、避免数据类型的隐式转换
隐式转换会导致索引失效
3、利用表上已经存在的索引
4、禁止连接不同的数据库使用不同的账号,禁止垮库查询
为数据库迁移和分库分表留出余地
减低业务耦合度
避免权限过大而产生的安全风险
5、禁止使用select * 必须用select 字段列表 查询
消耗更多的CPU和io以及网络带宽资源
无法使用覆盖索引
可减少表结构变更带来的影响
6、禁止使用不含字段列表的insert语句
如,insert into t values(‘a’,’b’,’c’)
7、避免使用子查询,可以把子查询优化为join操作
子查询的结果集无法使用索引
子查询会产生临时表,如果子查询数据量大则严重影响效率
消耗过多的CPU和io资源
8、避免使用join关联太多的表
每join一个表会多占用一部分内存join_buffer_size
会产生临时表操作,影响查询效率
mysql最多关联61个表,建议不超过5个
9、减少同数据库的交互次数
10、禁止使用order by rand()进行随机排序
11、where从句中禁止对列进行函数转换和计算
对列进行函数转换和计算会导致无法使用索引
如:where date(createtime)=’20160901’
优化后:where createtime>=’20160901’
目录展示
需要更多mysql相关资料,关注公众号:Java架构师联盟,后台回复mysql即可获取,亦可查看这份资料获取方式哦
以上是 阿里数据库开发规范:谁还敢说你的数据库设计的“烂” 的全部内容, 来源链接: utcz.com/z/534274.html