台湾 || 语言: 大陆简体港澳繁體台灣正體

Mysql资料库开发的36条原则

雪花台湾 2019-06-27 23:36

【小宅按】前言这些原则都是经历过实战总结而成每一条原则背后都是血淋淋的教训这些原则主要是针对资料库开发人员，在开发过程中务必注意总是在灾难发生后，才想起容灾的重要性；总是在吃过亏以后，才记得曾有人提醒过。

前言

这些原则都是经历过实战总结而成

每一条原则背后都是血淋淋的教训

这些原则主要是针对资料库开发人员，在开发过程中务必注意

总是在灾难发生后，才想起容灾的重要性；

总是在吃过亏以后，才记得曾有人提醒过。

一、核心原则

1.尽量不在资料库做运算

俗话说：别让脚趾头想事情，那是脑瓜子的职责

作为资料库开发人员，我们应该让资料库多做她所擅长的事情：

尽量不在资料库做运算
复杂运算移到程序端CPU
尽可能简单应用MYSQL

举例：

在mysql中尽量不要使用如：md5()、Order by Rand()等这类运算函数

2.尽量控制单表数据量

大家都知道单表数据量过大后会影响数据查询效率，严重情况下会导致整个库都卡住

一般情况下，按照一年内单表数据量预估：

纯INT不超过1000W
含CHAR不超过500W

同时要尽量做好合理的分表，使单表数据量不超载，常见的分表策略有：

通过USERID来分表（根据ID区间分表）：在金融行业应用较多，用户量大、用户特征明显
按DATE分表（按天、周、月分表）：在电信行业应用非常多，如用户上网记录表、用户简讯表、话单表等
按AREA分表（省、市、区分表）
其他

分区表的适用场景主要有：

① 表非常大，无法全部存在内存，或者只在表的最后有热点数据，其他都是历史数据；

② 分区表的数据更易维护，可以对独立的分区进行独立的操作；

③ 分区表的数据可以分布在不同的机器上，从而高效使用资源；

④ 可以使用分区表来避免某些特殊的瓶颈；

⑤ 可以备份和恢复独立的分区。

但是使用分区表同样有一些限制，在使用的时候需要注意：

① 一个表最多只能有 1024 个分区；

② 5.1版本中，分区表表达式必须是整数， 5.5可以使用列分区；

③ 分区栏位中如果有主键和唯一索引列，那么主键列和唯一列都必须包含进来；

④ 分区表中无法使用外键约束；

⑤ 需要对现有表的结构进行修改；

⑥ 所有分区都必须使用相同的存储引擎；

⑦ 分区函数中可以使用的函数和表达式会有一些限制；

⑧ 某些存储引擎不支持分区；

⑨ 对于 MyISAM 的分区表，不能使用 load index into cache；

⑩ 对于 MyISAM 表，使用分区表时需要打开更多的文件描述符。

3.尽量控制表栏位数量

单表的栏位数量也不能太多，根据业务场景进行优化调整，尽量调整表栏位数少而精，这样有以下好处：

IO高效
全表遍历
表修复快
提高并发
alter table更快

那究竟单表多少栏位合适呢？

按照单表1G体积，500W行数据量进行评估：

顺序读1G文件需N秒
单行不超过200Byte
单表不超50个纯INT栏位
单表不超20个CHAR(10)栏位

==>建议单表栏位数上限控制在20~50个

4.平衡范式与冗余

相关文章