台湾 || 语言: 大陆简体港澳繁體台灣正體

Mysql資料庫開發的36條原則

雪花台灣 2019-06-27 23:36

【小宅按】前言這些原則都是經歷過實戰總結而成每一條原則背後都是血淋淋的教訓這些原則主要是針對資料庫開發人員，在開發過程中務必注意總是在災難發生後，才想起容災的重要性；總是在吃過虧以後，才記得曾有人提醒過。

前言

這些原則都是經歷過實戰總結而成

每一條原則背後都是血淋淋的教訓

這些原則主要是針對資料庫開發人員，在開發過程中務必注意

總是在災難發生後，才想起容災的重要性；

總是在吃過虧以後，才記得曾有人提醒過。

一、核心原則

1.盡量不在資料庫做運算

俗話說：別讓腳趾頭想事情，那是腦瓜子的職責

作為資料庫開發人員，我們應該讓資料庫多做她所擅長的事情：

盡量不在資料庫做運算
複雜運算移到程序端CPU
儘可能簡單應用MYSQL

舉例：

在mysql中盡量不要使用如：md5()、Order by Rand()等這類運算函數

2.盡量控制單表數據量

大家都知道單表數據量過大後會影響數據查詢效率，嚴重情況下會導致整個庫都卡住

一般情況下，按照一年內單表數據量預估：

純INT不超過1000W
含CHAR不超過500W

同時要盡量做好合理的分表，使單表數據量不超載，常見的分表策略有：

通過USERID來分表（根據ID區間分表）：在金融行業應用較多，用戶量大、用戶特徵明顯
按DATE分表（按天、周、月分表）：在電信行業應用非常多，如用戶上網記錄表、用戶簡訊表、話單表等
按AREA分表（省、市、區分表）
其他

分區表的適用場景主要有：

① 表非常大，無法全部存在內存，或者只在表的最後有熱點數據，其他都是歷史數據；

② 分區表的數據更易維護，可以對獨立的分區進行獨立的操作；

③ 分區表的數據可以分布在不同的機器上，從而高效使用資源；

④ 可以使用分區表來避免某些特殊的瓶頸；

⑤ 可以備份和恢復獨立的分區。

但是使用分區表同樣有一些限制，在使用的時候需要注意：

① 一個表最多只能有 1024 個分區；

② 5.1版本中，分區表表達式必須是整數， 5.5可以使用列分區；

③ 分區欄位中如果有主鍵和唯一索引列，那麼主鍵列和唯一列都必須包含進來；

④ 分區表中無法使用外鍵約束；

⑤ 需要對現有表的結構進行修改；

⑥ 所有分區都必須使用相同的存儲引擎；

⑦ 分區函數中可以使用的函數和表達式會有一些限制；

⑧ 某些存儲引擎不支持分區；

⑨ 對於 MyISAM 的分區表，不能使用 load index into cache；

⑩ 對於 MyISAM 表，使用分區表時需要打開更多的文件描述符。

3.盡量控制表欄位數量

單表的欄位數量也不能太多，根據業務場景進行優化調整，盡量調整表欄位數少而精，這樣有以下好處：

IO高效
全表遍歷
表修復快
提高並發
alter table更快

那究竟單表多少欄位合適呢？

按照單表1G體積，500W行數據量進行評估：

順序讀1G文件需N秒
單行不超過200Byte
單表不超50個純INT欄位
單表不超20個CHAR(10)欄位

==>建議單表欄位數上限控制在20~50個

4.平衡範式與冗餘

相关文章