會(huì)經(jīng)常發(fā)現(xiàn)開發(fā)人員查一下沒用索引的語句或者沒有l(wèi)imit n的語句,這些沒語句會(huì)對數(shù)據(jù)庫造成很大的影響,例如一個(gè)幾千萬條記錄的大表要全部掃描,或者是不停的做filesort,對數(shù)據(jù)庫和服務(wù)器造成io影響等。這是鏡像庫上面的情況。
而到了線上庫,除了出現(xiàn)沒有索引的語句,沒有用limit的語句,還多了一個(gè)情況,mysql連接數(shù)過多的問題。說到這里,先來看看以前我們的監(jiān)控做法
1. 部署zabbix等開源分布式監(jiān)控系統(tǒng),獲取每天的數(shù)據(jù)庫的io,cpu,連接數(shù)
2. 部署每周性能統(tǒng)計(jì),包含數(shù)據(jù)增加量,iostat,vmstat,datasize的情況
3. Mysql slowlog收集,列出top 10
以前以為做了這些監(jiān)控已經(jīng)是很完美了,現(xiàn)在部署了mysql節(jié)點(diǎn)進(jìn)程監(jiān)控之后,才發(fā)現(xiàn)很多弊端
第一種做法的弊端: zabbix太龐大,而且不是在mysql內(nèi)部做的監(jiān)控,很多數(shù)據(jù)不是非常準(zhǔn)備,現(xiàn)在一般都是用來查閱歷史的數(shù)據(jù)情況
第二種做法的弊端:因?yàn)槭敲恐苤慌芤淮?,很多情況沒法發(fā)現(xiàn)和報(bào)警
第三種做法的弊端: 當(dāng)節(jié)點(diǎn)的slowlog非常多的時(shí)候,top10就變得沒意義了,而且很多時(shí)候會(huì)給出那些是一定要跑的定期任務(wù)語句給你。。參考的價(jià)值不大
那么我們怎么來解決和查詢這些問題呢
對于排查問題找出性能瓶頸來說,最容易發(fā)現(xiàn)并解決的問題就是MYSQL的慢查詢以及沒有得用索引的查詢。
OK,開始找出mysql中執(zhí)行起來不“爽”的SQL語句吧。
方法一: 這個(gè)方法我正在用,呵呵,比較喜歡這種即時(shí)性的。
01Mysql5.0以上的版本可以支持將執(zhí)行比較慢的SQL語句記錄下來。
02mysql> show variables like 'long%'; 注:這個(gè)long_query_time是用來定義慢于多少秒的才算“慢查詢”
03+-----------------+-----------+
04| Variable_name | Value |
05+-----------------+-----------+
06| long_query_time | 10.000000 |
07+-----------------+-----------+
081 row in set (0.00 sec)
09mysql> set long_query_time=1; 注: 我設(shè)置了1, 也就是執(zhí)行時(shí)間超過1秒的都算慢查詢。
10Query OK, 0 rows affected (0.00 sec)
11mysql> show variables like 'slow%';
12+---------------------+---------------+
13| Variable_name | Value |
14+---------------------+---------------+
15| slow_launch_time | 2 |
16| slow_query_log | ON | 注:是否打開日志記錄
17| slow_query_log_file | /tmp/slow.log | 注: 設(shè)置到什么位置
18+---------------------+---------------+
193 rows in set (0.00 sec)
20mysql> set global slow_query_log='ON' 注:打開日志記錄
21一旦slow_query_log變量被設(shè)置為ON,mysql會(huì)立即開始記錄。
22/etc/my.cnf 里面可以設(shè)置上面MYSQL全局變量的初始值。
23long_query_time=1
24slow_query_log_file=/tmp/slow.log
方法二:mysqldumpslow命令
01/path/mysqldumpslow -s c -t 10 /tmp/slow-log
02這會(huì)輸出記錄次數(shù)最多的10條SQL語句,其中:
03-s, 是表示按照何種方式排序,c、t、l、r分別是按照記錄次數(shù)、時(shí)間、查詢時(shí)間、返回的記錄數(shù)來排序,ac、at、al、ar,表示相應(yīng)的倒敘;
04-t, 是top n的意思,即為返回前面多少條的數(shù)據(jù);
05-g, 后邊可以寫一個(gè)正則匹配模式,大小寫不敏感的;
06比如
07/path/mysqldumpslow -s r -t 10 /tmp/slow-log
08得到返回記錄集最多的10個(gè)查詢。
09/path/mysqldumpslow -s t -t 10 -g “l(fā)eft join” /tmp/slow-log
10得到按照時(shí)間排序的前10條里面含有左連接的查詢語句。
最后總結(jié)一下節(jié)點(diǎn)監(jiān)控的好處
1. 輕量級(jí)的監(jiān)控,而且是實(shí)時(shí)的,還可以根據(jù)實(shí)際的情況來定制和修改
2. 設(shè)置了過濾程序,可以對那些一定要跑的語句進(jìn)行過濾
3. 及時(shí)發(fā)現(xiàn)那些沒有用索引,或者是不合法的查詢,雖然這很耗時(shí)去處理那些慢語句,但這樣可以避免數(shù)據(jù)庫掛掉,還是值得的
4. 在數(shù)據(jù)庫出現(xiàn)連接數(shù)過多的時(shí)候,程序會(huì)自動(dòng)保存當(dāng)前數(shù)據(jù)庫的processlist,DBA進(jìn)行原因查找的時(shí)候這可是利器
5. 使用mysqlbinlog 來分析的時(shí)候,可以得到明確的數(shù)據(jù)庫狀態(tài)異常的時(shí)間段
有些人會(huì)建義我們來做mysql配置文件設(shè)置
調(diào)節(jié)tmp_table_size 的時(shí)候發(fā)現(xiàn)另外一些參數(shù)
Qcache_queries_in_cache 在緩存中已注冊的查詢數(shù)目
Qcache_inserts 被加入到緩存中的查詢數(shù)目
Qcache_hits 緩存采樣數(shù)數(shù)目
Qcache_lowmem_prunes 因?yàn)槿鄙賰?nèi)存而被從緩存中刪除的查詢數(shù)目
Qcache_not_cached 沒有被緩存的查詢數(shù)目 (不能被緩存的,或由于 QUERY_CACHE_TYPE)
Qcache_free_memory 查詢緩存的空閑內(nèi)存總數(shù)
Qcache_free_blocks 查詢緩存中的空閑內(nèi)存塊的數(shù)目
Qcache_total_blocks 查詢緩存中的塊的總數(shù)目
Qcache_free_memory 可以緩存一些常用的查詢,如果是常用的sql會(huì)被裝載到內(nèi)存。那樣會(huì)增加數(shù)據(jù)庫訪問速度。
更多信息請查看IT技術(shù)專欄