我們知道,快取的設計思想在RDBMS資料庫中無處不在,就拿號稱2500w行程式碼,bug堆積如山的Oracle資料庫來說,SQL的執行計劃可以快取在library cache中避免再次執行相同SQL發生硬解析(語法分析->語義分析->生成執行計劃),SQL執行結果快取在RESULT CACHE記憶體元件中,有效的將物理IO轉化成邏輯IO,提高SQL執行效率。
MySQL的QueryCache跟Oracle類似,快取的是SQL語句文字以及對應的結果集,看起來是一個很棒的Idea,那為什麼從MySQL 4.0推出之後,5.6中預設禁用,5.7中被deprecated(廢棄)以及8.0版本被Removed,今天就聊聊MySQL QueryCache的前世今生。
QueryCache介紹MySQL查詢緩(QC:QueryCache)在MySQL 4.0.1中引入,查詢快取儲存SELECT語句的文字以及傳送給客戶機的結果集,如果再次執行相同的SQL,Server端將從查詢快取中檢索結果返回給客戶端,而不是再次解析執行SQL,查詢快取在session之間共享,因此,一個客戶端生成的快取結果集,可以響應另一個客戶端執行同樣的SQL。
回到開頭的問題,如何判斷SQL是否共享?
透過SQL文字是否完全一致來判斷,包括大小寫,空格等所有字元完全一模一樣才可以共享,共享好處是可以避免硬解析,直接從QC獲取結果返回給客戶端,下面的兩個SQL是不共享滴,因為一個是from,另一個是From。
--SQL 1select id, balance from account where id = 121;--SQL 2select id, balance From account where id = 121;
下面是Oracle資料庫透過SQL_TEXT生成sql_id的演算法,如果sql_id不一樣說明就不是同一個SQL,就不共享,就會發生硬解析。
#!/usr/bin/perl -wuse Digest::MD5 qw(md5 md5_hex md5_base64);use Math::BigInt;my $stmt = "select id, balance from account where id = 121\0"; my $hash = md5 $stmt; my($a,$b,$msb,$lsb) = unpack("V*",$hash);my $sqln = $msb*(2**32)+$lsb;my $stop = log($sqln) / log(32) + 1;my $sqlid = '';my $charbase32 = '0123456789abcdfghjkmnpqrstuvwxyz';my @chars = split '', $charbase32;for($i=0; $i < $stop-1; $i++){ my $x = Math::BigInt->new($sqln); my $seq = $x->bdiv(32**$i)->bmod(32); $sqlid = $chars[$seq].$sqlid;}print "SQL is:\n $stmt \nSQL_ID is\n $sqlid\n";
大家可以發現SQL 1和SQL 2透過程式碼生成的sql_id值是不一樣,所以不共享。
SQL is: select id, balance from account where id = 121 SQL_ID is dm5c6ck1g7bdsSQL is: select id, balance From account where id = 121 SQL_ID is 6xb8gvs5cmc9b
如果讓你比較兩個Java程式碼檔案的內容的有何差異,只需要將這段程式碼理解透了,就可以改造實現自己的業務邏輯。
QueryCache配置mysql> show variables like '%query_cache%';+------------------------------+----------+| Variable_name | Value |+------------------------------+----------+| have_query_cache | YES || query_cache_limit | 1048576 || query_cache_min_res_unit | 4096 || query_cache_size | 16777216 || query_cache_type | OFF || query_cache_wlock_invalidate | OFF |
query_cache_min_res_unit說明
通常開啟QueryCache方式
# 修改MySQL配置檔案/etc/my.cnf,新增如下配置,重啟MySQL server即可。[mysqld]query_cache_size = 32Mquery_cache_type = 1
QueryCache使用
先搞點測試資料,分別對禁用和開啟QueryCache下的場景進行測試。
--建立一個使用者表users,並且插入100w資料。CREATE TABLE `users` ( `id` bigint NOT NULL AUTO_INCREMENT, `name` varchar(20) NOT NULL DEFAULT '' COMMENT '姓名', `age` tinyint NOT NULL DEFAULT '0' COMMENT 'age', `gender` char(1) NOT NULL DEFAULT 'M' COMMENT '性別', `phone` varchar(16) NOT NULL DEFAULT '' COMMENT '手機號', `create_time` datetime NOT NULL DEFAULT CURRENT_TIMESTAMP COMMENT '建立時間', `update_time` datetime NOT NULL DEFAULT CURRENT_TIMESTAMP ON UPDATE CURRENT_TIMESTAMP COMMENT '修改時間', PRIMARY KEY (`id`)) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4 COMMENT='使用者資訊表';select count(*) from users;+----------+| count(*) |+----------+| 1000000 |
禁用queryCache場景在不使用QueryCache的時候,每次執行相同的查詢語句,都要發生一次硬解析,消耗大量的資源。
#禁用QueryCache的配置query_cache_size = 0query_cache_type = 0
重複執行下面查詢,觀察執行時間。
--第一次執行查詢語句mysql> select * from users order by create_time desc limit 10;+---------+------------+-----+--------+-------------+---------------------+---------------------+| id | name | age | gender | phone | create_time | update_time |+---------+------------+-----+--------+-------------+---------------------+---------------------+| 997855 | User997854 | 54 | M | 15240540354 | 2020-12-15 14:34:50 | 2020-12-15 14:34:50 |.......10 rows in set (0.89 sec)--第二次執行同樣的查詢語句mysql> select * from users order by create_time desc limit 10;+---------+------------+-----+--------+-------------+---------------------+---------------------+| id | name | age | gender | phone | create_time | update_time |+---------+------------+-----+--------+-------------+---------------------+---------------------+| 997855 | User997854 | 54 | M | 15240540354 | 2020-12-15 14:34:50 | 2020-12-15 14:34:50 |.......10 rows in set (0.90 sec)-- profile跟蹤情況mysql> show profile cpu,block io for query 1; +----------------------+----------+----------+------------+--------------+---------------+| Status | Duration | CPU_user | CPU_system | Block_ops_in | Block_ops_out |+----------------------+----------+----------+------------+--------------+---------------+| preparing | 0.000022 | 0.000017 | 0.000004 | 0 | 0 || Sorting result | 0.000014 | 0.000009 | 0.000005 | 0 | 0 || executing | 0.000011 | 0.000007 | 0.000004 | 0 | 0 || Sending data | 0.000021 | 0.000016 | 0.000004 | 0 | 0 || Creating sort index | 0.906290 | 0.826584 | 0.000000 | 0 | 0 |
可以看到,多次執行同樣的SQL查詢語句,執行時間都是0.89s左右,幾乎沒有差別,同時時間主要消耗在Creating sort index階段。
開啟queryCache場景開啟查詢快取時,查詢語句第一次被執行時會將SQL文字及查詢結果快取在QC中,下一次執行同樣的SQL執行從QC中獲取資料返回給客戶端即可。
#禁用QueryCache的配置query_cache_size = 32Mquery_cache_type = 1
--第一次執行查詢語句mysql> select * from users order by create_time desc limit 10;+---------+------------+-----+--------+-------------+---------------------+---------------------+| id | name | age | gender | phone | create_time | update_time |+---------+------------+-----+--------+-------------+---------------------+---------------------+| 997855 | User997854 | 54 | M | 15240540354 | 2020-12-15 14:34:50 | 2020-12-15 14:34:50 |.......10 rows in set (0.89 sec)--第二次執行查詢語句mysql> select * from users order by create_time desc limit 10;+---------+------------+-----+--------+-------------+---------------------+---------------------+| id | name | age | gender | phone | create_time | update_time |+---------+------------+-----+--------+-------------+---------------------+---------------------+| 997855 | User997854 | 54 | M | 15240540354 | 2020-12-15 14:34:50 | 2020-12-15 14:34:50 |.......10 rows in set (0.00 sec)-- profile跟蹤資料mysql> show profile cpu,block io for query 3;+--------------------------------+----------+----------+------------+--------------+---------------+| Status | Duration | CPU_user | CPU_system | Block_ops_in | Block_ops_out |+--------------------------------+----------+----------+------------+--------------+---------------+| Waiting for query cache lock | 0.000016 | 0.000015 | 0.000001 | 0 | 0 || checking query cache for query | 0.000007 | 0.000007 | 0.000000 | 0 | 0 || checking privileges on cached | 0.000004 | 0.000003 | 0.000000 | 0 | 0 || checking permissions | 0.000034 | 0.000033 | 0.000001 | 0 | 0 || sending cached result to clien | 0.000018 | 0.000017 | 0.000001 | 0 | 0 |
可以看到,第一次執行QueryCache裡沒有快取SQL文字及資料,執行時間0.89s,由於開啟了QC,SQL文字及執行結果被快取在QC中,第二次執行執行同樣的SQL查詢語句,直接命中QC且返回資料,不需要發生硬解析,所以執行時間降低為0s,從profile裡看到sending cached result to client直接傳送QC中的資料返回給客戶端。
查詢快取命中率查詢快取相關的status變數
mysql>SHOW GLOBAL STATUS LIKE 'QCache\_%';+-------------------------+----------+| Variable_name | Value |+-------------------------+----------+| Qcache_free_blocks | 1 | --查詢快取中可用記憶體塊的數目。| Qcache_free_memory | 33268592 | --查詢快取的可用記憶體量。| Qcache_hits | 121 | --從QC中獲取結果集的次數。| Qcache_inserts | 91 | --將查詢結果集新增到QC的次數,意味著查詢已經不在QC中。| Qcache_lowmem_prunes | 0 | --由於記憶體不足而從查詢快取中刪除的查詢數。| Qcache_not_cached | 0 | --未快取的查詢數目。| Qcache_queries_in_cache | 106 | --在查詢快取中註冊的查詢數。| Qcache_total_blocks | 256 | --查詢快取中的塊總數。
查詢快取命中率及平均大小
Qcache_hitsQuery cache hit rate = ------------------------------------------------ x 100% Qcache_hits + Qcache_inserts + Qcache_not_cached query_cache_size = Qcache_free_memoryQuery Cache Avg Query Size = --------------------------------------- Qcache_queries_in_cache
更新操作對QC影響舉個例子,支付系統的裡轉賬邏輯,先要鎖定賬戶再修改餘額,主要步驟如下:
對於這種情況來說,QC是不太適合的,因為第一次執行查詢SQL未命中,返回結果給客戶端,新增SQL文字及結果集到QC之後,下一次執行同樣的SQL直接從QC返回結果,不需要硬解析操作,但是每次Update都是先更新資料,然後鎖定QC然後更新快取結果,會導致之前的快取結果失效,再次執行相的查詢SQL還是未命中,有得重新新增到QC,這樣頻繁的鎖定QC->檢查QC->新增QC->更新QC非常消耗資源,降低資料庫的併發處理能力。
為何放棄QueryCache一般業務場景從業務系統的操作型別,可以分為OLTP(OnLine Transaction Processing 聯機事務處理系統)和OLAP(OnLine Analysis Processing聯機分析處理系統),對於政企業務,也可以分為BOSS(Business Operation Support System-業務操作支撐系統,簡稱業支)和BASS(Business Analysis Support System-業務分析支撐系統,簡稱經分),來總結下這兩類系統的特點。
適合QueryCache的場景首先,查詢快取QC的大小隻有幾MB,不適合將快取設定得太大,由於在更新過程中需要執行緒鎖定QueryCache,因此對於非常大的快取,可能會看到鎖爭用問題。那麼,哪些情況有助於從查詢快取中獲益呢?以下是理想條件:
相同的查詢是由相同或多個客戶機重複發出的。被訪問的底層資料本質上是靜態或半靜態的。查詢有可能是資源密集型和/或構建簡短但計算複雜的結果集,同時結果集比較小。併發性和查詢QPS都不高。這4種情況只是理想情況下,實際的業務系統都是有CRUD操作的,資料更新比較頻繁,查詢介面的QPS比較高,所以能滿足上面的理想情況下的業務場景實在很少,我能想到就是配置表,資料字典表這些基本都是靜態或半靜態的,可以時透過QC來提高查詢效率。
同時,查詢快取使用單個互斥體來控制對快取的訪問,實際上是給伺服器SQL處理引擎強加了一個單執行緒閘道器,在查詢QPS比較高的情況下,可能成為一個性能瓶頸,會嚴重降低查詢的處理速度。因此,MySQL 5.6中預設禁用了查詢快取。
刪除QueryCacheThe query cache is deprecated as of MySQL 5.7.20, and is removed in MySQL 8.0. Deprecation includes query_cache_type,可以看到從MySQL 5.6的預設禁用,5.7的廢棄以及8.0的徹底刪除,Oracle也是綜合了各方面考慮做出了這樣的選擇。
上面聊了下適合和不適合的QueryCache的業務場景,發現這個特性對業務場景要求過於苛刻,與實際業務很難吻合,而且開啟之後,對資料庫併發度和處理能力都會降低很多,下面總結下為何MySQL從Disabled->Deprecated->Removed QueryCache的主要原因。
同時查詢快取碎片化還會導致伺服器的負載升高,影響資料庫的穩定性,在Oracle官方搜尋QueryCache可以發現,有很多Bug存在,這也就決定了MySQL 8.0直接果斷的Remove了該特性。
總結上面為大家介紹了MySQL QueryCache從推出->禁用->廢棄->刪除的心路歷程,設計之初是為了減少重複SQL查詢帶來的硬解析開銷,同時將物理IO轉化為邏輯IO,來提高SQL的執行效率,但是MySQL經過了多個版本的迭代,同時在硬體儲存發展之快的今天,QC幾乎沒有任何收益,而且還會降低資料庫併發處理能力,最終在8.0版本直接Removd掉了。
其實快取設計思想在硬體和軟體領域無處不在,硬體方面:RAID卡,CPU都有自己快取,軟體方面就太多了,OS的cache,資料庫的buffer pool以及Java程式的快取,作為一名研發工程師,需要根據業務場景選擇合適快取方案是非常重要的,如果都不合適,就需進行定製化開發快取,來更好的Match自己的業務場景。