首頁>技術>

我們知道,快取的設計思想在RDBMS資料庫中無處不在,就拿號稱2500w行程式碼,bug堆積如山的Oracle資料庫來說,SQL的執行計劃可以快取在library cache中避免再次執行相同SQL發生硬解析(語法分析->語義分析->生成執行計劃),SQL執行結果快取在RESULT CACHE記憶體元件中,有效的將物理IO轉化成邏輯IO,提高SQL執行效率。

MySQL的QueryCache跟Oracle類似,快取的是SQL語句文字以及對應的結果集,看起來是一個很棒的Idea,那為什麼從MySQL 4.0推出之後,5.6中預設禁用,5.7中被deprecated(廢棄)以及8.0版本被Removed,今天就聊聊MySQL QueryCache的前世今生。

QueryCache介紹

MySQL查詢緩(QC:QueryCache)在MySQL 4.0.1中引入,查詢快取儲存SELECT語句的文字以及傳送給客戶機的結果集,如果再次執行相同的SQL,Server端將從查詢快取中檢索結果返回給客戶端,而不是再次解析執行SQL,查詢快取在session之間共享,因此,一個客戶端生成的快取結果集,可以響應另一個客戶端執行同樣的SQL。

回到開頭的問題,如何判斷SQL是否共享?

透過SQL文字是否完全一致來判斷,包括大小寫,空格等所有字元完全一模一樣才可以共享,共享好處是可以避免硬解析,直接從QC獲取結果返回給客戶端,下面的兩個SQL是不共享滴,因為一個是from,另一個是From。

--SQL 1select id, balance from account where id = 121;--SQL 2select id, balance From account where id = 121;

下面是Oracle資料庫透過SQL_TEXT生成sql_id的演算法,如果sql_id不一樣說明就不是同一個SQL,就不共享,就會發生硬解析。

#!/usr/bin/perl -wuse Digest::MD5  qw(md5 md5_hex md5_base64);use Math::BigInt;my $stmt = "select id, balance from account where id = 121\0"; my $hash = md5 $stmt; my($a,$b,$msb,$lsb) = unpack("V*",$hash);my $sqln = $msb*(2**32)+$lsb;my $stop = log($sqln) / log(32) + 1;my $sqlid = '';my $charbase32 = '0123456789abcdfghjkmnpqrstuvwxyz';my @chars = split '', $charbase32;for($i=0; $i < $stop-1; $i++){  my $x = Math::BigInt->new($sqln);  my $seq = $x->bdiv(32**$i)->bmod(32);  $sqlid = $chars[$seq].$sqlid;}print "SQL is:\n    $stmt \nSQL_ID is\n    $sqlid\n";

大家可以發現SQL 1和SQL 2透過程式碼生成的sql_id值是不一樣,所以不共享。

SQL is:    select id, balance from account where id = 121 SQL_ID is  dm5c6ck1g7bdsSQL is:    select id, balance From account where id = 121 SQL_ID is  6xb8gvs5cmc9b

如果讓你比較兩個Java程式碼檔案的內容的有何差異,只需要將這段程式碼理解透了,就可以改造實現自己的業務邏輯。

QueryCache配置
mysql> show variables like '%query_cache%';+------------------------------+----------+| Variable_name                | Value    |+------------------------------+----------+| have_query_cache             | YES      || query_cache_limit            | 1048576  || query_cache_min_res_unit     | 4096     || query_cache_size             | 16777216 || query_cache_type             | OFF      || query_cache_wlock_invalidate | OFF      |

query_cache_min_res_unit說明

通常開啟QueryCache方式

# 修改MySQL配置檔案/etc/my.cnf,新增如下配置,重啟MySQL server即可。[mysqld]query_cache_size = 32Mquery_cache_type = 1
QueryCache使用

先搞點測試資料,分別對禁用和開啟QueryCache下的場景進行測試。

--建立一個使用者表users,並且插入100w資料。CREATE TABLE `users` (  `id` bigint NOT NULL AUTO_INCREMENT,  `name` varchar(20) NOT NULL DEFAULT '' COMMENT '姓名',  `age` tinyint NOT NULL DEFAULT '0' COMMENT 'age',  `gender` char(1) NOT NULL DEFAULT 'M' COMMENT '性別',  `phone` varchar(16) NOT NULL DEFAULT '' COMMENT '手機號',  `create_time` datetime NOT NULL DEFAULT CURRENT_TIMESTAMP COMMENT '建立時間',  `update_time` datetime NOT NULL DEFAULT CURRENT_TIMESTAMP ON UPDATE CURRENT_TIMESTAMP COMMENT '修改時間',  PRIMARY KEY (`id`)) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4 COMMENT='使用者資訊表';select count(*) from users;+----------+| count(*) |+----------+|  1000000 |
禁用queryCache場景

在不使用QueryCache的時候,每次執行相同的查詢語句,都要發生一次硬解析,消耗大量的資源。

#禁用QueryCache的配置query_cache_size = 0query_cache_type = 0

重複執行下面查詢,觀察執行時間。

--第一次執行查詢語句mysql> select * from users order by create_time desc limit 10;+---------+------------+-----+--------+-------------+---------------------+---------------------+| id      | name       | age | gender | phone       | create_time         | update_time         |+---------+------------+-----+--------+-------------+---------------------+---------------------+|  997855 | User997854 |  54 | M      | 15240540354 | 2020-12-15 14:34:50 | 2020-12-15 14:34:50 |.......10 rows in set (0.89 sec)--第二次執行同樣的查詢語句mysql> select * from users order by create_time desc limit 10;+---------+------------+-----+--------+-------------+---------------------+---------------------+| id      | name       | age | gender | phone       | create_time         | update_time         |+---------+------------+-----+--------+-------------+---------------------+---------------------+|  997855 | User997854 |  54 | M      | 15240540354 | 2020-12-15 14:34:50 | 2020-12-15 14:34:50 |.......10 rows in set (0.90 sec)-- profile跟蹤情況mysql> show profile cpu,block io for query 1;  +----------------------+----------+----------+------------+--------------+---------------+| Status               | Duration | CPU_user | CPU_system | Block_ops_in | Block_ops_out |+----------------------+----------+----------+------------+--------------+---------------+| preparing            | 0.000022 | 0.000017 |   0.000004 |            0 |             0 || Sorting result       | 0.000014 | 0.000009 |   0.000005 |            0 |             0 || executing            | 0.000011 | 0.000007 |   0.000004 |            0 |             0 || Sending data         | 0.000021 | 0.000016 |   0.000004 |            0 |             0 || Creating sort index  | 0.906290 | 0.826584 |   0.000000 |            0 |             0 |

可以看到,多次執行同樣的SQL查詢語句,執行時間都是0.89s左右,幾乎沒有差別,同時時間主要消耗在Creating sort index階段。

開啟queryCache場景

開啟查詢快取時,查詢語句第一次被執行時會將SQL文字及查詢結果快取在QC中,下一次執行同樣的SQL執行從QC中獲取資料返回給客戶端即可。

#禁用QueryCache的配置query_cache_size = 32Mquery_cache_type = 1
--第一次執行查詢語句mysql> select * from users order by create_time desc limit 10;+---------+------------+-----+--------+-------------+---------------------+---------------------+| id      | name       | age | gender | phone       | create_time         | update_time         |+---------+------------+-----+--------+-------------+---------------------+---------------------+|  997855 | User997854 |  54 | M      | 15240540354 | 2020-12-15 14:34:50 | 2020-12-15 14:34:50 |.......10 rows in set (0.89 sec)--第二次執行查詢語句mysql> select * from users order by create_time desc limit 10;+---------+------------+-----+--------+-------------+---------------------+---------------------+| id      | name       | age | gender | phone       | create_time         | update_time         |+---------+------------+-----+--------+-------------+---------------------+---------------------+|  997855 | User997854 |  54 | M      | 15240540354 | 2020-12-15 14:34:50 | 2020-12-15 14:34:50 |.......10 rows in set (0.00 sec)-- profile跟蹤資料mysql> show profile cpu,block io for query 3;+--------------------------------+----------+----------+------------+--------------+---------------+| Status                         | Duration | CPU_user | CPU_system | Block_ops_in | Block_ops_out |+--------------------------------+----------+----------+------------+--------------+---------------+| Waiting for query cache lock   | 0.000016 | 0.000015 |   0.000001 |            0 |             0 || checking query cache for query | 0.000007 | 0.000007 |   0.000000 |            0 |             0 || checking privileges on cached  | 0.000004 | 0.000003 |   0.000000 |            0 |             0 || checking permissions           | 0.000034 | 0.000033 |   0.000001 |            0 |             0 || sending cached result to clien | 0.000018 | 0.000017 |   0.000001 |            0 |             0 |

可以看到,第一次執行QueryCache裡沒有快取SQL文字及資料,執行時間0.89s,由於開啟了QC,SQL文字及執行結果被快取在QC中,第二次執行執行同樣的SQL查詢語句,直接命中QC且返回資料,不需要發生硬解析,所以執行時間降低為0s,從profile裡看到sending cached result to client直接傳送QC中的資料返回給客戶端。

查詢快取命中率

查詢快取相關的status變數

mysql>SHOW GLOBAL STATUS LIKE 'QCache\_%';+-------------------------+----------+| Variable_name           | Value    |+-------------------------+----------+| Qcache_free_blocks      | 1        |  --查詢快取中可用記憶體塊的數目。| Qcache_free_memory      | 33268592 |  --查詢快取的可用記憶體量。| Qcache_hits             | 121      |  --從QC中獲取結果集的次數。| Qcache_inserts          | 91       |  --將查詢結果集新增到QC的次數,意味著查詢已經不在QC中。| Qcache_lowmem_prunes    | 0        |  --由於記憶體不足而從查詢快取中刪除的查詢數。| Qcache_not_cached       | 0        |  --未快取的查詢數目。| Qcache_queries_in_cache | 106      |  --在查詢快取中註冊的查詢數。| Qcache_total_blocks     | 256      |  --查詢快取中的塊總數。

查詢快取命中率及平均大小

                                          Qcache_hitsQuery cache hit rate = ------------------------------------------------ x 100%                       Qcache_hits + Qcache_inserts + Qcache_not_cached                                                     query_cache_size = Qcache_free_memoryQuery Cache Avg Query Size = ---------------------------------------                                      Qcache_queries_in_cache
更新操作對QC影響

舉個例子,支付系統的裡轉賬邏輯,先要鎖定賬戶再修改餘額,主要步驟如下:

對於這種情況來說,QC是不太適合的,因為第一次執行查詢SQL未命中,返回結果給客戶端,新增SQL文字及結果集到QC之後,下一次執行同樣的SQL直接從QC返回結果,不需要硬解析操作,但是每次Update都是先更新資料,然後鎖定QC然後更新快取結果,會導致之前的快取結果失效,再次執行相的查詢SQL還是未命中,有得重新新增到QC,這樣頻繁的鎖定QC->檢查QC->新增QC->更新QC非常消耗資源,降低資料庫的併發處理能力。

為何放棄QueryCache一般業務場景

從業務系統的操作型別,可以分為OLTP(OnLine Transaction Processing 聯機事務處理系統)和OLAP(OnLine Analysis Processing聯機分析處理系統),對於政企業務,也可以分為BOSS(Business Operation Support System-業務操作支撐系統,簡稱業支)和BASS(Business Analysis Support System-業務分析支撐系統,簡稱經分),來總結下這兩類系統的特點。

適合QueryCache的場景

首先,查詢快取QC的大小隻有幾MB,不適合將快取設定得太大,由於在更新過程中需要執行緒鎖定QueryCache,因此對於非常大的快取,可能會看到鎖爭用問題。那麼,哪些情況有助於從查詢快取中獲益呢?以下是理想條件:

相同的查詢是由相同或多個客戶機重複發出的。被訪問的底層資料本質上是靜態或半靜態的。查詢有可能是資源密集型和/或構建簡短但計算複雜的結果集,同時結果集比較小。併發性和查詢QPS都不高。

這4種情況只是理想情況下,實際的業務系統都是有CRUD操作的,資料更新比較頻繁,查詢介面的QPS比較高,所以能滿足上面的理想情況下的業務場景實在很少,我能想到就是配置表,資料字典表這些基本都是靜態或半靜態的,可以時透過QC來提高查詢效率。

同時,查詢快取使用單個互斥體來控制對快取的訪問,實際上是給伺服器SQL處理引擎強加了一個單執行緒閘道器,在查詢QPS比較高的情況下,可能成為一個性能瓶頸,會嚴重降低查詢的處理速度。因此,MySQL 5.6中預設禁用了查詢快取。

刪除QueryCache

The query cache is deprecated as of MySQL 5.7.20, and is removed in MySQL 8.0. Deprecation includes query_cache_type,可以看到從MySQL 5.6的預設禁用,5.7的廢棄以及8.0的徹底刪除,Oracle也是綜合了各方面考慮做出了這樣的選擇。

上面聊了下適合和不適合的QueryCache的業務場景,發現這個特性對業務場景要求過於苛刻,與實際業務很難吻合,而且開啟之後,對資料庫併發度和處理能力都會降低很多,下面總結下為何MySQL從Disabled->Deprecated->Removed QueryCache的主要原因。

同時查詢快取碎片化還會導致伺服器的負載升高,影響資料庫的穩定性,在Oracle官方搜尋QueryCache可以發現,有很多Bug存在,這也就決定了MySQL 8.0直接果斷的Remove了該特性。

總結

上面為大家介紹了MySQL QueryCache從推出->禁用->廢棄->刪除的心路歷程,設計之初是為了減少重複SQL查詢帶來的硬解析開銷,同時將物理IO轉化為邏輯IO,來提高SQL的執行效率,但是MySQL經過了多個版本的迭代,同時在硬體儲存發展之快的今天,QC幾乎沒有任何收益,而且還會降低資料庫併發處理能力,最終在8.0版本直接Removd掉了。

其實快取設計思想在硬體和軟體領域無處不在,硬體方面:RAID卡,CPU都有自己快取,軟體方面就太多了,OS的cache,資料庫的buffer pool以及Java程式的快取,作為一名研發工程師,需要根據業務場景選擇合適快取方案是非常重要的,如果都不合適,就需進行定製化開發快取,來更好的Match自己的業務場景。

17
最新評論
  • BSA-TRITC(10mg/ml) TRITC-BSA 牛血清白蛋白改性標記羅丹明
  • Pycharm_新手基礎使用_程式碼雲倉庫 香