MySQL查詢快取都不知道

首頁>技術>運維天地2020-12-22 19:50

MySQL查詢快取都不知道

我們知道，快取的設計思想在RDBMS資料庫中無處不在，就拿號稱2500w行程式碼，bug堆積如山的Oracle資料庫來說，SQL的執行計劃可以快取在library cache中避免再次執行相同SQL發生硬解析（語法分析->語義分析->生成執行計劃），SQL執行結果快取在RESULT CACHE記憶體元件中，有效的將物理IO轉化成邏輯IO，提高SQL執行效率。

MySQL的QueryCache跟Oracle類似，快取的是SQL語句文字以及對應的結果集，看起來是一個很棒的Idea，那為什麼從MySQL 4.0推出之後，5.6中預設禁用，5.7中被deprecated（廢棄）以及8.0版本被Removed，今天就聊聊MySQL QueryCache的前世今生。

QueryCache介紹

MySQL查詢緩（QC：QueryCache）在MySQL 4.0.1中引入，查詢快取儲存SELECT語句的文字以及傳送給客戶機的結果集，如果再次執行相同的SQL，Server端將從查詢快取中檢索結果返回給客戶端，而不是再次解析執行SQL，查詢快取在session之間共享，因此，一個客戶端生成的快取結果集，可以響應另一個客戶端執行同樣的SQL。

回到開頭的問題，如何判斷SQL是否共享？

透過SQL文字是否完全一致來判斷，包括大小寫，空格等所有字元完全一模一樣才可以共享，共享好處是可以避免硬解析，直接從QC獲取結果返回給客戶端，下面的兩個SQL是不共享滴，因為一個是from，另一個是From。

--SQL 1select id, balance from account where id = 121;--SQL 2select id, balance From account where id = 121;

下面是Oracle資料庫透過SQL_TEXT生成sql_id的演算法，如果sql_id不一樣說明就不是同一個SQL，就不共享，就會發生硬解析。

#!/usr/bin/perl -wuse Digest::MD5  qw(md5 md5_hex md5_base64);use Math::BigInt;my $stmt = "select id, balance from account where id = 121\0"; my $hash = md5 $stmt; my($a,$b,$msb,$lsb) = unpack("V*",$hash);my $sqln = $msb*(2**32)+$lsb;my $stop = log($sqln) / log(32) + 1;my $sqlid = '';my $charbase32 = '0123456789abcdfghjkmnpqrstuvwxyz';my @chars = split '', $charbase32;for($i=0; $i < $stop-1; $i++){  my $x = Math::BigInt->new($sqln);  my $seq = $x->bdiv(32**$i)->bmod(32);  $sqlid = $chars[$seq].$sqlid;}print "SQL is:\n    $stmt \nSQL_ID is\n    $sqlid\n";

大家可以發現SQL 1和SQL 2透過程式碼生成的sql_id值是不一樣，所以不共享。

SQL is:    select id, balance from account where id = 121 SQL_ID is  dm5c6ck1g7bdsSQL is:    select id, balance From account where id = 121 SQL_ID is  6xb8gvs5cmc9b

如果讓你比較兩個Java程式碼檔案的內容的有何差異，只需要將這段程式碼理解透了，就可以改造實現自己的業務邏輯。

QueryCache配置

mysql> show variables like '%query_cache%';+------------------------------+----------+| Variable_name                | Value    |+------------------------------+----------+| have_query_cache             | YES      || query_cache_limit            | 1048576  || query_cache_min_res_unit     | 4096     || query_cache_size             | 16777216 || query_cache_type             | OFF      || query_cache_wlock_invalidate | OFF      |

query_cache_min_res_unit說明

通常開啟QueryCache方式

# 修改MySQL配置檔案/etc/my.cnf，新增如下配置，重啟MySQL server即可。[mysqld]query_cache_size = 32Mquery_cache_type = 1

QueryCache使用

先搞點測試資料，分別對禁用和開啟QueryCache下的場景進行測試。

--建立一個使用者表users，並且插入100w資料。CREATE TABLE `users` (  `id` bigint NOT NULL AUTO_INCREMENT,  `name` varchar(20) NOT NULL DEFAULT '' COMMENT '姓名',  `age` tinyint NOT NULL DEFAULT '0' COMMENT 'age',  `gender` char(1) NOT NULL DEFAULT 'M' COMMENT '性別',  `phone` varchar(16) NOT NULL DEFAULT '' COMMENT '手機號',  `create_time` datetime NOT NULL DEFAULT CURRENT_TIMESTAMP COMMENT '建立時間',  `update_time` datetime NOT NULL DEFAULT CURRENT_TIMESTAMP ON UPDATE CURRENT_TIMESTAMP COMMENT '修改時間',  PRIMARY KEY (`id`)) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4 COMMENT='使用者資訊表';select count(*) from users;+----------+| count(*) |+----------+|  1000000 |

禁用queryCache場景

在不使用QueryCache的時候，每次執行相同的查詢語句，都要發生一次硬解析，消耗大量的資源。

#禁用QueryCache的配置query_cache_size = 0query_cache_type = 0

重複執行下面查詢，觀察執行時間。

--第一次執行查詢語句mysql> select * from users order by create_time desc limit 10;+---------+------------+-----+--------+-------------+---------------------+---------------------+| id      | name       | age | gender | phone       | create_time         | update_time         |+---------+------------+-----+--------+-------------+---------------------+---------------------+|  997855 | User997854 |  54 | M      | 15240540354 | 2020-12-15 14:34:50 | 2020-12-15 14:34:50 |.......10 rows in set (0.89 sec)--第二次執行同樣的查詢語句mysql> select * from users order by create_time desc limit 10;+---------+------------+-----+--------+-------------+---------------------+---------------------+| id      | name       | age | gender | phone       | create_time         | update_time         |+---------+------------+-----+--------+-------------+---------------------+---------------------+|  997855 | User997854 |  54 | M      | 15240540354 | 2020-12-15 14:34:50 | 2020-12-15 14:34:50 |.......10 rows in set (0.90 sec)-- profile跟蹤情況mysql> show profile cpu,block io for query 1;  +----------------------+----------+----------+------------+--------------+---------------+| Status               | Duration | CPU_user | CPU_system | Block_ops_in | Block_ops_out |+----------------------+----------+----------+------------+--------------+---------------+| preparing            | 0.000022 | 0.000017 |   0.000004 |            0 |             0 || Sorting result       | 0.000014 | 0.000009 |   0.000005 |            0 |             0 || executing            | 0.000011 | 0.000007 |   0.000004 |            0 |             0 || Sending data         | 0.000021 | 0.000016 |   0.000004 |            0 |             0 || Creating sort index  | 0.906290 | 0.826584 |   0.000000 |            0 |             0 |

可以看到，多次執行同樣的SQL查詢語句，執行時間都是0.89s左右，幾乎沒有差別，同時時間主要消耗在Creating sort index階段。

開啟queryCache場景

開啟查詢快取時，查詢語句第一次被執行時會將SQL文字及查詢結果快取在QC中，下一次執行同樣的SQL執行從QC中獲取資料返回給客戶端即可。

#禁用QueryCache的配置query_cache_size = 32Mquery_cache_type = 1

--第一次執行查詢語句mysql> select * from users order by create_time desc limit 10;+---------+------------+-----+--------+-------------+---------------------+---------------------+| id      | name       | age | gender | phone       | create_time         | update_time         |+---------+------------+-----+--------+-------------+---------------------+---------------------+|  997855 | User997854 |  54 | M      | 15240540354 | 2020-12-15 14:34:50 | 2020-12-15 14:34:50 |.......10 rows in set (0.89 sec)--第二次執行查詢語句mysql> select * from users order by create_time desc limit 10;+---------+------------+-----+--------+-------------+---------------------+---------------------+| id      | name       | age | gender | phone       | create_time         | update_time         |+---------+------------+-----+--------+-------------+---------------------+---------------------+|  997855 | User997854 |  54 | M      | 15240540354 | 2020-12-15 14:34:50 | 2020-12-15 14:34:50 |.......10 rows in set (0.00 sec)-- profile跟蹤資料mysql> show profile cpu,block io for query 3;+--------------------------------+----------+----------+------------+--------------+---------------+| Status                         | Duration | CPU_user | CPU_system | Block_ops_in | Block_ops_out |+--------------------------------+----------+----------+------------+--------------+---------------+| Waiting for query cache lock   | 0.000016 | 0.000015 |   0.000001 |            0 |             0 || checking query cache for query | 0.000007 | 0.000007 |   0.000000 |            0 |             0 || checking privileges on cached  | 0.000004 | 0.000003 |   0.000000 |            0 |             0 || checking permissions           | 0.000034 | 0.000033 |   0.000001 |            0 |             0 || sending cached result to clien | 0.000018 | 0.000017 |   0.000001 |            0 |             0 |

可以看到，第一次執行QueryCache裡沒有快取SQL文字及資料，執行時間0.89s，由於開啟了QC，SQL文字及執行結果被快取在QC中，第二次執行執行同樣的SQL查詢語句，直接命中QC且返回資料，不需要發生硬解析，所以執行時間降低為0s，從profile裡看到sending cached result to client直接傳送QC中的資料返回給客戶端。

查詢快取命中率

查詢快取相關的status變數

mysql>SHOW GLOBAL STATUS LIKE 'QCache\_%';+-------------------------+----------+| Variable_name           | Value    |+-------------------------+----------+| Qcache_free_blocks      | 1        |  --查詢快取中可用記憶體塊的數目。| Qcache_free_memory      | 33268592 |  --查詢快取的可用記憶體量。| Qcache_hits             | 121      |  --從QC中獲取結果集的次數。| Qcache_inserts          | 91       |  --將查詢結果集新增到QC的次數，意味著查詢已經不在QC中。| Qcache_lowmem_prunes    | 0        |  --由於記憶體不足而從查詢快取中刪除的查詢數。| Qcache_not_cached       | 0        |  --未快取的查詢數目。| Qcache_queries_in_cache | 106      |  --在查詢快取中註冊的查詢數。| Qcache_total_blocks     | 256      |  --查詢快取中的塊總數。

查詢快取命中率及平均大小

                                          Qcache_hitsQuery cache hit rate = ------------------------------------------------ x 100%                       Qcache_hits + Qcache_inserts + Qcache_not_cached                                                     query_cache_size = Qcache_free_memoryQuery Cache Avg Query Size = ---------------------------------------                                      Qcache_queries_in_cache

更新操作對QC影響

舉個例子，支付系統的裡轉賬邏輯，先要鎖定賬戶再修改餘額，主要步驟如下：

對於這種情況來說，QC是不太適合的，因為第一次執行查詢SQL未命中，返回結果給客戶端，新增SQL文字及結果集到QC之後，下一次執行同樣的SQL直接從QC返回結果，不需要硬解析操作，但是每次Update都是先更新資料，然後鎖定QC然後更新快取結果，會導致之前的快取結果失效，再次執行相的查詢SQL還是未命中，有得重新新增到QC，這樣頻繁的鎖定QC->檢查QC->新增QC->更新QC非常消耗資源，降低資料庫的併發處理能力。

為何放棄QueryCache一般業務場景

從業務系統的操作型別，可以分為OLTP（OnLine Transaction Processing 聯機事務處理系統）和OLAP（OnLine Analysis Processing聯機分析處理系統），對於政企業務，也可以分為BOSS（Business Operation Support System-業務操作支撐系統，簡稱業支）和BASS（Business Analysis Support System-業務分析支撐系統，簡稱經分），來總結下這兩類系統的特點。

適合QueryCache的場景

首先，查詢快取QC的大小隻有幾MB，不適合將快取設定得太大，由於在更新過程中需要執行緒鎖定QueryCache，因此對於非常大的快取，可能會看到鎖爭用問題。那麼，哪些情況有助於從查詢快取中獲益呢？以下是理想條件：

相同的查詢是由相同或多個客戶機重複發出的。被訪問的底層資料本質上是靜態或半靜態的。查詢有可能是資源密集型和/或構建簡短但計算複雜的結果集，同時結果集比較小。併發性和查詢QPS都不高。

這4種情況只是理想情況下，實際的業務系統都是有CRUD操作的，資料更新比較頻繁，查詢介面的QPS比較高，所以能滿足上面的理想情況下的業務場景實在很少，我能想到就是配置表，資料字典表這些基本都是靜態或半靜態的，可以時透過QC來提高查詢效率。

同時，查詢快取使用單個互斥體來控制對快取的訪問，實際上是給伺服器SQL處理引擎強加了一個單執行緒閘道器，在查詢QPS比較高的情況下，可能成為一個性能瓶頸，會嚴重降低查詢的處理速度。因此，MySQL 5.6中預設禁用了查詢快取。

刪除QueryCache

The query cache is deprecated as of MySQL 5.7.20, and is removed in MySQL 8.0. Deprecation includes query_cache_type，可以看到從MySQL 5.6的預設禁用，5.7的廢棄以及8.0的徹底刪除，Oracle也是綜合了各方面考慮做出了這樣的選擇。

上面聊了下適合和不適合的QueryCache的業務場景，發現這個特性對業務場景要求過於苛刻，與實際業務很難吻合，而且開啟之後，對資料庫併發度和處理能力都會降低很多，下面總結下為何MySQL從Disabled->Deprecated->Removed QueryCache的主要原因。

同時查詢快取碎片化還會導致伺服器的負載升高，影響資料庫的穩定性，在Oracle官方搜尋QueryCache可以發現，有很多Bug存在，這也就決定了MySQL 8.0直接果斷的Remove了該特性。

總結

上面為大家介紹了MySQL QueryCache從推出->禁用->廢棄->刪除的心路歷程，設計之初是為了減少重複SQL查詢帶來的硬解析開銷，同時將物理IO轉化為邏輯IO，來提高SQL的執行效率，但是MySQL經過了多個版本的迭代，同時在硬體儲存發展之快的今天，QC幾乎沒有任何收益，而且還會降低資料庫併發處理能力，最終在8.0版本直接Removd掉了。

其實快取設計思想在硬體和軟體領域無處不在，硬體方面：RAID卡，CPU都有自己快取，軟體方面就太多了，OS的cache，資料庫的buffer pool以及Java程式的快取，作為一名研發工程師，需要根據業務場景選擇合適快取方案是非常重要的，如果都不合適，就需進行定製化開發快取，來更好的Match自己的業務場景。

∨ Pycharm_新手基礎使用_程式碼雲倉庫香

熱門排行

劇多

MySQL查詢快取都不知道