本文出自“Python為什麼”系列,歸檔在 Github 上:https://github.com/chinesehuazhou/python-whydo
毫無疑問,Python 是一門強型別語言。強型別語言。強型別語言!(關於強弱型別話題,推薦閱讀這篇 技術科普文)
這就意味著,不同型別的物件通常需要先做顯式地型別轉化, 然後才能進行某些操作。
下面以字串和數字為例,看看強行操作會產生什麼結果:
但是,如果我們先把數字“轉化”成字串型別,再執行“+”操作,就不會報錯了:
由此,我們要引出一個問題:如何在不作顯式型別轉化的情況下,進行字串與數字型別的拼接呢?
在《詳解Python拼接字串的七種方式》這篇文章中,它梳理了七種拼接字串的寫法,我們可以逐個來試驗一下。
幾種字串拼接方式:
1、格式化類:%、format()、template
2、拼接類:+、()、join()
3、插值類:f-string
為了節省篇幅,此處直接把可以順利拼接的 4 種寫法羅列如下:
第二和第三種寫法,它們是第一種寫法的升級版,不同的是,它們的佔位符是通用型的,不必指定“%s”、“%d”等等明確的型別。這兩種寫法中,數字型別的引數被傳給特定的格式化方法(即 safe_substitute 與 format),在這些方法的內部,它們會作型別轉化處理。
可以說,上述三種寫法都不難理解,它們的意圖都有跡可循。
但是,現在再看看最後一種寫法,也就是 f-string 寫法,似乎就不是那麼明顯了。
首先,在字串內部,它並沒有像“%格式化”那樣指定佔位符的型別;其次,所要拼接的數字並沒有作為任何函式的引數來傳遞。
也就是說,在明面上根本看不出任何要作型別轉化的意圖。但是,由於我們已知 Python 是強型別語言,已知數字型別絕對不可能直接拼接到字串裡,因此,只能說明 f-string 語法在底層作了某種型別轉化的操作!
那麼,我們就可以再提出一個新的問題:f-string 語法在處理字串與數字時,是如何實現數字的型別轉化的呢?
也許有的讀者會猜想它是呼叫了內建的 str() 或 repr()(或它們對應的魔術方法__str__() 與 __repr__()),從而實現型別轉化,但是,答案並沒有如此簡單!
f-string 語法是在 Python 3.6 版本引入的。為了省事,我們直接找到 PEP-498 文件,在裡面查閱看是否有關於實現原理的線索。
文件地址:https://www.python.org/dev/peps/pep-0498
PEP 裡提到,f-string 的語法格式是這樣的:
f'<text> { <expression> <optional !s, !r, or !a> <optional : format specifier> } <text> ...'
其中,花括號裡的內容就是要作格式化的內容,除去可選的“optional”部分後,“expression”部分就是真正要處理的內容。對應前文的例子,數字 666 就是一個 expression。
expression 會按 __format__ 協議進行格式化,但是並不會直接呼叫 __format__() 這個方法。
文件上指出,實際的執行過程等效於type(value).__format__(value, format_spec) 或者 format(value, format_spec) 。
事實上,字串物件的 foramt() 方法跟 Python 內建的 foramt() 函式,它們都會呼叫__format__() 魔術方法,所以,f-string 其實是前文中 format() 格式化寫法的升級版。
在預設情況下,format_spec 是一個空字串,而format(value, "") 的效果等同於str(value) ,因此,在不指定其它 format_spec 的情況下,可以簡單地認為 f-string 就是呼叫了 str() 來作的型別轉化……
至此,我們看到了 f-string 的實現原理,明白了它在拼接字串與數字時,效果等效於前文的 format() 格式化方法,也等效於使用 str() 進行型別轉化。