首先向大家介紹一下坎貝爾·哈維教授。哈維教授是美國杜克大學的金融學教授。他是2016年美國金融協會的主席。哈維教授在公司治理,行為金融,計量經濟,計算機科學等領域發表過120多篇頂級學術論文。他寫的關於甄別基金經理的運氣和技能的文章,連續兩年獲得Journal of Portfolio Management最佳論文獎。他也曾8次獲得美國金融分析師協會(CFA)頒發的格雷厄姆/多徳獎(Graham/Dodd Awards)。
我向哈維教授提出,雖然巴菲特透過“猴子”的例子提醒投資者不要被基金經理表面的業績誤導,但他同時也指出,有很多好的基金經理都來自於同一個村落,即所謂的“價值投資”村落。在一次公開演講中,巴菲特舉了不少這樣的基金經理的例子,包括Walter Schloss, Tom Knapp,以及他自己。這些經理未必能夠達到“3倍標準差”或者更高的統計要求,但是他們都是很優秀的基金經理。
隨著計算機程式設計在金融投資中得到越來越廣泛的應用,量化交易也越來越得到大家的關注。據華爾街日報報道,在過去20年,量化基金的數量和管理的資產規模有了大幅度增長。股票指數期貨交易中,超過7成為量化交易。國際外匯期貨交易中,量化交易量大約佔到8成以上。
那麼到底什麼是量化交易?它和傳統的基金投資策略有何不同?依靠電腦程式進行投資,和人相比有什麼優劣點?如何判斷一個量化交易策略的好壞?帶著這些問題,我和美國杜克大學的坎貝爾·哈維(Campbell Harvey)教授進行了一場非常有趣的談話。
由於我們談話涵蓋的範圍比較廣,因此我將我們的談話內容分為兩篇文章分別發表。今天這篇文章,是我們談話的第一部分,主要講講如何來甄別量化投資策略的好壞。
首先向大家介紹一下坎貝爾·哈維教授。哈維教授是美國杜克大學的金融學教授。他是2016年美國金融協會的主席。哈維教授在公司治理,行為金融,計量經濟,計算機科學等領域發表過120多篇頂級學術論文。他寫的關於甄別基金經理的運氣和技能的文章,連續兩年獲得Journal of Portfolio Management最佳論文獎。他也曾8次獲得美國金融分析師協會(CFA)頒發的格雷厄姆/多徳獎(Graham/Dodd Awards)。
我們從哈維教授寫過的一篇論文《Evaluating Trading Strategies》說起。
我問哈維教授,在其他一些領域,比如物理,確認一個新發現需要達到“5倍標準差”。但是為什麼這個標準在金融研究裡沒有被執行?業界好像滿足於“2倍標準差”標準。
對於這些統計學概念不太熟悉的朋友,讓我在這裡稍微為大家做一下科普。
在統計學上,如果我們要確認任何規律或者發現,確保該發現具有統計意義,那麼我們就需要計算該發現的T值和P值。
如果T值為2左右(1.96),那麼其對應的P值(假設自由度夠大)就為0.05左右。也就是說,該統計結果有效的機率為95%。這也意味著,在這種情況下得到的統計結果,有5%的機率是假象。這個標準,稱為“2倍標準差”要求。
在一些精確度要求比較高的計算和實驗中,“2倍標準差”的誤差率太高,因此實驗人員需要提高確認結果的門檻,到3倍,甚至5倍標準差。
從上表中我們可以看到,T值越大,P值越小,結果產生誤差的機率也越小。如果一個發現的T值達到5,也就是“5倍標準差”,那麼該結果有效的機率為99.999%。因此,標準差倍數越高,T值越高,實驗結果越可信。
在哈維教授的文章中,他提到了希格斯玻色子(也被稱為“上帝粒子”)的例子。
早在1960年代,英國科學家彼得·希格斯就從理論上提出“希格斯玻色子”存在的可能性。但是,在實驗中真正確認該粒子的存在, 則一直要等到2013年。
2010年,義大利物理學家托馬索·多里戈宣稱,美國費米實驗室的萬億電子伏加速器(Tevatron)可能已經發現了希格斯玻色子。但當時的發現僅限於3倍標準差,因此沒有在科學界獲得認可。
直到2013年,歐洲核子研究組織確認發現希格斯玻色子時,其發現的可靠性達到了5倍標準差。因此這些物理學家們才敢向世界大方宣佈,我們終於證實了“上帝粒子”的存在。
為什麼2倍標準差和5倍標準差相差很大?原因在於,科學家們為了尋求某一種發現,他們可能會試上成千上萬次實驗。以希格斯玻色子為例,理論上該粒子僅會在每100億次碰撞中產生一次。因此為了證實希格斯玻色子的存在,物理學家們設計的粒子對撞機需要重複上千萬億次數級別的碰撞。
在任何實驗中,都有運氣的成分,因此也可能會導致虛假的發現。重複實驗的次數越多,偶然碰到假象的機率也越高。這就是為什麼物理學家們需要把檢驗標準提高到5倍標準差,確保該實驗結果在統計學上能夠過關的原因所在。
“5倍標準差”規則,背後有非常強的邏輯性。但是這個規則,並沒有被金融研究行業採納。目前絕大部分的金融量化研究,都還是以“2倍標準差”作為接受實驗結果的標準。這就導致很多金融研究得出的結論並不一定經得起推敲。
在哈維教授寫的論文中,他提到了一個非常有趣的例子。
如果一家基金向投資者呈現如上圖中左邊那張回測業績,相信絕大多數投資者都會非常喜歡這個交易策略。該投資策略有非常穩定的投資表現,幾乎沒有任何大幅度的回撤。即使在2008年金融危機期間都有不俗的表現。很多投資者可能會當即拍板:我決定投100萬!
但事實的真相從右邊那張圖中浮現出來。原來,研究人員只是做了200次隨機回測,然後從中挑選出一個表現最好的策略而已。對於投資者來說,他只看到那一個最好的策略回報,並沒有看到其他199個表現更差的情況。由於這所有200個交易策略都是隨機產生的,因此其未來的投資回報完全不可能重複。投資者接下來的投資回報和左圖一樣的機率幾乎為零。
這個簡單的例子告訴我們:即使沒有任何技能,只要樣本量足夠大,也能夠產生足以“以假亂真”的投資業績。
有些朋友可能對上文提到的統計知識點不太理解。那麼讓我在這裡再和大家分享一個更為簡單易懂的例子。
假設有1000只猴子參加扔硬幣大賽。如果扔到“正面”,猴子可以繼續留下來參加下一輪。如果扔到“反面”,該猴子被淘汰出局。大致來說,每一輪會有一半猴子被淘汰。我們可以看到,在扔硬幣大賽連續進行了7輪後,大約會剩下7只猴子。
如果我們去檢驗這7只猴子的扔硬幣記錄,每隻猴子都連續扔到7次硬幣的正面。任何一個人,連續扔到7次正面的機率都是很小的。因此他會告訴你,這和運氣完全無關,而是我有一套扔硬幣的“秘笈”。聰明的讀者,你會相信一隻猴子有扔硬幣的“特殊技能”麼?
當我向哈維教授提到這個例子時,他完全贊同我的意見。哈維教授說到,如果有10,000個基金經理,那麼在10年後,大約有10個基金經理會連續10年跑贏大盤戰勝市場。這完全是隨機和運氣決定的,和基金經理們的技能一點關係都沒有。這10個基金經理一個個看起來都像股神。
這就是哈維教授在論文中想要表達的意思:金融行業目前使用的統計學標準,比其他科學性強的行業落後太多。我們需要提高金融行業確認投資業績可靠性的標準。哈維教授提議,把“2倍標準差”提高到“3倍標準差”。提高了標準,就能夠把僅憑運氣而獲得的投資回報的策略和基金經理排除在外,也能降低投資者買到一隻“猴子”基金的機率。
那麼作為普通投資者,如何提高自己的鑑別能力,降低自己買到“猴子基金”的機率呢?
哈維教授提到,在業界,當很多機構去分析任何一個量化策略時,有一個不成文的規定,叫做“夏普率減半”,即把對方提供的夏普率減掉一半。換句話說,如果一個量化策略在回測中顯示可以獲得每年10%的投資回報。那麼作為投資者,你應該期望該策略在接下來的實際交易中,帶來每年5%的投資回報。
這主要是因為,量化基金經理提供給投資者看的投資回報,都是他們在經過成百上千次回測後挑選出來的最好的那個策略。為了防止自己碰到一隻特別幸運的“猴子”,投資者需要做出一定“縮水”調整。
用這種簡單粗暴的方法調整夏普比率,很多人可能會覺得不夠科學。基金經理會說,這對我不公平。有些投資者也會說,這會不會導致我們錯過原本非常不錯的交易策略。因此在哈維教授的論文中,他提到了一個更加科學的調整夏普比率(Sharpe Ratio Haircut)的方法。
對於那些非金融背景出身的朋友,讓我在這裡稍微花點時間給你們科普一下涉及的專業概念。
如上圖所示,夏普比率(Sharpe Ratio),是用超額回報(投資回報減去無風險利率),然後再除以投資組合的波動率(標準差)。該比率主要衡量的是“風險調整後收益”。
為了省事,你基本只要記住:夏普比率越高,說明該投資策略越好。(注:這是針對非金融行業讀者,比較簡單粗暴的解釋方法。真要細究的話,需要仔細分析夏普比率是怎麼得出來的。這已經超出了本文的範圍,因此不再贅述。)
絕大部分比較專業的金融機構和基金,都會向投資者披露該投資策略(或者基金)的夏普比率。哈維教授在他的論文中提出,我們應該對金融機構向我們展示的夏普比率保持懷疑態度,並進行合理的調整。
具體的調整細節涉及一些統計知識。我在這裡稍微給大家分享一下,有興趣的朋友可以去閱讀哈維教授的原著。在哈維教授的論文中,他甚至提供了計算機程式原始碼,有興趣的朋友可以直接下載然後使用。
假設某基金的夏普比率為0.92,該基金來自於一個包含200個類似基金的資料庫。那麼我們根據其夏普比率,算出其P值(0.4%)。然後根據樣本數量,調整其P值。在調整過的P值下,我們再計算出調整後的夏普比率為0.08,比原來的夏普比率下降了91%。
這個簡單易用的方法,可以幫助我們去除一些基金在宣傳材料中顯示的夏普比率的“水分”,讓投資者獲得更加真實客觀的資訊。
我向哈維教授提出,美國和中國量化研究的一大區別是,美國的金融歷史資料量要豐富得多。美國的股市資料,可以追溯到1920年代。而中國的A股,只是1990年代剛剛開始。中國第一隻公募基金,一直要等到2001年才開始發售。這是不是意味著絕大部分基於中國市場的量化策略都很難透過嚴格的統計要求?
哈維教授的看法是:大致來講,確實資料越多,量化策略的可靠性越高。畢竟如果一個量化策略基於的樣本量很小,那麼其結果就可能有很強的偶然性,因此難以在未來複制。
對於像中國這樣的新興市場,有兩個方法可以提高量化策略的質量。首先是增加樣本量。由於資料歷史有限,不可更改,因此研究人員只能在資料頻度上做文章。比如將研究的資料頻度調到每日股價變動,每小時股價變動甚至是每分鐘股價變動。頻度越是密,其資料量就越大。
其次,如果一些策略在發達國家中得到驗證可行,那麼我們就可以考慮把這樣的策略移到像中國這樣的新興市場進行交易。由於在其他國家市場中已經被驗證可行,因此類似策略在中國也行得通的可能性要高很多。
我向哈維教授提出,雖然巴菲特透過“猴子”的例子提醒投資者不要被基金經理表面的業績誤導,但他同時也指出,有很多好的基金經理都來自於同一個村落,即所謂的“價值投資”村落。在一次公開演講中,巴菲特舉了不少這樣的基金經理的例子,包括Walter Schloss, Tom Knapp,以及他自己。這些經理未必能夠達到“3倍標準差”或者更高的統計要求,但是他們都是很優秀的基金經理。
這個例子是否說明,投資者們在選擇基金經理時,也需要結合考慮該經理的投資風格和哲學來做出判斷?
哈維教授表示贊同。挑選好的基金經理,區分該基金經理的回報是來自於運氣還是技能,是一件非常複雜的系統工程。很多大型機構,比如養老基金,國家主權基金等都做不好,可見其難度之高。哈維教授在這個領域寫的好幾篇文章,被評為年度最佳論文,為這方面的研究做出了貢獻。但事實上,能夠真正讀懂並理解他文章的人,僅限於少數的業內人士。這本身就凸顯了要想挑選好的基金經理,難於上青天的事實。可笑的是,很多個人投資者“無知者無畏”,反而覺得選基很容易,這實在讓人有些哭笑不得。
目前的中國,大約有3,000個左右公募基金,3,000多個私募基金。在美國,大約有9,000多個公募基金。在如此眾多的基金基數上,要想找出幾個基金連續5年,或者更長時間取得好的投資回報,並不是一件難事。甚至這些基金經理可能完全不需要任何技能,僅憑運氣,也能連續多年獲得好的回報。而對於投資者來說,他以為自己買到了一個非常好的基金,其實只不過是把錢交給了一隻幸運的猴子而已。
我向哈維教授請教,在這種情況下,我們普通投資者應該怎麼做?特別是我們很多投資者一沒有專業知識,二沒有資料資訊。在這種情況下去挑選主動型基金,豈不是相當於誤打誤撞靠天吃飯?我們是不是應該放棄幻想,滿足於購買那些低成本的指數基金?
哈維教授表示完全贊同。在他看來,中國的3,000個公募基金,至少一半達不到專業的技能標準,根本不值得投資。美國的情況更遭。在哈維教授寫的另一篇論文中,他們發現在美國,最多隻有10%的公募基金經理有真正的投資技能。
對於普通個人投資者來說,他們大部分人都有自己的本職工作,同時並非來自金融專業。這些投資者,沒有時間,沒有專業技能,也沒有資料資訊幫助他們去挑選基金。因此對於他們來說,更好的選擇是購買低成本的指數基金。
在哈維教授寫的《Evaluating trading strategies》一文中,他得出結論:
絕大部分在金融期刊上發表,或者向投資者兜售的主動型量化交易策略,都可能是騙人的。基金公司們售賣的投資產品,有一半都是“假貨”。希望投資者們可以從哈維教授的研究中學到一些有用的知識,提高自己的警惕程度,不要輕易墮入基金公司和理財機構的銷售陷阱,做出最有利於自己的理性投資決策。
【注:我和哈維教授的談話摘要第二部分,主要涉及到人工智慧,機器學習(Machine Learning)等在量化交易中的應用。我會在另一篇文章中做出總結。】