本次演講整理自 HashBang 與 CYBEX 聯合舉辦的第六期 AMA,演講嘉賓爲區塊鏈和大數據技術專家、加密貨幣投資人劉毅,其曾任 HP、中國移動資深架構師,也是比特幣早期投資者,擁有 20 年 A 股和 10 年美股的投資經驗。本期演講主題爲《數據分析在加密貨幣投資中的應用》。

原文標題:《劉毅:會做數據分析的人,投資加密貨幣都不會太差》
演講嘉賓:劉毅,區塊鏈與大數據技術專家,加密貨幣投資人
文章來源:公衆號 HashBang

1、第一個問題,我們先來給大家普及下什麼是加密貨幣的數據分析,區塊鏈中有幾類數據,數據分析目前的發展現狀是怎麼樣的?

發達國家的資本市場是以機構投資者爲主,美國股市自動交易的交易量佔比也達到了百分之七八十。二級市場的機構投資都不同程度的依賴數據分析,包括資產定價、風險定價和對沖、量價分析、價格相關性分析等等,在互聯網普及之後,還融合了情緒面分析

在加密資產二級市場,以上分析都仍然有價值。由於加密資產是發行在區塊鏈(公鏈)上的數字資產,因此又增加了鏈上分析的維度。鏈上數據分析非常特殊,理論上來說所有鏈上交易的數據都是公開一致的,而且高度結構化,沒有垃圾不需要清洗,給數據分析帶來很大的便利。但是另一方面,鏈上交易無身份,地址之間不易關聯。而且在中心化交易所、二層網絡進行的交易,並沒有記錄在鏈上。因此對鏈上數據分析的應用效果也不宜預期過高,它並不是投資者的銀彈。

數據分析對兩類投資策略有價值。

第一類是量化投資,可以說沒有數據分析就不會有量化投資

其實嚴格地說,量化投資不是一類策略,而且一種投資方式,與它相對應的是主觀投資。但是量化投資的優勢是快速精確,不受人的情緒和主觀判斷的干擾,因此它特別適合短期的趨勢投資和套利。所以雖然量化是投資方式的,但是它跟趨勢投資和套利這兩大類策略密切聯繫。

第二類是投資策略是基本面投資,在基本面投資中,數據分析居於輔助地位,爲估值和擇時提供參考

在傳統資本市場,散戶(個人投資者)和機構在數據分析方面有巨大的差距。機構投資者投入大量人力物力用於數據採集、清洗、存儲、建模、分析,乃至於聘請最優秀的人才應用深度學習等高級方法致力於數據分析。可以說無所不用其極,不爲別的,就是爲了建立哪怕一點點信息優勢,然後通過規模化高槓杆的資金操作,把信息優勢轉化爲利潤。

加密資產是新出現的市場,還沒有巨頭玩家,因此一些創業團隊,利用先發優勢,可以建立起信息優勢。他們是未來的幣圈機構投資者,或者未來被進入加密資產市場的大玩家整合。

2、去年開始出現很多量化團隊,劉毅老師認爲這樣的團隊一般都需要什麼樣的數據類型,什麼樣的數據可以幫助他們做更好的判斷?

加密資產市場是量化交易的沃土,主要有兩大原因:

一是加密資產市場的結構跟股票市場有很大的不同

首先,股票市場的資產及其衍生品的數量遠遠超過市場數量,雖然也有一隻股票在多個市場交易的情況,但僅僅是極少數。加密資產正相反,高流動性資產很少(幾十種),但是市場有上萬個,因此跨市場套利(搬磚)機會比股票市場要多得多。

而且,股票市場的計價貨幣通常只有一種(即本國法幣)。但是在加密資產市場,基礎貨幣就有多種,btc/usdt/eth/ 交易所平臺幣,交易對數量比基礎資產數量高得多,給三角套利創造了很多機會。

最後,加密資產 7*24 小時交易,幾乎所有交易所都提供數據流和交易 API,極大降低了量化交易的門檻。上面談的三個因素形成了一個很大的無風險(或低風險)套利的機遇,養活了很多量化團隊,哪怕團隊的起點並不高,如果進入市場早,還有有可能抓住無風險套利的紅利。

所有套利的機會都可以看成是市場定價的失效,無風險(或低風險)套利是可以自行消除的定價失效。但是它的總體空間是有限的,大量的人在做套利,一方面利潤會越來越薄,另一方面會增加市場的有效性。因此量化團隊之間的競爭焦點,會逐步從瓜分無風險套利紅利,走向有風險套利和其他量化交易策略。換個說法就是,會越來越像股票市場的量化交易。在有效程度越來越高的資本市場,沒有能夠長期穩定獲利的量化策略。策略需要不斷變化,才能尋找到新的利潤空間。在有些情況下,策略和策略之間會直接博弈,甚至出現有針對性地獵殺策略的策略。

作爲加密貨幣投資者,如果你對數據分析感興趣,希望利用數據分析來進行投資。你首先需要做個決策,就是做量化交易還是基本面投資。如果你有知識基礎,願意長期研究數據分析、交易策略,可以選擇量化交易。但是你應該知道,未來這是機構博弈爲主的戰場,是無休止的數據和分析方法的軍備競賽。如果你不能成爲強大專業團隊的一部分,或早或晚會被擠出市場。如果你是業餘做投資,或者即便是專業個人投資者,但長處不在數據分析方面。那麼比較合理的選擇是利用數據分析做爲基本面投資的輔助手段。我後面的分享將只針對做第二種選擇的投資者。因爲有條件做第一種選擇的人是極少數,而且他們不需要聽我來講解投資數據分析。

3、您一般會在哪些網站或者用什麼樣的工具來收集或者分析數據呢?能否給普通投資者一些建議,我們在進行投資和判斷的時候,應該學會什麼樣的基本數據分析的能力?可以簡單舉例來說明一下嗎?

對於採用基本面投資策略的加密貨幣投資者,我推薦三個網站:

https://coinmetrics.io/ 有大量加密貨幣市場數據分析圖表,還提供加密資產量價數據下載;

http://charts.woobull.com/ 是著名分析師 willy woo 的個人網站,同樣免費提供大量有用圖表;

https://trends.google.com/ 谷歌趨勢,根據搜索關鍵詞熱度,輔助分析市場情緒面;

我在後面會具體講兩個圖表,作爲例子。

4、跟一些專業的分析師聊過,一般做傳統領域做數據分析,都要經過信息的蒐集,清洗,建模,分析,定策略這些流程,那在區塊鏈中或者在數字貨幣中,我們要通過什麼樣的路徑來實現數據的分析,比如一般去哪裏蒐集信息,比如社區活度、小道消息哪裏看?劉毅老師可以詳細說下嗎?

上面談過,數據分析當然最好是自己能動手做,這樣得到的信息是你獨有的,如果分析是對的,可以成爲你戰勝市場的工具。

但是自己做數據分析,還要得到獨有的關鍵信息,難度很高,而且會越來越高,因爲市場越來越有效。

對於多數人來說,基本的需求是能看懂專業人士做的分析圖表。我舉個例子,來說明圖表能夠給投資者帶來什麼。

從 UTXO 走勢到 MVRV 比率,初窺最前沿的加密貨幣投資思想

這是我在加密資產價值投資課上講的一張 ppt,原始圖表來自於 https://www.delphidigital.io/utxo。我上面推薦的 Willy Woo 個人網站也有這個圖,地址是 http://charts.woobull.com/bitcoin-hodl-waves/。是 delphi digital 做的比特幣 UTXO 歷史走勢圖,網站上有完整的分析報告,有興趣深入研究的同學可以自己看。

可能有部分同學不瞭解比特幣 UTXO 的概念,我簡單說一下。

UTXO 是 unspent transaction outputs 的縮寫。

區塊鏈記賬有兩種模型,一種是賬戶模型,另一種是 UTXO 模型。

賬戶模型跟銀行很類似,有賬號也就是地址,區塊鏈記錄了每個地址上有多少錢。用戶使用對應的私鑰,可以把地址上的錢轉給其他地址。以太坊使用的是賬戶模型。

UTXO 模型不像銀行,而是像一個放支票的箱子。箱子裏的每張支票都有一個金額,有個地址。用戶使用對應的私鑰可以使用支票。比如說我要給你轉 10 個 BTC,支票箱裏有 2 張支票屬於我,金額分別是 5 個 BTC 和 6 個 BTC。那麼我就可以做一筆交易,用這兩張支票作爲輸入,一共是 11 個比特幣,交易的輸出也是兩張支票。第一張的金額是 10 個 BTC,地址是你的地址,那麼以後只有你可以用這張支票,我就不能用了。另外一個輸出的支票金額是 1 個 BTC,地址還是我的地址。經過這次交易,我的兩張分別價值 5 個和 6 個比特幣的支票作廢了,產生了兩張新支票,一張 10 個 BTC 是給你的,另一張 1 個 BTC 的支票相當於是找回給我零錢。沒作廢,或者說沒有使用的支票就叫 UTXO。

每個 UTXO 都有時間戳,所以可以知道存入的時間。比如我要給你發 1 個比特幣,我的錢包軟件會檢查屬於我的所有存款,從中間挑出 1 筆金額合適的,比如有一筆數量爲 1.5 BTC 的 UTXO 屬於我。它就可以作爲轉賬交易的輸入。轉賬交易完成後會創建兩個新的 UTXO,一筆是 1 BTC 屬於你,就是我轉給你的。第二個 UTXO 是找零,金額是 0.5 BTC,找零屬於我。也就是說,轉賬交易用 1 個現有 UTXO 作爲輸入,2 個新創建的 UTXO 作爲輸出。交易完成後,輸入的 UTXO 存款就失效了,新產生的兩筆存款的存入時間就是交易完成的時間。

那麼這張圖是什麼呢?首先看最上面的黑線,是比特幣的歷史價格走勢,對應的是左邊的座標軸,是 log 尺度的價格。下面綠色的曲線,是幣齡在 1 年以上的 UTXO 佔已挖出的比特幣總量的百分比,座標軸在右側。可以看到,在 2015 年和 2016 年,年齡超過 1 年,也就是 1 年沒有動過的 btc 的佔比達到了 58%。到 2017 年的大牛市,綠色線快速下行,跌到了 40% 以下。綠色線下面還有很多根線,藍色線是 5 年以上的 utxo,紫色線是 3-5 年,草綠色是 2-3 年,桔黃色是 1-2 年。這張圖給出的信息非常豐富。我挑其中最典型,最有指導性的部分來談一談。

我們把大圖右下方黑框的部分放大,得到右上角這張圖。時間段大概是 2017 年 3 月到 2018 年年底。這張圖裏新增了一條線,是年齡小於 3 個月的 UTXO,也就是新生的 UTXO。它代表了新入場的投資者買入的 btc,和賣出者拿回的找零。可以看到,曲線 4 在 2017 年牛市快速向上,與此同時,幣齡超過 1 年的 UTXO,也就是綠色線,快速向下。而且向上和向下的幅度大體相當,大概是 btc 總量的 17%。那麼,我們得出一個粗糙的推論:2017 年的大牛市中早期囤幣者,賣了佔總量 17% 的 btc 給新入場的投資者。然後我們再看這個推論有什麼問題,首先沒有考慮找零。第二,轉賬不一定是買賣,老投資者整理錢包等等,都被計算在內了,這兩塊是主要的誤差來源。考慮到當時 BTC 的價格,囤幣者向新投資者出售的 BTC,幾乎可以肯定是百億美元級,我比較認同的估計是 2、3 百億美元。那麼是囤幣多少年的投資者在出貨呢?我們就看看另外幾條線,5 年以上幣齡的幾乎沒變化,這些幣要麼是丟了,要麼是在死多頭手裏,價格漲多少都不賣出。2012 年之前的幣價是個位數,死多頭拿着漲 10000 倍的幣都不賣。這種情況可能存在,但是多方面考慮應該是極少數,幣齡超過 5 年的 btc,差不多是 300 萬枚,絕大部分應該是丟失了。大量賣出的是 3-5 年幣齡和 2-3 年幣齡的 btc,也就是圖中 5 號和 3 號線,其中以 3-5 年爲出貨主力。牛市結束後的 2018 年,幣齡在 1 年以上的 UTXO 佔比開始觸底回升,到年底已經突破 50%,向着前期高點 58% 迴歸。

2013 年的牛市情況也是大同小異。總結下來就是:HOLDer 爲長期增值買入;韭菜因短期追漲買入。牛市 Holder 賣給韭菜,熊市韭菜賣給 HOLDER。隨着加密貨幣普及,Holder 和韭菜聯隊不斷壯大,推動市場整體向上。所以我管它叫 Hodler 韭菜混合接力跑。就是 HOLDer 牛市交棒給韭菜,韭菜拿着接力棒跑一段,熊市忍不住了,再把接力棒交還給 Hodler。當然這只是粗略地說法,每次牛市進來的新投資者,都有一部分能穿越熊牛,從韭菜進化成 Hodler。還有一些長期囤幣者,他不交棒,一直拿下去。也就是說他只賺基本趨勢的錢,不賺價格波動的錢。這個策略,看上去少賺了,但是也有它的優勢,我們後面再詳細談。

從這個實例可以看出,很多圖表有非常豐富的內涵,可以給我們很多對投資有價值的信息,值得花大量時間去深入研究。

5、目前市場現有的現金流折現模型、相對估值法、梅特卡夫這些模型,劉毅老師認爲哪些估值模型更適合幣圈項目呢?

資本市場估值分爲絕對估值和相對估值兩大門類,加密資產市場也不例外。股票市場絕對估值的金標準是 DCF 現金流折現法。但是現金流折現法只能用於生產性資產(productive asset),對非生產性資產是無效的。這也是巴菲特鄙視 BTC 的最關鍵原因,巴老認爲不能產生現金流的資產都不值得投資,因爲它不能爲社會創造新價值。在 BTC 之前,巴老 diss 最多的是黃金,黃金也是非生產性資產,同樣不能適用現金流折現法。

目前加密社區比較認可的絕對估值方法,依次由 V 神、John Peffer、Chris Burniske、Alex Evans 所闡述和發展。他們的文章都已經被翻譯爲中文,其中 John Peffer 和 Chris Burniske 估值方法是我牽頭翻譯的。雖然 Alex Evans 的估值模型比較完善,但是依然不具備實用性。它既不能解釋加密貨幣的主要價格現象,也不具備預測能力。原因是這條估值模型的發展線索,依據的是以艾爾文 . 費雪爲代表的古典主義貨幣需求理論,也都以費雪方程爲基礎。此理論本身存在缺陷,舉例來說:古典主義貨幣需求理論始終不能解釋貨幣流通速度 V 的巨大波動,以及 V 與經濟週期之間的關聯性。我在 Alex Evans 的估值模型基礎上發展出了加密資產估值雙池模型,雙池模型的有點有兩個,一是簡單,二是能夠解釋加密貨幣價格反身性現象。具體的估值方法,限於時間,我們就不深入談了。有興趣的同學可以來參加我的 CAVI 加密資產投資課,第三課會系統講解加密資產估值方法。但是總體而言,加密投資社區對絕對估值方法的研究熱度在下降。根本原因在於,估值方法其實本身沒有對錯,能達成共識的估值方法會自我實現。而估值方法之間是博弈關係,具體的分析可以看我個人公衆號「以利證道」的文章《當我們談加密資產價值投資,是在談什麼》。只有當估值方法的博弈達到均衡,纔會形成估值方法共識。均衡需要時間,也許一段時間之後,絕對估值方法的研究和討論會再熱起來。

加密社會現在討論比較多的是相對估值。與絕對估值相比,相對估值法有獨特的優勢,它不需要做預測,僅僅依據已有的收據,就能提供有參考價值的結果。但是應該注意,相對估值要能成立,依賴於市場的有效性。完全有效市場是指,參與市場的投資者有足夠的理性,並且能夠迅速對所有市場信息作出合理反應,因此資產的價格已經包含了全部的市場信息。在有效市場中,相同類型、質量也差不多的資產,估值水平應該相當。如果估值水平出現差異,就出現套利的機會。加密資產市場只有 10 年的歷史,可以說一個嬰兒,是個有效性非常低的市場。在這樣的市場環境下,橫行對比加密資產的估值水平意義不大。比較有意義的做法,是對一個資產,比較不同時間點的估值水平。因此,更準確說法是對加密資產做比率研究。也就是確定某種比率,以反映加密資產估值水平的變化趨勢。換句話說,是用加密資產的現在跟過去相比,但這也要求加密資產具有比較長的歷史,所以基本上都是研究比特幣。現在投資圈做比率研究的很多,貢獻較大的是 Willy Woo 和 Chris Burniske。對於某一種比率,即便分子和分母一樣,但是各家的計算方法也有不同。我們來看一個對投資實戰價值很高的比率 —— MVRV 比率。

從 UTXO 走勢到 MVRV 比率,初窺最前沿的加密貨幣投資思想

這是我在 CAVI 加密資產價值投資課的第三課估值講的一張 ppt,原始圖表來自於 Cryptolab Capital,但是 Cryptolab Capital 是不公開的。我上面推薦的 https://coinmetrics.io/ 網站有這個圖,地址是。coinmetrics 的創始人 Nic Carter 也是 MVRV 比率的提出者。

MVRV 比率方法相當新,是 Nic Carter 在 2018 年 9 月下旬一個比特幣會議上發表的。MVRV 比率顧名思義是 MV 除以 RV,MV market value 是加密貨幣的總市值。分母 RV 是 realized value,姑且翻譯爲實現價值。實現價值是把每一筆的加密貨幣,按照最後一次轉賬時的價格彙總起來得到的結果。對於比特幣來說,就是把全部的 UTXO 按它創建時的價格彙總的結果。我們計算 RV 實現價值,不管 UTXO 是系統給礦工的挖礦獎勵還是轉賬交易的輸出,都以它產生那一天比特幣的價格來計算,全加在一起就是 RV。用 RV 來做有兩個特別大的優點,第一就是排除了早期丟失的比特幣對估值的干擾。因爲早期 btc 很不值錢,所以很多人呢對它不上心,就有很多丟失的 btc。另外屬於中本聰的比特幣大概有 100 萬枚,因爲從來沒有移動過,以後很可能也不會再用了,如果把這 100 萬枚跟最近活躍 btc 在估值上同樣看待,肯定是不對的。那麼早期產生的 btc,UTXO 創建的時候 btc 價格極低,用 RV 的概念,就基本上把他們的影響消除了。第二個優點是符合市場參與者的價值認可,比如我在 2015 年中轉給你 10 個比特幣,那麼我到底轉了多少錢給你呢?按當時的價格,200 美元一枚,這筆錢我是看做 2000 美元轉給你的。所以用 UTXO 創建時的比特幣價格,反映了市場參與者的平均價值認可。我們說價格高低和漲跌都是相對的,價格的基準點又稱爲參考點,對每位投資者都是不一樣的。投資者通常會以自己的買入均價作爲加密貨幣價格的參考點。所以 MVRV 小於 1 意味着比特幣的價格已經低於投資者的價格參考點的加權平均值。第六課我們將談到,心理對投資決策的影響至關重要。所以我認爲 MVRV 比率是能夠體現投資者對比特幣價格共識的指標,具有非常重要的意義。

說清楚了 MVRV 比率,我們看圖。這是比特幣的 MVRV 的歷史走勢圖。圖中有兩條白色橫線,上面的白線是 MVRV=3.7,下面白線是 MVRV=1。2012 年之前的不說了。2012 年的三次比特幣大牛市,對應的就是這三個超過了 3.7 的峯值。2015 年的熊市底部,MVRV 降到了 1 以下。是不是非常厲害?2018 年 11 月,MVRV 又跌到 1 以下了,顯示 btc 又進入了相對低估狀態。但是請大家注意,MVRV 只能說明當前的價格跟歷史價格相比,是相對高位還是相對低位。它不能預測價格的反轉,就像 PE 一樣,某隻股票的歷史平均 PE 是 20 倍,當前 PE 是 10 倍,我們可以說它的估值水平處於相對低位,但是 PE 是否會進一步走低,或者它在低位將保持多少年,不是估值要解決的問題,而是擇時問題,是 CVAI 投資課第四課討論的內容。

簡單總結一下,現在就能用於加密貨幣投資實戰的方法是比率研究(加密資產相對於自己過往價格的估值)。比率研究有很多種指標,我個人認爲最有效的就是上面介紹的 MVRV 比率。當然還有很多指標也值得關注,限於時間我們不能講太多。建議大家仔細研究我推薦的網站。另外應該注意的是,比率研究的目的不是預測未來的價格,它也做不到預測價格。它能夠幫助我們瞭解,與歷史價格相比,當前(或者過去某個時點)加密貨幣的價格是處於低位還是高位。這是非常重要的信息,但是直接依賴它做投資決策,超出適用範圍的,會反受其害,還不如不知道。就我所知,目前沒有一個數據指標能夠預測長期價格走向(量化交易發現市場錯誤定價預測短線價格不在此列)。這對於個人投資者其實是好事,因爲我們和專業機構基本處於同一起跑線。或者說專業機構並不能通過特定的數據分析方法,就直接戰勝市場(其他機構和散戶)。基本面投資(包括價值投資)放棄試圖預測短期價格走勢的無效努力,通過多種方法(包括數據分析)力求預測長期價格趨勢,在傳統資本市場和學術界都被證明是可行的,能夠創造出超額利潤。

6、社區很多小夥伴對學習數據分析很感興趣,劉毅老師可以簡單說說學習數據分析是怎麼樣的一個過程,需要具備什麼樣的基礎技能嗎?

學習數據分析的基本要求是能看懂專業人士寫的數據分析文章、製作的圖表。做到這點難度不大,我推薦的網站的每個圖表都不復雜,有初中數學基本就夠了。但是要理解一些數據分析的觀點結論,需要一點統計學基礎,至少要理解均值、方差、協方差、相關性、相關係數這些基本概念。當然統計學懂得越多越好,如果再熟悉統計工具或者會寫程序,那就可以自己做數據分析,不用只接受別人的結論了。