文章來源:火幣區塊鏈大數據
作者:袁煜明 杜海 施俊晶 肖曉

摘要

本報告所有數據均來自於火幣區塊鏈研究院數據團隊的抓取和加工,引用請註明來源「火幣區塊鏈大數據」。

火幣區塊鏈研究院推出「火幣區塊鏈大數據」產品,旨在打造區塊鏈最全數據庫。爲投資人、量化交易者、研究人員及區塊鏈創業公司等區塊鏈及加密資產市場參與者提供數據服務,以輔助各類參與者的決策判斷流程。產品提供的數據分爲「鏈上數據」、「社交媒體數據」、「市場交易數據」三個大類,包含 40 多項數據,且數據量還在不斷增加。

鏈上數據方面,火幣區塊鏈研究院總結出了比特幣網絡中的梅特卡夫定律:即比特幣價格的對數與活躍地址數平方的對數呈高度正向線性關係。5 月以來,每週比特幣活躍地址數由 351.2 萬下降至 313.5 萬,下降的主要原因是每週新增活躍地指數不斷降低。

社交媒體數據方面,社區情緒指數分析結果顯示,巴比特社區參與者的情緒兩級分化較爲嚴重,有 25.4% 參與者對市場非常悲觀,21.9% 參與者對市場非常樂觀;而投資人情緒調查問卷結果顯示,39% 的個人投資人大力看多市場,只有 9% 的個人投資人大力看空市場。產生差異的原因可能是社區參與者情緒更加極端。

市場交易數據方面,2013 年至今,比特幣價格最長連續下跌天數爲 8 天,僅發生一次,97.1% 的連續下跌週期都在 6 天及 6 天以內,且在連續下跌 6 天之後,價格回彈的條件概率約爲 72.6%。在較主流的 10 大幣種中,相關性最高的三個幣種對爲 IOTA/BCH、ADA/XRP、ADA/IOTA,相關係數最低的三個幣種對爲 LTC/EOS、XRP/EOS、BTC/EOS。

1. 「火幣區塊鏈大數據」簡介

1.1 業務內容及價值創造

「火幣區塊鏈大數據」產品是火幣區塊鏈研究院最新發布的數據產品,旨在打造最全的區塊鏈數據庫,爲投資人、量化交易者、研究人員及區塊鏈創業公司等區塊鏈及加密資產市場參與者提供數據服務,以輔助各類參與者的決策判斷流程。

服務內容包括:網頁端各類數據查詢、360 度數據評估、行業數據週報、量化交易策略後驗、社交媒體數據檢測、數據挖掘及模型搭建、專業 REST API 設計等等。

「火幣區塊鏈大數據」產品將種類繁多的數據進行相關性整合,並以可視化的方式呈現數據本身和數據分析結果,降低數據使用者的理解壁壘。對於區塊鏈行業研究及投資人員,該大數據產品可以幫助判斷真正的市場熱點以及社區情緒,且基於數據的分析可以更有依據地做出研究結論和投資決策;對於量化交易者,通過模型後驗有助於交易策略的及時調整和優化;對於區塊鏈從業公司,更全面的行業數據有助於競爭分析以及戰略決策。

1.2 數據類別

「火幣區塊鏈大數據」提供的數據分爲三大類:鏈上數據、社交媒體數據、市場交易數據。

鏈上數據

鏈上數據包括交易量和地址信息兩個子類。其中交易量包括鏈上交易筆數、鏈上交易量、鏈上換手率;地址信息包括活躍地址數、失活地址數、重新激活地址數、地址集中度、錢包最近交易時間分佈等 15 項數據,且繼比特幣區塊鏈之後,還在接入更多其他區塊鏈信息。

社交媒體數據

社交媒體數據來自於代碼社區、社交媒體、論壇以及搜索引擎等,包括 Github 新增 star 數、新增 fork 數、粉絲數、閱讀量、詞雲與詞頻、情緒指數、搜索指數等等近 20 項數據,且媒體範圍以及數據種類均在持續增加。

市場交易數據

市場交易數據來自於各大交易所,主要包括各幣種價格行情以及交易量情況,比如本週最高價格、最低價格、價格波動標準差、交易所成交量、交易所換手率等等。

2. 鏈上數據分析

2.1 比特幣裏的梅特卡夫定律

梅特卡夫定律提到,網絡的價值與網絡規模的平方成正比,具體表現爲網絡價值與網絡節點數(即聯網用戶的數量)的平方成正比。經過數據分析,火幣研究院發現比特幣網絡也符合梅特卡夫定律。

我們選取 2017 年 5 月 1 日至 2018 年 5 月 31 日區間內的比特幣 10 日平均價格和活躍地址數量數據,如下圖:

火幣區塊鏈大數據產品及近期研究結論

從圖中可以看出,比特幣 10 日動態平均價格會跟隨 10 日動態平均活躍地址數的平方變化而變化,且變化方向相同。對二者以及二者的對數做相關性分析,結果如下:

火幣區塊鏈大數據產品及近期研究結論

從上表結果可以看出:(1)比特幣價格與活躍地址數的平方呈正相關,二者相關係數超過 0.7,二者對數的相關係數更是高達 0.96 左右;(2)價格取平均值的週期越長,相關係數越大,即正相關性越明顯。我們在此基礎上進一步對二者的對數進行線性迴歸分析:

火幣區塊鏈大數據產品及近期研究結論

從結果可以看出,比特幣 10 日動態平均價格與 10 日動態平均地址數的平方呈正線性關係,且該回歸方程可以在 91.4% 的程度上解釋比特幣價格對數的變動。

2.2 比特幣地址活躍度分析

進入 2018 年 5 月以來,每週比特幣活躍地址數持續下降,由 351.2 萬下降至 313.5 萬。

火幣區塊鏈大數據產品及近期研究結論

我們對活躍地址數進行了拆分:本週活躍地址數 = 前周持續活躍地址數+本週新增活躍地址數+重新激活地址數。拆分結果顯示,總活躍地址數下降主要原因是新增活躍地址數下降。

火幣區塊鏈大數據產品及近期研究結論

從上圖可以看出,前周持續活躍地址數與重新激活地址數保持穩定,新增活躍地址數下降從 192.9 萬下降到 166.8 萬。

3. 社交媒體數據分析

3.1 社區情緒指數

火幣研究院利用目前最好的中文情緒分析處理庫 SnowNLP 統計了巴比特社區 2018 年 5 月 19 日至 2018 年 5 月 25 日內的情緒。社區情緒兩級分化較爲嚴重,有 25.4% 參與者對市場非常悲觀,情緒指數在 0-0.1 之間;21.9% 參與者對市場非常樂觀,情緒指數在 0.9-1 之間。平均指數爲 0.4658,表示情緒爲中立稍偏悲觀。

火幣區塊鏈大數據產品及近期研究結論

該項結果與投資人問卷調查結果有較大出入,2018 年 5 月投資者情緒問卷調查中,39% 的個人投資者大力看多市場,只有 9% 大力看空。產生不同結果的原因可能是論壇用戶在市場情緒方面較爲極端。

火幣區塊鏈大數據產品及近期研究結論

4. 市場數據分析

4.1 比特幣價格連續下跌週期及反彈概率分析

火幣區塊鏈研究院選取 CoinMarektCap 上 2013 年 5 月 1 日至 2018 年 6 月 3 日之間比特幣價格作爲價格連續下跌週期及反彈概率的研究對象,其中相關的定義爲:

  • 開盤價:當天 UTC-0:00 時間的比特幣價格;
  • 收盤價:後一天 UTC-0:00 時間的比特幣價格;
  • 價格連續下跌:(1)連續 3 天收盤價比開盤價低;(2)在連續下跌過程中,如果某日價格回彈在 3% 之內,該日仍記入連續下跌天數;
  • 價格回彈 / 停止下跌:(1)比特幣價格上升 3% 以上;(2)比特幣價格連續上升 2 日,無論上升幅度是否在 3% 以上;
  • 價格回彈概率:價格連續下跌 n 天之後回彈的條件概率。

結果如下:

火幣區塊鏈大數據產品及近期研究結論

2013 年至今,比特幣價格共發生 105 次連續下跌;最長下跌天數爲 8 天,僅發生一次;97.1% 的連續下跌週期都在 6 天及 6 天以內。在連續下跌 6 天之後,價格回彈的條件概率約爲 72.6%。

4.2 數字資產價格相關性分析

火幣區塊鏈研究院選取了 BTC、ETH、XRP、BCH、EOS、LTC、ADA、XLM、IOTA、TRON 十種主流幣種,從 CoinMarketCap 取其 2018 年 1 月 1 日至 2018 年 5 月 25 日之間的價格做相關性分析,結果如下,其中相關性係數定義爲:火幣區塊鏈大數據產品及近期研究結論

火幣區塊鏈大數據產品及近期研究結論

相關性越低越有助於分散投資風險。從結果看,相關性最高的三個幣種對依次爲 IOTA/BCH、ADA/XRP、ADA/IOTA,相關係數分別爲 0.97、0.95 和 0.95。相關係數最低的三個幣種對依次爲 LTC/EOS、XRP/EOS、BTC/EOS,分別爲 0.10、0.21 和 0.26。