原文標題:《Web3 數據經濟》

影子數據經濟

《經濟學人》2017 年 5 月刊的封面故事將數據定義爲「世界上最具價值的資源」。在數據背後,谷歌、臉書和其它少數公司共計投入逾十億美元的市場資本,開展相關業務。對於他們來說,數據就是金錢:更多的數據意味着更完善的人工智能模型、受衆定位更準確的廣告、更可觀的廣告點擊量和更豐厚的收益。逐利的目光又重新回到了數據身上。

我們擁有的數據經濟卻是一種影子數據經濟。這種數據經濟是不透明的:谷歌等公司出於競爭原因對數據進行保密,不與外界分享(即所謂的「data silo」)。同時,權力呈現出集中化狀態,比如扎克伯格掌握 20 億用戶數據。

我們可以將數據經濟轉變爲一種開放且無需許可的經濟嗎?這就是海洋協議(Ocean Protocol)所追求的目標。幸運的是,我們已經有了靈感……

貨幣經濟

2005 年,草莓採摘工 Alberto Ramirez 成功申請到一筆貸款,用以購買一套價值 72 萬美元的房子,而他的年收入是 1 萬 5 千美元。也就是說,他不可能還得清這筆貸款。那他爲何能貸款成功呢?正如數據一樣:跟着錢走。借貸方賺取了鉅額的手續費:他們早就摸清了如何通過信用違約掉期之類的伎倆使「不可能還清」的貸款被評爲高質量貸款。

2008 年,這個不切實際的計劃如紙牌屋轟然倒塌,導致了數萬億美元的損失。最後是納稅人爲此買單。而銀行家們淨顧着聚攏各自的分紅,卻對此殘局一言不發。

這就是美聯儲和銀行所遭遇的影子貨幣經濟。這種經濟是不透明的,同時,權力集中在少數人手中。

但後來我們有了比特幣!中本聰明確地指出,金融危機就是 TA 創造比特幣的原因所在。比特幣引發了區塊鏈運動。而作爲該運動一部分的代幣經濟爲貨幣開闢了新方向:透明且無需許可。

從影子數據經濟邁向透明且無需許可的 Web3 數據經濟

代幣經濟就是我們的靈感來源。正如我們已經通過區塊鏈運動爲貨幣開闢了新天地一樣,讓我們也爲數據翻開新的篇章吧。

讓我們從不透明且權力集中的影子數據經濟轉型爲透明且無需許可的 Web3 數據經濟吧。

從影子數據經濟邁向透明且無需許可的 Web3 數據經濟

問題在於如何轉型?同時,這種轉型實際上會呈現出怎樣的面貌?出人意料的是,這一切的契機在於人工智能。

邁向開放的數據經濟

有了數據,你就可以得到價值。轉化過程的關鍵一步在於人工智能模型。你擁有的數據越多,你的模型就越準確,所獲得的收益就越豐厚。人工智能就是關鍵所在。

從影子數據經濟邁向透明且無需許可的 Web3 數據經濟

企業、非政府組織和政府擁有大量的數據以及人工智能問題(需求)。人工智能初創公司擁有大量的人工智能專業知識。同時擁有兩者的卻寥寥無幾。

企業(財富 500 強公司)、非政府組織和政府內部的確掌握數以噸計的數據。儘管它們擁有數據,卻未掌握人工智能專業知識。它們難以吸引人工智能研究者的加入。爲什麼呢?因爲人工智能專家都去組建自己的初創公司了,他們想通過人工智能賺錢。

同時,相信你也能猜到,這些初創公司開始意識到,他們沒有數據!

只有少數公司同時擁有數據和人工智能專業知識,比如谷歌、臉書等。就是這樣。這些組織形成的小團體在攏聚所有的價值。人工智能成爲了關鍵一環。

如果我們可以將數據所有者(擁有數據的人)和人工智能所有者(擁有人工智能專業知識且渴望擁有數據的人)聯繫在一起會怎樣呢?

從影子數據經濟邁向透明且無需許可的 Web3 數據經濟

爲此,設想我們可以創造一個用於連接這些人羣的基礎層。這個基礎層可以幫助實現人工智能和數據利用機會的均等化。

下面的圖片詳細展示了這一設想。頂層是主要用戶:問題提出者和問題解決者。底層就是上述具備連接功能的基礎層。兩者之間呢,則是類似於生命體中結締組織的中間件:與 AI Commons (直譯爲人工智能公共資源)並存的市場,以及數據科學工具。

從影子數據經濟邁向透明且無需許可的 Web3 數據經濟譯者注:即需方(左邊,同時也是數據供方)和解決方案供方(右邊)

在問題提出者一側,政府經常授權開放自身所掌握的數據。其中包括市級政府,直至州或省級政府和國家級政府。聯合國機構和其它非政府組織正致力於數據處理,但是遇到了和企業一樣的問題。如上文所述,企業難以獲取人工智能專業知識;這項挑戰也降臨到了政府和非政府組織頭上。

就數據而言,需求側相對容易做起來。人工智能熱愛數據。更準確的說法是,數據科學家知道自己的人工智能模型需要儘可能充分地利用外界提供的數據。

因此,真的要讓供給側給力起來。我們採取的方式是讓已標價數據和免費數據如陰陽哲學一般保持對立統一。想象一下,擁有幾十乃至上百個數據市場,在不同的行業和垂直領域買賣數據,比如汽車業、醫學領域等等,以及數據公共資源,那是怎樣的情景。同時,除了有價數據,還會出現免費數據,以及鼓勵人們提供免費數據的激勵機制。如果我們也在公共事業領域提出 AI 問題,加上鼓勵解決問題的激勵機制,我們就有了 AI Commons。

應用

我們一起來探討一下 Web3 數據基礎層的具體應用。

無人駕駛汽車。無人駕駛汽車有望以更低廉的成本實現更強大的機動性。然而,我們需要降低無人駕駛汽車的事故率。爲此,我們需要更多的數據:蘭德公司曾計算出我們需要 5000 億英里的里程數。從個別情況來看,大型汽車製造商計算得出,他們需要 10 到 20 年的時間來獲得這個數據量。寶馬、通用等公司組建了「MOBI (Mobility Open Blockchain Initiative, 移動開放區塊鏈計劃)基金會」(MOBI Foundation),藉此彙集數據,目前在利用 Ocean Web3 數據基礎層。

從影子數據經濟邁向透明且無需許可的 Web3 數據經濟

健康。癌症如果早發現早治療的話,可以挽救生命。我的一位朋友搭建了用於預測癌症的遺傳編程模型。如果可以擁有一個 100 個樣本點的數據集,他就很滿意了,這也意味着他的模型預測能力還是很差的。另外,由於數據收集方面的差異(比如樣本在測量之前呆在培養皿中的時長),每個醫院站點都存在偏差。如果我們可以在獲取來自 10 家、100 家或更多家醫院的數據並建立模型的同時做到保護隱私性會怎麼樣呢?有一種方法:在產生數據的地方計算,同時利用 Federated Learning (校對注:谷歌開發的一種機器學習模型,特點是將模型下載到本地、在本地提供數據改進模型之後再把新模型上傳到雲端、與其他人的更新進行整合)在多家醫院之間建立模型。

這就是 ConnectedLife 的研究方向,該公司致力於應對帕金森病,他們也再利用 Ocean Web3 數據基礎層。

農業。世界經濟論壇衍生出來的 Grow Asia 平臺致力於爲農民提供更多的數據,這樣的話,農民可以更加準確地預測施肥量、播種量等。他們利用 Ocean Web3 數據基礎層來迭代這個過程。

決策。 對於新的歐洲數據隱私保護規則(歐盟通用數據保護條例,GDPR)而言,決策者是基於當今技術來設計這些規則的。制定政策不是容易的事情。其中部分規則可能比較嚴厲,但是也大有裨益。但是,想象一下,如果你可以擁有解決隱私問題的更佳選擇同時可以從人工智能和數據中獲得經濟利益,那豈不是可以順利地完成這項艱難的任務嗎。出於此目的,新加坡政府的數據主管部門(資訊通信媒體發展管理局)目前在利用 Ocean Web3 數據基礎層進行迭代。

從影子數據經濟邁向透明且無需許可的 Web3 數據經濟

人工智能公共資源。作爲「人工智能造福人類(AI for Good)」運動的縮影,去年召開的「人工智能造福人類(AI for Good)」峯會聚集了 40 多個聯合國機構,學習如何利用人工智能實現聯合國 17 項可持續發展目標(UN 17 Sustainable Development Goals, SDGs)。這些機構的工作人員需要切實解決人工智能相關問題,而且他們有數據。但是,他們聯繫不到懂得如何解決這些問題的人士,即數據科學家。我們可以通過網絡實現一次性連接,或者可以在 Web3 數據基礎層中將其向上擴展爲人工智能公共資源。

從影子數據經濟邁向透明且無需許可的 Web3 數據經濟

數據經濟會呈現怎樣的面貌?

上文探討了實現開放且無需許可的 Web3 數據經濟的動機、從貨幣經濟中汲取的靈感、爲這種經濟打造的數據基礎層及其應用。那麼這種經濟究竟呈現出怎樣的面貌呢 ?

啓發

我們可以再次回到貨幣經濟來尋求啓發。一起來了解一下這種開放、自由的代幣經濟都由哪些元素組成。(儘管是一個簡化的模型,但是可能有用。)

從影子數據經濟邁向透明且無需許可的 Web3 數據經濟

底部是代幣經濟的基本層。有儲備貨幣或價值儲藏手段:比特幣。有應用平臺或者交易媒介,比如以太坊。最後還有應用融資平臺:以太坊。最近還出現了未來代幣簡單協議(Simple Agreement for Future Tokens, SAFTs)。

中部是效用的「最後一英里」。這些是去中心化應用。

頂部是經濟層的「最後一英里」。其中包括管理工具 / 錢包,比如 Coinbase、Tresor 和 Metamask;還包括代幣交易所,比如 GDAX 和 Binance (幣安);最後包括挖礦,比如 Bitmain (比特大陸)。

如果數據經濟像代幣經濟一樣(至少基本一致)會如何呢?我們可以通過下面的圖片構想一下。

從影子數據經濟邁向透明且無需許可的 Web3 數據經濟

我們可以對照設想出儲備貨幣、交換單位、數據或資產融資平臺以及效用和經濟的「最後一英里」。

Web3 數據經濟的組成元素

接下來,我們如何來實例化這個數據經濟呢?我們需要填充所有的藍框。我們來根據海洋協議現有 (但是可能變更) 的設計探究出一種實現途徑吧。

結合質押曲線(bonding curve),用戶可以把賭注押在數據資產上(詳情)。這用作表示數據集 X 的相關性。你在 X 上押的賭注越多,表示你認爲它的相關性或普及性會越高、因此爲其提供資金可以期望獲得更多的獎勵(校對注:原文爲「block reward」,區塊獎勵)。

從影子數據經濟邁向透明且無需許可的 Web3 數據經濟

質押曲線(BC)是自動化的做市商,即總是在以一定的價格購買或出售代幣,達到交換的目的。對於數據資產 X 來說,BC 開始出售被稱爲 DX (drops of X)的代幣,以交換 Ocean 代幣 O。起初 DX 數量爲 0,但是一旦有人開始購買 DX,那麼 BC 就會鑄造更多的代幣。DX 代幣隨着購買量的增加逐漸漲價。如果你出售一些 DX,它們就會被銷燬。這就形成了鑄造或燒燬代幣的一種不間斷的循環。

基本層:數據資產融資平臺。每當你發佈數據資產並初始化質押曲線的時候,你也將啓動一次「微型
ICO」。人們可以購買代幣,同時每個代幣都攜有一些從區塊獎勵中獲得預期收入的權利。起初,代幣並不存在。但是隻要有人開始對上述數據資產下注,就會發行這種數據資產的代幣。

從影子數據經濟邁向透明且無需許可的 Web3 數據經濟

基本層:儲備貨幣。質押曲線具備內置的儲備貨幣行爲。曲線下方的區域實際上是一個儲備區,用來控制流動資產。在其中一條質押曲線中押的代幣越多,你擁有的儲備貨幣就越多。

從影子數據經濟邁向透明且無需許可的 Web3 數據經濟

基本層:交換單位。交易的媒介會從購買和出售數據,以及存儲、計算等服務中產生。Web3 數據基礎層具備實現上述目的的多種機制。

從影子數據經濟邁向透明且無需許可的 Web3 數據經濟

綜上所述,Web3 數據基礎層在儲備貨幣或價值儲存手段、交換單位和融資平臺方面實現了數據經濟的基本層。

如下圖所示,該基本層上部就是經濟和效用的「最後一英里」。這裏涉及到很多內容,我們來一一介紹。

從影子數據經濟邁向透明且無需許可的 Web3 數據經濟

經濟的最後一英里:管理員 / 錢包。代幣管理可以通過傳統的工具實現,比如 Metamask 或
Balance,甚或是專門爲數據經濟設計的新型錢包。我們認爲,在代幣經濟中,我們目前已經走到代幣的長尾階段(校對注:即單個產品需求量很小但總市值很大的市場)。而在數據經濟中,我們可以更多數量級的代幣。這可能是 1 萬甚或 1 百萬個數據集,每個數據集帶有自己的代幣。屆時管理這些數據集的方式想必會很有趣。考慮一下這對於錢包建立者來說是多大的挑戰!

經濟的最後一英里:數據交易所。現有的中心化數據交易所和去中心化數據交易所可能會發現增加他們來自 Web3 數據基礎層的數據供應量是有價值的。區塊鏈代幣交易所可能會發現在他們的平臺上買賣更多的代幣是有利可圖的。

經濟的最後一英里:服務網絡。在 Web3 數據經濟中,數據、存儲和計算服務的提供者纔是真正的「礦工」。它們具備三大潛在效益:成爲獲取客戶的新渠道(這個渠道可能很大);爲其客戶提供新性能;以及通過獎勵爲自身及用戶帶來新收益。

效用的最後一英里。這是數據科學家的新世界:更多的數據、更好的信息源和新的收入機會(詳情)。因此,數據科學工具製造者可能會發現,利用 Web3 數據基礎層可以幫助他們提供更優質服務。我們也期待用於應對經濟和效用最後難關的工具出現有趣的結合,比如兼具內置錢包和數據買賣手段的 Jupyter 筆記本(一種交互式筆記本,支持運行 40 多種編程語言)。個別的筆記本憑藉其算法和技術訣竅,可能在數據買賣領域形成新氣象!

簡而言之,Web3 數據經濟可能在很多方面都和代幣經濟很像。

結論

數據就是金錢。讓我們在 Web3 的世界中開啓數據的大門吧。我們從影子貨幣經濟邁向了代幣經濟。數據方面也這麼幹吧。讓我們從影子數據經濟邁向透明且無需許可的數據經濟,即 Web3 數據經濟。