價值探索 51 期

探索價值 51 期 : ROSETTA AI 開發框架橫空出世

上期 AMA 活動 PlatON 的小夥伴們已經和大家分享了數據的價值以及在此之上的隱私能力的重要性。這一期, 我們要更進一步, 全世界最需要數據的地方, 人工智能領域的發展, 同樣離不開隱私能力的加持。讓我們揭開 Rosetta 的神祕面紗。
分享人:謝翔
整理: 紅軍大叔( 無涯社區 )01Rosetta 是什麼?這個名字的由來有什麼含義麼?

Rosetta 是基於 TensorFlow 的隱私 AI 框架,目的是能夠降低 AI 開發者的門檻,讓其能夠在不需要了解隱私計算技術細節的前提下使用,將原來傳統的數據處理方式很方便的切換到隱私計算的方式下來。

Rosetta 的名字取自古埃及的羅塞塔石碑(Rosetta Stone)。其上記載着古埃及象形文字,埃及草書和古希臘文。這裏 Rosetta 寓意着承載和結合隱私計算、區塊鏈和 AI 三種典型的技術。

02 爲什麼說隱私計算的核心是隱私 AI?PlatON 爲何會考慮加入 AI 支持?

這還得從 PlatON 的定位說起。PlatON 一個目標是要打造隱私計算的商用基礎設施。這裏的核心點是以商用爲目標

在現有的商業應用中接觸數據最多的應該就是 AI 行業,而且現在整個 AI 行業已經遇到一個大瓶頸:數據較爲分散,爲了提高整個模型的精度,則必須能夠拿到更多的數據;但是由於數據隱私的問題,越來越難拿到別人的數據。這個“矛盾”帶來的問題已經在 AI 整個行業突顯出來。

支持隱私 AI 則能在很大程度上緩解現在 AI 行業的“矛盾”,因而也會存在着巨大的新興市場。從商業角度,或者市場規模角度,支持隱私 AI 是必然的道路。

03Rosetta 框架核心是希望解決什麼問題?Rosetta 是整個 PlatON 系統中佔據一個怎樣的位置?

Rosetta 最終目的是要爲隱私計算提供快速,高效、穩定的開發框架。以解決在 AI 應用中數據的隱私保護問題。

PlatON 是要打造“隱私計算網絡”+“分佈式經濟體基礎設施”,分佈式經濟體基礎設施就是大家熟悉的區塊鏈。而 Rosetta 則是要爲建立隱私計算網絡提供基礎的技術框架。後續的隱私 AI 的應用都會基於 Rosetta 上來開發,當然也希望廣大開發者來使用 Rosetta,我們一起來不斷完善。

04 能否爲我們暢想一下, 解決了隱私保護問題之後的世界是什麼樣子的?或者說, 今天的數據隔離損害了哪些具體的效率?

要徹底解決隱私保護問題需要足夠長的一段時間,甚至也不能完全解決。但是我們期待的一個世界是,數據的價值可以真正的被量化,個人對自身的數據有完全掌控權。

數據不再是被拷貝的次數越多價值越低,而是使用的次數越多價值越高。數據最終可以真正“安全”的在不同的應用中流動。

現在數據保護的問題其實是非常嚴重的,個人的數據在未經允許下被濫用,電話號碼,身份證信息,住址等等其實都已經完全在不知情的泄漏給了第三方。希望以後的數字世界裏能夠緩解這些問題。

05 看到 Rosetta 幾乎集成了所有主流的 AI 框架, 如果一個開發者已經用 TensorFlow 實現了一個 AI 應用, 希望遷移到 PlatON 上, 需要根據 Rosetta 做哪些工作?

Rosetta 的目的是期望可以兼容各種主流的 AI 框架,但是我們目前還是腳踏實地的以 TensorFlow 作爲首選。

Rosetta 的最終目的就是降低熟悉 TensorFlow 的 AI 工程師使用隱私計算技術的門檻。如果已經有了一個 AI 應用,那麼工程師只要修改極少量的代碼,就可以把原來的應用遷移到隱私計算的框架下來。比如,只要引入下面的包即可:Import latticex.rosetta

06 基於 Rosetta 的框架之上的第一個產品將會是什麼?該產品的定位和作用可以介紹一下麼?

基於 Rosetta 框架之上的第一個產品將會是數據銀行(Data Bank)

數據銀行是一個數據資產的交易市場 , 以各類的數據生產要素爲核心服務對象,結合隱私 AI 算法、PlatON 區塊鏈,打造的分佈式數據資產交易平臺。

面向數據提供方、數據需求方和數據所有者提供全方位的技術基礎設施與全方位的產品支撐,激活並高效配置數據資產,釋放數據紅利。

數據銀行結合法規和政策,確保數據的隱私性和可用性,實現數據的可用不可見,可滿足跨機構、跨行業的數據融合、聯合分析和建模的需求。

07 提到 AI 我們不能不提大數據, 而提到大數據的第一個印象就是一個字“大”, 那麼我們可否認爲, 數據的價值主要是數據量的大小?

其實不然。我記得發生過一件事,某個雲廠商因爲技術問題丟失了一個企業客戶的數據。當時是按照數據量大小賠付了幾十萬元,但是該企業客戶依賴這些核心數據估值到了上千萬。所以很明顯直接按照數據量大小的估值方法是非常不準確的。

或者舉另外一個例子,大家是覺得以太坊網絡裏面所有的公開的交易數據(大概超過了 1TB)更有價值,還是手上擁有以太幣的賬號的私鑰(32 字節)更有價值?

所以,我們一直認爲數據的“效用”纔是體現數據價值的標準,而數據效用的體現離不開隱私計算。

08Rosetta 框架是面向哪些潛在用戶的?他們願意選擇 Rosetta 的理由會是什麼?

最直接的用戶應該是 AI 開發者,最大的理由就是可以複用存量的代碼,一鍵轉換

當然還包括另外兩類潛在用戶,一類是隱私計算算法開發者,包括密碼學,TEE 等等。也特別希望他們能把好的算法和框架結合起來,爲最終的 AI 開發者提供更多的工具。

另一類就是架構師,在 Rosetta 的團隊裏,我們有之前長期從事編譯器的同事,經驗豐富的軟件架構師,以及算法的同事一起在配合。

爲了瞭解 TensorFlow 的底層架構,我們花了 2 到 3 個月左右的時間一行一行讀 TensorFlow 的底層代碼。我們也深知現在對於 TensorFlow 底層架構的瞭解還不夠,所以也希望這方面的高手和我們一起來打磨和改善 Rosetta。

09Rosetta 開發框架預計什麼時候能和開發者正式見面?

Rosetta 的 v0.1.1 版本已經在 Github 上開源了,大家可以從這裏訪問:https://github.com/LatticeX-Foundation/Rosetta

歡迎大家 Star/Watch/Fork.

10 對於不同的企業之間的數據一起共享來做模型訓練來說, 在 Rosetta 技術上是通過什麼方式來支持?

這個問題我們把它叫做聯合建模,這是 Rosetta 支持的最經典的一種場景。

在傳統的方式下,開發者用 TensorFlow 寫一個模型,然後把數據收集起來進行訓練。當然,現在這種方式不再能行得通,因爲基本上很難把企業的數據收集到一起。

那用 Rosetta 的解決方式很簡單,還是利用原來的代碼,稍微添加一些內容(比如,import latticex.rosetta), 把這段代碼部署在不同的企業之間。就可以進行安全的聯合建模,也就是說大家一起訓練,但是不需要收集原始數據了

底層的技術,我們目前是採用的安全多方計算(MPC)來實現的,當前的版本支持三方一起來進行聯合訓練,後續我們會在豐富這些算法。

11 未來我的計算可能是放在某個雲計算中心, 但是我又不希望雲計算平臺看到我的敏感數據, 這種情況下 Rosetta 可以幫到我嗎?

這是 Rosetta 考慮的另外一個場景,我們叫做安全的數據外包,採用的是同態加密算法的技術。大概原理是用戶把數據加密之後存放在雲端。雲端對數據不可見,但是通過同態加密算法可以對數據進行操作。

我們的後續版本會集成同態加密算法,可以讓開發者無門檻的從普通的計算方式切換到基於同態加密的計算方式。

12PlatON 有打算如何支持開發者更好的理解和使用 Rosetta?

首先,在我們的 github 上有比較詳細的使用說明,包括 examples 和 tutorials,歡迎大家去試用和提意見。

另外,我們預計會有一系列的技術講解和活動,來讓大家熟悉如何利用 Rosetta 搭建隱私 AI 的模型訓練和預測。

最後,我們也會結合一些現有的案例,來爲廣大開發者介紹如何在實際案例中使用 Rosetta。

END

-往期回顧-

  • PlatON 商業落地完美構想與實踐

  • OG·weekly DeFi 陣痛 , 需要輸入新血液

  • OG·weekly: 打春·窮奇· 健康可持續發展

  • OG·DeFi weekly: 小寒 · 蠃魚

  • OG·DeFi Weekly: 2020 快樂

  • DeFi weekly: 盤點 2019, 展望 2020

  • DeFi weekly: 去掉妄念 , 繼續演化

  • Maskbook: 沒有祕密的人多無聊

  • DeFi 週報 : ENS 放異彩 , 超額抵押受到挑戰

  • DeFi 週報 : 去中心化金融穩定發展

  • 劉毅 : DeFI:未來的開放式金融應該是什麼樣子?

  • 潘超 : DeFI:以太坊的貨幣樂高

  • DeFi 一週速覽 : 錨定多個資產 , 合規 , 線下

  • Kava 主網上線 ,DeFi 市場將重新洗牌

  • 崔偉 : DeFi 的核心優勢和挑戰

  • DeFi 一週速覽 : 有些挑戰,有些變化,有些質疑

  • 楊民道 : DeFi : 以太出埃及記

  • 如何讓 DeFi 中的抵押品流動起來?

  • DeFi Weekly:速覽 DeFi 要點

  • 如何用 ETH 投資特斯拉債券?

  • 壓死 P2P 的最後一根稻草 , 會是 DeFi 嗎?

探索價值 51 期 : ROSETTA AI 開發框架橫空出世