人工智能、数据隐私与区块链的协同效应

2018-09-07365bet足球正网平台 10:48 网络

译者在原文基础上做了适当补充修改,以便理解。

基于区块链的数据交易市场会为机器学习带来很大变化,由区块链数据建立的模型有可能创造出世界上最强大的人工智能。这一数据市场结合了两个最有力的元素:

一、机器学习中涉及的隐私信息——可以在不透露私人数据的情况下进行数据整合建模,

二、基于区块链的激励机制——这些机制能有效吸引更好的数据和模型,并使整个系统更加智能化。

其结果就是整个数据市场更加开放,人人都可以出售自己的数据并保护自己的隐私,同时开发者可以激励用户吸引更好的数据源来调整算法。

建立这些系统非常具有挑战性,对区块生成有各种的需求,不过最简的系统版本已初具规模。相信这些交易市场会把我们从一家独大的互联网2.0带入到开放竞争的互联网3.0,并且数据和算法都将被货币化。

起源

这个想法可以追溯到2015年,Numerai对冲基金的Richard将一份加密数据信息发给一群数据专家,让其对股市建模并相互比拼。之后挑出好的模型进行整合,按照整合模型做股票投资,并对预测准确的人进行奖励。

数据专家之间竞争就像一个完全的去中心化系统,整合模型就是使系统可以应对任何一类问题。

建模


人工智能、数据隐私与区块链的协同效应


我们以去中心化交易所上的加密货币交易为例,为其建立一个完全的去中心化系统是常被提及的问题:

数据:数据招聘区块链工程师培训提供者将数据权益化,并提供给建模者。

建立分组模型:建模者挑选数据并建模。通过一个加密的计算方法进行数据模拟和模型拟合,模型可以在不泄漏隐私信息的前提下被调整拟合。同时模型也被权益化。

整合模型:通过一个算法整合分组模型,变成一个元模型。每个分组模型的权益会被算法采纳。建立元模型与否可以按照不同情况自行抉择。

使用元模型:在一个去中心化的链上交易系统中,智能合约可以通过程序运行元模型并进行交易。

去中心化的收益和损失:对模型进行一段时间的检测,交区块链职业方向易会有盈亏。盈亏取决于每个参与的模型是否足够优化。预测较差的模型所占权益和资金将会被部分或全部去除。其数据提供者的权益和回报也会被相应削减。

 可验证的计算过程:每一步的计算过程或者是中心化并可验证的;或者是去中心化,利用安全的多方计算来实现。

数据托管:因为链上存储的成本很高,数据或模型可托管在IPFS上或安全的多方计算网络上。   

强有力系统的保证

吸引优质数据

吸引优质数据是这个系统中最有效的部分,因为数据往往是大多数机器学习的限制因素。用同样方法,比特币通过开放式激励机制和恰当的数据激励结构,创建了一个全球计算能力最强的应急系统。这将为各类的应用程序带来源源不断的优质数据源。

算法竞争

算法和模型的开放性竞争史无先例,想象一下新闻栏背后的数千种算法带来的多样性。

回报透明

数据和模型提供者可以得到公平的回报,因为所有参与的过程和模型都是可验证的,透明的回报机制提高参与者的积极性。

自动化

链上的操作直接用代币反应价值,这是一个自动的、无需相互信任的闭环。

网络作用

由用户、数据提供者和数据科学家组成的网络,使这个系统更加强大。网络作用发挥得越好,越多资金会聚集在这个领域,相应的数据回报率会越高,这将吸引更多优质数据源和优质数据模型,循环往复。

隐私保护

除了以上所述,隐私保护是区块链带来的一大变化。

提供用户数据分享的选择权,

防止数据和模型的经济价值被他人占有。

如果任由数据、模型不做链上加密,则会被其他用户任意拷贝使用,占用创建者应得的经济回报。

有一种间接的解决方法是私下出售数据。即使购买者选择转售或出租数据,数据的价值随时间推移而减少。这个方法把数据的应用限制在短期使用范围,而且仍然会产生隐私问题。因此使用安全而强大的计算形式尤为重要。

安全计算

安全计算允许模型匀加速与区块链对数据进行拟合但不会泄露数据本身。目前使用和研究的安全计算有三种主要形式:同态加密(HE),安全多方计算(MPC)和零知识证明(ZKPs)。多方计算目前最常用于私人机器学习,因为同态加密过于缓慢,而如何将ZKP应用于机器学习还不明确。安全计算方法正处于计算机科学研究的前沿。它们通常比常规计算慢几个数量级,是系统的主要瓶颈,但近年来一直有进步。

终极推荐系统

为了说明隐私保护的机器学习的潜能,我们来试想一下一个“终极推荐系统”。系统会记录你在设备上的所有操作,包括浏览记录,应用操作,图片,位置数据,消费记录,可穿戴设备,相机和AR眼镜。基于这些信息,这个系统可给你推荐相应的产品。

这个推荐系统将会非常有效果。因为它的数据量比任何一个网站都要多,而且信息分类细化,大量的私人信息通过区块链加密使隐私得到保护,同时机器学习通过模型模拟得出对个体的立体分析。类似于之前的加密货币交易系统,它可以让不同领域的模型,例如网址推荐或音乐网站,通过竞争得到个人的加密数据,在保护隐私的前提下建模并作出产品推荐,甚至可能支付给客户相应的数据费用。

现在的解决方法

下图介绍了来自Algorithmia Research (https://algorithmia.com/) 的一个简单方案:用户将数据样本、回报、和模型绩效指标发布在智能合约中;人工智能算法工程师下载数据样本并建立数据模型,将最优模型返还给智能合约;如果模型的最终测试结果达到预定指标,工程师会得到相应的回报。


人工智能、数据隐私与区块链的协同效应


Numerai (https://numer.ai) 的模型则更进一步:使用加密数据(尽管不完全同态),整合分组模型到元模型,并根据未来的表现(本例中是未来一周的股票交易表现)来作出激励,而不是根据已经发生的信息(即回溯交易表现)。但现阶段数据仍然是中心化的,且重要因素的选取仍受建模者的主观想法限制。

当其他人仍在致力于建立安全的计算机网络时,Openmined (https://www.openmined.org/) 已经在创建一个可以拟合训练机器学习模型的多方计算网络。一个好的最终状态是将相互拥有元模型,它使数据提供者和建模者的所有权与其模型贡献相联。这些模型将被代币标记化,随时间推移可派发股息,甚至可以任参与者支配。这是一种互相拥有的蜂巢式结构,Enigma (ht365bet足球正网平台tps://enigma.co/) 和HumanAI (https://humanai.co/)也有类似的设置。


人工智能、数据隐私与区块链的协同效应



人工智能、数据隐私与区块链的协同效应



人工智能、数据隐私与区块链的协同效应


如何达到最好的结构

我无法准确的说清怎样才是最好的系统结构,但对此我有些许想法。

我曾写过一篇评价区块链的论文:在一个光谱系列中,有基于物理原生、基于数字原生、和基于区块链原生,若区块链原生越多,系统结构越好。区块链原生越少就需要大量可信任的第三方机构,这会增加系统复杂性并减少与其他系统互建模块的易用性。

这意味着如果创造的价值可以量化,系统就更有可能被优化——理想情况下直接以货币形式,更好的是以代币形式。这将创造一个干净的闭环系统。将之前介绍的加密货币交易系统与识别X射线肿瘤的例子作个比较:在后者中,你需要说服一家保险公司X射线模型是有价值的,谈判如何有价值,然后信任一小群身在现场的人,让其来证明模型的成功/失败。

这并不意味着对社会用途而言,数字原生的好处不存在。像之前提到的终极推荐系统就非常有用。如果说到信息挑选市场Curation Markets*,那就是另一种应用,模型在链上程序化操作,系统用代币作为激励回报来管理市场,以此创建一个干净的闭路。虽然现在看来基于区块链的运用还很模糊,但随着时间推移应用会越来越广泛。

启示

首先,分布式、去中心化的机器学习市场可以消除现有科技巨头对数据的垄断。在过去的20年中,他们将创造网络价值的资源标准化、商业化——专有数据网络和强大的周边效应。结果,所创价值使收益从数据转移到算法。


人工智能、数据隐私与区块链的协同效应


换句话说,他们为AI创建了一个直接的商业模式,用数据饲养并训练它。

其次,他们创造了世界上最强大的AI系统,通过直接的经济激励为他们吸引最好的数据和模型。他们的力量通过多方面的网络效应而增强。互联网2.0时代,网络数据垄断变得商品化,这似乎成为下一个起点的理想选择。

第三,正如推荐系统的例子所示,搜索被本末倒置了。搜索变成产品和竞争对人的追逐,而不是用户搜索产品。每个人都有个人偏好,推荐系统通过竞争将最相关的内容放入信息栏中,其相关性由每个人自己定义。

第四,用户能够从Google和Facebook等公司使用机器学习服务中获得同等好处,而不会泄漏隐私数据。

第五,机器学习领域能够有更快的发展。一个广大的数据市场对每个工程师开放,其受益群不再局限于一部分大公司的工程师。

挑战

首先,安全计算方法目前进展非常缓慢,而机器学习的计算成本已经很高。另一方面,对安全计算方法的市场兴趣已慢慢出现,算法本身性能也在不断提高。我看到过去6个月内HE,MPC和ZKPs有显着性能改进。

计算为元模型提供的一组特定数据或模型的值很难。

清理和格式化分组数据具有挑战性。我们很可能会看到一些工具、标准化和小企业的组合,他们可以解决这个问题。

最后,具有讽刺意味的是,创建这种系统的广义商业模式不如创建个体实例那么明确。似乎会带来很多新的加密原语,例如信息挑选市场Curation Markets。

结论

私人机器学习与区块链激励相结合,可以在各种应用中创造出最强大的机器智能。随着时间的推移,可以解决重大的技术挑战。他们的长期潜力是巨大的,并且从大型互联网公司对数据的垄断中受到欢迎。他们也有点可怕——他们引导自我存在,自我加强,消费私人数据,且几乎不可能关闭,这让我怀疑是否创建它们会比以前更好。但无论如何,它们是加密货币缓慢却突然进入每个行业的一大例证。

*Curation Markets是指社区内借助token让用户对其内容进行整理组织,这个制度将信息选择权利归还给了用户。用户把自己的利益跟信息流的质量绑定在一起,大家通过投票选出最优质的算法。

本文意见仅供参考,不构成投资建议。据此入市,风险自担。

你觉得这篇文章有趣吗?

您想了解更多区块链技术信息吗? 


人工智能、数据隐私与区块链的协同效应




免责声明:该文章来至网络,文章表达观点不代表本站观点,文章版权属于原作者所有,若有侵权,请联系本站站长处理!

收藏 举报

延伸 · 阅读