2023年9月19日,“2023上海区块链国际周·第九届区块链全球峰会”在上海开幕。香港理工大学潘乐陶慈善基金数据科学教授;电子计算学系分布式与移动计算讲座教授曹建农进行以《Web3的去中心化数据基础设施:当前进展和未来方向》为题的线上演讲。
更多信息请点击:《“2023上海区块链国际周”精彩内容直击(持续更新中)》
区块链网络对本次会议进行全程现场跟踪报道。以下是演讲内容整理。
各位来宾,大家早上好!我是香港理工大学的曹建农。首先非常感谢万向区块链的邀请,我分享的题目是《Web3的去中心化数据基础设施:当前进展和未来方向》。
大家知道最近Web3.0变得非常重要,首先在技术上,看到了Gartner技术成熟曲线,去年和今年Web3.0达到了发展高峰。各地的政府也把Web3.0作为重点对象,特别是香港,香港今年出台了一个Web3.0的策略声明,要把香港打造成虚拟资产的转换和保留中心。今年5月,北京也发表了关于Web3.0的创新发展白皮书。国际上,英国的新技术部门提出了关于Web3.0的策略,以及国家关于元宇宙的发展策略。
到底什么是Web3.0呢?Web3.0可以看作下一代的去中心化互联网。在第一代互联网上可以阅读想要看到的信息,Web1相当于一个结构化的文件系统,把需要的信息结构化,方便我们查找,这是一个Read only静态的Web。到了Web2时,除了读,还可以创建内容,所以叫Read write Web。到了第三代,就是Web3.0,除了能读、写,同时也拥有创建的内容,所以叫Read write own value Web,我们创建的内容就变得非常有价值。
Web3.0有三个非常重要的特征,第一个是去平台化和去中心化,没有中心化的平台去控制和管理用户的数据。第二是自控,自控的意思是,用户对自己的数据和身份有完全的掌控权。第三是代币化。所有用户创建的数据和内容,都可以通过代币的方式彰显自己的价值。这三个特征决定了Web3.0是一个去中心化,用户可以自主拥有内容、可以共享价值的新互联网。
在Web3.0的环境下,可以看见有很多不同的创新。首先是上层应用的创新,有很多关于去中心化的金融、GameFi和社交SocialFi的创新,这都是围绕Defi进行,Defi是用区块链、智能合约和数字身份,去掉传统金融中的不必要中间渠道。GameFi和SocialFi,分别把Defi的概念和技术应用于游戏和社交方面。对于Defi而言,有NFT、GameFi。除了应用层的创新外,企业组织、社会、经济等方面也可以看到Web3.0方面的创新,最有代表性的就是DAOs。DAOs是允许一个组织通过软件自组织运行,没有集中式管理。
Web3.0经济和社会的架构,也纷纷得到了大家的支持。Web3.0下一程创新,是基于区块链平台和智能合约、数字身份。但除了区块链之外,我们还需要其他架构,比如数字的基础设施以及计算的算力基础设施。特别是最近常见的生成式AI,它从数据到模型,以及用户用模型创建的Campaigns,都是Web3.0非常好的创新应用。
可以看到在Web3.0世界中,除了区块链智能合约和数字身份之外,我们还有一个重要的Component(成分),这个Component就是数据,数据在Web3.0就是价值。我们可以看见有用户在使用各种各样的数据,数据可以是Pos(位置)和Values(价值)。在Web3.0下,数据可以代币化,代币化就变成了用户的数字资产。同时用户的身份也能被数字化,所以就有了去中心化的数字身份。首先要在这两者之间建立关联性,就是用户拥有它创建的数字资产。有了以后,其他用户也有各自的数字资产,就可以形成Web3.0网络,用户可以共享和使用拥有的数据。各自拥有的数据产生的价值,就会被记录、被交易、被公平地传播。因此,Web3.0就是围绕数字进行的世界。
首先是数字的代币化,然后是数字价值和用户身份之间的关联性和认证,随后是每个用户对数字资产的使用能被追溯,最后是通过使用和共享产生的价值能够被公平地自动分发出去。
在这样的情况下,Web3.0领域为什么要用区块链和智能合约呢?因为区块链和智能合约已经用来支持基于数字和身份产生的一系列行为。区块链、智能合约和数字身份,是大家集中考虑和应用的主要部分。数字架构包括数字存储、数字共享、数字安全性,到目前为止是Web3.0还欠缺的主要部分。
在Web3.0的新环境下,需要有一个去中心化的数字架构。基于此,我提出了三层Web3.0数字架构。
首先是数字的存储层。在存储层上是使用层和共享层。再上面是价值层。在存储层,数据被分布式存储,里面牵扯到很多内容,如何高效、可靠地把用户数据分布式的存储起来。共享层,可以找到可共享的数据,在查找过程中如何使用户的隐私性和数据的隐私性被保护。这三层架构支撑的技术有区块链、智能合约和数字身份。除此之外,还需要人工智能、物联网和协作式边缘计算系统的支持。
在这样的Web3.0数字架构下,目前的三层架构发展情况是什么呢?当前的发展仅限于数据存储层。主要是去中心化的存储系统的发展,很多年前就已经有分布式的数据存储系统。这样的分布式存储使得用户可以把数据打散分布到不同的节点上。如何保持数字身份的对应呢?在过去的分布式存储上,又加了区块链。现在有了区块链和分布式存储之后,用户首先要付代币,能把数据存储到分布式存储系统中,同时也知道如何获取或查找数据的方法。区块链的节点主要是用来存储用户希望存储的数据和信息,在区块链上就能得到代币,这是现在主要的运行方式。但这样还不够,它欠缺的地方在于:首先,现在的系统主要是数据的存储系统,没有考虑到数据的共享和数据的价值分配,以及现在考虑的主要是一般性数据存储,没有考虑Web3.0环境下的特殊数据的存储,比如语义数据等都没有被充分研究。
现在Web3.0主要欠缺什么呢?有两边,左边是区块链的特征,数据可以到每一个节点,数据是高度结构化的,存储在区块链上。这些存储的数据也是开源的。但在Web3.0的环境下,数据应有什么特征?首先需要大量的数据,且不是传统的数据,有图片、视频等作为用户的数据资产和Campaign(活动)。我刚刚讲的这些数据有非常丰富的语义性,语义性不只是看作简单的0101的数据。接下来是Web3.0用户产生的数据,有安全性和私密性要求。这是探索两边中间所需要增加的关于Web3.0数字架构所需要的东西。
我们欠缺的是如何能通过安全高效可扩展、可靠的方式来存储共享和自动分配价值,所需要的大量语义丰富、对安全和私密性非常好的数据。
虽然是简单的一句话,但里面包含了很多技术和理论研究成果。大量的数据如何用去中心化的平台实现存储呢?同时还要保证可靠性、存取高效性,且数据的语义非常丰富。在语义丰富的背景下,是不是需要新的查找、打包和共识方法,以及Web3.0数据的私密性和安全性等,在数据共享情况下,提出了新挑战。
刚刚提了Web3.0的去中心化架构,第一,怎样能够有一个去中心化的分布式数据存储。第二,我们怎么能够使得它们被查找、被共享、被使用。
这只是数字架构,放在区块链的环境中,我们还需要一个Text posls(文本位置),包括要去重新设计网络,因为这是一个区块链的分析存储查找结构,能不能在网络上给予支持,比如网络协议知不知道Web3.0的存储语义能够并到网络协议中。到了上面,就是要提供一些服务层,用于支持Web3.0下面的应用,这是一个完整的Web3.0数字体系结构。
未来,除了数字架构外,Web3.0还包括科学的发现、科学的计算,这时候就需要算力的支持。越来越多的Web3.0应用,包括Metaverse和AIGC都需要AI服务,Web3.0的环境是不是要支持数据处理和数据服务器。Web3.0是一个集成数据、计算算力和AI服务的生态系统。所以我们看到这张图,刚讲的是数据架构,数据被使用时需要算力,算力算出来的结果是处理好的数据,能够存到数据架构中。AI的服务需要什么呢?在数据模型被使用时,需要存取这些数据,产生的内容被存储起来,AI需要算力的支持。所以数据、算力和AI的服务,这三者是有机结合在一起的。在未来的Web3.0世界中,这三个重要的部分要能被统一考虑。
我们大学最近申请到了香港一个研究项目,叫协作式边缘计算。这个理念是去中心化的,可以把分布式算力连接起来组成一个网络,使得资源可以被共享。用户在网络的任何节点,连接进来后就可以享受到这个网络里的数据,计算的算力和AI的服务。这样的愿景与内地提出的算力网类似,但我们的构建是遵循Web3从底层往上构建的,就是各自独立的计算算力和数据,能够被连接起来,能够被共享。在这样的情况下,对未来的Web3的计算平台和数据平台,我们都可以提供一个技术上或系统上的样本。这也是我们联合香港大学开发的项目,希望这个项目对Web3.0的发展有所贡献。
总结一下。我今天讲的内容,第一是Web3.0正在作为技术和应用被涌现出来,对政府来说变得非常重要。支持Web3.0的有区块链、智能合约,这是必不可少的。但只靠区块链和智能合约不够,还需要底层的基础架构,有数据架构、算力架构和人工智能架构,来形成一个完整的生态系统,支持Web3.0。
现在区块链支撑的Web3.0数据架构,还面临着很多挑战性问题,大量数据的Volume(体积)和Full replication(完全复制),如何有效可扩展的去处理它。Web3.0丰富的与异性和高度结构化数据之间的平衡,如何很可靠安全地去处理它。最后就是Web3.0环境下的数据和所有资产能够被贡献,我们怎么保证安全性、用户身份、用户数据的隐私性,这些都是具有挑战性的研究课题。
最后是对Web3.0的前景的希冀。将数据、算力和人工智能服务集成在一个协作式的边缘智能平台下——我们希望在不久的将来,可以实现它。
今天我就分享到这里,谢谢大家!
查看更多