近日,中国信息通信研究院云计算与大数据研究所副所长栗蔚接受科技云报道独家专访,分享了她对云计算的独到见解。
ChatGPT的成功也是云计算的成功
在数字原生时代,ChatGPT是一个颇具时代特色的产物。作为一款现象级的AI工具,几乎所有人都将目光投向了ChatGPT的算法层面。但在栗蔚看来,云计算在其中扮演了非常关键的作用,和算法优化同样重要。
“OpenAI与云计算的联姻,就像大脑找到了中枢神经,不仅仅催生出ChatGPT这样的爆款产品,更是充分释放出以云计算为中枢神经构建的数字生命体的竞争力。”栗蔚说。
纵观应用模型近十年发展史,人工智能模型不断涌现,却从未出现一款智能应用如ChatGPT一样深刻、广泛地改变人类社会生活,太多企业聚焦在模型算法的优化改良,而忽略了云计算中枢神经作用的发挥,也许是其中一个原因。
据栗蔚分析,ChatGPT作为一款“数字原生”的人工智能,云原生理念和技术是其胜出的重要因素。
一是云原生技术为ChatGPT提供超大规模并行计算的统一调度分发服务能力,显著降低ChatGPT训练成本。
在ChatGPT的训练中,高达1750亿个参数在底层进行运算,这种超大规模的模型计算需要对底层大规模算力统一编排和调度,但这种能力单纯靠GPU提供算力是很难实现的,需要云计算技术来实现分布式计算。
这一观点在ChatGPT的回复中也得到了印证。ChatGPT表示自己在模型训练中使用了分布式计算,底层基于云原生K8S服务根据不同的维度分布成超高量级节点的调度,进行分布式的节点计算。当问到分布式计算节点有多少时,ChatGPT表示规模太大了,无法透露。这也在一定程度上反映出大模型的训练消耗资源是非常大的,想要训练一个类似ChatGPT的产品,成本非常高昂。栗蔚表示,如果没有云计算的支撑,时间成本和经济成本将双向上升。
据公开资料显示,过去两年半,GPT-3等大模型的训练成本下降了80%以上,从首次训练开销1200万美元降至140万美元,其中很重要的原因就在于采用了云计算技术——多维信息部署、分布式调度计算、数据离混部技术从而大幅节约了AI模型的训练成本。
二是云原生技术能够实现多维应用部署,实现了ChatGPT的情景学习模式以及多模态(文本、代码、图片等多维度信息)输入。
ChatGPT得以突破以往人工智能只能聚焦文字、图片、语音等某一维度的训练,转而实现多维度的训练,迸发出惊人的自然语言处理能力,其重要原因正是云原生技术。
其中,云原生容器作为数字生命体的神经元,承载着模型参数类型以及调度连接的容器节点,具有标准化部署多维应用的能力,对文本、语音、图像等异构信息标准化接入部署,对“眼耳鼻舌身意”多维信息部署处理,加速数字大脑,也就是人工智能算法的进化。
三是通过云原生离混部技术实现离散训练、在线微调,实现了ChatGPT的人类反馈强化学习(RLHF)的微调训练机制和提示导引模式。
ChatGPT基于大量优质的数据语料训练,实现对话意图识别和内容生成能力的突破,这主要由于ChatGPT具有强大的智能算法学习和记忆调用基础。
通过云原生离线混部和极致弹性调用机制,离线训练千亿级别的超大规模参数,形成了ChatGPT的存储记忆资源池,通过在线补充完成人类反馈强化学习(RLHF)的微调训练机制和提示导引模式,模拟各个脑功能区的反馈,实现多任务单词、句子、图片之间关系的小规模反馈下的自我监督学习。
四是云原生+AI原生联动开启全新商业模式形成良性生态循环。
在开发侧,ChatGPT 依赖于云计算服务,多年来OpenAI共收到了上百亿的投资,这些资金帮助 OpenAI 在平台上运行和训练其模型;在产品侧,OpenAI 基于Cloud Native进行应用开发,基于云计算提供的便捷高性能计算运算模型和打磨算法,并对外销售产品和 API;而投资方基于AI Native来提升搜索、绘画等产品,未来会在Office、Teams甚至操作系统等产品中用到OpenAI提供的能力。
云计算: 数字生命体的中枢神经
“传统人工智能侧重模型算法创新,却忽略了智能是一个复杂的系统化工程。就像人类的智能一样,整体智能应该包括脑区部分和中枢神经,只有脑区而没有中枢神经的智能是静止的智能,人工智能应该建立在完善的中枢神经之上的”。
这个比喻也让栗蔚找到了云计算的独特定位——云计算是数字生命体的中枢神经。
首先,云计算中枢神经能够实现数字世界链接算力和脑区(应用)的调度系统。
云计算分布式能够调度超高量异构高性能计算GPU和通用计算CPU资源,对于异构的计算资源,云计算屏蔽了复杂的部署框架,给大规模参数一个标准化计算环境,可以高效得使用异构算力,降低了大量开发的开销和运行的成本,提高了效率。
其次,云计算中枢神经能够实现数字世界接入、部署和连接多维脑区(多维应用)。
大部分传统人工智能就像早期腔体动物只有一个脑区,只能学习训练单一维度参数,而ChatGPT却可以围绕某个主题同时学习多维(图像、语音、文本等)信息,原因就在于云计算能够实现多维模型参数的标准化部署,使得云计算可以将不同应用参数通过云原生容器等技术标准化部署在不同节点,并相互连接处理,通过云原生数据库等实现多维数据的统一处理。就像人类的大脑中枢神经一样,连接处理不同层级和不同维度的脑区。
再次,云计算中枢神经能够实现数字世界存储记忆(离线训练)和各个脑区(在线提示引导)。
通过云原生离线混部技术支持ChatGPT离线训练,在线提示引导的算法实现,就像人类中枢神经会不断传递经验和现实信息给大脑进行大脑信息修正,在用户看来ChatGPT可以根据交流调整答案,非常智能。
“这么多年来,大家都觉得云好像很重要,但是又说不清楚云计算到底是干嘛的,云在数字世界扮演一个什么样的角色。这和中枢神经很像,说不清在哪儿,但又非常重要。其实云计算和中枢神经一样无处不在”,栗蔚说。
数字原生企业 优先打造“中枢神经”
“云计算作为企业中枢神经的意义应该被更广泛认知”。
在栗蔚看来,尽管国内云计算市场发展多年,但大多数企业仍没有意识到云计算的重要性。很多企业还停留在早期云服务时代,把云计算当做虚拟化资源使用,只看到了云计算降低成本、高效开发的价值。但实际上,云计算是企业的中枢神经,可以实现企业各部门的业务软件贯通、数据贯通处理、流程IT再造。
事实上,正因为大部分企业没有认识到云计算深层次的价值,国内上云率一直停滞不前。据中国信通院统计去数据显示,2021年我国企业的上云率仅有30%,工业、交通、能源等传统行业上云率更低,仅为20%左右。这一数据在近两年内并未明显变化。
随着全球数字化进程越来越深入,数字原生将成为企业的核心竞争力。栗蔚表示,由于建立在中枢神经的发育上,数字原生企业天生适配数字世界规则,拥有数字世界的强大竞争力,将传统模式的企业远远甩在身后。
“就像云计算实现了ChatGPT多维信息综合处理,异构算力资源一体化调度,作为企业中枢神经的云计算,能够打通从上游采购到下游客户的全流程业务链条,打破烟囱式流程,实现采购、生产、销售、渠道、用户消费、人财物等全业务流程再造和创新,以及各环节数据统一汇聚和处理”。栗蔚表示,云计算结合人工智能、大数据等技术,帮助企业成为拥有“中枢神经”和“大脑”的完整智能体,即转型升级为“数字原生新实体”
在栗蔚看来,数字原生企业具有明显的特征:将云原生、大数据等数字思维刻划在企业DNA里,具备中枢神经、大脑、开放学习能力和智慧创新的四位一体智慧能力。而这些企业数字原生的进化过程,正是基于云原生这个最重要的神经元能力支撑技术上发育而成。
所有企业都希望获得数字化转型的成功,但企业想要在数字原生时代胜出,云计算作为企业中枢神经的意义就更应该被广泛认知。不仅如此,栗蔚认为还需要给予企业更多的助力。
一是,打造更加高质量的、云原生的产品,全方位多层次满足企业需求。
栗蔚建议云服务商针对不同行业、规模、类型的企业,提供细分的产品和服务方案。对于大部分的中小企业,提供中枢神经“即插即用”的能力;对于大企业,建立“中枢神经”;对于传统企业等刚刚上云的企业,从一开始就要做好中枢神经的规划。
二是,健全标准和评估体系,引导企业建立“中枢神经”,转型为数字原生生命体。
目前,中国信通院已发布了《云原生技术架构成熟度》标准,帮助企业打造一个成熟的云原生技术架构;《企业数字化成熟度模型IOMM》则针对不同行业、不同规模企业制定面向企业整体视角和企业IT部门视角的成熟度模型,通过“六大能力+六大价值+五类成熟度等级”对企业数字化转型能力水平进行评估,帮助各类企业更好地建设自己的“中枢神经”。
尽管国内大部分企业数字化水平离“中枢神经”还很远,但栗蔚并不气馁。
“数字化时代,云计算正在成为数字生命体的中枢神经,成为企业数字化转型的胎生力量,这一趋势已经到来。我们要做的就是探索数字原生新实体的发展路径,推广相关经验,让更多传统企业理解‘数字原生’、‘中枢神经’理念,持续增强企业创新活力和竞争力。”
在栗蔚看来,云计算技术在未来还将持续演进:一是重新定义软硬件,实现异构算力的统一编排调度;二是打造算网云融合的操作系统;三是实现数字世界新界面,通过标准化的API接口,打造遍布数字世界的神经元。
到那时,云计算作为“中枢神经”价值将赋能千行百业,更多企业成为长在数字世界中的数字原生新实体。
资讯来源:“科技云报道”,原文链接:https://mp.ofweek.com/cloud/a356714618337