智谱AI CEO张鹏:大模型创业是长征路,技术创新仍有机遇

发布日期:2024-03-04 11:17    点击次数:101

  记者董静怡北京报道

  追赶GPT-4,国内大模型厂商正在新一轮的技术突破中。

  1月16日,国内大模型企业智谱AI团队在其首届技术开放日(Zhipu DevDay)上发布了新一代基座大模型GLM-4。据介绍,相比上一代,GLM-4的性能提升接近60%,支持长达数百页的上下文窗口长度,具备更强的多模态能力,并提升了智能体能力。这些进展与GPT-4发布时更新的性能相近。

  成立于2019年的智谱AI,是国内最早研发大模型的企业之一,由清华大学知识工程实验室(KEG)技术成果转化而来。在国内此轮“百模大战”中,智谱AI是唯一全内资、国产全自研的大模型企业。

  从他们的动态也可以看出国内大模型企业追赶OpenAI的进程。智谱CEO张鹏在发布日上表示,从标准的大模型评测角度看,GLM-4性能整体上已经逼近GPT-4。“多模态是AGI的起点”

  据介绍,此次GLM-4的发布及上线,是智谱AI大模型研发上的关键突破。GLM-4的整体性能相比上一代大幅提升,在多个测评集中,GLM-4的成绩普遍高于GPT-3.5,与GPT-4有微小差距,个别项目上几乎持平。

  据悉,GLM-4还大幅提升了智能体能力,GLM-4All Tools实现自主根据用户意图,自动理解、规划复杂指令,自由调用网页浏览器、Code Interpreter代码解释器和多模态文生图大模型以完成复杂任务。

  智能体降低了大模型的使用门槛。去年6月,OpenAI应用研究主管Lilian Weng就曾提出Agent(智能体)是AI应用层的发展方向。张鹏也表示,GLM模型智能体的推出标志着任何人都能够自由运用GLM-4模型并挖掘它的潜力。

  多模态是大模型发展的重要趋势,围绕“听、说、读、写、看”等进一步提升模型智能化能力,GPT-4、Gemini等大模型都在多模态上发力。在接受记者专访时,张鹏表示,多模态是通用人工智能(AGI)的起点。

  “人大脑一定是各种感官融合到一起的,所以人的智力一定是多模态的,”张鹏向记者表示,“多模态不仅是文到图、图到文这么一件事情,它更多的是探究人的认知能力和各种感官之间的相互作用。”

  不仅如此,张鹏表示,从应用层面来讲,多模态也将催生更多落地应用。东方证券近日研报指出,多模态大模型一方面有利于形成图片、视频等更加生动活泼、更具交互性的应用,从而有助于C端爆款的诞生;另一方面,多模态大模型能真正打通物理世界和数字世界的障壁,实现与物理世界最自然的交互,从而对自动驾驶、人形机器人等具身智能领域的突破提供有力支撑。“0到1总要有人做”

  在国内此轮“百模大战”中,智谱AI是估值最高的明星大模型公司之一,2023年已累计获得超25亿人民币融资,投资方包括社保基金、君联资本、高瓴资本、美团战略投资部等机构。

  谈及国内大模型的整体水平,张鹏表示,必须承认和国外大模型相比,国内的大模型发展起步晚一些,加上高性能算力的限制和数据质量的差距等等,国内大模型无论规模还是核心能力,与世界先进水平还存在一年左右的差距。

  在此背景下,大模型应用的热度在2023年下半年逐渐兴起,业内有观点认为,基于大模型技术的AI原生应用被看作会真正点燃行业的路径,而非继续卷大模型,也有专家表示,AI原生应用的起点会在2024年。

  针对于此,张鹏向记者表示,短期内业内对于大模型发展路径的观点仍不一致,“有人认为中国原创大模型的基础不行,就等着看应用;也有人认为聚焦技术还有机会,值得努力一把,比如像我们。”

  张鹏向记者表示,大模型的技术还没有到天花板,也没有到稳定的阶段,过早地强调应用,反而有可能把这个整个势头拖慢下来。“总有第一拨人做0到1的事情的,为什么你不是那一拨人呢?”

  张鹏表示,大模型发展速度过快,短期之内业内对发展路径的观点很难统一。但将时间维度拉长到十年,业内对于大模型带来的机遇和变革是认同的。

  大模型已成为国际科技竞争“必争之地”,实现国产全自研、自主可控的人工智能基础模型迫在眉睫的任务。“这是个全新的人工智能科学难题,但也是一个我们赶超国际领先水平的机会。”张鹏表示。

  在追赶方面,智谱没有选择复刻先行者的路径,在当时存在BERT、GPT和T5等主流预训练框架之外,提出了GLM(General Language Model)算法框架,实现了BERT、GPT优劣互补。

  “想要追赶,你不能简单踩着别人的脚印往前走。”张鹏向记者表示,“如果所做的事情是建立在一个非你能掌握的,或者他人建立的基础之上,而你对本源都没有认知的话,很难长久地利用这一波浪潮所带来的势能。”

  以GLM-4为例,张鹏表示,从呈现效果上GLM-4正在追赶GPT-4,但具体的实现路径有细微差别,他认为,这是后发者的优势所在。

  “别人走过的路当然是一条比较安全稳健的路,但要想的是这条路是不是唯一的路,是不是最高效率的路。”张鹏向记者表示。

  也正如他在发言中所表示,大模型创业是一条长征路,需要人工智能行业所有的参与者、产业链上下游合作伙伴、开发者社区、学术界一同努力。




热点资讯

相关资讯



Powered by 在线炒股杠杆 @2013-2022 RSS地图 HTML地图

Copyright 365建站 © 2013-2021 365建站器 版权所有