请输入图说
赛道已经有了,围绕大语言模型的竞赛正式开跑,对参赛者来说,大规模语言的商用还有很长的一段路要走。
撰文|蓝洞商业 赵卫卫
「文心一言」发布的前一天,百度创始人李彦宏问文心一言,「你怎么看GPT4?」
文心一言代表的是百度在知识增强大语言模型上的最新成果,对标的就是美国人工智能公司Open AI在大语言模型上的产品ChatGPT,在过去三个月的时间里,ChatGPT吸引了全球互联网的目光,而就在百度发布文心一言的前一天,ChatGPT发布了最新的GPT4版本,已经支持图像输入等多模态模型。
「我测试感觉还是有很多不完美的地方」,李彦宏在文心一言的新闻发布会上,承认文心一言的不足。但前提是,文心一言是全球第一个互联网大厂正式发布的产品(ChatGPT由OpenAI开发,不隶属于微软)。
这种不完美其实广泛存在于ChatGPT和文心一言的大语言模型产品中,尤其是ChatGPT在2022年11月发布后,ChatGPT备受诟病的一点就是,其一本正经的胡说八道,经常乐于编造事实和发明材料来证明其论点,直到GPT4发布,这一弱点才得以真正改善。
百度的文心一言诞生,意味着中国市场有了自己的大语言模型产品。
领先于国内一众互联网公司,百度成为本土化市场中第一家真正发布大语言模型的公司,真正站上了赛道。文心一言,也无可避免被拿来对标微软广泛应用于其产品中的ChatGPT,二者也被视为中美互联网大厂竞争的代表。
即便「不完美」,但对于「你怎么看GPT4」这件事上,文心一言还是给出了让李彦宏相对满意的答案。因为叠加在大语言模型之上的知识增强和检索增强能力,让文心一言对GPT4这个新鲜事物做出了及时的总结,李彦宏说,「未来大家在这个方面也会看到我们不断的进步」。
于是「蓝洞商业」也把问题抛给了ChatGPT,它如何看待新生的文心一言?
ChatGPT把文心一言归入自己的同类,都是基于大规模预训练语言模型的聊天机器人技术,都可以根据用户的输入生成自然流畅的回复,「ChatGPT和百度文心一言各有优劣,没有绝对的强弱之分。它们都是人工智能领域的重要成果,也为未来的聊天机器人发展提供了新的可能性。」
虽迟但到
作为ChatGPT的对标,文心一言在发布时,李彦宏重点展现了大模型语言通用的五种能力,包括文学创作、商业文案创作、数理推算、中文理解和多模态生产等方面。续写三体,做鸡鸭同笼的算数游戏,写藏头诗,创作海报,都可以在文心一言中实现。
换句话说,文心一言会写小作文,能解数学方程式,能玩转生成图片和视频内容,这些都是文心一言的基本功。
尤其是在文学创作、商业文案创作的展现上,体现的是文心一言在内容创作生成上的能力,这需要一定大模型语言的总结分析,辅之以知识增强提高事实性的准确率,进而做到回答的准确和流畅,完成清晰的输出表达。
于是「蓝洞商业」也测试了一下文心一言和ChatGPT,试图从中找到二者的差异化。首先把问题抛给文心一言,让它问问它所关心的ChatGPT。
文心一言的回答逻辑清晰,列出了五个问题所涉及的方向,尤其是在多次验证中,关于人工智能语言模型如何理解人类的情感和沟通方式的问题,是文心一言和ChatGPT二者生成内容中的同类项,都是二者普遍关心的问题。
而同样的提问,抛给基于ChatGPT4的微软浏览器New Bing,得到的回答则同样是五个问题,二者的回答速度相差不多,都展现出了思维和逻辑分析能力,只是ChatGPT4内容相对简单很多,这可能是因为文心一言刚刚发布,内容并不太多。
AI不分高低,能够解决实际需求就是好的AI。
事实上,相比于用户感知到文心一言的生成内容,更值得注意的是其底层技术逻辑系统,这是文心一言得以不断迭代和进化的基础。
文心一言的大语言模型,改变了IT技术的技术栈,让过去的三层分级,变成了芯片层、框架层、模型层和应用层,而文心一言就处于模型层的位置中,百度在这四层中都有布局,所以李彦宏能够强调说,百度的优势独特,「在全球范围内每一层都有领先产品的公司,几乎没有」。
从2019年3月推出文心ERNIE1.0以来,期间经历了多次迭代,而正是因为这些底层技术的支撑,得以让文心一言的大模型不断迭代进化,四层形成一个高效反馈的闭环,帮助大模型越做越好。如今,ERNIE 3.0每天接受数十亿次用户的搜索请求。
如同ChatGPT在过去三个月间的进化一样,文心一言也开启了进化之路,二者将在各自的技术架构中不断优化并提升效率。从这一层面说,百度的文心一言作为本土化的大语言大模型仍旧值得期待,其赖以生存的更高效的模型,需不断升级来满足用户更丰富的场景需求。
十年埋伏
在国内一众互联网大厂中,百度算是在人工智能领域涉足最早、布局最成体系的一个。
究其原因,人工智能一直是李彦宏心心念念的所在。从早年在美国学习计算机科学,李彦宏就表现出了对人工智能课程的兴趣,远超过硬件相关的课程,只是因为当时缺少人工智能的应用环境,李彦宏就觉得比较失望,「只好把这个兴趣埋藏了起来」。
此后,随着计算机网络的发展,尤其是互联网技术的进步,李彦宏才觉得「希望回来了」。
从2012年成立深度学习研究院,到2014年首提搭建「百度大脑」,再到2016年将人工智能列为百度业务核心的核心,百度在人工智能领域的布局一直领先于国内厂商,带动了国内互联网公司成立人工智能实验室的风潮,形成了人工智能科学家从学界向企业界转移的潮流。
「人工智能将是照亮又一个新世代的火种,并在当时几乎无人看好的情况下,大规模投入这一领域。」在李彦宏这一判断之下,百度的体系不断完善,百度在2017年整合内部的AI团队,形成百度AI技术平台体系(AIG),由王海峰任总负责人,此举意在用新的组织形式释放百度人工智能的活力。
伏笔就此埋下。
2019年,王海峰成为百度CTO,这是10年来百度首次进行集团CTO的任命,被外界认为是百度AI战略落地、技术创新驱动产品创新加速的决心。也正是那一年,百度在自然语言处理领域取得先发优势,推出了文心大模型ERNIE 1.0,这成为如今文心一言的技术基础。
这背后的数字,更能证明百度十年埋伏下的能力。从2012年的23.05亿研发投入,到2021年249.38亿研发投入,近十年间百度积累超过1000亿在人工智能等领域的研发,让百度连续5年在人工智能申请量和授权量上排名国内第一。
「智能革命,它的过程会轰轰烈烈,但它的成果将会是一条宽广平缓的河流。人工智能领域的权威人士都认为,在不久的未来,智能流会像今天的电流一样平静地环绕、支持着我们,在一切环节提供养料,彻底改变人类经济、政治、社会、生活的形态。」李彦宏在《智能革命》一书的序言中说。
如今,风终于来了。文心一言标志着百度站上了大语言模型的智能革命赛道,更折射出互联网搜索赛道成为这场智能革命的风暴中心。
在过去的短短一个月,超过650家合作伙伴宣布加入文心一言生态,这成为大语言模型旺盛市场的证明,李彦宏认为,「AI市场即将迎来爆发性的需求增长,其商业价值的释放将是前所未有的、指数级的。」
李彦宏将基于大语言模型上的应用开发,比作是基于安卓或IOS开发的微信、淘宝、抖音等超级应用,因而大语言模型将会给全行业带来三大产业机会:
第一类是新型云计算公司,其主流商业模式从IaaS变为MaaS;
第二类是进行行业模型精调的公司,这是通用大模型和企业之间的中间层,他们具有行业Konwhow(技术诀窍),调用通用大模型能力,为行业客户提供解决方案;
而第三类是基于大模型底座进行应用开发的公司,即应用服务提供商。
多元开发平台的生态价值,才是未来的重点。只有开放逻辑下,拥有连接其他合作伙伴成果与产业环节的机会,才能让大语言模型技术拥抱未来。
在这些产业的未来中,以大语言模型为支撑的智能流,会不会像电流一样平静地环绕、支持着我们?这显然是百度巨大的空间所在。
交汇之后
如今回头看,竞争格局的决定性瞬间在2019年就已经定下。
当百度作为国内人工智能领导者推出文心大模型ERNIE 1.0时,微软也向ChatGPT的母公司OpenAI下注投资10亿美元,试图在云计算和人工智能领域超越亚马逊和谷歌。
如今,随着文心一言在国内的发布,大语言模型的进化速度更快了,中美科技界在大语言模型上实现了交汇。
李彦宏说过,一旦有了真实的人类反馈,文心一言的进步速度会非常快,「我们都希望它快点成长,早日为用户和客户创造价值」。
而竞争的另一端,微软将ChatGPT背后的AI技术纳入Office 办公套件,而提升为GPT4技术之后,ChatGPT是记忆力增加了10倍,开启的视图功能也进入了多模态模式,通过律师考试等一系列考核验证了其逻辑思维能力的增强。
「文心一言不是中美科技对抗的工具」,李彦宏在发布会的最后特别强调。此番是想说明,文心一言是一代代百度技术人员追逐科技改变世界的梦想的产物,是服务亿万用户,赋能千行百业的全新的平台,是创新驱动发展的最佳证明。
这番也是变相回应了微软,微软已然是把百度作为了对手,双方都在触碰人工智能的不同可能。
在今年2月,微软副董事长布拉德·史密斯(Brad Smith)就曾强调,通过负责任的AI推进未来,人工智能是这场竞争的下一个前沿领域。他把百度的人工智能研究院列为下一波人工智能浪潮中的第三大领先者,排在之前的分别是Open AI和微软的结合,以及谷歌内部的Deep Mind。
无论如何,赛道已经有了,围绕大语言模型的竞赛显然已经正式开跑,而对参赛者来说,大规模语言的商用还有很长的一段路要走。
「有必须是前提,可能一开始不够好,但随着用的人越来越多,生态体系越来越完善,国内外的差距会越来越小,甚至追平乃至超越,实践无数次证明,在把某一项技术玩出「花」这点上,我们要充分相信中国企业的智慧」,人工智能技术从业者胖总对「蓝洞商业」表示。
显而易见,人工智能系统正在成为未来日常生活的一部分。AI领域的大神杰弗里·辛顿 (Geoffrey Everest Hinton)曾做过一个精彩的中文比喻,他把GPT4比作是化茧成蝶,「毛毛虫提取养分,然后转化为蝴蝶。人们已经提取了数十亿块理解的金块,GPT4是人类的蝴蝶。」
从这一意义上看,百度和微软是当下「蝴蝶」,只不过分处两地,都是通过背后的NLP(自然语言)技术和大语言模型,确保从机器中提炼符合人类意图和价值观的金子。