4月11日上午,北京国家会议中心,阿里云峰会。阿里巴巴自研GPT大模型终于揭下神秘面纱。
这也是继百度“文心一言”之后,第二个由科技巨头主导并对外发布的国产大模型。虽然目前360等企业同样推出了类ChatGPT产品,但百度与阿里作为消费互联网和云计算领域的龙头企业,无疑被视为大模型之战中,现阶段实力最为强劲的玩家。
(资料图片仅供参考)
在公开亮相之前,阿里方面对“通义千问”的相关信息保持着低调。
此前,阿里云公众号曾在4月7日发布邀测文章,但很快又进行了删除,拿到邀请码的用户并不多。
随后在4月8日举行的一场AI大模型行业论坛上,阿里云达摩院语言技术实验室负责人黄非原定作为倒数第二位嘉宾上场,分享《通义大模型体系及应用》。不过,最后黄非并未如期出席。
可以说,关于通义千问最重要的信息,都被留在了这场令人瞩目的峰会上。
阿里如何盘算通义千问?
通义千问发布之后,阿里云下一步的动作是什么?未来要怎么做大模型?与其他大模型相比,通义千问有哪些特色?这无疑是本届云峰会上最大的看点。
在峰会上,阿里云CEO张勇和CTO周靖人揭示了这三个问题的答案。
张勇提到,在未来阿里云将推出一系列AI大模型及围绕模型的服务。在这个产品体系中,通义千问仅是其中一种产品选择。
实际上,早在2022年9月举办的世界人工智能大会上,阿里云就发布了“通义”大模型系列。通义千问是这一系列中的“新成员”。
张勇还宣布,阿里所有产品未来将接入大模型,进行智能化升级,包括天猫、钉钉、高德地图、淘宝、优酷、盒马等。不过,会后周靖人在采访环节表示,阿里全线产品接入大模型还没有具体的时间表。
同时,阿里云还将积极推动企业客户接入大模型,他提到:“今天,阿里云将把这些AI基础设施和大模型能力向所有企业开放,共同推动AI产业的发展。”
目前,阿里云已经与多家企业展开了合作探索,包括OPPO安第斯智能云、太平洋保险、吉利汽车、上汽、奇瑞汽车、毫末智行、太古可口可乐、波司登、掌阅科技等等。
▲(大模型将接入阿里所有产品,图源/市界摄于阿里云峰会)
周靖人展示,通义千问具有多轮对话、文案创作、逻辑推理、多模态理解、多语言支持等能力。不过据「市界」对通义千问的试用,当前版本的模型还不具备文字之外的多模态内容生成、理解能力。
对此周靖人说道:“目前我们开放了通义千问作为语言模型的原始能力,今后我们还会逐渐将搜索、知识增强等能力接入到通义千问的产品体系中,不断对产品体系进行升级。此外为了更好地使用千问,我们还需要不单单以web的形式与千问进行交流、提问,为了便于开发者去实现一系列应用,我们还将提供多种模型的接入、调用方式,用简单的API的方式去实现这样的能力。”
换句话说,通义千问未来将像ChatGPT、GPT-4一样,提供插件功能,允许开发者进行个性化开发、形成产品生态。
▲(当前版本的通义千问还不具备图片生成能力,图源/通义千问)
此外,周靖人还介绍了阿里云在训练、部署大模型背后的技术支撑,并从模型训练、模型推理、模型服务的成本三方面分别进行阐述。
据其分享,针对模型训练任务,阿里云启动了灵骏计算集群进行算力、存储支撑,灵骏平台能够支撑10万张GPU卡的计算规模,并实现低延迟互联。
推理方面,阿里云可以把模型部署在全球28个地域。同时,为了降低模型服务成本,阿里云可通过对模型的压缩,将成本降低至1/8。
张勇在阿里云的第一战
在通义千问发布之后,阿里云还将有一系列新动作,包括在4月18日发布行业大模型,以及尚未公布举办时间的生态大会——峰会上,张勇透露阿里云会在生态大会上提出全新生态战略。
接下来紧锣密鼓的新产品和战略发布,也意味着张勇和阿里云紧绷的“弦”,还不能松懈下来。
这个4月对于阿里巴巴来说颇不平静:创始人马云回国引发大量关注,一号位张勇官宣组织大变阵造成的热议仍在坊间流传……每个人都在关心,这家庞大的商业体下一步将要做些什么、去往何方。通义千问正是在这样的背景中亮相。
“张勇看起来又老了。”在云峰会会场中,一位熟悉阿里云的人士对「市界」说道。
在会上张勇也坦言:“(这个4月)对我来说也是一个全新开始,大家都知道,年初我躬身入局,亲自带队阿里云业务。”
从各个角度而言,大模型通义千问都在阿里云内部获得了极高的优先级。
据一位阿里员工告诉「市界」:“这段时间虽然阿里云研发人员很少直接见到老逍,但后者一直在亲自盯云业务线,主要对接云业务的高层(注:张勇花名为逍遥子)。”
无论是从技术迭代浪潮的冲刷,还是从阿里自身来考虑,入局NLP大模型都是阿里云不得不打的一场仗。
▲(图源/市界摄于阿里云峰会)
一方面,OpenAI发布的ChatGPT为整个行业做了议程设置。为了追赶大洋彼岸的强劲对手、不错过对NLP阶段性关键产品的攻城略地,包括阿里云在内的科技巨头们只能奋起直追。
特别是对阿里云来说,其在发布国产NLP大模型方面的时间表,已经比百度晚了一步。
在大模型的抢滩期,越早发布产品,意味着能够越早与企业伙伴达成合作。3月16日,百度举办大模型发布会时,官方数据称已有650家企业宣布接入文心一言。在拓展模型生态方面,阿里云或已落在后头。
另一方面,对于阿里云和整个阿里集团而言,面对消费互联网发展空间越发狭窄、产业互联网增长遭遇瓶颈的现实,找到新的增长引擎更是十分紧迫。
2022年12月29日,张勇发出全员邮件,将新一年的关键字定为“进”,而上一年的关键字是“定”。同样是在这封邮件中,张勇宣布自己将直接兼任阿里云总裁的职位。
从“定”到“进”的转变过程中,大模型成为这家云计算巨头不能错过的风口。
面对友商在大模型市场中的竞争和开拓大模型市场的挑战,阿里云在峰会上提到将全力投入AI建设。不过,周靖人表示,全力投入并不是不计成本all in AI ,“阿里云在智能方面的投入没有改变,我们一直是云智一体,不是all in,而是一如既往地投入……我们一直在做深度研发,策略没有改变”。
此前,周靖人也曾在接受品玩采访时提到:“通义千问是我们的一个中间态……它不是起点也不是终点,是个既定路线上的节点。我们这次是把过去积累的一部分工作向社会,向开发者开放。”
作为对比,百度在3月16日发布文心一言时,称文心一言对标的是2022年11月的ChatGPT版本。而阿里云并未公布通义千问对标的行业产品。
为了不断逼近“既定路线”上的目标,阿里云还需要不断推进“中间态”模型的迭代,以及拓展模型应用生态。
大模型赛道卷起来了
从2022年末至今,由ChatGPT掀起的大模型争霸赛愈演愈热,下场选手已经越来越多。
就在阿里云峰会举办前两天的4月9日,360宣布基于360GPT大模型开发的人工智能产品矩阵“360智脑”率先落地搜索场景,将面向企业用户开放内测。
紧随其后,“港股AI第一股”商汤科技在4月10日发布了名为“日日新SenseNova”的大模型体系。该体系下的千亿级语言大模型“商量SenseChat”号称拥有多轮对话和超长文本理解能力。
接下来,知乎、科大讯飞等企业将发布AI技术进展或相关战略。美团联合创始人王慧文创办的光年之外、搜狗创始人王小川创办的百川智能……许多创企同样瞄准了这条赛道。
另外,尽管华为、京东、腾讯等大厂尚未对外公开发布大模型产品,这些企业均有相应的技术布局。
AI从业者蒙灵告诉「市界」:“我们业内的人都在调侃,NLP大模型的市场还没来得及‘变蓝(海)’,可能就要‘红(海)’了。”
扎堆涌入的大小市场参与者,都在押宝一种名为MaaS(模型即服务)的商业模式。也就是如同SaaS、PaaS等云计算商业模式一样,允许客户利用大模型底座打造出个性化功能。李彦宏曾对此预测:“之前企业选择云厂商更多看算力、存储等基础云服务。未来,更多会看框架好不好、模型好不好,以及模型、框架、芯片、应用这四层之间的协同。”
▲(图源/市界摄于阿里云峰会)
但同时,市场普遍认为大模型市场将迎来激烈的竞合,最终仅留下少量玩家。如OpenAI(ChatGPT的发布方)创始人Sam Altman曾经的预测:“将来应该会出现几个大型的基础模型,开发人员都将基于这些基础模型研发AI应用。”
华为云人工智能领域首席科学家田奇也曾提出,未来“大模型将成为应对AI领域应用碎片化的一种方式,相较于此前不同场景对应不同小模型的状况,未来大模型有可能收编高度定制化的小模型,导致市场向大公司集中”。
另外,还有声音认为大模型并非解决所有商业问题的最佳解。
一家AI创企业务负责人告诉「市界」:“在很多的应用场景中,并不需要用大模型来解决问题,用一个小模型、中模型就能把问题解决得很好,所以说杀鸡焉用牛刀?况且中小企业客户的付费能力无法支撑接入大厂大模型。那未来应该怎么办?是像当初云计算市场一样,先用ToC打法去烧钱抢市场还是有新的玩法,我们都不知道。”
无论如何,一场全球科技企业都积极参与的AI争霸赛已然开始。
在阿里云峰会上,张勇说道:“所有行业和服务都值得重新做一遍。”但在重新定义千行百业的商业模式之前,还有许多问题需要解决。通义千问、文心一言或许都仅是一个开始。
作者 | 董温淑
编辑 | 董雨晴