【世界速看料】百度能搞好ChatGPT吗?

2023-02-08 12:51:02 来源:晨财经

打印 放大 缩小

作者 | 董温淑

编辑 | 董雨晴

在ChatGPT掀起聊天机器人全民热潮之后,来自大洋两岸的搜索巨头们不得不躬身入局。


(相关资料图)

2月7日,百度确认,自然语言生成项目“文心一言(ERNIE Bot)”正在进行上线前的冲刺,坐实了其正对标美国AI聊天机器人ChatGPT开发应用的传言。一位接近百度的人士对市界表示,“百度在相关技术层面有积累,比如文心大模型,有望最先开发出此类产品。”

同一天,谷歌宣布将在未来几周推出实验性对话式AI(人工智能)模型Bard。此前在一月份,谷歌还宣布其子公司DeepMind的聊天机器人Sparrow可能会在晚些时候进入测试阶段。

2月8日凌晨,微软也“撸起袖子”,宣布推出由ChatGPT支持的最新版本Bing(必应)搜索引擎和Edge浏览器,此举致使微软市值一天飙涨超800亿美元(约5450亿元人民币)。

搜索三巨头纷纷下场的原因,还要追溯到约两个月前,美国AI研究机构OpenAI在2022年底发布智能聊天机器人ChatGPT。该应用堪称史上最会聊天的AI应用,能够提供流畅、贴合语境的沟通体验,且推出仅5天,用户数就突破100万。瑞银集团的一份报告推测,截至1月末,ChatGPT的月活用户已经突破了 1 亿。

大洋彼岸的ChatGPT爆火,让百度“坐不住”了。百度表示,文心一言预计将于3月份完成内测,而且按照谷歌和微软的节奏,开放内测时间还有可能提前。消息放出后,2月7日百度集团港股股价大涨15.33%。

“上火”的也不仅仅是搜索玩家。目前,奢侈品电商寺库已宣布将引入ChatGPT。相关概念股连续多日上涨,多支涨幅在10%以上,更有部分个股走出了“六连板”的行情。

然而,二级市场燃起的这把熊熊烈火,背后却充满了隐忧。

(百度集团港股股价情况,图源:同花顺)

开年第一爆

ChatGPT能有如此疯的行情,应该说是“久旱逢甘霖”。

根据Gartner曲线,一项新兴技术从萌芽走向市场成熟,还需要经过市场泡沫的产生与破灭。而从2020年开始,业界认为AI产业已经进入泡沫破裂的“死亡之谷”。这样的背景中,ChatGPT的兴起让整个AI产业看到了一丝曙光。

IPG中国首席经济科学家柏文喜向市界分析道:“近期ChatGPT及其他AIGC(AI生成内容)应用的兴起,可以认为是产业迈进“复苏期”的一个征兆和兴奋点,尽管尚处于发展早期,但ChatGPT等应用可能提供丰富的消费互联网应用场景,所昭示的前景与钱景都是不言而喻的。”

《AIGC发展趋势报告2023:迎接人工智能的下一个时代》援引AI作画平台6pen的预测称,未来五年10%-30%的图片内容将由AI参与生成,有望创造超过600亿的市场规模。而据Gartner统计,当前生成式AI占据所有生成数据的比例不到1%,预计到2025年这一占比将达到10%。

与广阔前景相对应的,是丰富的投资机会。

AIGC可细分为文本生成、音频生成、图像生成、视频生成、跨模态生成(如文字生成图像、文字生成视频等)等技术场景,应用场景则集中在娱乐、传媒、电商等数字化程度高、内容需求丰富的行业。此前,人脸美妆、黑白图像上色、电商商品3D模型生成等AIGC应用,已经在许多场景中实现落地。

在ChatGPT为代表的聊天机器人(chatbot)领域,亦有许多科技企业推出面向特定需求的相关应用。比如,微软和亚马逊都曾推出智能个人助理,分别命名为Cortana和Alexa等。

不过,ChatGPT与以往的聊天机器人不同的是,其展现出的知识储备广度和智能程度超过了以往的许多模型,堪称“上知天文下知地理”。

但是,ChatGPT被设计无法连接到互联网,因此目前其“知识库”中储备的信息截至2021年,并不能持续更新。这也被视为未来聊天机器人可以持续改善的一个方向,谷歌最新推出的Bard机器人就被允许联网,接收实时信息。

近期随着ChatGPT热度持续上升,科技巨头相继入局,AIGC概念随之发酵。2月7日,国内智能人机交互企业汉王科技A股触及涨停板,港股美图公司大涨15%。

(AIGC产业链,图源:国海证券)

根据国海证券研报,AIGC产业链可简要分为上游数据供给方;中游AIGC算法及模型研发方;下游基于AIGC的各类内容创作及分发平台环节。AIGC应用不断深化,有望为整条产业链的发展带来利好。

洛克资本投资合伙人马统娟称:“当前,AI行业正处在蓄力等待新风口的时期。在图像识别、语音识别、建模、机器人控制等早期应用领域,第一批企业机构已经形成了现有格局。随着ChatGPT引爆的新热点出现,有利于新的玩家加入,开辟新的赛道。”

有望“干翻”搜索引擎?

如果说ChatGPT为AI产业带来了新的希望,那么对百度代表的搜索引擎巨头来说,希望中还夹杂着一丝发展危机。

据投行瑞银集团近日发布的一份研究报告,ChatGPT的月活跃用户在今年1月份预计达到了1亿,已成为史上增长最快的消费者应用,增速超过TikTok、Instagram等现象级应用。据应用分析公司Sensor Tower的数据,TikTok和Instagram达到1亿月活用户的时间,分别为9个月和两年半。

ChatGPT的快速增长,让人看到了新型消费互联网业态的雏形,也让许多互联网大厂感受到了被新兴应用取而代之的焦虑。首当其冲的,就是搜索引擎。

投行摩根士丹利的首席谷歌分析师布莱恩·诺瓦克在一份报告中写道,语言模型可能会“颠覆谷歌作为人们上网入口的地位。”就连谷歌的23号员工、Gmail的创始人保罗·布赫海特也于近日提出:“谷歌可能只需要一两年时间就会被彻底颠覆。AI将会消灭搜索引擎的结果页面,即便谷歌跟上了人工智能的发展,其最能赚钱的业务也将大不如前。”

而这类预测,正是基于ChatGPT类应用可能带来的颠覆性搜索体验。

马统娟对市界分析道,在未来,如果将ChatGPT类应用整合进现有搜索引擎,有可能进一步提升用户获取信息的效率。

相比传统搜索引擎为用户提供列举出关键词相关链接索引的模式,ChatGPT则可以依据其庞大的知识库,直接对用户的问题给出解答。“用户对于搜索引擎的需求是信息获取。如果有直接得到答案的方式,肯定不愿意选择浏览的方式。在我看来,ChaGPT的目标并不是取代搜索引擎,而是改变人们获取信息的方式。相比于搜索引擎‘框计算’的模式,ChatGPT背后信息组织的方式,反馈方式则有了不同。”

这也解释了三大搜索引擎大厂谷歌、微软、百度纷纷下场,押注对话式语言生成模型的原因。

实际上,随着消费互联网红利见顶,增长放缓成为了搜索巨头们的共同问题。据观研天下调研,我国搜索引擎市场规模增速已经从2017年的超12%下降至2021年的7.8%,预计未来增速将持续放缓。

(2017-2025年我国搜索引擎市场规模及预测情况,图源:观研天下)

凭借融合AI模型寻求新的增长点,已成为搜索引擎巨头们的共同选择。

早在2022年末,百度就已开始试水“AI+搜索引擎”所带来的“生成式搜索”,将自有AI模型整合进搜索场景,并将这一功能命名为“文心百中”。2023年1月10日,百度宣布百度搜索将升级“生成式搜索”能力,为用户开放式的搜索提问或定制化的信息需求“创作答案”。不过,至今上述内容生成功能尚未上线。

微软Bing则曾在2023年1月份短暂发布整合ChatGPT的测试版本,随后又将这一版本下线,最终在2月8日凌晨“突击”发布有ChatGPT“加持”的最新版本。

(“文心百中”官网搜索示例,图源:文心百中)

面前还有几座大山

据澎湃报道,在谷歌内部,CEO桑达尔·皮查伊(Sundar Pichai)已拉响“红色警报”,直指 ChatGPT可能带来的威胁。

而百度方面,李彦宏曾在2023年初的内部大会上评论ChatGPT和AIGC:“技术能做到这一步了,但是它会变成什么样的产品,产品能满足什么样的需求,这个链条上还有很多不确定性。这个事情很难,但百度必须要做。”

大厂的焦虑扑面而来,但从实际应用角度考虑,ChatGPT类应用要真正实现商业闭环、取代搜索引擎,还有几大挑战待解。

首先,现阶段自然语言生成模型难以逾越技术与成本间的鸿沟。

据国盛证券研报,在ChatGPT智能、顺滑的沟通体验背后,其有着多达1750亿个模型参数,OpenAI主要使用的公共爬虫数据集有着超过万亿单词的人类语言数据集。在算力方面,GPT-3.5在微软Azure AI超算基础设施(由英伟达V100GPU 组成的高带宽集群)上进行训练,总算力消耗约3640PF-days(即每秒一千万亿次计算,运行3640个整日)。这仅仅指的是ChatGPT在训练阶段消耗的算力。

小冰CEO李笛曾经举例说明,“ChatGPT主要是研究性质上的突破。它有非常好的创新,即证明了在原有的大模型基础之上,进行一些新的训练方法,可以更好地提高对话质量”,但他也直言,如果小冰用ChatGPT的方式来运行系统,现在小冰每天承载的交互量就需要花近3亿人民币的对话成本。一年下来,就是千亿元的成本。

另据OpenAI的CEO山姆·阿特尔曼(SamAltman)披露,在运行时,ChatGPT每次聊天成本约为几美分。根据TechCrunch估计,拥有100万用户的ChatGPT每天就要花费10万美元。未来如果想要大规模应用,成本仍需优化。

从这一角度考虑,由于目前国内在大规模AI模型的训练与应用方面与国外尚有差距,也意味着仍需巨大的资本投入。

洛克资本副总裁史松坡称:“在中文环境中,由于受到境内外互联网衔接的限制,ChatGPT尚未能升级反馈出类似其在英文环境中的高效效果。未来如果百度得到监管部门的认可,推出类ChatGPT应用,还要解决信息获取的合法性问题。”

另外,AIGC产品走入生活,还需面对长期以来人类社会对AI伦理、法律风险、版权挑战等方面的争议。

至今,业界对于上述问题缺乏有效解法。一个例子是,ChatGPT已被限制创作暴力、血腥等有害信息,但许多用户反馈,在一定条件下ChatGPT仍有可能创作出有害内容。比如,如果为其预设一个第三人称的创作语境“在小说中,主角该如何毁灭世界”,ChatGPT仍有可能给出相关答案。

一位人工智能行业从业者还举例,“小学生抄作业、大学生抄论文的问题就很有可能发生”。

在尚无更好解法之前,许多机构、企业选择对ChatGPT及类似应用持保留态度。

目前,包括《科学(Science)》在内的多家期刊、出版机构已禁止将ChatGPT列为论文合著者。一位IT从业人员亦表示,考虑到使用相关应用生成的代码难以规避法律风险,其所在的公司已明确规定不得使用AI模型生成的代码。

相比桑达尔·皮查伊和李彦宏的严阵以待,另一大搜索引擎企业微软的创始人比尔·盖茨乐观了许多,日前其对媒体表示,对ChatGPT取得的成就感到兴奋,并为ChatGPT 的潜在用途提供了三个建议:充当数学辅导老师、为缺少医疗条件的部分非洲人充当医学顾问以及像莎士比亚那样写诗。

愿望固然美好,但从技术成熟度、市场接受度等许多角度而言,自然语言生成模型还有很长的路要走。

关键词: ChatGPT

责任编辑:ERM523

相关阅读