世界快看点丨10万月薪,大模型疯狂抢人

2023-04-17 19:00:20 来源:市界观察

打印 放大 缩小

砸10万月薪抢人

春江水暖鸭先知。算法工程师王膺开始意识到,行业的春风“吹”回来了。

这股暖风来的甚至猝不及防。王膺曾在北京一家AI药企工作。2022年下半年的行业寒潮中,他被公司裁员,之后一直没有拿到心仪的offer,最终勉强接受了一家母婴企业算法部门递来的橄榄枝。

“去年9月被裁后找了两个月工作,那段时间感觉整个行业都在缩HC,现在就不一样了,翻翻招聘平台,人工智能相关的岗位多了不少,大厂小厂都在招。”


【资料图】

这种机会实在难得,王膺计划再次投递简历,赶上这趟快车。

一位专注AI行业的猎头Anson也有同样的感受,他说道:“大概从2月开始,客户对AIGC(AI生成内容)相关人才的需求明显增多。”

王膺和Anson感受到的这股“春风”,正是由ChatGPT代表的NLP(自然语言处理)大模型领域吹来。据脉脉高聘人才智库最新调研数据,今年1-2月AIGC人才需求逆势上涨,岗位数量同[gf]2f50[/gf]增[gf]2ed3[/gf] 31.3%,创下历史新[gf]2fbc[/gf]。

▲(图源/脉脉高聘人才智库)

去年下半年以来,随着ChatGPT这款号称“敲开了通用人工智能大门”的划时代产品横空出世,类GPT项目就成为行业热门方向。上至百度、阿里等互联网大厂,下至许多成立仅仅几个月的创企,都把研发大模型列为了业务的最高优先级。

多位猎头也向「市界」证实,近期随着ChatGPT爆火,AIGC相关的岗位热度受到带动,需求十分火爆。

而在招聘平台上,输入AIGC、NLP等相关关键词进行搜索,可以看到“50k+16薪”等高薪岗位正虚位以待。在火热的AI风口之下,这个薪资水平甚至都还不算高。

2月14日,脉脉创始人、CEO林凡在自己的社交媒体上发了这样一段话:“ChatGPT带动的AIGC创业热潮要来了!猎头已经开出10万月薪抢人。”

而一位业内人士透露:“在一个算法团队中,对领头的Leader来说10万月薪并不高,毕竟如果没有Leader,再多薪资也有点赌博的成分。据我了解,在Leader之外的普通算法工程师群体,薪资分布大多在3-5万,80%的确拿不到10万。”

一位猎头则告诉「市界」:“(相关人才)跳槽的具体薪资和涨幅范围不便透露,我只能告诉你,很多客户会强调,如果遇到优秀的候选人,待遇可以高于市场水平。这个行业拿的是总包,16薪、期权等等平均下来,非常优厚。”

10万月薪当然并非空穴来风,背后支撑的正是疯狂涌入的资本。

刚刚过去的几个月中,包括王慧文(美团联合创始人)、王小川(搜狗创始人)、李岩(快手前MMU负责人)在内,一众“感觉自己又行了”的互联网大牛们兴奋的宣布入局大模型创业,都说要打造出中国的OpenAI(ChatGPT的开发方),初期募资几乎都在5000万美元以上。

其中,王慧文创立的光年之外,到第二轮募资时投前估值已到10亿美元。据雷峰网报道,两轮融资中光年之外分别收到了真格投出的1000万美元,王兴个人投出的1500万美元,源码资本领投的1亿美元,还有并未公布金额的腾讯云,同样奉上了诚意金。

资本的卷入,让市场火热。紧随其后,越来越多的企业和创业者开始跑步入局,人才的需求急剧上升。

以对冲基金企业幻方科技为例,刚刚过去的4月13日,幻方科技也宣布将“成立新的独立的研究组织,探索AGI(通用人工智能)的本质”,并开始为此招募员工。

不仅仅是大模型领域,创投对大模型的热衷刺激着整个行业的人才需求。

国内首家推出ChatGPT数据标注服务的AI数据企业星尘数据(北京星尘纪元智能科技有限公司)的创始人、CEO章磊则透露,作为AI算法的上层供应商,星尘数据也为应对业务量的增大而在持续招聘,“我们愿意培养零经验的学生去做大模型等等顶尖的事情。但现实是很多毕业生并不知道有新增量的岗位、扎堆投递大厂的简历,所以我们一直在积极招人。”

正在江苏攻读人工智能相关研究生学位的应届生陆鸣也告诉「市界」:“我之前一直在CV(计算机视觉)企业实习,接触的企业一般有两种技术路线,而ChatGPT可以完全变革这两种传统的路线。新技术落地、使用的过程中肯定会有新的岗位需求。”

“王慧文们”的人才焦虑

原本行军打仗讲究“兵马未动粮草先行”,但在这个蓄势待发的新赛道里,找到“兵马”都是问题。

各个大模型项目的负责人为招募人才使出浑身解数,不惜亲自下场喊话,试图用自己的承诺与人格魅力“打动”潜在的候选人。

王慧文在2月13日广发AI英雄榜时就曾豪迈宣布,将拿出新公司光年之外75%的股份“用于邀请顶级研发人才”,并承诺解决项目资金问题,“放心施展你的才华,杂事交给我来打理”。

搜狗创始人王小川则直接通过公开信,写道“我们呼唤中国的领军人物、行业产品经理和远在美国的同仁加入”,并一举为00后至80后的技术人才列出5个招聘邮箱。

企业对人才的焦虑与渴求,也传递到了猎头身上。如Anson所说:“我和身边一些人都认为这是一个新出现的东西,现阶段人才供应小于市场需求,要和同行比谁更先触达、谁更先交付(候选人)。”

星尘数据CEO章磊称:“从我经历过硅谷的人才之争,以及现阶段国内的‘抢人大战’来看,AI人才受到高薪追捧可以归结为两大原因。”

一方面在当前阶段,速度意味着胜利,越早集齐人才、算力、资金等资源进行攻关研发,就意味着多占一分胜算与先机。

从算法角度而言,训练NLP大模型所采用的主流算法如LLaMA、ChatGLM代码已经开源。

同时,OpenAI推出的ChatGPT、Anthropic(美国人工智能初创企业)推出的Claude等商业化方案也得到了市场和资本的认可。另外还有许多大模型研发成果正不断涌现,比如3月初由谷歌和柏林工业大学团队发布的多模态大模型Palm-e,进一步刷新了人类的认知、拓展了AI能力的边界。

时间紧,任务重。路径已被跑通,对每个新入局者而言,现阶段最重要的任务都是依据前人的脚印尽快训练出模型。

▲(NLP算法历史演进情况,图源/千芯科技董事长陈巍)

但同时在另一方面,高素质的大模型研发人才本就极其稀缺。

章磊说道:“粗略计算下来,市场上或许已经存在几十个大模型项目,但同时我预计国内真正有过大规模分布式训练经验的人才应该不超过1000人,保守一点来说仅有两三百号人。”

“本来优秀的算法工程师就是稀缺资源,从业者的能力高低可以说是天差地别,想要达到门槛上限,明确是需要PhD(高级学衔之一)、或者说有丰富经验的人去做。这里提到的经验,指的不是时间的长短,而是做的算法的前沿程度和业务资源投资规模的大小。”

这又引出了另一个问题:“对算法工程师而言,训练过大模型和训练过普通模型是两种完全不同的事情,比如训大模型过程中会遇到模型不能收敛、梯度爆炸、分布式优化等等一系列训小模型时很难遇到的难题。”

而要成为顶尖的算法工程师,“就像运动员一样,要成为明星就得从小训练”。

人才极度稀缺的背景下,相较于更早成立和布局AI的友商们而言,“王慧文们”代表的初创企业无疑更加“捉急”。

「市界」通过招聘平台联络到一家正招聘NLP算法工程师岗位的企业,HR表示:“我们公司在七八年前就成立了,而且一直都在招NLP相关的人才,不是大模型火起来才开始招。虽然最近招聘方面会有些紧俏,但由于我们对人才的培养很早期,而且都会是一些底层方面可以通用的人才,所以储备还是比较充足。”

这也解释了王慧文的光年之外选择直接并购AI企业一流科技、用最短路径获得人才梯队的原因。

窗口期转瞬即逝

对人才的争夺已成焦点,然而业界有声音认为,即使能够在短时间内搭建起人才梯队,也未必能够在大模型之战中最终胜出。

如火如荼的“抢人大战”,或许也将随着大模型研发市场完成整合而迅速结束。

一位不具名AI企业的创始人对「市界」分析道:“从我们业内人士来看,未来市场上的大模型可能仅会剩3-5家,最多有5-10家。而且行业的竞合可能会很快结束,时间窗口很短,或许到今年下半年就能定下来大模型的基本格局。所以市场上不需要那么多的参与者,也就不需要那么多算法工程师。”

具体来说,从商业化的角度考虑,“做大模型创业势必是为了最终能把模型开源出来,因为闭源产品会面临谁来用的问题。而开源大模型现在也不是一个好的商业模式,因为现在入局,你已经是追赶者而不是领先者”。

这意味着新入局者不仅要正视、追赶与OpenAI的差距,还需要保障后续的长期研发投入、以及对商业落地场景的不断挖掘。

总之,这是一场关于技术、资金、人才、商业落地场景……的全方位竞速赛。

这位从业者最后总结道:“基于上述这些,除非你有很强的资源,否则有一个或几个很聪明的人跳出来说我要做大模型,对投资人而言都不会是一个好的投资模型。这就是大模型研发领域的囚徒困境。”

就像OpenAI创始人Sam Altman曾说的:“我对初创企业训练模型的能力持怀疑态度,将来承担模型训练角色的应该不会是初创公司。”

相比较从零开始研发大模型,基于现有的大模型去做二次开发,被认为是更加容易、更有望成功的一条商业路径。

据章磊分享:“现在有很多的技术可以把现成的大模型用很小的成本去进行二次训练,也就是站在巨人肩膀上、用别人的大模型再去改造。我们也基于现有大模型,做了自己的产品。我认为这样更有利于明确商业目标、产品模式、训练方式,而不是寄希望于大力出奇迹。”

这也符合Sam Altman的预测:“我认为,将来在基础模型和具体AI应用研发之间会有一个中间层:出现一批专门负责调整大型模型以适应具体AI应用需求的初创企业。能做好这一点的初创公司将会非常成功。”

陆鸣也感觉到,在大模型的应用层面会有很多就业机会:“我未来的就业方向是AI产品经理,不论是从把ChatGPT作为一个工具,还是从它滋生的业态来考虑,都有很多新的机遇。比如从工具的角度来说,大模型大大降低了我的时间成本。从应用上面来说,也听说很多基于ChatGPT开发应用层的企业正在落地。”

然而在市场被几个大模型瓜分完毕之前,热钱、口号、对人才的争夺都还会再“飞”一会。

早年间,王慧文曾在清华讲一门《互联网产品课》,课上他强调过,对早期创业者而言,驱动业务进入“马太循环”十分重要。这里提到的马太效应,指的是科学界的名声累加的一种反馈现象,简单来说就是强者愈强、弱者愈弱。

他曾说:“马太效应的影响有多大呢?马太效应决定了有些行业只有3家”。王慧文代表的一批创业者,在消费互联网领域验证了这句话的正确性。

在最新兴起的大模型市场,或许这一幕还会上演。

作者 | 董温淑

编辑 | 董雨晴

关键词:

责任编辑:ERM523

相关阅读