“我特别喜欢‘灵境’,中国味特浓。”早在1990年,“两弹一星”功勋科学家钱学森就关注到了虚拟现实(Virtual Reality,VR)技术,并给出了译名建议。5月27日,在北京市科协主办的2023中关村论坛平行论坛“互联网3.0:未来互联网产业发展”上,“钱学森数字人”正式发布,科研团队在数字空间内生动还原了钱学森的音容笑貌。
仅参照一两张泛黄的老照片,就能在数字空间复原出一位逝者的形象,这便是中国科学技术大学网络空间安全学院与灵境赛博公司联合团队研发的“合成现实”数字复原人技术。
人工智能模型的训练需要大量的高质量数据,但老科学家、革命先烈等逝者往往只留存了少量、低质量的影音资料。面对这一矛盾,科研团队融合了传统影视工业技术,将人工智能与现实塑造相结合,基于3D写实人脸雕刻、32类姿态表情采集标准,通过9台相机获取丰富的表情数据,再使用人工智能算法就能得到高逼真度的深度合成模型。
【资料图】
“大家好,好久不见了!”论坛上,“钱学森数字人”坐在书房内,微笑着与观众打招呼,并阐释了对“灵境”一词的理解。
“钱老当年关于‘灵境’的很多想法,现在在很大程度上已经实现了,通过深度合成技术复原钱老,仿佛是跨越了时空。”团队负责人、中国科学技术大学网络空间安全学院副院长张卫明说。经过约半年的探索,团队不仅成功还原了钱学森的一颦一笑,还根据历史资料建立了他的声音模型,从外形、声音、动作、神态等全方位实现了复原。“这次复原我们取得了相关单位的许可,钱老的儿子钱永刚教授也给予我们高度的认可。后续,‘钱学森数字人’将用于科学家精神的宣传。”
数字复原人技术还有望帮助唐氏综合征患儿打开心扉。“患有这种疾病的孩子,与他人交流会存在障碍,但他们很愿意和镜子里的自己交流。”一次偶然的机会,团队了解到这些患儿的需求,“用数字复原技术,我们能为患儿再造一个‘自己’,再结合人工智能语言模型,就能让患儿和‘自己’对话,开展心理治疗。”
当然,随着深度合成技术和生成式大模型的快速发展,其背后潜藏的科学伦理问题和安全风险也得到了更多关注。今年,《互联网信息服务深度合成管理规定》已正式施行,明确提供智能对话、合成人声、人脸生成、沉浸式拟真场景等生成或者显著改变信息内容功能服务的,应当进行显著标识,避免公众混淆或者误认;《生成式人工智能服务管理办法(征求意见稿)》则进一步明确了生成式人工智能的法律边界和责任主体。
“我们团队已在开展人工智能生成内容标识技术的研究,除了给它们加上可见或不可见的标识,还要探索这类产品的可追溯性,甚至尝试给大语言模型生成的文本加上‘水印’。期待通过我们的技术探索,能助推国家相关法律法规切实落地。”张卫明说。
(原标题:大家好,好久不见了!“钱学森”亮相中关村论坛)
来源:北京日报客户端 刘苏雅 王海欣
流程编辑:u002
版权说明:任何媒体、网站或个人未经书面授权许可不得转载、摘编或利用其它方式使用本网站上的文字、图片、图表、漫画、视频等内容。
未经许可即使用,或以此盈利的,均系侵害本网站著作权及相关权益的行为,本网站将追究法律责任。
如遇作品内容、版权等问题,请在相关文章刊发之日起30日内与本网联系。
联系方式:takefoto@vip.sina.com