❤️ ×
各类单机,绅士游戏不断更新:https://www.acghua.com/
网站地址

赛博朋克2077本地化采用AI技术的原因与创新方法

news 发布于 2025-10-04 阅读(1)

《Cyberpunk 2077》即将上线,众多大牌联手打造精彩未来

《Cyberpunk 2077》游戏角色Johnny Silverhand与V

即将推出的《Cyberpunk 2077》备受瞩目,云集了众多娱乐和科技界的重量级人物。其中,波兰著名游戏工作室CD Projekt以其制作的《巫师3:狂猎》享誉全球,而在明星阵容方面,精选了《黑客帝国》和《疾速追杀》主演基努·里维斯饰演的Johnny Silverhand角色,以及朋克乐队Refused和流行歌手Grimes在原声中的精彩表现。

合作公司:Jali Research助力大作人物动画

Jali Research简介

提到Jali Research,可能不少玩家不太熟悉,但它其实是一家来自加拿大多伦多的面部动画技术公司。该公司近年来在《Cyberpunk 2077》的本地化工作中发挥了重要作用,协助实现角色的真实面部表情动画。Jali Research由多伦多大学的博士生Pif Edwards与奥斯卡获奖动画师Chris Landreth,以及尤金·菲梅和Karan Singh教授共同创立。

创始团队与技术背景

Edwards原本攻读计算机科学博士,专注于面部动画研究,后来发现表达时人们几乎总是在说话,因此转而研究语音合成。他致力于解决当时存在的语音动画工具难题,自己开发了先进的算法,用于模拟不同语言中的口型和发音特征。

实现多语种口型同步的技术革新

为何需要高精度口型动画

《巫师3》的面部动画曾利用算法处理八种语言的语音,而在《Cyberpunk 2077》中,CD Projekt的目标更高,希望实现十种语言的完美口型同步,包括英语、德语、西班牙语、法语、意大利语、波兰语、巴西葡萄牙语、俄语、普通话和日语。这对动画细节和技术提出了更大挑战。

Jali的双模式AI技术

Jali结合了机器学习和基于规则的人工智能(Rule-based AI),实现从语音到面部表情的精准转换。首先通过“对齐阶段”让机器学习识别语音中的各个声音(音素),获取“何时发出‘哈’、‘啊’等声音”信息。例如,给定一段“Hello”的录音,系统可以标记出每个音的开始和结束点,并训练模型预测未来出现未见过的台词时的音素边界及长度。

Jali Research技术示意图

完成音素识别后,Jali转入动画生成阶段,利用传统的规则AI来决定对应的面部动作,确保嘴型符合发音特点。这种“如果...那么...”的规则让动画更加自然、多样。比如,虽然“you”和“yoo”发音相似,但嘴型细节不同,系统会根据音素规则作出反应。

多语种跨文化的面部动画措施

此技术的优势在于不同语言的表达方式具有共通性。因为人们在发出相同声音时会展现类似的面部表情,通过对多语言声音数据的训练,机器学习模型可以跨越语言边界,为每种语言生成逼真的面部动画,为游戏带来沉浸式体验。

未来展望与总结

Jali Research的技术展现了未来游戏中多语种角色动画的可能性,不仅提高了效率,也大大增强了真实性。这一技术将为《Cyberpunk 2077》等多语言大作提供坚实的基础,使玩家在任何语言环境下都能感受到角色的真实情感表达。

常见问答(FAQ)

Q: 《Cyberpunk 2077》的面部动画是否可以自由定制?

A: 是的,借助Jali Research的技术,开发团队可以根据不同语言和情境定制更加细腻的面部表情与嘴型动画,从而实现高度个性化和真实的角色表现。

Q: 这种多语种口型同步技术未来会应用到其他游戏吗?

A: 绝对会。随着技术成熟,越来越多的游戏开发商会采用类似的方案,为全球玩家提供更自然、更逼真的多语言游戏体验。

游戏本地化中的AI动画技术创新

据Edwards介绍,为每种语言开发专门的机器学习流程,但动画组件保持一致。“我们没有为日本语开发特定的动画模型,只有语言模型。说话时嘴型的变化其实不特定于某种语言。”

跨语言的语音动画原则

“令人惊讶的是,语言学的基本原则在所有语言中都适用。不过这很难实现。人们不愿做基于规则的工作,原因在于必须了解规则,这需要花费大量时间。”

Jali Research团队图片

节省时间与提升效率

这一技术能极大节省动画制作时间。平均而言,动画师制作一段一分多钟的对话需花费七小时。考虑到一个RPG游戏通常包含大量对话且需要支持十种不同语的口型同步,手工制作非常繁琐且耗时漫长。这意味着需要投入大量人力,以完成高质量的多语言本地化工作。

多语言本地化的革新

最终,这项技术推动了游戏本地化的变革,使全球更多的语言被视为“第一等公民”。通常,游戏会为某一语言(通常是英语)设计口型同步,而在本地化到其他语言时,通常只是增加配音(dub)。

真实感十足的语音表现

“当你在游戏中看到讲普通话的人时,嘴型、额头、眼睛的动作都像在真正讲普通话,不仅仅是嘴巴的变化。”

虽然过程繁琐,但实验结果仍可能显得生硬,因为翻译内容必须在不改变嘴部动作的情况下适应音频,或者被压缩以适应原始音频的空间。

面部表情的重要性

“语言不仅仅是文字,面部表情和演讲时的面部表现也是沟通的重要部分。”

动画同步的挑战与突破

“举例来说,将一段英语对话翻译成法语时,可能比原文更长,很多游戏会简单放大动画,但那样看起来很愚蠢。Jali的动画则能做到每个细节都同步:嘴型、前额、眼睛的眨动、脖子动作、脸部变化都能一致同步,就像用同一引擎为英语和汉语制作。”

CD Projekt的多语言本地化经验

虽然今天以RPG闻名,但CD Projekt最初是在波兰为本土市场做本地化。CD Projekt本地化示意图

在前苏联国家,盗版盛行,部分原因是很多发行公司未投入翻译工作。CD Projekt通过提升翻译和本地化质量,创造出值得购买的作品,赢得了玩家的支持。

这一理念一直延续至今。夏天,CD Projekt中国区PR与市场总监Darren Ding在LinkedIn上提到,《赛博朋克2077》的预售在中国最为火爆,原因之一是游戏配有简体中文和普通话的字幕及配音,Jali的口型同步也支持普通话,极大提升了本地化体验。

用心的本地化带来回报

“只要用心,玩家就会回报你。”

Edwardsof称:“我和一位俄罗斯同事谈到我们的工作,他超级喜欢《巫师3》,但只用英语玩,因为那是最受关注的版本。实际上俄罗斯人讲俄语,但他用英语玩的原因就是英语版的内容最丰富。这让他非常兴奋,因为玩《赛博朋克2077》时也能有和讲英语的玩家一样的体验。”

他总结道:“这是一种让玩家更深入融入游戏的方式,极大增强了沉浸感,使他们真正进入故事情节。”

常见问题解答(FAQ)

Q: 这种多语言动画技术是如何实现的?

A: 通过机器学习模型,结合语言学原则,使不同语言的嘴型和面部动作同步实现。该技术能够自动调整动画,确保每个语种的表达自然真实。

Q: 这种技术对游戏开发周期有何影响?

A: 大大缩短了多语言本地化的时间,减少了人工动画的需要,节省大量人力成本,提升效率,同时也改善了多语言版本的表现质量。

标签:  动画