译学文献|字幕翻译技术研究: 现状、问题及建议 您所在的位置:网站首页 纪录片在国内外的发展 译学文献|字幕翻译技术研究: 现状、问题及建议

译学文献|字幕翻译技术研究: 现状、问题及建议

2023-10-10 00:12| 来源: 网络整理| 查看: 265

随着 AI 技术的发展,AI 听译、神经网络机器翻译等技术发展迅速,极大地提高了字幕翻译的效率,重塑了字幕翻译的工作模式和商业模式,字幕翻译技术的内涵得以不断扩展,逐渐引起学界的普遍关注。在字幕翻译领域,国内外都有多个相关的概念,国外主要概念有 screen translation、audiovisual translation、multimedia translation、subtitle translation 等,国内主要使用影视翻译、字幕翻译、多媒体翻译等概念,上述概念内涵都可能涵盖字幕翻译。本文研究的字幕翻译技术是指数字化时代字幕翻译过程中应用到的翻译相关的综合技术,因此,是否涉及字幕翻译技术是本研究筛选文献的关键指标。

2.1 国外现状

截至 2019 年 12 月底,分别以 screen translation、audiovisual translation、multimedia translation、subtitle translation 等和technology 为组合主题词,检索翻译研究专用数据库Translation Studies Bibliography(TSB) 并结合人工筛选,返回 4 个有效结果; 检索数据库 Web of Science 并结合人工筛选,返回 44 个有效结果; 检索 Google Scholar 并结合人工筛选,返回 30 个有效结果。西方学者在该领域的研究起步较早,Jan Ivarsson、Jorge Díaz-Cintas、Luis Perez-Gonzalez、Aline Remael、David Bannon 等是主要研究者。Subtitling for the Media: A Handbook of an Art(Ivarsson, 1992) 是欧洲首部系统研究字幕翻译的著作,部分章节从技术层面讨论了字幕翻译,第二版(Ivarsson & Caroll, 1998) 讨论了诸如数字技术等新技术条件下的字幕翻译策略与技巧。由于技术发展迅速,该领域的很多重要成果呈现在期刊和论文集中。目前有 6 本论文集,时间跨度从 2006 年延续到 2017 年,研究主题既有连续性,又逐渐深化细致。其中,综合分析上述检索结果,国外字幕翻译技术研究的核心议题是如何通过技术手段提高字幕翻译的效率和质量,研究主要涉及以下四个方面:

(1) 机器翻译: 在数据驱动的统计机器翻译占主流的时代,较多学者探讨机器翻译在字幕翻译中的应用,如 O'Hagan(2003) 、Armstrong et al.(2006) 、Flana-gan & Kenny (2007) 、Volk (2008) 、Flanagan (2009) 、Díaz-Cintas(2013) 、Mauč ec et al.(2014) 、Bywood et al.(2017)。随着语音转文本技术和神经网络机器翻译的发展,视频字幕同步翻译技术发展迅速,有不少学者提出新的方法来提高其准确度。如Song et al.(2019)提出 基 于 词 向 量 (Word2Vec) 和 长 短 期 记 忆 网 络(LSTM) 将文本分割为句子并生成句号的方法,用以提高英文字幕自动翻译的准确性。机器翻译和译后编辑相结合的工作模式普遍受到认可,如 De Sousa et al.(2011) 、Etchegoyhen et al.(2014) 等通过实验方法验证了大多数机器翻译产出的字幕质量评级良好,机器翻译译后编辑工作模式比人工翻译更节省时间。

(2) 翻译记忆: 翻译记忆技术旨在利用平行语料来简化重复性的翻译劳动。O'Hagan(2003) 认为翻译记忆技术可以提高电影字幕翻译的效率。Imre(2010)认为利用计算机辅助翻译工具memoQ 的翻译记忆和术语库管理功能可有效提高字幕翻译的效率和质量。Díaz-Cintas(2013) 也认同可以利用 CAT 工具翻译包含大量重复词汇的字幕文本。

(3) 众包协作: 在互联网的云端化过程中,众包协作技术发展迅速,技术的进步模糊了专业字幕员和志愿者之间的界限,众包字幕翻译现象愈加普遍,字幕翻译趋向众包化。Díaz-Cintas(2014) 提出云技术改变了字幕制作模式,催生了众包字幕翻译模式。他认为通过云字幕平台可高效管理字幕翻译项目,输出不同格式的字幕,将可交付的内容自动发送给客户。Jiménez-Crespo(2017) 阐释了志愿者利用众包协作技术为 TED 翻译字幕的实践,认为诸如 Amara、Dotsub、Viki、YYeTs、Shooter 等平台促进并简化了用户的工作,推动了字幕协作模式的蓬勃发展。

(4) 其他辅助技术与工具: 由于字幕翻译的特殊性,专业字幕工具逐渐被研发并投入使用,费用也不断降低,大量免费和开源的工具被业界或字幕组广泛使用。Díaz-Cintas & Remael(2014) 、Dwyer&Lobato(2016) 、Basari& Nugroho(2017) 探讨了 WinCaps、Aegisub、Subtitle Workshop 等字幕翻译软件在字幕翻译中的应用。此外,Lambourne(2006) 、Díaz-Cintas(2014) 提出 ASR 技术能够解决字幕翻译中语音转文本的问题。O'Hagan(2003) 提出 OCR 能够解决硬字幕的文本提取问题。

2.2 国内现状

截至 2019 年 12 月底,以字幕翻译为主题词,知网返回文献总数为2,960篇; 分别以影视翻译、视听翻译、字幕翻译、多媒体翻译、影视本地化等和技术为组合主题词检索并且通过人工筛选,论文仅有 83 篇,核心期刊文章 25 篇。国内关于字幕翻译研究的文献主要集中在语言本体、翻译策略和翻译理论的研究,对于现代翻译技术在字幕翻译中的应用方面研究成果较少,大致可归纳为以下四个方面:

(1) CAT 技术: 王华树、席文涛 (2014) 提出将CAT 技术应用于字幕翻译,并阐述了 CAT 技术在字幕翻译中保持一致性、改善质量、提高效率等方面的重要作用; 吕乐、闫栗丽(2014) 以“网易公开课项目”字幕翻译案例讨论视频翻译项目管理的技术和流程问题; 王华树(2019) 讨论了字幕翻译的困境及 CAT 解决方案; 苗菊、侯强(2019) 通过采访 Díaz-Cintas,指出云技术、语音识别软件、自动字幕翻译技术与软件对字幕翻译的推动作用。

(2) 字幕众包技术: 陆艳(2012) 、曹艺馨(2015) 、胡安江(2017) 、邵璐( 2019) 等讨论字幕众包模式的发展,论及字幕翻译相关技术为字幕翻译众包化提供技术支持。

(3) 字幕翻译技术教学: 王华树(2012) 通过调研发现国外 120 多所高校开设了翻译技术课程,多数学校的课程内容涵盖字幕翻译; 肖维青(2012) 探讨了影视翻译课建设,系统讲解如何利用 Subtitle Workshop进行字幕翻译教学; 苗菊、侯强(2019) 通过采访视听翻译教学与研究的国际领先学者 Jorge Díaz-Cintas,讨论了视听翻译教学组织和教学内容等。

(4) 字幕本地化: 王华树、刘明(2015) 论及多媒体本地化项目流程复杂,涉及图片、音频、视频、动画、脚本等多种处理对象,需要利用文字抽取、字幕翻译、格式转换以及时间轴制作等多种技术和工具才能完成项目。

3 问题分析

近年来,人工智能驱动的“算力 + 算法”、大数据技术以及语音识别技术突飞猛进,字幕翻译技术亦快速增长,学界理应重视此领域的研究。然而,无论是从文献数量,还是从主题的广度和深度来看,国内外对字幕翻译技术的研究整体不足,主要问题可归纳如下:

3.1 尚未形成体系性研究

纵观国内外,字幕翻译技术研究与行业发展脱节,滞后于时代技术发展,技术关注度不足,发文较少,缺乏对字幕翻译技术的理论体系构建,这在国内尤为明显。在 AI 时代,字幕翻译呈现技术驱动的特征,如ArcTime、Subtitle Edit、百度视频翻译、人人译视界、网易见外、字幕通(YeeCaption) 等集成工具已广泛应用于字幕翻译活动,以提高效率,降低成本,技术成为字幕翻译服务的重要竞争力要素。Díaz-Cintas(2013) 明确提出字幕的技术转向,认为字幕翻译领域的技术进步直接对字幕翻译实践产生了重大影响。虽然字幕翻译技术领域已有不少研究,但是对于字幕翻译技术的相关概念、范畴和原理尚未进行理论阐释,尚未揭示字幕翻译的技术本质、技术要素的互动机制以及与效率质量相关的深层问题; 整体呈现研究对象不明晰、研究内容零散、研究结论适用性不强等问题。究其原因,主要是对于字幕翻译技术的重要性认识不足,对于字幕翻译的技术驱动现象缺乏理论剖析意识。

3.2 尚未覆盖技术全流程

当前研究内容聚焦于特定字幕翻译环节的技术解决方案,未能从全流程角度关注技术发展。在技术驱动下,字幕翻译流程和翻译技术融合发展的趋势日益显著。字幕翻译流程通常包括视频源获取、字幕工程处理、字幕翻译、校对、切分时间轴、制作特效、压制、后续发布等环节。翻译技术层面涵盖术语管理、翻译记忆管理、机器翻译、AI 视频听译、翻译管理、众包协作、时间轴调整、多模态产品发布等环节。其中,术语技术可以保证术语一致,机器翻译技术可快速高效地提供译文,翻译记忆技术可保证翻译数据高效复用,自动化质量保证工具可协助确保翻译质量的一致性,AI 视频听译可自动将语音转换为字幕文本。然而,多数文章局限于文字翻译本身,并没有考虑现代语言服务背景下基于翻译流程的技术应用及作用机制。字幕翻译技术研究理应关注并围绕字幕翻译全流程中的技术体系寻求理论突破。

3.3 跨学科融合研究不足

在技术时代,字幕翻译表征了一种特殊的数字化媒体文化。字幕翻译技术自产生之初就具有跨学科性(Bannon,2010) ,涉及传播学、符号学、翻译学、语言学、机器翻译、软件工程、动漫设计、多媒体技术、本地化技术等诸多学科和领域,呈现多学科融合发展的趋势。但是,在过去的研究中,跨学科视角处于割裂状态,其一是有关字幕翻译技术的探讨总体上倾向于技术工具的作用研究,多学科理论阐释意识不强; 其二是多数研究从传播学、翻译学等理论层面探讨语言文化问题,缺乏技术洞察力,很难诠释或指导字幕翻译相关的技术问题。字幕翻译技术活动本质上是兼具多模态、非线性、复杂性、交互性、动态性的人机交互过程,从翻译内容到技术形式的转换、交互、综合与演变等过程具有独特的媒体间性。传统研究范式因其跨学科不足,难以揭示字幕翻译技术活动的内在联系和规律,更难以推动其向纵深研究发展。通过深度跨学科理论交融,实现多学科知识的碰撞、对接和共舞,是推动字幕翻译技术研究发展的必由之路。

4 字幕翻译技术发展趋势

在 AI 技术驱动之下,字幕翻译的市场需求和处理对象日趋多样化,技术加速更新换代,字幕翻译技术呈现出新的发展趋势,必将会对此领域的研究产生深刻的影响。

4.1 集成化

字幕翻译工具的集成化程度显著增强,功能日益强大,如 Aegisub、ArcTime、Subtitle Edit、Subtitle Workshop、WinCaps 等功能越来越强大,被业界广泛应用。过去,字幕软件功能通常注重后期制作,集成字幕编辑和翻译协作的较为少见; 当前,字幕翻译需求旺盛,呈现出层次化和多样化的特征,必然要求技术最大程度地辅助人工翻译,这促使更多技术研发商提供“一站式”服务和功能。Díaz-Cintas(2014) 曾指出 CAT 工具在字幕领域可发挥明显的优势。当前很多翻译工具开发商逐渐整合字幕工具和 CAT 工具的多种功能,提供集成工作环境,尽可能地囊括字幕翻译流程中所需的功能,将客户沟通、项目管理、术语管理、语音识别、机器翻译、翻译记忆、审校、质量保证、交付、语言资产管理等功能集成,避免用户在各个软件之间来回切换,操作更加方便。

4.2 自动化

字幕翻译技术的自动化主要体现在以下两个方面: (1) 翻译流程自动化。AI 工具具备语音识别、神经网络机器翻译、时间轴切分等综合场景的应用能力,集成式字幕翻译工具将有效提升翻译流程的自动化,极大地提高字幕生产效率。(2) 机器翻译自动化。Díaz-Cintas(2014) 指出过去机器自动字幕翻译项目之所以失败,其原因在于过度依赖不成熟的机器翻译技术并且缺乏专业的字幕翻译数据。随着垂直领域的神经网络机器翻译引擎开发以及影视剧本大规模语料训练,机器翻译质量迅速提高。越来越多的客户深化机器学习,让机器学习用户和译者干涉后的翻译数据,数据质量和自动化服务的水平将会大幅度提高。

4.3 智能化

字幕翻译技术的智能化趋势日益显著。(1) 语音识别智能化。低资源语料挖掘技术和机器学习技术可以应对复杂的场景问题,智能化解决语音识别难题——自适应性问题、清除噪音问题。例如,基于 AI 语音技术,根据语音波形反映出的个人生理和行为特征的语音参数,并以此来识别说话者的身份。未来的语音识别会更加智能,自动识别相应的语言,或者可以选择同时识别多种语言,并且智能排除背景音或者口音的干扰。(2) 时间轴切分智能化(如 YeeCaption、VideoLocalize 等) 。越来越多字幕软件提供了自动切轴、拍打切轴以及波形切轴等多种方式,未来 AI 增强型时间轴切分技术将更加准确地识别字幕开始和结束的时间,减少后期人工工作量。

4.4 众包化

众包是通过整合大众智慧来完成个体难以单独处理的任务,众包翻译和交互技术成为字幕翻译的可靠选项。随着众包和机器高效协作、任务搜索个性化、任务推荐功能优化、数据安全和隐私保护措施更加完善、与社交网络的结合更加密切(冯剑红等,2015) ,采用众包模式的字幕翻译技术平台显著增多,呈现协作规模化、流程开放化、用户译者化的特点。Amara、人人译视界、网易见外等字幕翻译技术众包平台基于云端分配任务进行多人协作,平台多提供 “AI 听译 + 人工校对” 的工作模式,用户编辑和润色机器产出的初稿,通过内嵌的社交插件实现即时通讯,通过内嵌的视频后期工具实现智能调轴、一键压制、语言转化、字幕生成等功能。市场需求和技术门槛的降低将进一步推动众包模式在字幕翻译技术领域的应用。

5 启发与建议

随着影视翻译市场需求的增加、人工智能技术的强力驱动以及机器翻译技术的突飞猛进,字幕翻译的技术化时代即将来临。面对新技术带来的机遇和挑战,我们该如何推动字幕翻译技术研究与时俱进? 如何将字幕翻译技术充分应用于国家“一带一路”建设和“人类命运共同体”理念的传播实践? 这是我们当前亟需解决的问题。

5.1 对接国家文化传播战略

影视作品“走出去”是中国文化“走出去”和文化强国战略的重要组成部分。字幕翻译质量过硬的影视作品不仅有助于观众理解原作,还能促进不同文化的交互与融合和文化认同与共鸣。信息全球化和智能化时代,对外翻译和文化传播面临的一个主要挑战是海量字幕翻译任务超出了有限的译者能够产出的负荷,即如何在有限的时间将急需传播的影视作品进行快速译制。随着 AI 技术在语音识别、机器视觉、机器翻译、数据挖掘等领域的应用场景拓展,在影视文化传播的翻译环节,可以充分利用多种现代翻译技术手段,提高翻译效率,加快生产周期,快速地推向国际市场。乘着国家“一带一路”倡议的东风,通过字幕翻译技术赋能中国文化对外传播和国家对外话语体系建设将是字幕翻译技术多元化应用的有益尝试。

5.2 拓展字幕翻译技术研究

字幕翻译技术的研究对象是字幕翻译实践中用到的机器翻译、翻译记忆、众包协作、ASR、OCR 等技术手段,它们之间相互作用和融合,形成一个动态发展的字幕翻译技术系统。随着字幕翻译与技术深度融合以及字幕翻译技术的纵深发展,很有必要拓展字幕翻译技术研究。既需要厘清字幕翻译技术的内涵本质、基本分类和发展历程,也需要探究其影响机制,探究技术系统的内部要素和外部的人员、信息和组织要素对字幕翻译过程的影响以及各要素之间的相互影响,增强字幕翻译技术理论的阐释力,系统构建字幕翻译技术的理论体系。字幕翻译技术作为翻译技术的子概念可纳入 J.S. Holmes 提出的翻译辅助(translation aids)分支,明确字幕翻译技术研究的定位,体现 AI 时代技术的多样化发展,进而完善应用翻译研究体系框架。此外,有效地结合语言学、翻译学、传播学和信息学等其他学科的知识,利用概念研究、眼动追踪、问卷、访谈、文献综述法、语料库研究等研究方法(Pérez-González, 2014) ,通过跨学科融合拓展字幕翻译技术的研究深度,优化字幕翻译技术的算法和模型,实现更高层次的人机交互。

5.3 加强字幕翻译技术教育

字幕翻译是影视传播、文化交流、跨境电商、教学科研等众多领域提升沟通效率的重要支撑。随着泛在网络技术的深化,字幕翻译将会有更大需求,需要大批懂字幕技术的专业化人才。但是,开设字幕翻译技术相关课程的高校以及社会上的培训机构非常少,现有人才不能满足市场需求。针对字幕翻译人才短缺的情况,相关高校可以根据字幕翻译市场需求,开设字幕翻译技术相关的课程; 社会上可以开展更多的字幕翻译技术培训,包括如视频编辑、时间轴切分、机器翻译和译后编辑等全过程的培训(如约克大学组织的 AVT 暑期学校、中国外文局组织的“高级影视翻译”培训) ; 构建大数据视频教学资料库,如对接国际性多语视频供应商( Netflix、Amazon Prime、Bamboo、Mobile、Odyssey、HPO 等) ,打造多模态字幕翻译语料共享平台; 搭建互译合作平台(如中国文化译研网) ,加强中外译者协作和交流,推进字幕项目合作; 开展字幕翻译技术资质认证,明确字幕译者基本要求,紧密对接字幕翻译市场需求和国家战略,促进国际文化传播人才培养和高端智库建设。

5.4 促进政产学研用融合创新

智联万物的时代,AI 赋能字幕翻译技术升级为赋能整个影视翻译生态。字幕翻译需要“内外兼顾”谋发展,从生态视角看待字幕翻译技术,构建字幕翻译技术创新联盟,打造技术共同体,将政府、高校、科研机构、影视公司、翻译公司、译者、用户等汇聚在一个创新平台,实现协同发展。政府大力推动影视产品和服务进出口,出台并引导市场主体用足用好国家扶持政策,为影视字幕翻译实践营造良好的政策、法律和市场环境。高校重在培养符合市场需求的具备技术综合能力的翻译专才。研究机构重在加强技术研发,利用 AI 驱动翻译流程自动化,为影视文化产品创新提供技术支撑。影视公司、翻译公司及其他语言服务提供方应注重语言技术基础设施建设,提升字幕翻译技术能力和生产能力。用户多角度、多层次参与产学研合作,减少了字幕翻译技术创新的盲目性。特别是在数字与人文融合的过程中,用户成为创新的主体,进一步提高了技术与市场需求的耦合度。

6 结语

AI 赋能的融媒体时代,通过推动影视作品海外传播,提升文化软实力和增强文化自信,亟需解决的问题是海量的字幕翻译需求。字幕翻译技术呈现出集成化、自动化、智能化、众包化的发展趋势,极大地提高了字幕翻译的效率和质量,对高效构建和发展影视文化传播体系,提高传播能力具有重要的意义。本文通过系统梳理字幕翻译技术的相关文献,对研究中存在的问题提出针对性的建议,希望引起人们对字幕翻译技术研究的关注。限于多种原因,本文在文献收集和数据挖掘方面存在一定的局限性。我们期待学界同仁有更深入的研究,构建符合 AI 时代需求的字幕翻译技术理论体系。

转载编辑:陈雨

…………………………………………………………………………………………………………

往期精彩回顾

双语字幕制作:Arctime+Aegisub

快速学习影视字幕翻译技巧!

字幕行业“危机”之下,SUBTLE能否力挽狂澜?

技术时代面向语言服务市场的语料库笔译教学模式研究

如何批量查找和替换文本中的内容?

行业洞察 | 字幕行业“危在旦夕”?它……会消失吗?

字幕与机器翻译的碰撞,催生了哪些新职业?

技术与工具 | 字幕翻译的好搭档:Arctime Pro+Urban Dictionary

如需更深入学习,可关注微信公众号“翻译技术教育与研究”“语言服务行业”,留言交流。返回搜狐,查看更多



【本文地址】

公司简介

联系我们

今日新闻

    推荐新闻

    专题文章
      CopyRight 2018-2019 实验室设备网 版权所有