时间:2023-01-19 | 标签: | 作者:Q8 | 来源:网络
小提示:您能找到这篇{AI干起了实时翻译,我们离跨越语言的鸿沟还有多}绝对不是偶然,我们能帮您找到潜在客户,解决您的困扰。如果您对本页介绍的AI干起了实时翻译,我们离跨越语言的鸿沟还有多内容感兴趣,有相关需求意向欢迎拨打我们的服务热线,或留言咨询,我们将第一时间联系您! |
1954年,美国成功研制出了世界首个机器翻译系统,实现了俄英两种语言之间的简单转化。但由于人类语言本身的复杂性和多样性,半个多世纪以来,计算机系统对于人类语言的理解一直处于相对较低的阶段,投入实际应用的研究成果寥寥无几。 直到近10年,以“深度学习”为代表的人工智能技术在语音识别、自然语言处理等基础应用领域与产业结合的业务中取得了较大突破,能够识别语音的机器翻译逐渐从实验室走向普罗大众。 在AI机器翻译这条赛道上,互联网巨头都在虎视眈眈自去年乌镇互联网大会上,百度、搜狗相继亮相人工智能同声传译技术之后,又一次引发机器翻译是否会取代同声传译的激烈争论。 尽管专业人工翻译公司依然看衰AI对翻译产业的颠覆性,但包括Google、Facebook、微软、百度、腾讯、搜狗在内的各大技术巨头却在不遗余力地推进深度学习在机器翻译领域的研发和应用。 2016年9月,Google发布谷歌神经机器翻译(GNMT: Google Neural Machine Translation)系统,声称该系统利用神经网络技术,模仿人脑的神经思考模式,产出媲美人工翻译的高质量译文,并将误差降低了55%-85%。谷歌公司己经将该技术应用于网页翻译与手机应用,译文质量明显提升。 腾讯、百度、阿里巴巴等国内互联网公司将深度学习理念应用到机器翻译,在智能翻译领域持续发力,推出多款基于神经网络技术的在线翻译和手机应用。甚至在手机浏览器的升级战争中,智能翻译也被当作重要功能革新,搜狗手机浏览器推出“智能翻译”,集合了语音对话翻译、AR实时翻译、拍照翻译等常用功能。 智能翻译架起了不同语种间人们便利沟通的桥梁,已经成为日常交流、出国旅游、外文学习等方面不可或缺的助手。笔者就简要梳理一下AI实现文字和口语翻译的基本原理、结合实例介绍智能口语翻译难点以及智能翻译有哪些需要解决的问题。 各种花哨的技术概念,核心仍然是AI处理人类语言的三种方法实现让计算机处理人类自然语言是人工智能领域的一个重要课题,与句法分析、语义理解和自然语言生成等计算语言学核心理论密切相关。目前,AI主要有三种方法翻译人类自然语言。 1、基于规则的机器翻译方法。早期机器翻译的主流方法。基于规则的机器翻译系统依靠人工编纂的双语词典和专家总结的各种形式的翻译转化规则,但在通用领域中的应用性不强,往往被限制在了专有应用上,逐渐被新的方法取代。 2、基于实例的机器翻译方法。从已有的翻译经验知识出发,将源语言句子切分为翻译知识中见过的短语片段,通过对已有翻译资源进行自动总结,得出双语对照的实例库,并设计规则处理双语对照实例库中的歧义性等问题,实现对新的源语言句子进行翻译。 3、基于统计的翻译方法。统计机器翻译方法将任何目标语言句子都看成源语言句子的可能翻译候选,从语料自动学习翻译模型,然后基于此翻译模型,对输入源语言句子寻找一个评价分数最高的目标语言句子作为翻译结果。目前谷歌、搜狗等基本采用的是这种。 深度学习能够自动学习抽象特征表示、建立源语言与目标语言之间复杂的映射关系,给统计机器翻译的实现提供新途径,目前已经在词对齐、语言模型训练、解码等模块的优化应用方面取得较多成果。 例如,2006年谷歌发布基于短语的机器学习(PBMT)系统,该系统将句子分解成词和短句,进行逐个翻译。它的弱点在于忽略了上下文,因此译文质量不佳。2016年谷歌发布的神经机器翻译GNMT,将句子视为基本单元,不再对词和短句逐个翻译,明显改善了译文质量。 作为智能翻译的“制高点”,AI口语翻译难在哪?与普通文字翻译相比,AI口语翻译难度更大,原因有二: 一、想要“译的准”,首先要能“听得清”。 AI要准确判断出指令发出者的语音、停顿,并在极短时间内进行“语音断句”,在涉及一些模糊音时能够根据“上下文”进行及时调整,这需要有深度学习的模型自动更换为一个语义通顺、更符合作者指令的句子,然后才能进行文字翻译处理。 二、想要“译的准”,还要包容口语的“4个任性” 基于神经网络技术的智能翻译系统越来越多,翻译质量确有较大提高,但是能不能很好地包容口语的各种任性,我们来做几项测试,检验一下人工智能翻译的水平。为便于说明,选取了具有代表性的谷歌翻译和搜狗手机浏览器自带的智能翻译进行比对。 1、日常口语具有不连贯的特性。在口语交谈中,经常会出现一些不连贯的成分,如:重复、次序颠倒、冗余和语句残缺。下文是一个典型的兼有语句残缺和发音重复的句子。
谷歌翻译在重复的处理上未真实体现原文,搜狗手机浏览器智能翻译如实还原。但是,两个翻译结果在表达上都不同程度地存在错误。 2、语法约束相对较弱。口语中很少会有严格符合语法约束的结构完整、正确的句子,而大量存在的是语法规则难以处理的现象。一方面是由于系统的语法知识对语言现象的覆盖程度不足;而更主要的则是口语本身的特性所决定的,例如口语中存在大量的代词,人类口语比较容易理解,但是AI不能结合上下文,缺乏背景知识,难以区分指代对象,导致翻译结果偏离原意。
翻译的关键在于两个词:look和man。谷歌的翻译也对,而看起来,搜狗手机浏览器的翻译结果更符合生活实际。 3、没有明确的句子边界。口语中没有标点符号来标志456微营销句子,也基本没有传统意义上的句子,缺少了必要的声调和停顿,很容易造成句子的歧义。 例如:“这苹果不大好吃”。那么该句有两种不同的理解结果:这苹果不大/好吃(苹果不大,但是味道好),这苹果/不大好吃(苹果味道不好)。两家AI都未能分清句子结构发音上的差别,都默认翻译为“苹果味道不好”。 4、非正式语体材料多。中英口语中都存在较多随意性的口语或网络用语,生活化气息浓厚,多为非正式的语体材料,智能翻译需要庞大的基础词汇库支撑。
可以说,两家AI对这段话的翻译,虽然都有些许瑕疵,但是总体都还是比较到位的,搜狗手机浏览器对于“搭便车”这个典型口语化词汇翻译相对更准确。 中国古诗英译一直是文化翻译的一个难题,甚至被认为是可译性最小的文学形式。我们来试验一下两家AI对王维《九月九日忆山东兄弟》的理解和翻译能力。
翻译古诗词,确实非常难为两家AI。不过,翻译的结果很有趣,搜狗手机浏览器对前两句翻译尚可,后两句翻译成了我的兄弟在高处到处种植茱萸,谷歌对最后两句完全是进行了想象性的拓展。 要跨越语言不通的鸿沟,智能翻译还需往哪加油智能翻译确实取得了令人惊喜的进展,拿着手机和老外进行日常交流已经基本没有问题。但是智能翻译还存在“短板”,会有“词不达意”的时候,AI要想更进一步发展,和有着数十年积淀的高水平翻译员进行竞争,可能还需要从以下几个方面进行努力。 1、大量补充口语化语料 智能翻译对于口语化文本处理能力还不强,一是由于翻译语料库口语化语料不足,二是针对口语词汇与口语表达多采取直译方式,因此出现较多误译。该问题的解决应该从扩大对应部分语料库入手,增加口语类文本语料库,包括常见口语化词汇、表达与生活用语。 2、提高语境理解能力 智能翻译对于中文复杂含义句式中的时态辨别能力还不够,往往需要充分理解整句话的意思才能准确把握时态。智能翻译并非基于理解,而是基于统计学与语料库,只能做到将这句话意思大致翻译准确,在识别感情色彩方面,还有欠缺。 但,我们依然满怀期待AI让我们摆脱语言鸿沟的那一天。
作者:草原骑士/智能相对论:2个前人工智能行业管理咨询老鸟+1个老媒体人组成的三人帮,深挖人工智能这口井,评出咸淡,讲出黑白,道出深浅。 本文由 @智能相对论 于。,。 题图由作者提供 |
上一篇:外卖“环保”压力:面对“餐盒垃圾”的窘境,
下一篇:快手产品体验分析报告
一、标题规则:标题关键词分开的店铺,关键词排名和权重会排在前面。所以店主...
作为一个淘宝卖家,关注自己的店铺权重,是十分重要的,因为这对自己的销量、...
一般的消费者在淘宝买东西的时候都会先输入一个他理解这个产品的词组,顾客的...
淘宝直通车收费方式还是挺好的,所以对于一些资金比较少的淘宝店家来说,推广...
第一步:登录到淘宝卖家中心,点击左侧菜单中的『物流管理-电子面单平台-我的...
推广当然都希望立竿见影,最好来一个点你广告的,就做一笔生意,所以要选择你...
现在开淘宝网店只要交一些保证金就可以完成了,可以说是投资最低的创业成本了...
宝贝滞销,也就是说宝贝长期没有销量,上架之后90天依然没有销量,那么淘宝方...
直通车坑位指的是大家在使用直通车做店铺推广的时候,官方平台给予宝贝的展示...
线下活动对很多网站来说不容易,对于一些静态网站来说更加无从着手。比如技术...
小提示:您应该对本页介绍的“AI干起了实时翻译,我们离跨越语言的鸿沟还有多”相关内容感兴趣,若您有相关需求欢迎拨打我们的服务热线或留言咨询,我们尽快与您联系沟通AI干起了实时翻译,我们离跨越语言的鸿沟还有多的相关事宜。
关键词:ai, 人工智能, 实时翻译,