NLP 中的机器翻译：示例、流程和模型

已发表: 2021-01-21

介绍

世界上有超过 6,500 种公认的语言。人们认为需要时间来了解跨文化的书面资源。在这种尝试中，许多旧书被翻译成当地语言并保存下来以供参考。

例如，梵语是印度教遗产的古老语言，据说有丰富的古代信息。这是因为很少有人知道梵文。它可能依赖于某种机制从经文和手稿中寻找信息。

很多时候，我们希望计算机能够理解自然语言。计算机的好处是它们的计算速度比我们人类快。然而，学习自然语言的挑战很难在计算模型上复制。

机器翻译

术语“机器翻译”（MT）是指负责在有或没有人工协助的情况下进行翻译的计算机化系统。它不包括通过提供对在线词典、远程术语数据库、文本传输和接收等的访问来支持翻译人员的基于计算机的翻译工具。

在人工智能技术时代之前，开发了用于将文本从一种语言自动翻译成另一种语言的计算机程序。近年来，人工智能的任务是对人类语言的脚本、方言和变体的流动性和多功能性进行自动或机器翻译。鉴于人类语言固有的模糊性和灵活性，机器翻译具有挑战性。

什么是自然语言处理？

自然语言处理（NLP）是人工智能（AI）技术传播的分支之一。该学科涉及创建处理和理解自然语言的计算模型。 NKP 模型本质上使计算机能够理解对象的语义分组（例如，单词“cat and dog”在语义上与单词“cat and bat”非常相似）、文本到语音、翻译语言等等。

自然语言处理 (NLP) 使计算机系统使用、解释和理解人类语言和口头语言，例如英语、德语或其他“自然语言”。今天在实践中看到了一系列 NLP 应用程序。

它们通常被分组在各自的用例中，例如语音识别、对话系统、信息检索、问答和机器翻译已经开始重塑人们识别、检索和利用信息资源的方式。

自然语言处理示例

语音/语音识别系统或像 Siri 这样的查询系统会处理问题并返回答案。在这里，您将语音输入计算机，它会理解您的信息。
以简单的英语阅读财务报告并生成数字（例如通货膨胀率）的计算机程序。
工作门户检索候选人详细信息并自动构建简历和应用程序以匹配与技能相匹配的工作。
谷歌翻译处理输入字符串中的文本并将其与语言映射以将其翻译成飞行。
在您在搜索框中键入主题词后，类似 Google 的搜索引擎会返回您的文档。例如，当您搜索 Tajmahal 时，Google 会为您提供包含 Tajmahal 作为人工制品甚至是“Tajmahal”品牌的文档。这里，考虑了英语同义词和英语复数模式。

自然语言处理流程

自然语言处理是一种人工智能。如果你想构建一个 NLP 程序，你可以开始编写诸如“忽略单词末尾的 s”之类的规则。这是老派的做事方式，被称为“基于规则”的方法。

但是，更先进的技术使用统计学习，您可以在其中对计算机进行编程以学习英语模式。如果你这样做，你甚至可以只编写一次程序并训练它以多种人类语言工作。

NLP 的目标是使人类语言可理解，以便程序化机制可以解释和理解手稿。在这里，我们称之为机器的程序化机制，而手稿是提供给程序的语言脚本。因此，计算机程序以数字知识的形式提取语言数据。

然后，机器而不是统计学习模型将语言属性转换为基于规则的统计方法，旨在解决特定问题并执行处理语言的任务。

在许多较旧的系统中，尤其是那些“直接翻译”类型的系统，分析、传输和综合的组成部分并不总是清楚地分开。其中一些还混合了数据（字典和语法）以及处理规则和例程。

新系统具有不同的模块化程度，因此系统组件、数据和程序可以在不损害整体系统效率的情况下进行调整和更改。在一些最近的系统中，进一步的阶段是分析和合成组件的可逆性，即在生成该语言的文本时，用于分析特定语言的数据和转换被反向应用。详细了解自然语言处理的应用。

机器翻译的演变

直到 1980 年代后期，在此阶段对机器翻译进行了大量研究，当时开发了第一个统计机器翻译 (SMT) 系统。

传统上，基于规则的系统被用于这项任务，后来在 1990 年代被统计方法取代。最近，深度神经网络模型在被正确称为神经机器翻译的领域取得了最先进的成果。

统计机器翻译用从示例中学习翻译的模型取代了经典的基于规则的系统。

神经机器翻译模型适合单个模型而不是精炼的管道，并且目前达到了最先进的结果。自 2010 年代初以来，该领域在很大程度上放弃了统计方法，然后转向神经网络进行机器学习。

NLP 统计方法的几个显着早期成功出现在机器翻译领域，旨在为 IBM 研究院工作。由于法律要求将所有政府程序翻译成政府相应系统的各种官方语言，这些系统能够利用由加拿大议会和欧盟制作的现有多语言文本机构。

但是，许多其他系统都依赖于专门为这些系统执行的任务而开发的语料库，这一直是系统开发的主要限制因素。因此，需要对从有限数据中有效学习的方法进行大量研究。

例如，神经机器翻译 (NMT) 一词强调基于深度学习的机器翻译方法直接学习序列到序列的转换，从而无需统计机器翻译中使用的单词对齐和语言建模等中间步骤（表面贴装）。谷歌于 2016 年底开始在谷歌翻译的生产中使用这种模型。

序列到序列模型

通常，序列到序列模型包括两部分；首先是编码器，其次是解码器。 它们是两个不同的神经网络模型，它们作为一个大网络携手合作。

然后模型的解码器部分在输出中生成一个映射序列。解码器加密字符串并在表示中为序列添加含义。用于神经机器翻译的编码器-解码器方法将句子的整个输入字符串编码为一个有限长度的向量，从那里翻译被解码。

从广义上讲，编码器网络的功能是读取和分析输入序列以产生意义，然后生成输入字符串的小维度表示。然后模型将此表示转发到解码器网络。

编码器-解码器LSTM 是一种循环神经网络，旨在解决序列到序列问题，有时称为 seq2seq。 长短期记忆 (LSTM) 是一种用于深度学习的人工循环神经网络 (RNN) 架构。

例如，当输入序列中的字符串是“这是什么地方”时，在通过编码器-解码器网络解析该输入序列后，使用 LSTM 块（一种 RNN 架构）合成字符串。解码器然后在解码器迭代的每一步中生成序列中的单词。

在迭代的总循环之后，构造输出序列，比如“这个地方是浦那”。 LSTM 网络适用于根据规则进行分类，分析以处理输入并使用经过训练的数据示例进行预测。

注意力模型

“注意力”模型，极大地提高了机器翻译系统的质量。 Attention 允许模型根据需要关注输入序列的相关部分。

注意力模型在两个主要方面不同于经典的序列到序列模型：

编码器将更多数据传递给解码器。编码器没有传递编码阶段的最后一个隐藏状态，而是将所有隐藏状态传递给解码器。
注意解码器在产生其输出之前会执行额外的步骤。

变压器型号

顺序计算不能并行化，因为我们必须等待上一步完成才能继续下一步。这会延长训练时间和运行推理所需的时间。解决顺序困境的一种方法是使用卷积神经网络 (CNN) 而不是 RNN。变压器是一种使用注意力来提高速度的模型。更具体地说，它使用自注意力。在这里，每个编码器由两层组成：

自注意力
前馈神经网络

Transformers 使用卷积神经网络和注意力模型进行机器翻译。 Transformer 是一种越来越受欢迎的神经网络架构。 OpenAI 最近在他们的语言模型中使用了 Transformer，DeepMind 最近也在 AlphaStar 中使用了 Transformer，这是他们击败顶级职业星际争霸玩家的程序。 Transformers 在特定任务中的表现优于 Google 神经机器翻译模型。

结论

简而言之，系统中的自注意力机制允许输入的变化相互影响（“自我”），并让他们决定应该更多地关注谁（“注意力”）。因此，处理后的输出是这些交互的聚合，并用注意力分数加权。

对 NLP 中 MT 的基本理解有助于数据分析师和数据科学家为承担涉及 AI 的 NLP 学科项目的著名项目做好准备。由upGrad等提供者提供的该主题的培训课程有助于迈向前进的道路。 upGrad 品牌是一个在线高等教育平台，提供广泛的行业相关课程，随时准备引领您的职业成功。

如果您有兴趣了解有关机器学习和人工智能的更多信息，请查看 IIIT-B 和 upGrad 的机器学习和人工智能 PG 文凭，该文凭专为在职专业人士设计，提供 450 多个小时的严格培训、30 多个案例研究和作业， IIIT-B 校友身份、5 个以上实用的实践顶点项目和顶级公司的工作协助。

从世界顶级大学学习ML 课程。获得硕士、Executive PGP 或高级证书课程以加快您的职业生涯。

Q1。 NLP 中的机器翻译有哪些类型？

机器翻译，也称为机器人翻译，是计算机或机器独立快速地将大量文本从特定源语言翻译成目标语言的过程，无需人类付出任何努力。换句话说，机器翻译通过使用帮助将文本从一种输入语言翻译成另一种语言的应用程序来发挥作用。 NLP 中有四种不同类型的机器翻译：统计机器翻译、基于规则的机器翻译、混合机器翻译和神经机器翻译。机器翻译的主要优势在于它提供了速度和成本效益的有效结合。

Q2。 NLP 和 AI 一样吗？

正如一些专家所说，人工智能基本上是人类智能的计算机复制，可以设置为做出决策、执行特定操作并从结果中学习。当你将 AI 专注于人类语言学时，它就会产生 NLP。因此，NLP 是 AI 的一个子领域，它使人类能够与机器交谈。同样，NLP 是人工智能的子集，它使计算机能够理解、解释和处理人类语言并执行特定任务。在 NLP 的帮助下，计算机可以检测短语和关键字，感知语言意图，并准确翻译以生成适当的响应。

Q3。 NLP 是一个好的职业领域吗？

近年来，NLP 已发展成为数据科学和人工智能领域的一项革命性技术。智能设备使用的增加、云解决方案的采用以及 NLP 应用程序的开发以增强客户服务体验是 NLP 市场突然扩张的主要因素。研究表明，NLP 是 2021 年需求量最大的七种技术技能之一，其市场规模预计将超过 340 亿美元，复合年增长率接近 22%。在美国，NLP 专业人员的平均年薪约为 80,000 至 110,000 美元。