Alexa 技能开发:入门指南
已发表: 2020-01-10在过去的十年里,语音助手已经动态地进入了我们的生活。 像 Alexa、Siri、Google Assistant 和 Cortana 这样的名字很可能会敲响警钟。 无论如何,语音助手的想法暴露在这些名字之前的路线上。
早在 1962 年,IBM 就推出了第一款名为 Shoebox 的语音助手。 如果你没有猜到,它的大小就是它的名字。 它可以做数学函数并识别数字 0-9 和 16 口语。 然后 Harpy 带着一个三岁孩子的词汇量来了,它可以识别 1,011 个单词。
所有这些最初的创新都为接下来的发展铺平了道路。 苹果、亚马逊、谷歌等巨头都在这方面绞尽脑汁,结果让全世界都看到了!
快进到今天,“Hey Siri”、“Alexa!”、“Okay, Google”是家喻户晓的。
但在所有这些中,Alexa 脱颖而出。 在 1 亿台设备上可用,它已成为业界的话题。 它不仅仅是带扬声器的会说话的汤姆猫,它实际上为你做家务,有时让你与众不同。
从技术上讲,它使用 AccuWeather 通过 NPR、ESPN 和当地广播电台等众多来源提供天气报告和新闻。
它了解用户对来自所有者的 Amazon Music 帐户的所有摇滚、流行和午夜旋律的节拍和流式传输的需求,并为 Spotify 和 Pandora 帐户提供内置支持。 它可以按照您想要的方式管理警报和待办事项列表,还可以为您拨打重要电话。
它理解客户对节拍的要求,并从所有者的亚马逊音乐唱片中流式传输大多数石头、流行和 12 PM 歌曲,并为 Spotify 和 Pandora 帐户提供帮助。 它可以以您需要的方式处理警报和计划一天,并为您拨打重要电话。
Alexa 所做的所有这些任务都是通过其称为“技能”的内置功能完成的。 用户可以使用 Alexa Skills Kit 在 Alexa 中教授和灌输新技能,然后可以通过提出请求或提问来访问这些技能。 您还可以创建智能家居技能、音乐技能、视频技能、Flash 简报技能和自定义技能。
它是一款采用最新技术运行的综合设备,最多可以完成您对语音助手的所有期望。
在本指南中,我们将介绍自定义 Alexa 技能开发,但在此之前,
“Alexa,在构建 Alexa 技能之前我应该知道什么?”
构建任何类型技能的常见(明显)先决条件是开发者控制台上的帐户,该帐户将用于为您的技能创建配置。
配置将需要有关技能的信息,例如技能的名称、交互模型的类型、内容提要或端点以及其他信息。 此配置用于确定应针对您的技能发送到 Alexa 服务的用户请求。
您将需要一个可访问 Internet 的端点来托管基于云的服务、Amazon Web Services (AWS) 帐户和 Amazon 开发人员帐户,以使用 AWS Lambda、适当的开发人员环境和支持 Alexa 的设备进行测试。
您需要一个 AWS 帐户,这是一个适合您首选编程语言的开发人员环境。 您可以使用 Node.js、Python、Java、C# 或 Go 来创作 Lambda 函数。 要进行测试,您必须拥有支持 Alexa 的设备。
构建视频技能需要具有公共 API 或访问基于云的服务的支持云的视频服务提供商、AWS 帐户、支持 Alexa 的设备以及适合编码的开发人员环境。
您将需要一个可通过 Internet 访问的内容提要,使用 RSS 或 JSON,它会使用新内容进行刷新。
对于音乐技能,你需要有一个亚马逊开发者账户、一个注册了支持 Alexa 的设备、一个 AWS 账户、一个用于流式传输音乐的音乐服务和一个用于控制它的云 API。
“Alexa,我怎样才能让你工作?”
可以要求 Alexa 以两种方式告诉星座,一种是,
“Alexa,向今天的星座查询双鱼座的星座。” 其中示例话语与调用匹配,另一个是:
“Alexa,我的星座是什么?”,其中间接调用了 Alexa 自定义技能。
这都是意图和话语的简单游戏,您的示例话语应该与您用来提问或请求 Alexa 的调用相匹配。
调用名称与命令、动作或问题相结合,进一步发送带有与用户请求相对应的意图的“IntentRequest”。 调用短语中的命令、操作或问题在示例话语中定义并映射到意图。
有时用户可能希望 Alexa 只听他们说的话,以缓解可能导致的愤怒,提供大量以各种形式编写的示例话语。
此外,谁不想在一天可能遇到的每一种心情旁边列出他们的个性化播放列表。 Alexa 可以根据您的要求流式传输音乐和媒体。 一旦 Alexa 设备注册到用户的亚马逊账户,他们就可以从完全可访问的亚马逊音乐库中请求任何曲目。
“Alexa,你的技术方面是什么?”
有哪些技术要记住?
现在,这个问题的答案应该没有歧义。 这里的工作是创建一个基于云的服务来处理对技能的请求并将其托管在云中。
要构建自定义技能,使用 AWS Lambda 函数。 另一种方法是编写 Web 服务(使用任何语言),在这种情况下,Web 服务将响应 Alexa 发送的请求。
创建自定义技能时定义交互模型。 Alexa 使用它从语音中获取单词并将其转换为请求,然后将其发送到特定技能。
其他技能类型具有提供内置交互模型的 API。
“Alexa,我如何建立技能?”
技能培养过程在开发者控制台上以系统的方式组织,从在构建页面上创建技能到对其进行测试和分析。
在开发者控制台的构建页面上,进行技能的设置和配置。 为服务指定相应的交互模型和端点。 所有这些选项都可以在开发者控制台上轻松使用。
但是,这里应该使用哪些特定选项取决于技能的模型。 对于自定义模型,会创建意图和示例话语。 对于预建的智能家居模型,指定端点并执行帐户链接配置。
一项技能可以通过多种方式进行测试。 Utterance Profiler 用于测试自定义交互模型。
在 Developer Console 的测试页面上,有一个模拟器可以访问 Alexa Skill development Kit 功能,用于测试技能。 另一种选择是使用支持 Alexa 的设备进行测试。
也可以使用 ASK CLI 命令从命令行测试该技能。
否则,技能管理 API 提供相同的技能测试功能。
开发者控制台上的分发页面用于确定技能的可用性,并一目了然在技能商店中查看它时的显示方式。
此处使用的元数据是特定于语言的。 需要使用技能支持的每种语言填写详细信息。 然后,此数据将显示在技能商店中可访问的技能详细信息页面上。
在“认证”页面上,确认您的技能已准备就绪并将其提交以进行认证过程。 技能的发布状态会显示在开发者控制台的状态栏。
技能发布后,发布状态变为实时。 在这里,技能也可以隐藏或移除。
如果有任何认证失败或问题,则将其修复以成功验证和认证。
开发者控制台上的分析页面用于查看技能的使用指标。 此仪表板描述了有关客户如何使用该技能的详细信息。
语音助手的当前需求清楚地表明,它们正在彻底改变人们的生活方式。 据分析,没有智能语音助手的人希望购买一个。
预计语音助手会变得非常聪明,只要你轻轻地说“Alexa,我饿了”,它就会自动为你点最喜欢的菜。
人工智能具有帮助智能扬声器自主思考和学习的能力,而无需针对其他所有意图进行编程。 人工智能将成为市场领导者,而语音助手,作为它的产物,并且一直在学习和改进,不会去任何地方。 语音助手在这里成长和留存。
现在,如果您正在为您的公司寻找 Alexa 技能开发,请确保您聘请专业团队并避免任何最后一分钟的麻烦。 它不仅可以帮助您改善客户服务,还可以帮助您节省时间,同时让您领先于竞争对手。