Alexa 기술 개발: 시작 안내서

게시 됨: 2020-01-10

지난 10년 동안 음성 비서는 우리 삶에 역동적으로 들어왔습니다. Alexa, Siri, Google Assistant 및 Cortana와 같은 이름은 종을 울릴 가능성이 큽니다. 어쨌든, 보이스 보좌관의 아이디어가 노출된 것은 이 이름들 이전의 루트였습니다.

1962년으로 거슬러 올라가면 IBM은 최초의 음성 비서인 Shoebox를 출시했습니다. 당신이 그것을 추측하지 않았다면, 그것의 크기는 이름에 따라갔습니다. 수학적 기능을 수행하고 숫자 0-9 및 16개의 음성 단어를 인식할 수 있습니다. 그리고 하피가 3살짜리 단어를 가지고 와서 1,011개의 단어를 인식할 수 있었습니다.

이 모든 이니셜 혁신은 다음에 올 것을 위한 길을 닦았습니다. Apple, Amazon, Google 및 기타 거대 기업은 이에 대한 최고의 두뇌를 가지고 있으며 그 결과는 전 세계가 볼 수 있는 것이었습니다!

오늘날에는 "Hey Siri", "Alexa!", "Okay, Google"이 일반적으로 알려져 있습니다.

그러나 이 모든 것 중에서 Alexa는 대중을 압도합니다. 1억 개의 장치에서 사용할 수 있게 되면서 업계에서 화제가 되었습니다. 그리고 그것은 단지 스피커가 있는 Talking Tom이 아니라 실제로 당신을 위해 당신을 위해 당신을 위해 일을 하고 때로는 당신을 다른 누구와도 같지 않게 만듭니다.

기술적으로 말하면 AccuWeather를 사용하여 NPR, ESPN 및 지역 라디오 방송국과 같은 과다한 소스와 함께 기상 보고서 및 뉴스를 제공합니다.

비트에 대한 사용자의 요구를 이해하고 소유자의 Amazon Music 계정에서 모든 록, 팝 및 자정 멜로디를 스트리밍하고 Spotify 및 Pandora 계정에 대한 기본 제공 지원을 제공합니다. 알람과 할 일 목록을 원하는 방식으로 관리하고 중요한 전화를 걸 수도 있습니다.

그것은 비트에 대한 고객의 요구 사항을 이해하고 소유주의 Amazon Music 레코드에서 대부분의 스톤, 팝 및 12 PM 노래를 스트리밍하고 Spotify 및 Pandora 계정에 도움이 되는 제안을 제공합니다. 알림을 처리하고 필요한 방식으로 하루 계획을 세울 수 있으며 더 나아가 중요한 전화를 걸 수 있습니다.

Alexa가 수행하는 이러한 모든 작업은 "Skills"라는 내장 기능을 통해 수행됩니다. 사용자는 Alexa Skills Kit를 사용하여 Alexa에서 새로운 기술을 가르치고 가르칠 수 있으며, 그런 다음 요청하거나 질문하여 액세스할 수 있습니다. 스마트홈 스킬, 음악 스킬, 영상 스킬, 플래시 브리핑 스킬, 커스텀 스킬도 만들 수 있습니다.

최신 기술로 작동하는 포괄적인 장치이며 음성 비서에서 기대할 수 있는 모든 기능을 기껏해야 합니다.

이 가이드에서는 사용자 지정 Alexa 기술 개발을 살펴보겠지만 그 전에

Alexa Skill Development

"Alexa, Alexa 기술을 구축하기 전에 내가 알아야 할 모든 것은 무엇입니까?"

모든 유형의 기술을 구축하기 위한 공통(명백한) 전제 조건은 기술에 대한 구성을 만드는 데 사용되는 개발자 콘솔의 계정입니다.

구성에는 기술 이름, 상호 작용 모델 유형, 콘텐츠 피드 또는 끝점 및 기타 정보와 같은 기술에 대한 정보가 필요합니다. 이 구성은 기술에 대해 Alexa 서비스에 보내야 하는 사용자 요청을 결정하는 데 사용됩니다.

맞춤형 기술을 구축하기 위한 도구:

클라우드 기반 서비스를 호스팅하려면 인터넷에 액세스할 수 있는 엔드포인트, Amazon Web Services(AWS) 계정, AWS Lambda를 사용하려면 Amazon 개발자 계정, 적절한 개발자 환경, 테스트용 Alexa 지원 장치가 필요합니다.

스마트 홈 기술을 구축하기 위한 도구:

선호하는 프로그래밍 언어에 적합한 개발자 환경인 AWS 계정이 필요합니다. Node.js, Python, Java, C# 또는 Go를 사용하여 Lambda 함수를 작성할 수 있습니다. 테스트하려면 Alexa 지원 장치가 있어야 합니다.

비디오 기술을 구축하는 도구:

비디오 기술을 구축하려면 공개 API 또는 클라우드 기반 서비스에 대한 액세스 권한이 있는 클라우드 지원 비디오 서비스 제공업체, AWS 계정, Alexa 지원 장치, 코딩을 위한 적절한 개발자 환경이 필요합니다.

플래시 브리핑 기술을 구축하기 위한 도구:

새로운 콘텐츠로 새로 고쳐지는 RSS 또는 JSON을 사용하여 인터넷을 통해 액세스할 수 있는 콘텐츠 피드가 필요합니다.

음악 기술을 구축하는 도구:

음악 기술을 사용하려면 Amazon 개발자 계정, 등록된 Alexa 지원 장치, AWS 계정, 음악 스트리밍을 위한 음악 서비스 및 제어를 위한 클라우드 API가 필요합니다.

"알렉사, 어떻게 하면 당신을 일하게 만들까요?"

Alexa는 두 가지 방법으로 별자리를 알려주도록 요청할 수 있습니다.

"Alexa, 오늘의 별자리 운세에게 물고기자리 운세를 물어보세요." 샘플 발화가 호출과 일치하는 경우 다른 하나는 다음과 같습니다.

Alexa 사용자 지정 기술이 간접적으로 호출되는 "Alexa, 내 별자리는 무엇입니까?"

이는 모두 의도와 발언의 단순한 플레이이며 샘플 발언은 질문을 하거나 Alexa를 요청하는 데 사용하는 호출과 일치해야 합니다.

호출 이름은 사용자의 요청에 해당하는 의도와 함께 "IntentRequest"를 추가로 보내는 명령, 작업 또는 질문과 결합됩니다. 호출 구문의 명령, 작업 또는 질문은 샘플 발언에 정의되고 의도에 매핑됩니다.

사용자가 Alexa가 자신이 말하는 대로 무엇이든 얻고, 이로 인해 발생할 수 있는 분노를 완화하고, 다양한 형식으로 작성된 샘플 발언을 과다하게 제공하기를 원하는 때가 올 수 있습니다.

또한 하루에 마주할 수 있는 모든 기분 옆에 자신의 개인화된 재생 목록을 나열하고 싶지 않은 사람이 있을 것입니다. Alexa는 사용자가 원하는 대로 음악과 미디어를 스트리밍할 수 있습니다. Alexa 장치가 사용자의 Amazon 계정에 등록되면 사용자는 완전히 액세스할 수 있는 Amazon Music Library에서 모든 트랙을 요청할 수 있습니다.

"Alexa, 당신의 기술적 측면은 무엇입니까?"

명심해야 할 기술은 무엇입니까?

이제 이 질문에 대한 대답에 모호함이 없어야 합니다. 여기서 작업은 기술 요청을 처리하고 클라우드에서 호스팅하는 클라우드 기반 서비스를 만드는 것입니다.

사용자 지정 기술을 구축하기 위해 AWS Lambda 함수가 사용됩니다. 이에 대한 대안은 웹 서비스(모든 언어로)를 작성하는 것입니다. 이 경우 웹 서비스는 Alexa가 보낸 요청에 응답합니다.

사용자 지정 기술을 만들 때 상호 작용 모델이 정의됩니다. Alexa는 음성에서 단어를 가져와 요청으로 번역한 다음 특정 기술로 전송하는 데 사용합니다.

다른 기술 유형에는 기본 제공 상호 작용 모델을 제공하는 API가 있습니다.

"Alexa, 스킬은 어떻게 구축하나요?"

스킬 구축 프로세스는 개발자 콘솔에서 빌드 페이지에서 스킬 생성부터 테스트 및 분석에 이르기까지 체계적인 방식으로 구성됩니다.

기술 구축:

개발자 콘솔의 빌드 페이지에서 기술의 설정 및 구성을 수행합니다. 서비스에 대한 해당 상호작용 모델 및 엔드포인트를 지정하십시오. 이러한 모든 옵션은 개발자 콘솔에서 쉽게 사용할 수 있습니다.

그러나 여기에서 어떤 특정 옵션을 사용해야 하는지는 기술 모델에 따라 다릅니다. 사용자 지정 모델의 경우 의도 및 샘플 발언이 생성됩니다. 사전 구축된 스마트 홈 모델의 경우 엔드포인트가 지정되고 계정 연결 구성이 수행됩니다.

기술 테스트:

기술은 여러 가지 방법으로 테스트할 수 있습니다. Utterance Profiler는 사용자 지정 상호 작용 모델을 테스트하는 데 사용됩니다.

개발자 콘솔의 테스트 페이지에는 Alexa Skill Development Kit 기능에 대한 액세스를 제공하는 시뮬레이터가 있으며 이는 스킬 테스트에 사용됩니다. 또 다른 옵션은 Alexa 지원 장치를 사용하여 테스트하는 것입니다.

기술은 ASK CLI 명령을 사용하여 명령줄에서 테스트할 수도 있습니다.

또는 Skill management API는 이에 대한 기술 테스트 기능을 제공합니다.

스킬 미리보기:

개발자 콘솔의 배포 페이지는 스킬의 가용성을 결정하고 스킬 저장소에서 볼 때 어떻게 표시되는지 한 눈에 확인하는 데 사용됩니다.

여기에 사용된 메타데이터는 언어별로 다릅니다. 세부 정보는 해당 기술이 지원하는 각 언어로 입력해야 합니다. 그러면 이 데이터는 기술 저장소에서 액세스할 수 있는 기술 세부 정보 페이지에 표시됩니다.

기술 확인:

인증 페이지에서 기술이 모두 준비되었는지 확인하고 인증 프로세스를 위해 제출하십시오. 기술의 게시 상태는 개발자 콘솔의 상태 열에 표시됩니다.

기술이 게시되면 게시 상태가 라이브로 변경됩니다. 여기에서 스킬을 숨기거나 제거할 수도 있습니다.

인증 실패 또는 문제가 있는 경우 성공적인 검증 및 인증을 위해 수정됩니다.

기술 분석:

개발자 콘솔의 분석 페이지는 기술에 대한 사용 메트릭을 보는 데 사용됩니다. 이 대시보드는 고객이 기술을 사용하는 방법에 대한 자세한 정보를 보여줍니다.

보이스 어시스턴트의 현재 요구는 그들이 사람들의 라이프스타일을 영원히 바꾸고 있음을 분명히 했습니다. 스마트 음성 비서가 없는 사람들은 구매 의향이 있는 것으로 분석됐다.

음성 비서는 "Alexa, 배고프다"라는 작은 속삭임에도 자동으로 가장 좋아하는 요리를 주문할 정도로 똑똑해질 것으로 예상됩니다.

AI는 스마트 스피커가 다른 모든 의도에 맞게 프로그래밍되지 않고 스스로 생각하고 학습하는 데 도움이 되는 기능을 가지고 있습니다. 인공 지능은 시장 리더가 될 것이며 음성 도우미는 그 산물이며 항상 배우고 개선하는 것은 어디에도 없습니다. 음성 어시스턴트는 성장하고 유지하기 위해 여기에 있습니다.

이제 회사를 위한 Alexa 기술 개발을 찾고 있다면 전문 팀을 고용하고 막바지 번거로움을 피하십시오. 고객 서비스를 개선하는 데 도움이 될 뿐만 아니라 시간을 절약하면서 경쟁업체보다 앞서 나갈 수 있습니다.