Rozwój umiejętności Alexy: przewodnik dla początkujących
Opublikowany: 2020-01-10W ciągu ostatniej dekady asystenci głosowi dynamicznie wkroczyli w nasze życie. Nazwy takie jak Alexa, Siri, Asystent Google i Cortana najprawdopodobniej zadzwonią. W każdym razie dopiero droga przed tymi nazwiskami ujawniła pomysł asystenta głosowego.
Już w 1962 roku IBM wprowadził na rynek pierwszego w historii asystenta głosowego o nazwie Shoebox. Jeśli tego nie zgadłeś, jego rozmiar odpowiadał jego nazwie. Może wykonywać funkcje matematyczne i rozpoznawać cyfry 0-9 i 16 wypowiadanych słów. Potem przyszła Harpia ze słownictwem trzylatka, potrafiła rozpoznać 1011 słów.
Wszystkie te początkowe innowacje utorowały drogę do tego, co miało nadejść. Apple, Amazon, Google i inni giganci mają w tym swój najlepszy umysł, a wynik był widoczny dla świata!
Szybkie przewijanie do dzisiaj „Hej Siri”, „Alexa!”, „Ok, Google” jest powszechnie znane.
Ale spośród tych wszystkich Alexa wyróżnia się dla mas. Będąc dostępnym na urządzeniach 100Mn, stał się tematem dyskusji w branży. I to nie tylko Talking Tom z głośnikiem, on faktycznie wykonuje za ciebie obowiązki, a czasami sprawia, że jesteś jak nikt inny.
Technicznie rzecz biorąc, wykorzystuje AccuWeather do dostarczania raportów o pogodzie i wiadomości z wielu źródeł, takich jak NPR, ESPN i lokalne stacje radiowe.
Rozumie potrzeby użytkowników dotyczące bitów i strumieniowania wszystkich melodii rockowych, popowych i o północy z konta Amazon Music właściciela i oferuje wbudowaną obsługę kont Spotify i Pandora. Może zarządzać alarmami i listami rzeczy do zrobienia w sposób, w jaki chcesz, a także wykonywać dla Ciebie ważne połączenia.
Rozumie wymagania klientów dotyczące bitów i strumieniuje większość piosenek stone, pop i 12 PM z płyty Amazon Music właściciela, a także oferuje pomoc dla kont Spotify i Pandora. Może radzić sobie z alertami i planować dzień w sposób, w jaki potrzebujesz, a ponadto wykonywać dla Ciebie znaczące połączenia.
Wszystkie te zadania Alexa wykonuje dzięki wbudowanym możliwościom zwanym „Umiejętnościami”. Użytkownicy mogą uczyć i wpajać nowe umiejętności w Alexa za pomocą zestawu Alexa Skills Kit, do którego można uzyskać dostęp poprzez składanie próśb lub zadawanie pytań. Możesz tworzyć umiejętności inteligentnego domu, umiejętności muzyczne, umiejętności wideo, umiejętności prezentacji flash, a także umiejętności niestandardowe.
Jest to kompleksowe urządzenie działające w oparciu o najnowszą technologię i robiące wszystko, czego można oczekiwać od asystenta głosowego co najwyżej.
W tym przewodniku przyjrzymy się rozwojowi niestandardowych umiejętności Alexy, ale wcześniej
„Alexa, co powinienem wiedzieć przed zbudowaniem umiejętności Alexa?”
Typowym (oczywistym) warunkiem wstępnym budowania dowolnego rodzaju umiejętności jest konto w Konsoli programisty, które służyłoby do tworzenia konfiguracji dla Twoich umiejętności.
Konfiguracja wymagałaby informacji o umiejętności, takich jak nazwa umiejętności, typ modelu interakcji, źródło treści lub punkt końcowy oraz inne informacje. Ta konfiguracja służy do określania żądań użytkownika, które powinny być wysyłane do usługi Alexa w celu uzyskania Twoich umiejętności.
Będziesz potrzebować punktu końcowego z dostępem do Internetu, aby hostować usługę opartą na chmurze, konto Amazon Web Services (AWS) i konto programisty Amazon, aby korzystać z AWS Lambda, odpowiednie środowisko programistyczne i urządzenie z obsługą Alexa do testowania.
Potrzebujesz konta w AWS, odpowiedniego środowiska programistycznego dla preferowanego języka programowania. Możesz użyć Node.js, Pythona, Java, C# lub Go do napisania funkcji Lambda. Do testowania musisz mieć urządzenie obsługujące Alexa.
Zbudowanie umiejętności wideo wymagałoby dostawcy usług wideo obsługujących chmurę z publicznym API lub dostępem do usługi opartej na chmurze, konta z AWS, urządzenia obsługującego Alexa i odpowiedniego środowiska programistycznego do kodowania.
Będziesz potrzebować źródła treści, które będzie dostępne przez Internet, za pomocą RSS lub JSON, które odświeży się nową treścią.
Aby móc korzystać z umiejętności muzycznych, musisz mieć konto programisty Amazon, zarejestrowane na nim urządzenie z obsługą Alexa, konto AWS, usługę muzyczną do strumieniowego przesyłania muzyki i chmurowe API do sterowania nią.
„Alexa, jak zmusić cię do pracy?”
Alexa może zostać poproszona o podanie horoskopu na dwa sposoby, jeden to:
„Alexa, zapytaj Horoscopes Today o horoskop dla Ryb”. gdzie przykładowe wypowiedzi są dopasowane do inwokacji, druga to:
„Alexa, jaki jest mój horoskop?”, w którym pośrednio przywoływana jest niestandardowa umiejętność Alexa.
To wszystko jest prostą grą intencji i wypowiedzi, twoje przykładowe wypowiedzi powinny pasować do inwokacji, których używasz do zadawania pytań lub proszenia Alexy.
Nazwa wywołania jest połączona z poleceniem, akcją lub pytaniem, które następnie wysyła „IntentRequest” z intencją odpowiadającą żądaniom użytkownika. Polecenie, akcja lub pytanie w frazie wywołania jest zdefiniowane w przykładowych wypowiedziach i odwzorowane na intencje.
Mogą nadejść czasy, kiedy użytkownicy będą chcieli, aby Alexa po prostu dostała to, co mówią, aby złagodzić irytację, która może wyniknąć, dostarczyć mnóstwo przykładowych wypowiedzi napisanych w różnych formach.
Ponadto, kto nie chciałby, aby ich spersonalizowana lista odtwarzania była wymieniona obok każdego nastroju, jaki może napotkać dzień. Alexa może przesyłać strumieniowo muzykę i multimedia, gdy o to poprosisz. Po zarejestrowaniu urządzenia Alexa na koncie Amazon użytkownika może on zażądać dowolnego utworu ze swojej w pełni dostępnej biblioteki Amazon Music Library.
„Alexa, jakie są twoje aspekty techniczne?”
O jakich szczegółach technicznych należy pamiętać?
Teraz nie powinno być dwuznaczności w odpowiedzi na to pytanie. Zadanie polega na stworzeniu usługi opartej na chmurze do obsługi żądania umiejętności i hostowaniu go w chmurze.
Aby zbudować niestandardową umiejętność, używana jest funkcja AWS Lambda. Alternatywą jest napisanie serwisu internetowego (w dowolnym języku), w którym to przypadku serwis internetowy odpowie na żądanie wysłane przez Alexę.
Model interakcji jest definiowany podczas tworzenia umiejętności niestandardowej. Jest używany przez Alexę, aby pobrać słowa z głosu i przetłumaczyć je na żądanie, które jest następnie wysyłane do określonej umiejętności.
Inne typy umiejętności mają swoje interfejsy API, które zapewniają wbudowany model interakcji.
„Alexa, jak zbudować umiejętność?”
Proces budowania umiejętności jest zorganizowany w Konsoli programisty w sposób systematyczny, od utworzenia umiejętności na stronie kompilacji po jej testowanie i analizę.
Na stronie kompilacji w Konsoli programisty przeprowadź konfigurację i konfigurację umiejętności. Określ odpowiedni model interakcji i punkty końcowe usługi. Wszystkie te opcje są łatwo dostępne w Konsoli programisty.
Jednak od modelu umiejętności zależy, jakie konkretnie opcje należy tutaj zastosować. W przypadku modelu niestandardowego tworzone są intencje i przykładowe wypowiedzi. W przypadku gotowych modeli inteligentnego domu określany jest punkt końcowy i przeprowadzana jest konfiguracja łączenia kont.
Umiejętność można testować na wiele sposobów. Wypowiedź Profiler służy do testowania niestandardowego modelu interakcji.
Na stronie Test w Konsoli programisty znajduje się symulator, który daje dostęp do funkcji zestawu deweloperskiego Alexa Skill i służy do testowania umiejętności. Inną opcją jest przetestowanie za pomocą urządzenia obsługującego Alexa.
Umiejętność można również przetestować z wiersza poleceń za pomocą poleceń ASK CLI.
Lub też interfejs API do zarządzania umiejętnościami zapewnia funkcje testowania umiejętności dla tego samego.
Strona Dystrybucja w Konsoli programisty służy do określenia dostępności umiejętności i sprawdzenia, jak będzie wyglądała w sklepie Skill Store.
Użyte tutaj metadane są specyficzne dla języka. Dane muszą być wypełnione w każdym języku obsługiwanym przez umiejętność. Te dane byłyby następnie wyświetlane na stronie szczegółów umiejętności dostępnej w sklepie umiejętności.
Na stronie Certyfikacja sprawdź, czy Twoje umiejętności są gotowe i prześlij je do procesu certyfikacji. Stan publikacji umiejętności zostanie wyświetlony w kolumnie Stan w Konsoli programisty.
Po opublikowaniu umiejętności status publikacji zmienia się na aktywną. Tutaj umiejętność można również ukryć lub usunąć.
Jeśli wystąpią jakiekolwiek niepowodzenia lub problemy z certyfikacją, są one naprawiane w celu pomyślnej walidacji i certyfikacji.
Strona Analytics w Konsoli programisty służy do wyświetlania danych dotyczących wykorzystania umiejętności. Ten pulpit nawigacyjny przedstawia szczegółowe informacje o tym, jak klienci korzystają z umiejętności.
Obecne żądanie Asystentów Głosowych jasno pokazało, że zmieniają oni styl życia ludzi na dobre. Przeanalizowano, że osoby, które nie posiadają inteligentnego asystenta głosowego, chcą go kupić.
Przewiduje się, że asystenci głosowi będą tak inteligentni, że na Twój najmniejszy szept „Alexa, jestem głodny”, automatycznie zamówią Twoją ulubioną kuchnię.
Sztuczna inteligencja ma możliwości, które pomogą inteligentnym głośnikom myśleć i uczyć się samodzielnie, bez konieczności programowania pod kątem innych celów. Sztuczna inteligencja będzie liderem na rynku, a Asystenci Głosowi, będąc jej produktem, zawsze ucząc się i doskonaląc, nigdzie się nie wybierają. Asystenci głosowi są tutaj, aby się rozwijać i pozostać.
Teraz, jeśli szukasz rozwoju umiejętności Alexa dla swojej firmy, upewnij się, że zatrudniasz profesjonalny zespół i unikasz kłopotów w ostatniej chwili. Pomoże to nie tylko poprawić jakość obsługi klienta, ale także zaoszczędzić czas, jednocześnie wyprzedzając konkurencję.