Entwicklung von Alexa-Fähigkeiten: Ein Kickstarter-Leitfaden

Veröffentlicht: 2020-01-10

In den letzten zehn Jahren sind Sprachassistenten dynamisch in unser Leben eingetreten. Namen wie Alexa, Siri, Google Assistant und Cortana werden höchstwahrscheinlich eine Glocke läuten. Auf jeden Fall war es weit vor diesen Namen, dass die Idee eines Sprachassistenten aufgedeckt wurde.

Bereits 1962 brachte IBM den allerersten Sprachassistenten namens Shoebox auf den Markt. Wenn Sie es nicht erraten hatten, ging seine Größe durch seinen Namen. Es könnte die mathematischen Funktionen ausführen und die Ziffern 0-9 und 16 gesprochene Wörter erkennen. Dann kam Harpy mit dem Wortschatz eines Dreijährigen, er konnte 1.011 Wörter erkennen.

All diese anfänglichen Innovationen hatten den Weg für das geebnet, was als nächstes kommen sollte. Apple, Amazon, Google und andere Giganten haben sich dabei ihre besten Gedanken gemacht, und das Ergebnis war für die ganze Welt zu sehen!

Vorspulen bis heute, „Hey Siri“, „Alexa!“, „Okay, Google“ ist allgemein bekannt.

Aber von all dem sticht Alexa aus der Masse hervor. Da es auf 100 Mio. Geräten verfügbar ist, ist es zum Gesprächsthema der Branche geworden. Und es ist nicht nur der Talking Tom mit einem Lautsprecher, er erledigt tatsächlich Ihre Aufgaben für Sie und bringt Sie manchmal wie kein anderer.

Technisch gesehen verwendet es AccuWeather, um Wetterberichte und Nachrichten mit einer Vielzahl von Quellen wie NPR, ESPN und lokalen Radiosendern bereitzustellen.

Es versteht die Bedürfnisse der Benutzer für die Beats und streamt alle Rock-, Pop- und Mitternachtsmelodien aus dem Amazon Music-Konto des Besitzers und bietet integrierte Unterstützung für Spotify- und Pandora-Konten. Es kann die Alarme und Aufgabenlisten nach Ihren Wünschen verwalten und auch wichtige Anrufe für Sie tätigen.

Es versteht die Anforderungen der Kunden an die Beats und streamt die meisten Stone-, Pop- und 12-Uhr-Songs aus der Amazon Music-Platte des Eigentümers und bietet Unterstützung für Spotify- und Pandora-Konten. Es kann mit den Warnungen umgehen und den Tag so planen, wie Sie es benötigen, und außerdem wichtige Anrufe für Sie tätigen.

All diese Aufgaben erledigt Alexa durch seine integrierten Fähigkeiten namens „Skills“. Benutzer können Alexa mithilfe des Alexa Skills Kit neue Fähigkeiten beibringen und einprägen, auf die dann zugegriffen werden kann, indem sie Anfragen stellen oder Fragen stellen. Sie können auch Smart-Home-Skills, Musik-Skills, Video-Skills, Flash-Briefing-Skills und benutzerdefinierte Skills erstellen.

Es ist ein umfassendes Gerät, das auf der neuesten Technologie basiert und alles bietet, was Sie von einem Sprachassistenten höchstens erwarten können.

In diesem Leitfaden werden wir uns mit der Entwicklung von benutzerdefinierten Alexa-Fertigkeiten befassen, aber davor,

Alexa Skill Development

„Alexa, was sollte ich alles wissen, bevor ich einen Alexa-Skill aufbaue?“

Die übliche (offensichtliche) Voraussetzung für das Erstellen jeder Art von Skill ist ein Konto in der Entwicklerkonsole, das verwendet wird, um die Konfiguration für Ihren Skill zu erstellen.

Die Konfiguration würde die Informationen über die Fertigkeit erfordern, wie z. B. den Namen der Fertigkeit, die Art des Interaktionsmodells, den Inhalts-Feed oder Endpunkt und andere Informationen. Diese Konfiguration wird verwendet, um die Benutzeranfragen zu bestimmen, die für Ihren Skill an den Alexa-Dienst gesendet werden sollen.

Tools zum Erstellen einer benutzerdefinierten Fähigkeit:

Sie benötigen einen über das Internet zugänglichen Endpunkt zum Hosten des Cloud-basierten Dienstes, ein Amazon Web Services (AWS)-Konto und ein Amazon-Entwicklerkonto, um AWS Lambda, eine geeignete Entwicklerumgebung und ein Alexa-fähiges Gerät zum Testen zu verwenden.

Tools zum Aufbau einer Smart-Home-Fähigkeit:

Sie benötigen ein Konto bei AWS, eine geeignete Entwicklerumgebung für Ihre bevorzugte Programmiersprache. Sie können Node.js, Python, Java, C# oder Go verwenden, um eine Lambda-Funktion zu erstellen. Zum Testen benötigen Sie ein Alexa-fähiges Gerät.

Tools zum Erstellen eines Video-Skills:

Das Erstellen eines Video-Skills würde einen Cloud-fähigen Videodienstanbieter mit einer öffentlichen API oder Zugriff auf den Cloud-basierten Dienst, ein Konto bei AWS, ein Alexa-fähiges Gerät und eine geeignete Entwicklungsumgebung zum Programmieren erfordern.

Tools zum Aufbau einer Flash-Briefing-Fähigkeit:

Sie benötigen einen Inhalts-Feed, auf den über das Internet mit RSS oder JSON zugegriffen werden kann und der mit den neuen Inhalten aktualisiert wird.

Tools zum Aufbau einer Musikfertigkeit:

Für einen Musik-Skill benötigen Sie ein Amazon-Entwicklerkonto, ein darauf registriertes Alexa-fähiges Gerät, ein AWS-Konto, einen Musikdienst zum Streamen von Musik und eine Cloud-API zur Steuerung.

„Alexa, wie bringe ich dich zum Arbeiten?“

Alexa kann auf zwei Arten aufgefordert werden, das Horoskop zu erzählen, eine ist,

„Alexa, frage Horoskope heute nach dem Horoskop für Fische.“ wo die Beispieläußerungen mit dem Aufruf abgeglichen werden, ist die andere:

„Alexa, was ist mein Horoskop?“, wo indirekt ein benutzerdefinierter Alexa-Skill aufgerufen wird.

Es ist alles ein einfaches Spiel von Absichten und Äußerungen, Ihre Beispieläußerungen sollten mit den Aufrufen übereinstimmen, die Sie verwenden, um Fragen zu stellen oder Alexa anzufordern.

Der Aufrufname wird mit einem Befehl, einer Aktion oder einer Frage kombiniert, die weiter eine „IntentRequest“ mit der Absicht sendet, die den Anforderungen des Benutzers entspricht. Der Befehl, die Aktion oder die Frage in Ihrem Aufrufsatz wird in den Beispieläußerungen definiert und den Absichten zugeordnet.

Es können Zeiten kommen, in denen die Benutzer möchten, dass Alexa einfach versteht, was sie sagen, um den daraus resultierenden Ärger zu lindern, eine Fülle von Beispieläußerungen in verschiedenen Formen bereitzustellen.

Außerdem, wer möchte nicht, dass seine personalisierte Playlist neben jeder Stimmung aufgelistet wird, die ein Tag antreffen könnte. Alexa kann Musik und Medien streamen, wenn Sie es wünschen. Sobald das Alexa-Gerät beim Amazon-Konto des Benutzers registriert ist, kann er jeden Titel aus seiner voll zugänglichen Amazon Music Library anfordern.

„Alexa, was sind deine technischen Aspekte?“

Welche technischen Details sind zu beachten?

Nun, es sollte keine Zweideutigkeit in der Antwort auf diese Frage geben. Die Aufgabe hier besteht darin, einen Cloud-basierten Dienst zu erstellen, um die Anfrage nach den Fähigkeiten zu bearbeiten und in der Cloud zu hosten.

Um einen benutzerdefinierten Skill zu erstellen, wird die AWS Lambda-Funktion verwendet. Eine Alternative dazu ist das Schreiben eines Webservice (in beliebiger Sprache), in welchem ​​Fall der Webservice auf die von Alexa gesendete Anfrage antworten würde.

Beim Erstellen eines benutzerdefinierten Skills wird ein Interaktionsmodell definiert. Es wird von Alexa verwendet, um die Wörter aus der Stimme zu holen und sie in eine Anfrage zu übersetzen, die dann an einen bestimmten Skill gesendet wird.

Die anderen Fertigkeitstypen haben ihre APIs, die ein integriertes Interaktionsmodell bereitstellen.

„Alexa, wie baue ich einen Skill?“

Der Skill-Building-Prozess ist in der Developer Console systematisch organisiert, von der Erstellung eines Skills auf der Build-Seite bis hin zum Testen und Analysieren.

Aufbau einer Fähigkeit:

Führen Sie auf der Erstellungsseite der Entwicklerkonsole die Einrichtung und Konfiguration des Skills durch. Geben Sie das entsprechende Interaktionsmodell und die Endpunkte für den Dienst an. Alle diese Optionen sind in der Developer Console leicht verfügbar.

Es hängt jedoch vom Modell des Skills ab, welche spezifischen Optionen hier verwendet werden sollten. Für ein benutzerdefiniertes Modell werden Absichten und Beispieläußerungen erstellt. Für vorgefertigte Smart-Home-Modelle wird ein Endpunkt angegeben und die Konfiguration der Kontoverknüpfung durchgeführt.

Testen einer Fertigkeit:

Eine Fertigkeit kann auf mehrere Arten getestet werden. Der Utterance Profiler wird zum Testen des benutzerdefinierten Interaktionsmodells verwendet.

Auf der Testseite der Entwicklerkonsole gibt es einen Simulator, der Zugriff auf die Funktionen des Alexa Skill Development Kits bietet und zum Testen der Skills verwendet wird. Eine weitere Möglichkeit besteht darin, mit einem Alexa-fähigen Gerät zu testen.

Der Skill kann auch über die Befehlszeile mit ASK CLI-Befehlen getestet werden.

Andernfalls bietet die Skill-Management-API die entsprechenden Skill-Testfunktionen.

Vorschau eines Skills:

Die Verteilungsseite in der Entwicklerkonsole wird verwendet, um die Verfügbarkeit des Skills zu bestimmen und einen Blick darauf zu werfen, wie er aussehen würde, wenn er im Skill Store angezeigt wird.

Die hier verwendeten Metadaten sind sprachspezifisch. Die Details müssen in jeder Sprache ausgefüllt werden, die von der Fertigkeit unterstützt wird. Diese Daten werden dann auf der Skill-Detailseite angezeigt, auf die im Skill-Store zugegriffen werden kann.

Verifizieren einer Fertigkeit:

Überprüfen Sie auf der Zertifizierungsseite, ob Ihr Skill bereit ist, und reichen Sie ihn für den Zertifizierungsprozess ein. Der Veröffentlichungsstatus des Skills wird in der Statusspalte der Entwicklerkonsole angezeigt.

Sobald der Skill veröffentlicht wurde, ändert sich der Veröffentlichungsstatus in live. Hier kann der Skill auch ausgeblendet oder entfernt werden.

Wenn Zertifizierungsfehler oder -probleme auftreten, werden diese für eine erfolgreiche Validierung und Zertifizierung behoben.

Analyse einer Fertigkeit:

Die Analytics-Seite in der Developer Console wird verwendet, um die Nutzungsmetriken für einen Skill anzuzeigen. Dieses Dashboard zeigt detaillierte Informationen darüber, wie die Kunden den Skill verwenden.

Die aktuelle Nachfrage der Voice Assistants hat deutlich gemacht, dass sie den Lebensstil der Menschen nachhaltig verändern. Es wurde analysiert, dass die Personen, die keinen intelligenten Sprachassistenten besitzen, einen kaufen möchten.

Es wird erwartet, dass die Sprachassistenten so schlau gemacht werden, dass sie beim leisesten Flüstern von „Alexa, ich habe Hunger“ automatisch Ihre Lieblingsküche bestellen.

KI verfügt über die Fähigkeiten, die den intelligenten Lautsprechern helfen, selbstständig zu denken und zu lernen, ohne für jede andere Absicht programmiert zu werden. Künstliche Intelligenz wird der Marktführer sein und Sprachassistenten, die ein Produkt davon sind und ständig lernen und sich verbessern, werden nirgendwo hingehen. Die Sprachassistenten sind hier, um zu wachsen und zu bleiben.

Wenn Sie jetzt nach Alexa-Fähigkeitsentwicklung für Ihr Unternehmen suchen, stellen Sie sicher, dass Sie ein professionelles Team einstellen und Ärger in letzter Minute vermeiden. Es wird Ihnen nicht nur dabei helfen, Ihren Kundenservice zu verbessern, sondern Ihnen auch dabei helfen, Zeit zu sparen und sich von Ihren Mitbewerbern abzuheben.