A Alexa cassé? Pourquoi votre Echo n’est parfois effrayant choses

0
154

Zero

17-alexa.jpg

Alexa détecte les sons à travers un réseau de microphones.

Amazon

C’était, bien sûr, l’inévitable. “Alexa, cette. Alexa, qu’.” Après un certain temps, nous avons tout juste savait Alexa allait … qu’est-ce que les gars sur Twitter a dit? “Il ya une bonne chance que je vous assassinés ce soir.”

L’admettre. Si vous êtes l’un des millions d’Alexa propriétaires, vous avez remarqué que de drôles de comportements. Si vous êtes comme ma femme et moi, vous avez probablement, peut-être même plus d’une fois, me demandais juste combien de temps il serait avant notre IA suzerains de se lever et de nous mettre vers le bas.

Nous allons couvrir l’histoire de retour assez rapide, puisqu’il a été écrit au sujet ailleurs. Alexa a été connu pour soudain, présentent des comportements bizarres. En janvier, j’ai écrit sur la façon Alexa a soudainement commencé à parler sans être réveillé par un signal word.

Il y A quelques semaines, chroniqueur high-tech Farhad Manjoo a écrit dans le New York Times à propos de la façon dont sa Alexa fit sursauter dans son lit une nuit en criant. Tout à travers l’Internet cette semaine, nous avons entendu des histoires au sujet de Alexas sortir avec spontanément, mal à consonance rires.

Ce qui se passe?

Détendez-vous. Votre Alexa n’est pas hantée (probablement). Votre Alexa ne va pas vous assassiner dans son sommeil (il n’a pas de mains ou de pieds). Et, votre Alexa n’est pas en train de devenir folle. Bien…

En fait, par définition, ce dernier ne peut pas, techniquement, être tout à fait vrai. Selon Google, une définition de la folie consiste à “être dans un état d’esprit qui empêche la perception normale, le comportement, ou l’interaction sociale.”

define-insane.jpg

Dictionary.com définition de “folie”.

Quand il s’agit de Alexa, tout est une question de perception et de comportement.

Réveil Alexa

Alexa est déclenchée par ce qu’on appelle un “réveil”. Cela permettra de répondre à une veillée mot de Alexa, Echo, Amazon, ou de l’Ordinateur, selon ce que vous choisissez dans votre Amazon Echo préférences. D’autres voix assistants également utiliser l’éveil des mots. Siri utilise “Hey, Siri.” Google utilise des “Ok, Google.” Windows 10 répond à “Hey Cortana”, et bientôt, juste “Cortana”, nommé d’après l’IA adjoint Master Chief de Halo le jeu vidéo de la série.

Pour l’instant, nous allons simplement parler de la suite de mots “Alexa”, et l’Alexa appareils. Mais ce que je suis sur le point de discuter s’applique à toute écoute active, système de reconnaissance vocale.

Alexa, et les autres IA voix des systèmes, ont surmonter (au moins pour la plupart) un énorme défi technique. Comment filtrer à travers tout le bruit (littéralement, bruit) dans un environnement, et savoir quand intervenir?

La manière dont les développeurs sont en train de résoudre, c’est maintenant à l’écoute pour une foulée mot, ou, essentiellement, un spécifiquement défini le son de forme d’onde. Alexa est microphones sont toujours sur. La vibration de la membrane sur chaque micro est converti à une signature numérique.

Le traitement hub à l’intérieur de chaque Alexa appareil examine ensuite que la signature numérique, et si elle correspond à celle d’un pré-définis sillage mot, alors et seulement alors que l’appareil est-il censé analyser suivi de sons, de sens.

Le tamisage à travers tout ce bruit pour une veillée mot est un non-trivial problème de programmation. Jetez un oeil à la vague formulaire ci-dessous.

alexa-optimal-audio.jpg

“Alexa” une qualité audio optimale

C’est le mot “Alexa.” J’ai enregistré que sur un micro de studio professionnel, avec ma tête et de la bouche situé à l’exact emplacement optimal pour l’enregistrement de la voix. J’ai enregistré ce dans un silence de la salle, avec tout, sauf de mon ordinateur éteint.

Maintenant, regardez ce qui arrive à cette forme de vague quand je marche à peine cinq pieds de distance et de répéter le mot, “Alexa.”

alexa-five-feet-away.jpg

“Alexa,” cinq pieds de distance

Comme vous pouvez le voir, les bosses sont encore relativement perceptible, mais l’amplitude de l’onde est beaucoup moins.

En quelque sorte, le processeur sur Alexa appareil est de reconnaître que la forme d’onde, c’est juste entendu correspond à une commande de réveil et d’écouter. L’appareil effectue que dans un couple des manières.

Tout d’abord, il a plusieurs micros, il est donc en mesure de ramasser différents onde sonore structures sur chaque micro. Parce que les micros sont disposés autour de l’appareil, chaque micro ramasser un événement sonore très légèrement différentes de temps, et avec un très légèrement différente des vagues.

Si, et seulement si, l’appareil détermine que le son qu’il vient d’entendre est la suite de mots, puis il commence à traiter les sons.

Mais nous ne sommes pas prêts à discuter Alexa de traitement de la commande tout de suite. Rappelez-vous que j’ai enregistré les ondes indiqué ci-dessus dans des conditions optimales de l’environnement studio. L’analyse de la foulée mot par Alexa serait facile si elle a toujours vécu dans des conditions optimales de l’environnement studio.

Mais Alexa n’est pas.

Le véritable défi technique que l’assistant vocal vendeurs comme Amazon ont à surmonter, c’est la variété. Il y a des millions d’Alexa propriétaires, et vous pouvez parier que beaucoup d’entre eux disent “Alexa” de façon très différente. Ils peuvent avoir des accents différents, ils ont certainement des voix différentes, des sonneries, des sons, et la vitesse d’élocution.

Ils ont également une large gamme de bruits de fond. Une porte de voiture peut slam. Une TÉLÉVISION peut être sur. La musique peut jouer dans une autre pièce. Un chien pourrait être aboiements. Un ventilateur peut être de générer une couverture de bruit blanc. Vous obtenez l’idée.

Dans cette variété, en quelque sorte, Alexa a afin de déterminer si elle a été réveillé par le mot “Alexa.”

Étant donné qu’il y a des millions d’appareils, des situations et des voix, vous pouvez commencer à voir le défi que les développeurs ont eu à faire l’invocation de fonctionner de manière fiable. Vous ne pouvez pas avoir Alexa se réveiller spontanément, ou qui serait inquiétant. D’autre part, si Alexa ne répond pas quand on lui parle, qui pourrait également être très frustrant pour les utilisateurs.

La construction d’une machine système d’apprentissage qui peut analyser toutes ces variables, la réalisation d’un équilibre pratique entre un trop grand nombre de faux positifs sans avoir l’air d’ignorer les demandes, de l’est (et je vais utiliser l’expression) non-trivial.

Les causes probables d’Alexa de réactions spontanées

Compte tenu de tout cela, la cause la plus probable d’un Alexa réaction spontanée est une mauvaise interprétation de son. Compte tenu de la sensibilité Alexa a être à un processus de réveil, des mots, parfois Alexa va réagir à un son (même un, nous pourrions ne pas entendre ou de préavis) et de l’interpréter comme un signal word.

Bien que beaucoup plus rares, il y a aussi la possibilité qu’une mise à jour a changé Alexa code et a introduit un bug.

Il y a aussi le problème de l’internet et Alexa basés dans le cloud système d’IA. Parlons-en, à côté.

Comment une commande est interprété

Alexa répond à beaucoup, beaucoup de commandes. L’analyse de toutes ces formes d’ondes est beaucoup trop de travail pour le processeur sur le local Alexa appareil. Pour faire le traitement, Alexa s’appuie sur Amazon cloud d’infrastructure.

Si vous demandez à Alexa pour le moment, demander à définir un rappel, changer le thermostat, ou en exigeant de “Plus d’un son de cloche,” chaque commande de requête ou de vous parler, c’est, en fin de compte, juste une autre forme de vague.

Même si Amazon n’a pas divulgué l’exacte des détails techniques Alexa de fonctions internes, nous savons que le complexe d’analyse de problème pour toutes ces commandes, c’est trop pour un PROCESSEUR local. L’onde sonore (ou, une représentation compressée) doit être téléchargés sur Amazon centres de données pour l’analyse statistique.

Une fois téléchargée, l’Alexa back-end IA a une tâche très importante: match de l’onde sonore à un Alexa chaîne de commande.

Alexa a une grande bibliothèque de commandes possibles. Non seulement il y a le natif de commandes, comme des rappels et l’heure de la demande, mais il y a toutes les commandes associées à Alexa toujours croissante de compétences de la bibliothèque.

Les compétences de la bibliothèque est d’Alexa de la version de l’app store, où à l’extérieur, non-Amazon les développeurs peuvent créer un code personnalisé qui attend pendant un certain Alexa commande et exécute alors un comportement.

Nous reviendrons sur les compétences dans un moment, mais pour l’instant, nous allons continuer avec le défi de la recherche de la bonne commande.

Pour augmenter la facilité d’utilisation d’Alexa, il a à être en mesure de répondre à des variations d’une commande donnée. Par exemple, Alexa a à être en mesure de traiter “Alexa, dites-moi le temps”, ainsi que “d’Alexa, quelle heure est-il.” La plupart des IA gère ce problème en ignorant remplissage de mots (c’est à dire, est, les, etc) et de convertir les sons en sons tiges et normalisée des séquences. Essentiellement, cela permet au système de prendre une variété d’expressions et de les traiter comme de la même commande.

Rappelez-vous que non seulement il y a des milliers de commandes pour Alexa analyser, les ondes sonores ne sont pas vierges. Le son du système de traitement pour être en mesure de prendre le son des vagues et faire de son mieux pour interpréter ce que les humains parlant demandent.

Comme avec la suite de mot, ce n’est pas simple étant donné les centaines de millions de locuteurs, des dialectes, des accents, des voix, des terrains, des distances à partir de périphériques, et de l’environnement des bruits de fond.

Franchement, il n’est rien de moins étonnant que cela fonctionne à tous. Ici aussi, Alexa peut paraître “dans un état d’esprit qui empêche la perception normale” si il a mal interprété une onde sonore, accepte un faux positif, ou ignore ce qui pourrait être une demande valide.

En agissant sur les commandes

Tout d’Alexa n’, en agissant sur les commandes est la partie la plus facile. Une fois l’Alexa back-end de l’IA sait que vous allez avoir le temps, un temps de recherche est facile à coder. Donc, aussi, est la voix de synthèse de la réponse, parce que la seule variable est la chaîne de mots à l’oral.

Dans presque tous les cas, si Alexa semble agir bizarrement, ce n’est pas vraiment le comportement de la composante de Alexa AI l’esprit. C’est presque sans aucun doute la perception de la composante.

Cela dit, il y a des commandes qui pourraient entraîner les gens à penser Alexa a perdu ses billes. Au moment de la rédaction de cet article, il y a quatre tiers de compétences en lien avec “scream.”

scream.jpg

Amazon compétences pour “crier”

Le “cri farce” compétence initier à la phrase “Alexa, crier blague.” Après, on va attendre soixante secondes, puis crier. Qui permet à l’farceur pour configurer la farce, de quitter la salle, puis la torture qui se trouve être à proximité de l’appareil quand il hurle.

Le “spooky scream” est encore plus diabolique. Elle commence avec la phrase “Alexa, demandez Effrayant Cri commence dans deux minutes.” Vous pouvez régler le temps de retard. En tant que tel, vous pourriez demander Alexa pour démarrer le cri dans dix minutes, de quitter la salle, et ont la farce de déclenchement, bien après que vous avez quitté.

Alexa la mauvaise conduite de

Qui sait ce qui est arrivé à faire Alexa crier dans Farhad de la chambre à coucher? Certes, quand Alexa a parlé à ma femme et à moi, sans demande, nous n’avons pas d’entendre ou de dire quelque chose qui aurait causé à prendre la parole.

Mais si oui ou non Alexa entendu quelque chose à l’extérieur est quelque chose que nous ne le saurons jamais. Pixel (notre chienne) souvent aboie à des bruits que lui seul peut entendre. Aujourd’hui, il aboya à l’ONDULEUR camion de trois minutes avant que le pilote a sonné la cloche. Il est possible de Pixel entendu le camion en bas de la rue et aboya, avant d’être arrêté à notre maison.

Dans le cas de la chair de poule rire comportement, il est hautement probable qu’Alexa était de répondre à des faux positifs. Jetez un oeil à la vague formulaire ci-dessous.

alexa-laugh-optimal.jpg

“Alexa, rire.” Un enregistrement Optimal.

Vous pouvez le voir, il ya trois principales vagues dans cette position optimale de l’enregistrement de la phrase “Alexa, rire.” Les deux premiers correspondent à l’Alexa sillage mot. Le troisième est le verbe “rire”. Notez que la vague est en fait assez plat. C’est parce que “rire” est un mot doux, sans beaucoup de sommets ou des caractéristiques distinctives.

Maintenant, regardez à la prochaine vague forme. C’est la même phrase, mais prononcé à partir d’environ cinq pieds de distance.

alexa-laugh-across-the-room.jpg

“Alexa, rire.” Enregistré à travers la salle.

Vous pouvez à peine dire à partir de la vague, ce qui se passe. L’image suivante est un zoom dans la version ci-dessus de l’onde.

alexa-laugh-across-room-zoomed-in.jpg

“Alexa, rire.” Enregistré à travers la salle, zoom avant

Vous pouvez le voir il y a quelques pointes, mais l’amplitude est terrible. Il y a très peu de données ici. Étant donné que Alexa était de répondre à une simple “rire” de commande, il est certainement possible que, dans les millions de ménages avec Alexa appareils, quelques généré suffisamment de données pour être interprété comme un éclat de rire de commande.

La nécessité pour l’apprentissage humain

C’est là que l’apprentissage humain, plutôt que de l’apprentissage de la machine, vient en. Alexa les développeurs, dans le sillage de la vague de protestations, ont changé d’Alexa de la séquence de commande pour un éclat de rire. Maintenant, Alexa, de rire, de” ne pas faire n’importe quoi. Au lieu de cela, les humains chez Amazon appris et changé le commandement “d’Alexa, pouvez-vous rire?”

Espérons que la course aux armements est toujours en faveur de l’homme. Si Alexa AI jamais fait parvenir à la conscience de soi, nous avons probablement tous sont voués à l’échec. En attendant, bien que, vous savez maintenant que vous pouvez craie plus d’Alexa est effrayant comportement mal interprété les ondes sonores.

D’une certaine manière, ce n’est pas comme une pensée réconfortante comme je l’avais espéré qu’il serait.

Vous pouvez suivre ma journée-à-jour mises à jour du projet sur les médias sociaux. Assurez-vous de me suivre sur Twitter à @DavidGewirtz, sur Facebook à Facebook.com/DavidGewirtz sur Instagram à YouTube.com/DavidGewirtzTV.

Rubriques Connexes:

Amazon

Transformation Numérique

CXO

L’Internet des objets

L’Innovation

Des Logiciels D’Entreprise

0