Recherchez et suivez l'évolution des prix sur 140 000 produits

Apple va améliorer l’assistance vocale en détectant l’emplacement des sources sonores

0

De nouvelles recherches montrent qu'Apple étudie comment des haut-parleurs intelligents ou d'autres appareils avec assistance vocale intégrée pourraient utiliser le son pour estimer la distance qui les sépare d'un utilisateur qui parle, voire pour identifier plus précisément les sons qui les entourent.

À l'heure actuelle, des appareils comme le HomePod, Google Home et les différentes offres avec Alexa sont capables d'entendre suffisamment bien votre voix, même lorsque vous écoutez de la musique forte, mais deux récentes demandes de brevet montrent qu'Apple veut améliorer cette capacité d'écoute et la porter à un nouveau niveau.

L'un des deux documents parle de l'estimation de la distance en fonction de l'apprentissage et implique "l'utilisation de l'audio non seulement pour reconnaître un utilisateur mais aussi pour savoir où il se trouve". "Il est souvent souhaitable que l'appareil estime la distance entre l'appareil et l'utilisateur à l'aide de son réseau de microphones", peut-on lire dans la demande de brevet. "Par exemple, l'appareil peut ajuster le volume de lecture ou la réponse d'un appareil d'assistance intelligent en fonction de la distance estimée de l'utilisateur par rapport à l'appareil."

Les implications sont intéressantes, par exemple si un utilisateur est très proche de l'appareil, la musique ou la parole peuvent ne pas être jouées à un volume élevé, ou bien, si l'utilisateur est éloigné, la lecture des médias ou la réponse d'un appareil d'assistance intelligent peuvent être calibrées à un volume plus élevé. Un autre objectif collatéral du brevet est d'améliorer la manière dont un système de plusieurs assistants installés dans la maison évalue correctement lequel d'entre eux doit être activé en cas de requête.

Parmi les solutions exposées pour améliorer la reconnaissance, Apple propose des cartographies simples de l'environnement conduisant à la création d'une grille de points mesurés, qui permettrait d'approcher la position de plus en plus précisément. Mais cette méthodologie pourrait être inadéquate avec des sujets en mouvement, c'est pourquoi nous envisageons également la possibilité de trianguler la source avec un système de microphones créés ad hoc. Dans ce cas également, nous serions confrontés à une limitation matérielle dans le cas de dispositifs à microphone unique. Nous pensons donc aussi à une solution plus complexe impliquant un système basé sur l'apprentissage, comme un réseau neuronal profond (DNN) qui ne nécessite pas de dispositifs particulièrement avancés.

Dans ce cas, le système pourrait être entraîné à distinguer la voix du bruit de fond, à calculer les informations sur les sons attribuables à un simple bruit de fond et à mieux évaluer la propagation directe du signal. Et c'est sur ce point que se concentre la deuxième demande de brevet, en fait, différents scénarios d'utilisation sont pris en compte qui ne peuvent actuellement pas être gérés efficacement par les systèmes couramment utilisés.

Par exemple, les appareils du futur pourraient être capables de distinguer le son d'une sonnette de porte de celui d'une alarme, provoquant des réactions différentes selon le contexte. Pour l'instant, il est difficile de dire si des systèmes similaires seront développés et intégrés dans les technologies futures. Apple et de nombreux autres géants technologiques ont l'habitude de déposer un très grand nombre de brevets et beaucoup d'entre eux ne sont pas nécessairement destinés à se traduire en applications réelles.

Partager.

A propos de l'auteur

Créateur du site, passionné par la domotique, le développement Web, Les gadgets Chinois et par plus ou moins tout ce qui existe en fait. Le site a été créé autour de l'impression 3D et de la domotique, mais d'autres briques s'ajoutent eu fil du temps. Car dès que j'ai une nouvelle passion, j'essaye de la faire partager. Vous pouvez aussi découvrir mon blog dédié à la pâtisserie.

Laisser un commentaire