Communiqués de presse

Mitsubishi Electric développe la technologie Scene-Aware InteractionDes interactions plus naturelles et plus intuitives entre l'humain et la machine grâce à la gestion de l'environnement

Ce texte est une traduction de la version anglaise officielle de ce communiqué de presse. Il est fourni à titre de référence et pour votre confort uniquement. Pour plus de détails ou de précisions, veuillez vous reporter à la version originale en anglais. En cas de divergence, la version originale en anglais prévaut.

POUR DIFFUSION IMMÉDIATE, n° 3365

TOKYO, 22 juillet 2020Mitsubishi Electric Corporation (TOKYO : 6503) a annoncé aujourd'hui le développement de ce qu'il considère comme la première technologie au monde capable d'offrir une interaction très naturelle et intuitive avec les hommes. Cette technologie s'appuie sur une fonctionnalité sensible à l'environnement pour traduire les informations des capteurs multimodaux en langage naturel. La nouvelle solution Scene-Aware Interaction, qui inclut la technologie d'IA compacte Maisart®*, propriété de Mitsubishi Electric, analyse les informations de capteurs multimodaux afin d'offrir une interaction très naturelle et intuitive avec les hommes, grâce à la génération d'informations de langage naturel dépendant du contexte.

Cette technologie reconnaît les objets et événements contextuels en fonction d'informations provenant de capteurs multimodaux, par exemple des images et des vidéos capturées via des caméras ou des données audio enregistrées avec des microphones, ou encore des informations de localisation obtenues par le biais du système LiDAR. Pour hiérarchiser ces différentes catégories d'informations, Mitsubishi Electric a mis au point une technologie de fusion multimodale attentionnelle capable d'évaluer automatiquement les informations unimodales importantes, afin de prendre en charge les sélections de mots appropriées pour décrire les scènes avec précision. Dans les évaluations utilisant un ensemble de tests commun, la technologie de fusion multimodale attentionnelle a utilisé des informations audio et visuelles pour obtenir un score d'évaluation des descriptions d'image basées sur le consensus (CIDEr, Consensus-Based Image Description Evaluation)** supérieur de 29 points de pourcentage à celui obtenu avec des informations visuelles uniquement. En combinant la fusion multimodale attentionnelle de Mitsubishi Electric avec la technologie de compréhension de l'environnement et la génération d'informations de langage naturel basées sur le contexte, on peut obtenir un puissant système d'interaction, sensible à l'environnement de bout en bout, pour des interactions hautement intuitives avec les utilisateurs dans diverses situations.

  1. * Mitsubishi Electric's AI creates the State-of-the-ART in technology Maisart (« L'intelligence artificielle de Mitsubishi Electric crée une technologie de pointe ».)
  2. **La mesure CIDEr permet d'évaluer la similarité d'une phrase générée par rapport à un ensemble de phrases écrites par l'homme en situation réelle, en mettant l'accent sur l'ordre des mots assez fréquemment appliqué par les êtres humains.

Dans le contexte de la navigation automobile, par exemple, la solution Scene-Aware Interaction offrira des indications intuitives aux conducteurs. Ainsi, plutôt que de lui dire : « Tournez à droite dans 50 m », par exemple, ce système proposera au conducteur des indications sensibles à l'environnement, par exemple : « Tournez à droite avant la boîte aux lettres » ou « Suivez la voiture grise qui tourne à droite ». De plus, s'il prévoit qu'un objet proche va entrer en collision avec le véhicule, le système pourra générer des avertissements vocaux, par exemple : « Attention, un piéton est en train de traverser la rue ». Dans ce but, le système analyse l'environnement, afin d'identifier des éléments dynamiques et des repères visuels clairement visibles aux alentours, les reconnaît et les utilise pour générer intuitivement des phrases à l'attention du conducteur.

Des améliorations récemment apportées à différentes technologies, telles que la reconnaissance des objets, la description de vidéos, la génération d'informations de langage naturel et le dialogue vocal, au moyen de réseaux neuronaux profonds, ont permis aux machines de mieux appréhender leur environnement et d'interagir de manière plus naturelle et intuitive avec les hommes. La technologie Scene-Aware Interaction devrait avoir un grand nombre d'applications, que ce soit au niveau des interfaces homme-machine pour l'info-divertissement en voiture, des interactions avec des robots au sein de systèmes d'automatisation d'usines et de bâtiments, des systèmes de contrôle de l'état de santé et du bien-être des patients, des fonctionnalités de surveillance capables d'interpréter des situations complexes pour les humains afin de favoriser l'éloignement sanitaire, ou encore de la prise en charge d'opérations sans contact sur des machines dans des lieux publics, entre autres.

Exemple d'indications contextuelles proposées par Scene-Aware Interaction

Exemple d'indications destinées à éviter les risques proposées par Scene-Aware Interaction


Remarque

Veuillez noter que les communiqués de presse sont exacts au moment de la publication, mais peuvent être sujets à modification sans préavis.


Demande de renseignements

Contact presse

Demandes de renseignements des clients