PARA LANÇAMENTO IMEDIATO N.º 3259

Este texto é uma tradução da versão em inglês oficial deste comunicado de imprensa, sendo fornecido apenas para referência e conveniência. Consulte a versão em inglês original para obter detalhes e/ou informações específicas. Em caso de discrepância, prevalecerá o conteúdo da versão em inglês original.

Mitsubishi Electric desenvolve tecnologia de reconhecimento de discurso multilingue que identifica automaticamente o idioma falado

Vai ajudar a desenvolver interfaces de discurso, extremamente adequadas para uma grande variedade de situações, ao aplicar a IA compacta Maisart da empresa para, simultaneamente, identificar e compreender os idiomas falados, mesmo em situações em que estão várias pessoas a falar

Versão PDF

TÓQUIO, 13 de fevereiro de 2019 – A Mitsubishi Electric Corporation (TÓQUIO: 6503) anunciou hoje que desenvolveu o que a empresa acredita ser a primeira tecnologia no mundo capaz de oferecer um reconhecimento de discurso multilingue altamente preciso sem que seja necessário informar o sistema acerca do idioma que está a ser falado. A inovadora tecnologia de Reconhecimento de Discurso Contínuo incorpora a tecnologia de IA compacta e exclusiva, Maisart®*, num único sistema que pode, simultaneamente, identificar e compreender os idiomas falados. Em testes que envolveram separadamente 5 e 10 idiomas, todos realizados em ambientes com ruído reduzido, o sistema alcançou um reconhecimento com mais de 90% e 80% de exatidão, respetivamente, sem dispor de informações acerca do idioma que estava a ser falado. A tecnologia também consegue compreender quando estão várias pessoas a falar o mesmo idioma ou diferentes idiomas em simultâneo.

*Mitsubishi Electric's AI creates the State-of-the-ART in Technology (A IA da Mitsubishi Electric cria a tecnologia mais avançada)

Tecnologia de Reconhecimento de Discurso Contínuo

A tecnologia de Reconhecimento de Discurso Contínuo utiliza o método exclusivo de aprendizagem profunda da Mitsubishi Electric para oferecer uma flexibilidade e precisão sem precedentes. Adotando uma estrutura de aprendizagem profunda completa onde uma rede profunda é treinada utilizando apenas amostras de entrada e de saída, a tecnologia cria um sistema único que, simultaneamente, identifica e compreende os idiomas falados sem depender de conhecimentos especializados, como sistemas de fonemas e léxicos de pronunciação. A aprendizagem simultânea através dos dados de discurso multilingue aumenta a sua robustez.

O novo sistema utiliza o Método de Atenção/CTC Híbrida exclusivos da Mitsubishi Electric para um reconhecimento de discurso completo, o que melhora significativamente a precisão do processo de reconhecimento de discurso. O método é baseado em dois métodos representativos para o reconhecimento de discurso completo (classificação temporal conetora [CTC] e descodificação baseada em atenção), combinando as suas vantagens e, ao mesmo tempo, reduzindo o impacto das suas desvantagens. Em particular, o método híbrido beneficia da capacidade da CTC em prever alinhamentos precisos entre sinais de entrada de discurso e carateres de saída e a capacidade do método de atenção em considerar as interdependências ao longo do tempo das características acústicas e linguísticas do discurso.

Precisão do reconhecimento de discurso

  Funciona sem que o idioma falado seja especificado 5 idiomas 10 idiomas
Nova tecnologia Sim >90% >80%
Tecnologia convencional** Não 87% 72%
  • Nota: pressupõe condições ideais de gravação
  • **Combinação de vários sistemas concebidos e treinados separadamente para cada idioma, com seleção manual prévia do idioma falado

A tecnologia de reconhecimento de discurso tornou possível a utilização de dispositivos, como smartphones e sistemas de navegação automóvel por voz. No entanto, uma vez que os sistemas de reconhecimento de discurso convencionais são desenvolvidos separadamente para cada idioma, os utilizadores têm de selecionar previamente o idioma em que pretendem falar. É possível utilizar um método de identificação de idioma antes do reconhecimento de discurso, mas isso resulta na degradação da usabilidade, devido ao atraso necessário para a identificação do idioma, e no aumento de erros de reconhecimento, devido a erros de identificação de idioma e a sistemas de reconhecimento de discurso não otimizados e treinados com dados monolingues insuficientes. A precisão dos sistemas de reconhecimento de discurso convencionais também é consideravelmente afetada quando se trata de um discurso sobreposto por vários oradores, limitando a sua aplicabilidade.

Espera-se que a tecnologia de Reconhecimento de Discurso Contínuo da Mitsubishi Electric ajude a desenvolver interfaces de discurso que são extremamente adequadas para uma grande variedade de situações, como uma família multilingue que utilize o mesmo eletrodoméstico ou viajantes internacionais que precisem de consultar um sistema de orientação no terminal de um aeroporto nas suas línguas maternas. No futuro, a Mitsubishi Electric irá trabalhar para continuar a melhorar a precisão e aplicabilidade do reconhecimento automático de discurso em ambientes reais, incluindo automóveis, casas, instalações públicas e muito mais.

Tenha em atenção que as informações apresentadas são válidas no momento da publicação, mas podem estar sujeitas a alterações sem aviso prévio.