بالنسبة للنشرة الفورية رقم ٣٢٥٩

إن هذا النص ترجمة للنص الإنجليزي الرسمي لهذا الإصدار الجديد، وقد تم تزويده للرجوع إليه بسهولة عند الحاجة. يرجى الرجوع إلى النص الإنجليزي الأصلي للحصول على التفاصيل و/أو المواصفات الخاصة. في حال وجود أي تعارض، فيجب اتباع محتوى الإصدار الإنجليزي الأصلي.

شركة Mitsubishi Electric تطور تقنية للتعرف على الكلام بلغات متعددة حيث تحدد تلقائيًا اللغة التي يتم التحدث بها

ستساعد في تقديم واجهات كلام تناسب تمامًا مجموعة واسعة من المواقف عن طريق تطبيق تقنية الذكاء الاصطناعي المدمج ذات العلامة التجارية Maisart الخاصة بالشركة لتحديد اللغات المنطوقة وفهمها في الوقت ذاته، حتى عند تحدث عدة أشخاص

نسخة PDF ‏(PDF:447.5KB)

طوكيو، ١٣ فبراير ٢٠١٩ - أعلنت شركة Mitsubishi Electric Corporation (طوكيو: ٦٥٠٣) اليوم عن تطويرها تقنية تعتقد أنها التقنية الأولى في العالم القادرة على التعرف على الكلام بلغات متعددة بدقة عالية من دون إعلامها باللغة التي يتم التحدث بها. إن التقنية الجديدة، وهي التعرف على الكلام بصورة سلسة، تتضمن تقنية الذكاء الاصطناعي المدمج ذات العلامة التجارية Maisart®* المسجلة ملكيتها لشركة Mitsubishi Electric وتقوم على نظام واحد يمكنه تحديد اللغات المنطوقة وفهمها في الوقت ذاته. وفي اختبارات تضمنت ٥ و١٠ لغات بشكل منفصل، والتي أجريت جميعها في بيئات منخفضة الضوضاء، استطاع النظام التعرف بدقة تجاوزت ٩٠ في المئة و٨٠ في المئة، على التوالي، من دون إعلامه باللغة التي تم التحدث بها. كما يمكن للتقنية فهم عدة أشخاص يتحدثون باللغة ذاتها أو بلغات مختلفة في الوقت ذاته.

* Mitsubishi Electric's AI creates the State-of-the-ART in Technology (الذكاء الاصطناعي في Mitsubishi Electric يبتكر التطور في مجال التكنولوجيا)

تقنية التعرف على الكلام بصورة سلسة

تستخدم تقنية التعرف على الكلام بصورة سلسة طريقة التعلم المتعمق المسجلة ملكيتها لشركة Mitsubishi Electric للحصول على دقة ومرونة على نحو غير مسبوق. ومن خلال استخدام إطار التعلم المتعمق الكامل حيث يتم تدريب شبكة متعمقة باستخدام عينات الدخل والخرج فقط، تبني التقنية نظامًا واحدًا يحدد اللغات المنطوقة ويفهمها في الوقت ذاته دون الحاجة للاعتماد على معارف متخصصة مثل نظام الوحدات الصوتية والمعاجم التي توضح النطق. كما يزيد التعلم المتزامن باستخدام بيانات الكلام بلغات متعددة من كفاءة التقنية.

يستخدم النظام الجديد طريقة تصنيف CTC/التركيز الهجينة المسجلة ملكيتها لشركة Mitsubishi Electric للتعرف على الكلام بصورة كاملة، ومن ثمّ تزداد دقة عملية التعرف على الكلام بدرجة كبيرة. وتقوم هذه الطريقة على طريقتين تمثيليتين للتعرف على الكلام بصورة كاملة، وهما التصنيف الزمني الربطي (CTC) وفك الترميز القائم على التركيز، بحيث يتم الجمع بين مزايا كل منهما والحد من سلبياتهما. وعلى وجه الخصوص، تستفيد الطريقة الهجينة من قدرة CTC على التنبؤ بالمواءمات الدقيقة بين إشارات دخل الكلام وحروف الخرج، كما تستفيد من قدرة طريقة التركيز على مراعاة الاعتماد المتبادل عبر الوقت للخصائص الصوتية واللغوية للكلام.

دقة التعرف على الكلام

  تعمل من دون تحديد اللغة المنطوقة ٥ لغات ١٠ لغات
التقنية الجديدة نعم تزيد عن ٩٠% تزيد عن ٨٠%
التقنية التقليدية** لا ٨٧% ٧٢%
  • ملاحظة: يتم افتراض حالات التسجيل المثالية
  • ** تم بناء مجموعة من عدة أنظمة وتدريبها لكل لغة بشكل منفصل، مع تحديد يدوي مسبق للغة المنطوقة

أتاحت تقنية التعرف على الكلام تشغيل أجهزة مثل الهواتف الذكية وأنظمة ملاحة السيارات صوتيًا. ولكن نظرًا لتطوير أنظمة التعرف على الكلام التقليدية بشكل منفصل لكل لغة، يتعيّن على المستخدمين تحديد اللغة التي يرغبون تحدثها بشكل مسبق. ومن الممكن استخدام طريقة تحديد لغة قبل التعرف على الكلام، ولكن هذا يؤثر سلبًا على قابلية الاستخدام بسبب التأخير اللازم لتحديد اللغة، وزيادة أخطاء التعرف بسبب أخطاء تحديد اللغة وأنظمة التعرف على الكلام دون المستوى الأمثل المدربة بواسطة بيانات أحادية اللغة غير كافية. وتقل أيضًا دقة أنظمة التعرف على الكلام التقليدية بشكل ملحوظ عند التعامل مع كلام متداخل من قبل عدة متحدثين، مما يحد من إمكانية تطبيقها.

من المتوقع أن تساعد تقنية التعرف على الكلام بصورة سلسة من شركة Mitsubishi Electric في تقديم واجهات كلام تناسب تمامًا مجموعة واسعة من المواقف، مثل استخدام عائلة متعددة اللغات الأجهزة المنزلية ذاتها أو طلب المسافرين الدوليين معلومات من نظام التوجيه في صالة المطار بلغاتهم الأصلية. وبالمضي قدمًا، ستعمل Mitsubishi Electric على زيادة تحسين دقة التعرف التلقائي على الكلام وإمكانية تطبيقه في البيئات الفعلية، بما في ذلك السيارات، والمنازل، والمرافق العامة وأكثر من ذلك.

تجدر الإشارة إلى أن النشرات الإخبارية دقيقة في وقت نشرها لكنها قد تكون عرضة للتغيير من دون إشعار.