النشرات الإخبارية
إن هذا النص ترجمة للنص الإنجليزي الرسمي لهذا الإصدار الجديد، وقد تم تزويده للرجوع إليه بسهولة عند الحاجة. يرجى الرجوع إلى النص الإنجليزي الأصلي للحصول على التفاصيل و/أو المواصفات الخاصة. في حال وجود أي تعارض، فيجب اتباع محتوى الإصدار الإنجليزي الأصلي.
بالنسبة للنشرة الفورية رقم ٣٣٦٥
طوكيو ٢٢ يوليو ٢٠٢٠ - أعلنت شركة Mitsubishi Electric Corporation (طوكيو: ٦٥٠٣) اليوم أنها قد طورت ما تعتقد بأنها التقنية الأولى على مستوى العالم القادرة على التفاعل بطريقة سلسة وطبيعية بدرجة عالية مع البشر اعتمادًا على القدرة على التعرف على المشهد، والتي من خلالها تتم ترجمة معلومات الاستشعار متعدد الوسائل إلى لغة طبيعية. وتتضمن التقنية الجديدة، المعروفة باسم التفاعل من خلال التعرف على المشهد، تقنية Maisart®* المسجلة ملكيتها لشركة Mitsubishi Electric والتي تقوم على الذكاء الاصطناعي وتتميز بصغر حجمها، وذلك من أجل تحليل معلومات الاستشعار متعدد الوسائل لإتاحة تفاعل سلس وطبيعي بدرجة أعلى مع البشر من خلال توليد لغة طبيعية بناءً على السياق.
تتعرف هذه التقنية على الأحداث والأجسام السياقية بناءً على معلومات الاستشعار متعدد الوسائل، مثل الصور ومقاطع الفيديو الملتقطة من خلال الكاميرات، والمعلومات الصوتية المسجلة بالميكروفونات، ومعلومات تحديد الموقع المُقاسة من خلال تقنية ليدار. ولتحديد الأولوية بشأن هذه الفئات المختلفة من المعلومات، طورت Mitsubishi Electric تقنية الدمج متعدد الوسائل القائم على الملاحظة، والتي بإمكانها تقييم مدى أهمية المعلومات الرئيسية أحادية الوسيلة تلقائيًا، وذلك لدعم اختيار الكلمات المناسبة لوصف المشاهد بدقة. وأثناء إجراء اختبار قياس الأداء باستخدام مجموعة اختبارات عامة، استخدمت تقنية الدمج متعدد الوسائل القائم على الملاحظة معلومات صوتية وبصرية، وكانت نتيجة تقييم وصف الصور القائم على التوافق (CIDEr)** أعلى مما هي عليه في حالة استخدام المعلومات البصرية فقط بمقدار 29 نقطة مئوية. إن شركة Mitsubishi Electric جمعت بين تقنية الدمج متعدد الوسائل القائم على الملاحظة وتقنية فهم المشهد والقدرة على توليد لغة طبيعية قائمة على السياق، وذلك لتوفير نظام قوي متكامل للتفاعل من خلال التعرف على المشهد يتيح التفاعل مع المستخدمين بطريقة سلسة للغاية في مختلف الأوضاع.
إن استخدام تقنية التفاعل من خلال التعرف على المشهد في مجال ملاحة السيارات يأتي من ضمن التطبيقات المستهدفة، وذلك لأنه سيساهم في إرشاد السائقين على الطريق بطريقة سلسة. فعلى سبيل المثال، سيقدم النظام إرشادًا من خلال التعرف على المشهد، مثل "انعطف يمينًا أمام صندوق البريد" أو "اتبع السيارة الرمادية المنعطفة يمينًا" بدلاً من إرشاد السائق بعبارة "انعطف يمينًا بعد ٥٠ مترًا". وبالإضافة إلى ذلك، سيصدر النظام تحذيرات صوتية، مثل "أحد المشاة يعبر الشارع"، وذلك في حالة توقع تقاطع الأجسام القريبة مع مسار السيارة. ولتنفيذ هذه الوظائف، يحلل النظام المشاهد لتحديد المعالم المرئية التي يمكن تمييزها والعناصر الديناميكية الموجودة في المشهد، ومن ثم يستخدم تلك الأحداث والأجسام التي تعرف عليها لإصدار لغة سلسة لإرشاد السائق.
إن أوجه التقدم الأخيرة المحرزة في مجال تقنيات الحوارات المنطوقة وتوليد اللغات الطبيعية ووصف مقاطع الفيديو والتعرف على الأشياء باستخدام الشبكات العصبية العميقة تُمكّن الآلات من إدراك ما يحيط بها بشكل أفضل والتفاعل مع البشر بطريقة سلسة وطبيعية بدرجة أكبر. ومن المتوقع أن يتم استخدام تقنية التفاعل من خلال التعرف على المشهد على نطاق واسع، بما في ذلك واجهات الربط بين الإنسان والآلة المخصصة لأنظمة المعلومات والترفيه داخل السيارة، والتفاعل مع الروبوتات في أنظمة أتمتة المصانع والمباني، وأنظمة مراقبة صحة الأشخاص ورفاهيتهم، وأنظمة المراقبة التي تفهم المشاهد المعقدة للبشر وتحث على التباعد الاجتماعي، وتقديم الدعم لتشغيل المعدات من دون لمس في المناطق العامة، وغيرها.
مثال على تقنية التفاعل من خلال التعرف على المشهد التي تقدم إرشادًا بناءً على السياق
مثال على تقنية التفاعل من خلال التعرف على المشهد التي تقدم إرشادًا لتجنب الأخطار
تجدر الإشارة إلى أن النشرات الإخبارية دقيقة في وقت نشرها لكنها قد تكون عرضة للتغيير من دون إشعار.