الأدوات

الشبكة العصبية الآن ليست أسوأ من أن الجهات الفاعلة يمكن أن صوت الفيديو


لتحميل الفيديو بالفعل بالرصاص ليست مهمة سهلة. نظرًا لوجود نسخة متماثلة واحدة غير صحيحة ، في بعض الأحيان ، يتعين عليك إطلاق النار على كل شيء مرة أخرى أو اختراع خطوة المدير. ومع ذلك ، فقد اقترح العلماء حلا لهذه المشكلة. وظائف الجمعية على جزء من التكرارات غير الناجحة ، تحولوا إلى الذكاء الاصطناعي. تم تعليمه نطق الكلمات اللازمة نيابة عن الممثل حتى لا يلاحظ الجمهور أي شيء.

لقد تطور فريق من جامعة ستانفوردخوارزمية تحرير مسار الصوت الغريب مع إدخال النص الأساسي. يستخدم التطبيق آلية لفك تشفير حركات الكلام من أجزاء مختلفة من مقطع فيديو مسجل مسبقًا. يتم تحويلها إلى مواد معدلة مع رسم حركات مناسبة لشفاه المذيعين والممثلين.

بالنسبة للفيديو المكتمل ، ما عليك سوى إضافة كلمات جديدة أو إزالة الكلمات القديمة أو حتى استبدال النسخ المتماثلة بأكملها. ونتيجة لذلك ، يبدو أن المؤامرة غير مستعدة للمشاهد طبيعية تمامًا.

إذا ارتكب الممثل خطأ في نطق الحصادالنص ، ثم تحرير المواد ستكون بسيطة: فقط أدخل التعديل مباشرة من لوحة المفاتيح. وقال في أقسام أخرى من السجل إن تقنية التعلم بالآلة العصبية سوف تجمع النسخة الصحيحة من الكلمات المختلفة أو أجزاء منها. في الوقت الحالي ، سيحتاج تعلم الذكاء الاصطناعي إلى طول الفيديو الأصلي الذي لا يقل عن 40 دقيقة.


جامعة ستانفورد دكتوراه أوهاد فريدوأعرب عن أسفه لأن مثل هذه التطورات ستحبها الجهات الفاعلة السيئة بشكل رئيسي. ومع ذلك ، في رأيه ، فإنه يستحق العمل على التكنولوجيا. بعد كل شيء ، سيكون لديه الكثير من التطبيقات العملية في مجال إنشاء وتحرير الفيديو والمحتويات الأخرى.

كما يؤكد المطورين ، منهجية بهميعد تحرير الفيديو مساعدة كبيرة للمنتجين والمحررين. ولكن يمكن استخدامه أيضًا لإنتاج بكرات مزيفة. يعتقد الخبراء أنه ينبغي تنظيم استخدام هذه الأداة. على سبيل المثال ، يمكنك إخطار المشاهدين حول معالجة الفيديو باستخدام شبكة عصبية.

المصدر: المستقبل