غوغل تصدم عالم الفيديو: جيميناي أومني فلاش يحرر المقاطع بالأوامر الصوتية
تواصل غوغل توسيع حضورها في مجال الذكاء الاصطناعي التوليدي، ومع هذا التطور كشفت الشركة عن أحد أبرز أنظمتها الجديدة، وهو جيميناي أومني فلاش. وتقدمه غوغل كأداة ذكية لتحرير الفيديو تعتمد على الذكاء الاصطناعي، مع تركيز واضح على التحكم الصوتي، والواجهة الحوارية، والتعامل مع أنواع متعددة من المحتوى في وقت واحد.
وعلى عكس برامج المونتاج التقليدية التي تعتمد على الخطوط الزمنية، والأزرار الكثيرة، والإعدادات اليدوية المعقدة، يسمح جيميناي أومني فلاش للمستخدم بتعديل الفيديو من خلال أوامر صوتية وعبارات طبيعية. فكل ما يحتاجه المستخدم هو وصف النتيجة المطلوبة، ليتولى النظام تنفيذ التعديلات داخل المشهد تلقائياً.
كيف يعمل جيميناي أومني فلاش
ينتمي جيميناي أومني فلاش إلى منظومة غوغل جيميناي أومني، ويعتمد على ذكاء اصطناعي متعدد الوسائط. وبفضل ذلك، يستطيع النظام معالجة أكثر من نوع من البيانات في الوقت نفسه، بما في ذلك:
النصوص والتعليمات المكتوبة؛
الأوامر الصوتية؛
الصور؛
الملفات الصوتية؛
مقاطع الفيديو الجاهزة.
هذا الدمج يجعل عملية تحرير الفيديو أكثر طبيعية، وكأن المستخدم يتحدث إلى مساعد إبداعي يفهم ما يريده. ويمكن، على سبيل المثال، أن يقول المستخدم: “اجعل المشهد بأسلوب سايبربانك” أو “أضف أجواء غروب الشمس”، ثم يقوم الذكاء الاصطناعي بتطبيق التغييرات المناسبة على المشهد.
وقد استعرضت غوغل قدرات هذه المنصة خلال مؤتمر غوغل للمطورين 2026، حيث أوضحت كيف يستطيع النظام الحفاظ على سياق المشهد، وتذكر التعديلات السابقة، وضمان اتساق مظهر الشخصيات بين مقاطع الفيديو المختلفة.
التحكم الصوتي بدلاً من المونتاج التقليدي
تعد ميزة تحرير الفيديو بالصوت من أهم الخصائص التي يقدمها جيميناي أومني فلاش. فبدلاً من استخدام القوائم والأدوات اليدوية، يمكن للمستخدم التفاعل مع الذكاء الاصطناعي من خلال حوار مباشر يشبه التحدث إلى محرر فيديو محترف.
ومن أمثلة الأوامر التي يمكن استخدامها:
“أضف مطراً درامياً”.
“غيّر الإضاءة إلى أجواء مسائية”.
“اترك الشخصية كما هي، لكن بدّل ملابسها”.
“حوّل المشهد إلى أسلوب رسوم كوميكس”.
“أضف حركة كاميرا ولمسة سينمائية”.
يقوم النظام بتحليل الأمر، ثم يحدد التأثيرات والتعديلات المناسبة ويطبقها على الفيديو. كما يأخذ الذكاء الاصطناعي التغييرات السابقة في الاعتبار، مما يساعد على الحفاظ على وحدة المشهد من دون الحاجة إلى تعديل كل لقطة يدوياً.
ما الذي يميز جيميناي أومني فلاش عن المنافسين؟
توجد حالياً في السوق عدة أدوات ذكاء اصطناعي مخصصة لإنشاء الفيديو، من بينها سورا، ورانواي، وفيو من غوغل. لكن جيميناي أومني فلاش لا يركز فقط على توليد مقاطع جديدة، بل يضع التحرير التفاعلي في صميم التجربة.
ومن أبرز قدرات المنصة:
تحرير الفيديو في الوقت الفعلي؛
دعم النص والصوت والصورة والفيديو؛
التحكم الكامل عبر الأوامر الصوتية؛
فهم سياق المشهد؛
المساعدة في بناء القصص؛
الحفاظ على مظهر الشخصيات بين المقاطع.
وبذلك تحاول غوغل تحويل الذكاء الاصطناعي من مجرد أداة لإنشاء لقطات منفصلة إلى مساعد إبداعي قادر على المشاركة في صناعة المحتوى من الفكرة الأولى حتى النسخة النهائية.
كيف يغير الذكاء الاصطناعي صناعة المحتوى؟
لم يعد الذكاء الاصطناعي الحواري مقتصراً على روبوتات الدردشة أو كتابة النصوص. ويظهر جيميناي أومني فلاش كيف أصبحت هذه التقنيات تدخل مباشرة في مراحل الإنتاج المرئي وصناعة الفيديو.
وقد يساهم هذا النوع من الأدوات في تسهيل إنشاء المحتوى لعدة منصات، منها:
يوتيوب؛
تيك توك وإنستغرام؛
الإعلانات الرقمية؛
الفيديوهات التعليمية؛
محتوى الألعاب؛
المقاطع القصيرة المخصصة للهواتف.
وقد تكون هذه التقنية مفيدة بشكل خاص لصناع المحتوى المستقلين والفرق الصغيرة التي لا تمتلك ميزانيات ضخمة أو إمكانية الوصول إلى استوديوهات إنتاج احترافية.
المخاطر والتحديات المحتملة
رغم المزايا الكبيرة التي يوفرها تحرير الفيديو بالذكاء الاصطناعي، فإن هذه التقنية تفتح الباب أمام مجموعة من المخاوف. ومن أبرز المخاطر التي يشير إليها الخبراء:
إنشاء المقاطع المزيفة العميقة؛
نشر المعلومات المضللة؛
تعقيد قضايا حقوق الملكية الفكرية؛
استخدام صور وأصوات أشخاص دون موافقة؛
التلاعب بالمحتوى المرئي بطريقة يصعب كشفها.
ولمواجهة هذه التحديات، تخطط غوغل للاعتماد على تقنية العلامات المائية الرقمية سينث آي دي، والتي تساعد في تحديد المحتوى الذي تم إنشاؤه أو تعديله باستخدام الذكاء الاصطناعي.
ما الذي سيحدث لاحقاً؟
يعكس جيميناي أومني فلاش الاتجاه الذي تسير نحوه صناعة المحتوى الرقمي. فمن المتوقع أن تجمع منصات الذكاء الاصطناعي القادمة داخل واجهة واحدة بين أدوات متعددة، مثل:
مونتاج الفيديو؛
توليد الصور؛
إنشاء الأصوات؛
التحريك؛
معالجة الصوت؛
كتابة السيناريوهات.
وبهذا الشكل، قد تتحول صناعة المحتوى من عملية تقنية معقدة إلى محادثة طبيعية بين المستخدم ومساعد ذكي يفهم التعليمات ويحولها إلى مشاهد قابلة للنشر.
وتوضح غوغل من خلال جيميناي أومني فلاش أن مستقبل الأدوات الإبداعية سيكون قائماً على الذكاء الاصطناعي متعدد الوسائط والتفاعل الطبيعي. وقد يصبح هذا النظام واحداً من أوائل النماذج الكبيرة التي تكشف كيف يمكن للذكاء الاصطناعي أن يعيد تشكيل إنتاج الفيديو وصناعة المحتوى الرقمي.