في فعالية I/O 2025، افتتحت Google فصلًا جديدًا في عالم الذكاء الاصطناعي بالكشف عن الإصدار الثالث من نموذجها لتوليد الفيديو تحت اسم Veo. ما يميز هذا الإصدار عن باقي المنافسين هو قدرته على توليد الفيديو والصوت في آنٍ واحد — وهي ميزة لم نشهدها حتى الآن في أي من النماذج المماثلة من شركات مثل OpenAI وMeta وStability AI وRunway.
يستطيع Veo 3 توليد أصوات بيئية مثل ضوضاء الشارع، زقزقة العصافير، وحتى الحوارات بين الشخصيات. ويعتبر كثيرون هذا الإنجاز نقطة تحول في تاريخ إنتاج المحتوى المرئي وبداية عصر جديد لتقنيات الذكاء الاصطناعي، حتى إن البعض وصفه بأنه "لحظة الذكاء العام الاصطناعي (AGI) لعالم الفيديو".
موج من الإعجاب من المستخدمين على وسائل التواصل الاجتماعي
مع تقديم Veo 3، امتلأت وسائل التواصل الاجتماعي بسرعة بمقاطع فيديو تم إنشاؤها باستخدام هذه التقنية. وأبدى المستخدمون إعجابهم بالتناغم المذهل بين الصورة والصوت، وإعادة بناء الفيزياء الدقيقة للأجسام، وحتى تطابق حركة الشفاه مع الكلمات.
نشر أحد المستخدمين على منصة X فيديو يصور فيثاغورس وهو يشرح نظريته الشهيرة في اليونان القديمة. وفي مقطع آخر، يُرى رجل يقدم عرض كوميدي واقفًا ويجعل الجمهور يضحك بنجاح.
حالياً، يتوفر Veo 3 لمستخدمي Ultra في الولايات المتحدة عبر تطبيقات Gemini و Flow، وكذلك لمستخدمي المؤسسات عبر Vertex AI.
أداة Flow: تحول في عملية صناعة الأفلام
بالتزامن مع إطلاق Veo 3، كشفت Google أيضًا عن أداة جديدة تسمى Flow للمخرجين السينمائيين. تتيح هذه الأداة للمستخدمين إنشاء مشاهد سينمائية بلغة بسيطة، ودمج الموارد في لقطات مختلفة، والتحكم الكامل في العناصر الإبداعية للمشروع.
وفقًا لـ Google، استُلهم تصميم Flow من اللحظات التي تكون فيها الإبداع في ذروته ويبدو أن الزمن يتوقف. تقدم هذه الأداة ميزات مثل التحكم بحركة الكاميرا، إنشاء وتوسيع اللقطات، وإدارة الأصول البصرية. كما يتضمن قسم Flow TV فيديوهات نموذجية تم إنشاؤها باستخدام Veo، تعرض بدقة عملية الإنتاج والتعليمات الخاصة بها.
مستقبل جديد لصناعة السينما
يرى خبراء التكنولوجيا أن Veo 3 قادر على إحداث ثورة في صناعة الأفلام. تتوقع داريا أونوتماز، أستاذة في مختبر جاكسون، أن الأفلام بجودة الرسوم المتحركة مثل Toy Story، التي كانت تستغرق سابقًا أربع سنوات وتكلف ملايين الدولارات، يمكن الآن إنتاجها في غضون أيام قليلة وبجزء بسيط من التكلفة.
يعتقد بعض المستخدمين أيضًا أن الذكاء الاصطناعي سيلعب دورًا محوريًا في المستقبل القريب في إنتاج الأفلام القصيرة وحتى الأعمال السينمائية عالية الميزانية، وسيُستخدم بشكل واسع خصوصًا في خلق المشاهد المعقدة والمؤثرات الخاصة.
أعلنت Google أيضًا عن تعاون مع مشروع يُدعى Primordial Soup ؛ وهي سلسلة ذات طابع قصصي من إخراج دارين آرونوفسكي، يتم فيها إنتاج ثلاثة أفلام قصيرة باستخدام أدوات الذكاء الاصطناعي. سيُخرج هذه الأعمال مخرجون ناشئون، وسيكون آرونوفسكي إلى جانبهم كموجه.
Imagen 4: خطوة كبيرة في توليد الصور بالذكاء الاصطناعي
إلى جانب Veo 3، قدمت Google أيضًا نموذجها المتقدم لتوليد الصور والذي يُدعى Imagen 4. يتمتع هذا النموذج بقدرة على إنتاج صور بدقة 2K مع تفاصيل مذهلة، مثل نسيج الأقمشة، وانعكاسات قطرات الماء، وفراء الحيوانات، وقد أظهر أداءً رائعًا في الأنماط الواقعية والفنية.
تحسّنت قدرات Imagen 4 أيضًا في إنشاء النصوص المصوّرة، ويمكن استخدامه في تصميم بطاقات التهنئة، الملصقات الترويجية، والرسوم المصورة المخصصة. يمكن الوصول إلى هذا النموذج عبر أدوات مثل Gemini، وWhisk، وVertex AI، ومجموعة Google Workspace (بما في ذلك Slides وVids وDocs)، وهو ينافس مباشرة نموذج توليد الصور من OpenAI.
الخلاصة: ريادة Google في سباق الذكاء الاصطناعي
من خلال إطلاق Veo 3 وImagen 4، أثبتت Google أنها لا تواكب المنافسين فحسب، بل ترسم أيضًا مستقبل الذكاء الاصطناعي. يقدم Veo 3، بقدرته على إنتاج الفيديو والصوت في آنٍ واحد، تجربة غير مسبوقة في إنشاء المحتوى المرئي، في حين يُحدث Flow تحولًا في عملية صناعة الأفلام من خلال توفير أدوات احترافية.
من ناحية أخرى، يرتقي Imagen 4، بجودته العالية ودقته اللافتة، بالمصممين والفنانين إلى مستوى جديد من الإبداع. وتُظهر هذه الابتكارات أن مستقبل صناعة المحتوى لن يكون فقط أكثر ذكاءً، بل سيكون أيضًا أسرع بكثير وأكثر إبداعًا.