اضغط ⬆️ ثم "إضافة للشاشة الرئيسية"

القائمة الرئيسية

جيميناي أومني تعيد تعريف انتاج مقاطع الفيديو بالذكاء الاصطناعي

{title}

تملك غوغل بالفعل نموذجا لتوليد مقاطع الفيديو باستخدام الذكاء الاصطناعي يدعى "فيو". ولكن هذا لم يمنعها من الإعلان عن عائلة نماذج أخرى بقدرات تتخطى "فيو" باسم "جيميناي أومني". يبدأ أولها بنموذج "أومني فلاش" ضمن فعاليات مؤتمرها الأخير للمطورين.

تأتي عائلة نماذج "جيميناي أومني" لتقدم تجربة توليد مقاطع فيديو مختلفة تماما عن تلك التي توفرها "فيو" أو حتى حزمة أدوات "فلو" المختلفة. وذلك لأنها قادرة على توليد مقاطع الفيديو مباشرة من خلال الصور ومقاطع الفيديو، فضلا عن النصوص. أي أنها تستطيع التعامل مع أكثر من نوع من المدخلات.

تجسد عائلة نماذج "جيميناي أومني" اختلافا كبيرا في تجربة استخدام نماذج الذكاء الاصطناعي لتوليد مقاطع الفيديو من خلالها. إذ تحرر المستخدم من الحاجة لكتابة أوامر نصية طويلة ومعمقة. وتمنحه القدرة على توليد مقاطع الفيديو بناء على أي نوع من المدخلات يجده.

يستطيع المستخدم من خلال "جيميناي أومني" التعامل مع الصور والنصوص ومقاطع الفيديو على حد سواء لتتمكن من توليد مقاطع فيديو احترافية تحافظ على المحتوى والشخصيات الموجودة في المواد الأصلية.

يعني هذا إن قمت برفع صورة مباشرة إلى الأداة، فإنك تستطيع توليد مقطع فيديو للشخص أو الأشكال الموجودة في الصورة واستخدامها بكل تفاصيلها داخل المقطع دون خسارة أي شيء.

تفتح هذه القدرة أمام مستخدمي "أومني" مجموعة كبيرة ومتنوعة من الاستخدامات التي لم تكن موجودة في السابق وكانت تتطلب مستوى احترافيا في كتابة الأوامر الموجهة للذكاء الاصطناعي.

توجد العديد من الاستخدامات التي يمكن الاستفادة من "أومني" فيها، بدءا من إمكانية تعديل مقاطع الفيديو الموجودة مسبقا وفق تقرير موقع "تيك كرانش" التقني الأمريكي.

إلى جانب ذلك، تستطيع تعديل الصور على غرار أداة "نانو بانانا برو" باستخدام "أومني" مباشرة والاستفادة أيضا من القدرات المتطورة للأداة.

لا تحتاج عملية تعديل أو مونتاج مقاطع الفيديو إلى أي مهارات أو قدرات خاصة. يكفي فقط أن تصف لـ"أومني" ما ترغب بتعديله في المقطع لتقوم هي تلقائيا بتعديل المقطع ثم تحويله إلى مقطع جديد جاهز للمشاركة.

كما يوفر النموذج للمستخدمين القدرة على توليد صورة رمزية حقيقية "أفاتار" تشبه المستخدم بشكل متطابق إلى جانب استخدام درجات الصوت ذاتها للمستخدم. ثم تستطيع تحريك هذه الصورة واستخدامها في مقاطع الفيديو كما ترغب، وفق تقرير "تيك كرانش".

تظل قدرات "أومني فلاش" محصورة بإمكانية توليد مقطع فيديو لمدة 10 ثوان فقط، وفق التقرير. ترى "غوغل" بأن المستخدمين لن يرغبوا في إنشاء مقاطع أطول من هذا في الوقت الحالي.

تضيف نيكول بريشتوفا مديرة إدارة المنتجات في شركة "غوغل ديب مايند" أن تقييد مدة المقاطع المنتجة بـ10 ثوان فقط ليس تقييدا للنموذج أو بسبب ضعفه. ولكنه قرار يستند إلى الرغبة في إتاحة النموذج لأكبر عدد من المستخدمين معا.

تحمل كافة المقاطع التي يتم توليدها مباشرة باستخدام "جيميناي أومني" العلامة المميزة لمقاطع الفيديو المولدة بالذكاء الاصطناعي من قبل غوغل، والتي تسهل على الأدوات والمنصات اكتشافها. وهي "سينث آي دي"، وذلك لحماية المستخدمين من إساءة استخدام الأداة.

تعود عائلة نماذج "أومني" بالنفع على كل من يعمل في وظائف لها علاقة مباشرة بمقاطع الفيديو إلى جانب صناع المحتوى، إذ تقلل الوقت اللازم لتعديل وإنتاج مقاطع الفيديو دون الحاجة إلى تعلم برامج المونتاج المعقدة.

استخدام "أومني" لا يتطلب حواسيب متطورة وذات عتاد قوي، بل يمكن استخدامها والاستفادة منها مباشرة من خلال تطبيق الهاتف الخاص بـ"جيميناي".

يشير تقرير موقع "ذا فيرج" التقني الأمريكي إلى أن الاختلاف الرئيسي بين "أومني" و"فلو"، أداة توليد مقاطع الفيديو القديمة من غوغل، يكمن في نوعية المدخلات التي تستطيع كل أداة التعامل معها.

تستطيع "فيو" التعامل مع الصور والنصوص لتوليد مقاطع الفيديو. بينما يوسع "أومني" التجربة إلى التعامل مع مدخلات متعددة، تشمل الصور ومقاطع الفيديو والصوت والنصوص، إلى جانب تحرير الفيديو بالمحادثة.

بينما يبدو أن هذا هو الاختلاف الأبرز بين "أومني" و"فلو" من ناحية المستخدم، إلا أن الآلية التي تقف خلف كل أداة مختلفة تماما. وذلك لأن غوغل تصف "أومني" بكونه أقرب إلى نموذج "عالم" بدلا من مجرد نموذج ذكاء اصطناعي تقليدي.

يكمن الفرق بين نماذج العالم ونماذج الذكاء الاصطناعي التقليدية في كونها قادرة على فهم والتعامل مع قوانين العالم الطبيعي الفيزيائية والواقعية والالتزام بها إلى حد كبير وتوقع نتائجها على الأشياء الموجودة ضمن النموذج.

يعني هذا أن مقطع الفيديو الذي سيقوم "أومني" بتوليده سيكون أقرب إلى الواقع ويلتزم بقوانين العالم الفيزيائية ويتبعها مثل الجاذبية واتجاه حركة الهواء وتأثر الأشياء بالقوة الخارجية وغيرها، وهو ما يزيد من واقعية المقاطع بشكل كبير.

كما أن "أومني" يعتمد على عائلة مختلفة من نماذج الذكاء الاصطناعي التي تقدمها غوغل، وهي تدمج بشكل مباشر بين نموذج الذكاء الاصطناعي اللغوي "جيميناي" والبيانات التي تم تدريبه عليها وبين نماذج توليد مقاطع الفيديو الخاصة بالشركة، وفق تقرير "تيك كرانش".

تحاول غوغل وضع مجموعة من القيود والآليات لتقويض استخدام "أومني" في توليد مقاطع التزييف العميق مثل وضع العلامة المميزة للكشف عن المقاطع المولدة بالذكاء الاصطناعي "سينث آي دي". فضلا عن وضع خطوات للتيقن من هوية المستخدم قبل إتاحة عمل "أفاتار" خاص به.

لكن، تملك العديد من الأدوات قيودا مماثلة ولم تكن قادرة على إيقاف سيل مقاطع النفايات الرقمية المولدة بالذكاء الاصطناعي إلى جانب مقاطع التزييف العميق. فهل تستطيع أدوات غوغل التغلب على هذا الأمر؟