به گزارش گروه علم و آموزش ایرنا از وبگاه زِداِمای سایِنس (ZME Science)، در هفتههای اخیر، هوشهای مصنوعی تولیدکننده تصویر شکوفا شده و تواناییشان فراتر از آن شده است که چند سال پیش انتظارش را داشتیم. اکنون، الگوریتمها آماده هستند تا همه چیز را به مرحله بعدی ببرند و شروع به تولید ویدئو کنند.
تصور کنید «یک سگ با لباس اَبَرقهرمان و شنل قرمز در آسمان پرواز میکند.» این تمام ورودی متنی است که برای تولید کلیپ بالا نیاز دارید. هوش مصنوعی شرکت متا که «یک ویدئو بساز» نام دارد، میتواند ویدئوهای کوتاهی را از متن تولید کند که دستاورد چشمگیری است.
«یک ویدئو بساز» هنوز برای عموم در دسترس نیست. قرار است متا آن را به طور رسمی در ماه نوامبر راهاندازی میکند؛ اما به نظر می رسد درست مانند هوشهای مصنوعی که تصویر تولید میکنند، کار کند: شما یک پیام متنی را اضافه میکنید، هر اندازه که دوست دارید آنچه را میخواهید توصیف میکنید و بعد منتظر ویدئو میمانید.
فناوری موجود در پس «یک ویدئو بساز» مبتنیبر کارهایی است که هماکنون در تبدیل متن به تصویر انجام میشود. همین چند ماه پیش، متا مدل هوش مصنوعی تبدیل متن به تصویر خود را با عنوان «یک تصویر بساز» معرفی کرد.
تولید فیلم به جای تصاویر بسیار مشکلتر است. از دیدگاه یک موتور هوش مصنوعی، یک ویدئو مجموعهای از صدها یا هزاران تصویر است و باید موتور خود را با دادههای بسیار بیشتری آموزش دهید. مجموعههای ویدئویی در مقیاس بزرگ که میتوان از آنها برای آموزش استفاده کرد نیز بسیار کمیابتر از تصاویر هستند و این یعنی حداقل در آینده نزدیک، هوش مصنوعی ویدئویی احتمالاً به شرکتهای بزرگ با منابع زیاد محدود خواهد شد.
به نظر میرسد که هوش مصنوعی متا در حال حاضر هم بسیار شایسته است. این شرکت قبلاً ویدئوهای ساختهشده در چندین سبک از جمله سوررئال (فراواقعگرایانه) یا رئالیستی (واقعگرایانه) را به نمایش گذاشته است. این موتور راه زیادی در پیش دارد تا به نقطه دلخواه برسد؛ اما ظاهراً هماکنون نیز قادر است زوایا و سبکهای مختلف ویدئویی را ترکیب کند. ویدئوها دقیقاً واقعبینانه بهنظر نمیرسند؛ اما چندان هم دور از دسترس نیستند.
امکان استفاده از تصاویر (و ویدئوهای) تولیدشده توسط هوش مصنوعی در اخبار جعلی وجود دارد.
متا همچنین خطرات ایجاد ویدئوهای واقعگرایانه در صورت تقاضا را تصدیق کرد. آنها میگویند قصد دارند با افزودن واترمارک (علامت) با این موضوع مقابله کنند و با این روش بینندگان را آگاه کنند که ویدئو با هوش مصنوعی تولید شده است و ضبطشده نیست.