تهران- ایرنا- یکه‌تازی هوش مصنوعی در دنیای دیجیتال همچنان یکی از اصلی‌ترین تحولات فناورانه سال جاری میلادی خواهد بود. مجله «ام‌آی‌تی» چشم‌اندازی از این تحولات را ارائه داده که قابل تامل است.

در سال ۲۰۲۳ چت‌بات‌های چندرسانه‌ای محبوبیت بیشتری یافتند و سیاستگذاران مقررات جدیدی را برای هوش مصنوعی وضع کردندمتخصصان، رسانه‌ها و انجمن‌های مختلفی هرساله پیش‌بینی‌هایی درباره دستاوردهای تازه فناوری دارند که برخی از این پیش‌بینی‌ها به وقوع پیوسته و برخی نیز شاید بعدها اتفاق بیافتد. در ارتباط با پدیده‌های فناورانه پیش رو، مجله «ام‌آی‌تی» (MIT Technology Review) چشم‌اندازی را ترسیم کرده است.

گزینش بررسی گروه ام آی تی به این دلیل است که نسبت به گروه‌های دیگر از بدیهیات گذر کرده و به گزینه‌های بسیار مهمی که بیشترین اثرگذاری را دارند می‌پردازد. همچنین این مجله حوزه فناوری در سال گذشته، پیش‌بینی‌هایی را مطرح کرد که عمده‌ آنها به طور کامل اتفاق افتادند و برخی هم به میزان زیادی محقق شدند.


پیش‌بینی‌هایی که درست درآمد یا در نوبت وقوع است

طبق پیش‌بینی مجله ام‌ آی ‌تی، در سال ۲۰۲۴ هوش مصنوعی مولد به طور فزاینده‌ای در دسترس افراد عادی قرار خواهد گرفت

از جمله‌ این پیش‌بینی‌های تحقق‌یافته می‌توان به موارد زیر که در مقاله «آینده هوش مصنوعی در سال ۲۰۲۳» عنوان شده است، اشاره داشت:

نخست، مدل‌های زبانی چندرسانه‌ای: این مدل‌ها می‌توانند علاوه بر متن، با تصاویر و صدا نیز تعامل داشته باشند و کاربردهای جدیدی را در زمینه‌های مختلفی مانند چت‌بات‌ها، آموزش و سرگرمی ایجاد کنند.

دوم، افزایش مقررات هوش مصنوعی: دولت‌ها و سازمان‌های بین‌المللی مقررات جدیدی را برای استفاده از هوش مصنوعی وضع خواهند کرد تا از تبعیض، سوءاستفاده و سایر مشکلات احتمالی این فناوری جلوگیری کنند.

سوم، تداوم رشد هوش مصنوعی متن‌باز: هوش مصنوعی متن‌باز به رشد خود ادامه خواهد داد و استارتاپ‌های بیشتری از این فناوری برای توسعه محصولات و خدمات خود استفاده خواهند کرد.

چهارم، پیشرفت هوش مصنوعی در حوزه سلامت: هوش مصنوعی نقش مهم‌تری در حوزه سلامت ایفا خواهد کرد و در زمینه‌هایی مانند تشخیص بیماری، درمان و مراقبت‌های بهداشتی کاربردهای جدیدی پیدا خواهد کرد.

در پایان سال ۲۰۲۳، دو مورد از این پیش‌بینی‌ها به واقعیت پیوستند؛ چت‌بات‌های چندرسانه‌ای محبوبیت بیشتری یافتند و سیاستگذاران مقررات جدیدی را برای هوش مصنوعی وضع کردند. در دو مورد دیگر هنوز زود است که قضاوت کنیم زیرا شرکت‌های بزرگ فناوری هنوز از سوی استارتاپ‌های متن‌باز احساس فشار نمی‌کنند و هوش مصنوعی هنوز تغییرات اساسی در صنعت داروسازی ایجاد نکرده است.

یک کارگزار املاک می‌تواند از یک ربات گفت‌وگوی سفارشی برای تولید توصیفات املاک سود جوید. این ربات می‌تواند از تصاویر و فیلم‌های املاک برای ایجاد توصیفات دقیق و جذاب استفاده کندامسال، یعنی سال ۲۰۲۴ نیز همچون روال سال‌های قبل، مجله ام‌ آی ‌تی به چهار مورد بسیار داغ از عملکرد هوش مصنوعی می‌پردازد. همانطور که گفته‌شد، این مجله به ذکر بدیهیاتی که که در مجلات دیگر وجود دارند نمی‌پردازد و تنها چند روند خاص‌تر را گزینش کرده‌است چنانکه محققان این مجله می‌گویند: «چالش‌های هوش مصنوعی از انواع تبعیض گرفته تا حقوق مالکیت معنوی در دستور کار محققان، تنظیم‌کنندگان و مورد توجه عموم مردم قرار خواهد گرفت؛ آن هم نه فقط در سال ۲۰۲۴ بلکه برای سال‌های آینده. بنابراین در عوض همه‌موارد، چند روند خاص‌تر را انتخاب کرده‌ایم.»

اما این روندها کدامند؟ در ادامه به تک‌تک آنها می‌پردازیم:

یک ربات سفارشی گفت‌وگو برای هر نفر

طبق پیش‌بینی مجله ام‌ آی ‌تی، در سال ۲۰۲۴، هوش مصنوعی مولد (generative AI) به طور فزاینده‌ای در دسترس افراد غیرفنی قرار خواهد گرفت. شرکت‌های فناوری مانند «گوگل» و «اوپن آی» OpenAI در حال توسعه پلتفرم‌های کاربرپسند هستند که به مردم امکان می‌دهد ربات‌های گفت‌وگوی سفارشی (Customized chatbots) خود را ایجاد کنند. این ربات‌ها می‌توانند برای طیف گسترده‌ای از کاربردها، از خدمات مشتری گرفته تا آموزش، استفاده شوند.

مدل‌های هوش مصنوعی مولد، مانند GPT-۴ و Gemini، دارای قابلیت‌های چندرسانه‌ای هستند. این بدان معناست که می‌توانند علاوه بر متن، تصاویر و فیلم‌ها را نیز پردازش کنند. این قابلیت‌های جدید می‌توانند طیف وسیعی از برنامه‌های جدید را امکان‌پذیر کنند. به عنوان مثال، یک کارگزار املاک می‌تواند از یک ربات گفت‌وگوی سفارشی برای تولید توصیفات املاک استفاده کند. این ربات می‌تواند از تصاویر و فیلم‌های املاک برای ایجاد توصیفات دقیق و جذاب استفاده کند.

با این حال پیش‌بینی ام آی تی شروطی را در پی دارد چرا که موفقیت هوش مصنوعی مولد به حل چندین چالش بستگی دارد. یکی از چالش‌ها این است که مدل‌های زبانی اغلب چیزهایی را جعل می‌کنند. این امر می‌تواند به تولید اطلاعات نادرست یا گمراه‌کننده منجر شود. چالش دیگر این است که مدل‌های مولد با سوگیری‌ها روبرو هستند. این سوگیری‌ها می‌توانند سبب تولید نتایج تبعیض‌آمیز شود.

شرکت‌های فناوری باید این چالش‌ها را حل کنند تا هوش مصنوعی مولد بتواند به طور گسترده‌ای پذیرفته شود. با حل این چالش‌ها، هوش مصنوعی مولد می‌تواند پتانسیل انقلابی در بسیاری از صنایع را داشته باشد.

غول‌های فیلم‌سازی از جمله پارامونت و دیزنی اکنون در حال بررسی استفاده از هوش مصنوعی تولید خلاقانه در سراسر خط تولید فیلم خود هستند

تولید فیلم‌های واقعی با هوش مصنوعی: موج دوم انقلاب هوش مصنوعی

تولید تصاویر واقعی با هوش مصنوعی در سال‌های اخیر به سرعت پیشرفت کرده و ابزارهایی مانند «دال‌ای» (Dall-E)، اینترنت و فضای مجازی را با تصاویر خیره‌کننده‌ای از هر چیزی، از چهره‌های مشهور گرفته تا آثار هنری، پر کرده‌اند. این فناوری اکنون در حال گسترش به حوزه تولید فیلم است.

اولین فیلم‌های کوتاه تولید شده با هوش مصنوعی در سال ۲۰۲۳ منتشر شدند، اما کیفیت آنها هنوز نسبتا پایین بود. با این حال، پیشرفت‌های سریع در فناوری تولید خلاقانه هوش مصنوعی، به تولید فیلم‌های واقعی و باکیفیت با استفاده از هوش مصنوعی منجر شده است.

«ران‌وی» (Runway) یک استارتاپ تولیدکننده مدل‌های تولید فیلم با هوش مصنوعی، هر چند ماه یک بار نسخه‌های جدیدی از ابزارهای خود را منتشر می‌کند. آخرین مدل آن، «جن‌تو» «Gen-۲» هنوز هم فقط چند ثانیه فیلم تولید می‌کند، اما کیفیت آن چشمگیر است. بهترین فیلم‌های آن چندان با آنچه پیکسار «Pixar» تولید می‌کند فاصله ندارند.

ران‌وی، یک جشنواره فیلم سالانه با هوش مصنوعی برگزار کرده است که فیلم‌های ساخته‌شده با استفاده از طیف وسیعی از ابزارهای هوش مصنوعی را به نمایش می‌گذارد. جشنواره امسال یک جایزه نقدی ۶۰ هزار دلاری دارد و ۱۰ فیلم برتر در نیویورک و لس‌آنجلس به نمایش گذاشته خواهند شد.

با این اوصاف اصلا تعجب‌آور نیست که استودیوهای بزرگ به این مهم توجه خاص دارند. غول‌های فیلم‌سازی از جمله «پارامونت» و «دیزنی» اکنون در حال بررسی استفاده از هوش مصنوعی تولید خلاقانه در سراسر خط تولید فیلم خود هستند.

آنها از هوش مصنوعی برای همگام‌سازی (یا به اصطلاح دوبلورها سینک) لب بازیگران با چندین صداگذاری و ایجاد جلوه‌های ویژه پیشرفته استفاده می‌کنند. در سال ۲۰۲۳، فیلم جدید «ایندیانا جونز» (Indiana Jones and the Dial of Destiny) با هنرنمایی «هریسون فورد » جوان‌تر از طریق «دیپ‌فیک» (deep fake) ساخته شد.

برخی هنرپیشه‌ها نگران شده‌اند که استودیوها از فناوری مانند دیپ فیک برای جایگزینی بازیگران با آواتارهای دیجیتال استفاده کنند که هر متنی که به آنها می‌دهید با فشار دادن یک دکمه تکرار می‌کنند

چالش‌های موج دوم

طبق گزارش ام‌ آی ‌تی، فناوری دیپ فیک برای اهداف بازاریابی یا آموزش نیز در حال استفاده است. به عنوان مثال «سینتزیا» (Synthesia) ابزارهایی را ایجاد می‌کند که می‌توانند یک اجرای یک‌باره یک بازیگر را به یک جریان بی‌پایان از آواتارهای دیپ‌فیک تبدیل کنند. طبق گفته این شرکت، فناوری آن اکنون از سوی ۴۴ درصد از شرکت‌های Fortune ۱۰۰ استفاده می‌شود.

از طرفی توانایی تولید فیلم‌های واقعی با هزینه بسیار کم پرسش‌های جدی را برای بازیگران مطرح می‌کند. آنها نگرانند که استودیوها از این فناوری برای جایگزینی بازیگران با آواتارهای دیجیتال استفاده کنند که هر متنی را که به آنها می‌دهید، با فشار دادن یک دکمه تکرار می‌کنند.


«سوکی مِهدایی» (Souki Mehdaoui) کارگردان مستقل و یکی از بنیانگذاران Bell & Whistle به عنوان متخصص فناوری‌های خلاقانه در این باره معتقد است «فیلمسازی از اساس در حال تحول است»

از موارد مهمی که ام ‌آی‌ تی به عنوان یکی از روندهای خاص هوش مصنوعی در سال ۲۰۲۴ به شمار آورده‌، توانایی افزایش شایعه‌پراکنی‌های انتخاباتی است

افزایش شایعه‌پراکنی انتخاباتی با هوش مصنوعی

سومین موردی که از سوی ام ‌آی‌ تی به عنوان یکی از روندهای خاص هوش مصنوعی در سال ۲۰۲۴ به شمار آمده‌، توانایی هوش مصنوعی در افزایش شایعه‌پراکنی‌های انتخاباتی است. در حالی که مشخص نیست این نمونه‌ها تا چه میزان بر نتایج انتخابات تأثیر گذاشته‌اند، گسترش آنها یک روند نگران کننده است. تشخیص آنچه در اینترنت واقعی است سخت‌تر از همیشه خواهد بود. در فضای سیاسی ملتهب و دوقطبی موجود در کشورها، این روند می‌تواند پیامدهای جدی داشته باشد.

چند سال پیش ایجاد یک دیپ‌فیک به مهارت‌های فنی پیشرفته نیاز داشت، اما هوش مصنوعی مولد آن را به شدت آسان و قابل دسترس کرده است. از طرفی نیز به تازگی خروجی‌ها به نظر واقعی‌تر می‌رسند. حتی منابع معتبر ممکن است برابر محتوای تولید شده با هوش مصنوعی فریب بخورند. برای مثال، تصاویر تولید شده با هوش مصنوعی که به نظر می‌رسد بحران اسرائیل_غزه را به تصویر می‌کشد، بازار تصویر سهام مانند Adobe را بسیار کساد کرده‌است.

بنابراین سال آینده برای کسانی که می خواهند با گسترش اخبار جعلی مبارزه کنند، سال مهمی خواهد بود. تکنیک‌های ردیابی و کاهش اثر محتوا هنوز در مراحل اولیه توسعه هستند. پلتفرم‌های رسانه‌های اجتماعی نیز باید در برداشتن اطلاعات نادرست سریعتر عمل کنند.

ربات‌های چندکاره و آینده‌ای نویدبخش برای هوش مصنوعی

اما آخرین روند خاص پیش‌بینی شده ام ‌آی ‌تی ظهور و ارتقاء ربات‌هایی با کاربری‌های متعدد است. فرایند یادگیری عمیق می‌تواند به ربات‌ها کمک کند تا طیف گسترده‌ای از وظایف را انجام دهند. تاکنون، ربات‌ها معمولا برای انجام وظایف خاصی طراحی شده‌اند؛ به عنوان مثال فقط مونتاژ صنعتی یا رفت‌وروب خانگیدر سال‌های اخیر، شاهد تحولی در هوش مصنوعی (AI) بوده‌ایم که از استفاده از چندین مدل کوچک برای انجام وظایف خاص به سمت استفاده از یک مدل بزرگ و یکپارچه برای انجام طیف گسترده‌ای از وظایف، تغییر کرده است. این رویکرد به عنوان یادگیری عمیق شناخته می‌شود و در زمینه‌های مختلفی از جمله پردازش زبان طبیعی، بینایی کامپیوتری و یادگیری ماشین موفقیت‌آمیز بوده است.

به تارگی محققان در حال بررسی کاربرد یادگیری عمیق در رباتیک هستند. آنها معتقدند که این رویکرد می‌تواند به ربات‌ها توانایی انجام طیف گسترده‌ای از وظایف را بدهد؛ از جمله کارهای صنعتی و خانگی.
توضیح آن که تاکنون، ربات‌ها معمولا برای انجام وظایف خاصی طراحی شده‌اند. به عنوان مثال، یک ربات صنعتی ممکن است برای مونتاژ یک محصول خاص یا یک ربات خانگی ممکن است برای تمیز کردن خانه طراحی شده باشد. این امر به این دلیل است که آموزش یک ربات برای انجام یک وظیفه خاص، معمولا به مجموعه داده‌های بزرگی از نمونه‌های آن وظیفه نیاز دارد.

با این حال، در دنیای واقعی، ربات‌ها اغلب به انجام چندین وظیفه مختلف نیاز دارند. به عنوان مثال، یک ربات خانگی ممکن است نیاز داشته باشد تا کارهایی مانند تمیزکردن خانه، پخت‌وپز و مراقبت از کودکان را انجام دهد.

یادگیری عمیق می‌تواند به ربات‌ها کمک کند تا طیف گسترده‌ای از وظایف را انجام دهند. این امر به این دلیل است که یادگیری عمیق روی مجموعه داده‌های بزرگی از نمونه‌های مختلف آموزش می‌یابد. این امر به ربات‌ها اجازه می‌دهد تا الگوهای مشابهی را در بین وظایف مختلف بیاموزند و در نتیجه، برای انجام آنها بهتر شوند.

آخرین پیشرفت‌ها، چالش‌ها و چشم‌اندازها

در سال‌های اخیر، شاهد پیشرفت‌های قابل توجهی در زمینه ربات‌های چندکاره بر اساس یادگیری عمیق بوده‌ایم. در سال ۲۰۲۳ «روبوکات ذهن عمیق» (DeepMind Robocat) راه‌اندازی شد؛ یک ربات چندکاره که می‌تواند چندین بازوی ربات را کنترل کند. این ربات از یک مدل یادگیری عمیق استفاده می‌کند که روی مجموعه داده‌ای از تصاویر و ویدئوهای بازوها آموزش دیده است.

در همان سال DeepMind همچنین یک مدل یادگیری عمیق جدید برای ربات‌ها به نام آرتی‌ایکس «RT-X» منتشر کرد. این مدل روی مجموعه داده‌ای از کارهای مختلف رباتیک آموزش دیده است و می‌تواند طیف گسترده‌ای از وظایف را انجام دهد.
محققان دانشگاه نیویورک در حال توسعه تکنیک‌هایی هستند که به ربات‌ها اجازه می‌دهد با آزمون و خطا یاد بگیرند. این تکنیک‌ها می‌توانند به ربات‌ها کمک کنند تا در محیط‌های جدید سازگار شوندتحقیقات دیگری در زمینه ربات‌های چندکاره نیز در حال انجام است. به عنوان مثال، محققان در دانشگاه نیویورک در حال توسعه تکنیک‌هایی هستند که به ربات‌ها اجازه می‌دهد با آزمون و خطا یاد بگیرند. این تکنیک‌ها می‌توانند به ربات‌ها کمک کنند تا در محیط‌های جدید سازگار شوند.

با وجود پیشرفت‌های قابل توجهی که در زمینه ربات‌های چندکاره بر اساس یادگیری عمیق صورت گرفته است، هنوز چالش‌هایی پیش روی این زمینه وجود دارد. یکی از چالش‌ها، کمبود داده‌های آموزشی است. ربات‌ها برای یادگیری طیف گسترده‌ای از وظایف، نیاز به مجموعه داده‌های بزرگی از نمونه‌های مختلف دارند.

چالش دیگر، محدودیت‌های سخت‌افزاری است. ربات‌ها برای اجرای مدل‌های یادگیری عمیق پیچیده، نیاز به سخت‌افزار قدرتمندی دارند. با وجود چالش‌ها، آینده ربات‌های چندکاره بر اساس یادگیری عمیق بسیار امیدوارکننده است. این ربات‌ها می‌توانند در طیف گسترده‌ای از کاربردها، از جمله کارهای صنعتی و خانگی، استفاده شوند. ربات‌های چندکاره می‌توانند به افزایش بهره‌وری و کاهش هزینه‌ها کمک کنند. آنها همچنین می‌توانند به بهبود کیفیت زندگی افراد یاری برسانند.