در سال ۲۰۲۳ چتباتهای چندرسانهای محبوبیت بیشتری یافتند و سیاستگذاران مقررات جدیدی را برای هوش مصنوعی وضع کردندمتخصصان، رسانهها و انجمنهای مختلفی هرساله پیشبینیهایی درباره دستاوردهای تازه فناوری دارند که برخی از این پیشبینیها به وقوع پیوسته و برخی نیز شاید بعدها اتفاق بیافتد. در ارتباط با پدیدههای فناورانه پیش رو، مجله «امآیتی» (MIT Technology Review) چشماندازی را ترسیم کرده است.
گزینش بررسی گروه ام آی تی به این دلیل است که نسبت به گروههای دیگر از بدیهیات گذر کرده و به گزینههای بسیار مهمی که بیشترین اثرگذاری را دارند میپردازد. همچنین این مجله حوزه فناوری در سال گذشته، پیشبینیهایی را مطرح کرد که عمده آنها به طور کامل اتفاق افتادند و برخی هم به میزان زیادی محقق شدند.
پیشبینیهایی که درست درآمد یا در نوبت وقوع است
طبق پیشبینی مجله ام آی تی، در سال ۲۰۲۴ هوش مصنوعی مولد به طور فزایندهای در دسترس افراد عادی قرار خواهد گرفت
از جمله این پیشبینیهای تحققیافته میتوان به موارد زیر که در مقاله «آینده هوش مصنوعی در سال ۲۰۲۳» عنوان شده است، اشاره داشت:
نخست، مدلهای زبانی چندرسانهای: این مدلها میتوانند علاوه بر متن، با تصاویر و صدا نیز تعامل داشته باشند و کاربردهای جدیدی را در زمینههای مختلفی مانند چتباتها، آموزش و سرگرمی ایجاد کنند.
دوم، افزایش مقررات هوش مصنوعی: دولتها و سازمانهای بینالمللی مقررات جدیدی را برای استفاده از هوش مصنوعی وضع خواهند کرد تا از تبعیض، سوءاستفاده و سایر مشکلات احتمالی این فناوری جلوگیری کنند.
سوم، تداوم رشد هوش مصنوعی متنباز: هوش مصنوعی متنباز به رشد خود ادامه خواهد داد و استارتاپهای بیشتری از این فناوری برای توسعه محصولات و خدمات خود استفاده خواهند کرد.
چهارم، پیشرفت هوش مصنوعی در حوزه سلامت: هوش مصنوعی نقش مهمتری در حوزه سلامت ایفا خواهد کرد و در زمینههایی مانند تشخیص بیماری، درمان و مراقبتهای بهداشتی کاربردهای جدیدی پیدا خواهد کرد.
در پایان سال ۲۰۲۳، دو مورد از این پیشبینیها به واقعیت پیوستند؛ چتباتهای چندرسانهای محبوبیت بیشتری یافتند و سیاستگذاران مقررات جدیدی را برای هوش مصنوعی وضع کردند. در دو مورد دیگر هنوز زود است که قضاوت کنیم زیرا شرکتهای بزرگ فناوری هنوز از سوی استارتاپهای متنباز احساس فشار نمیکنند و هوش مصنوعی هنوز تغییرات اساسی در صنعت داروسازی ایجاد نکرده است.
یک کارگزار املاک میتواند از یک ربات گفتوگوی سفارشی برای تولید توصیفات املاک سود جوید. این ربات میتواند از تصاویر و فیلمهای املاک برای ایجاد توصیفات دقیق و جذاب استفاده کندامسال، یعنی سال ۲۰۲۴ نیز همچون روال سالهای قبل، مجله ام آی تی به چهار مورد بسیار داغ از عملکرد هوش مصنوعی میپردازد. همانطور که گفتهشد، این مجله به ذکر بدیهیاتی که که در مجلات دیگر وجود دارند نمیپردازد و تنها چند روند خاصتر را گزینش کردهاست چنانکه محققان این مجله میگویند: «چالشهای هوش مصنوعی از انواع تبعیض گرفته تا حقوق مالکیت معنوی در دستور کار محققان، تنظیمکنندگان و مورد توجه عموم مردم قرار خواهد گرفت؛ آن هم نه فقط در سال ۲۰۲۴ بلکه برای سالهای آینده. بنابراین در عوض همهموارد، چند روند خاصتر را انتخاب کردهایم.»
اما این روندها کدامند؟ در ادامه به تکتک آنها میپردازیم:
یک ربات سفارشی گفتوگو برای هر نفر
طبق پیشبینی مجله ام آی تی، در سال ۲۰۲۴، هوش مصنوعی مولد (generative AI) به طور فزایندهای در دسترس افراد غیرفنی قرار خواهد گرفت. شرکتهای فناوری مانند «گوگل» و «اوپن آی» OpenAI در حال توسعه پلتفرمهای کاربرپسند هستند که به مردم امکان میدهد رباتهای گفتوگوی سفارشی (Customized chatbots) خود را ایجاد کنند. این رباتها میتوانند برای طیف گستردهای از کاربردها، از خدمات مشتری گرفته تا آموزش، استفاده شوند.
مدلهای هوش مصنوعی مولد، مانند GPT-۴ و Gemini، دارای قابلیتهای چندرسانهای هستند. این بدان معناست که میتوانند علاوه بر متن، تصاویر و فیلمها را نیز پردازش کنند. این قابلیتهای جدید میتوانند طیف وسیعی از برنامههای جدید را امکانپذیر کنند. به عنوان مثال، یک کارگزار املاک میتواند از یک ربات گفتوگوی سفارشی برای تولید توصیفات املاک استفاده کند. این ربات میتواند از تصاویر و فیلمهای املاک برای ایجاد توصیفات دقیق و جذاب استفاده کند.
با این حال پیشبینی ام آی تی شروطی را در پی دارد چرا که موفقیت هوش مصنوعی مولد به حل چندین چالش بستگی دارد. یکی از چالشها این است که مدلهای زبانی اغلب چیزهایی را جعل میکنند. این امر میتواند به تولید اطلاعات نادرست یا گمراهکننده منجر شود. چالش دیگر این است که مدلهای مولد با سوگیریها روبرو هستند. این سوگیریها میتوانند سبب تولید نتایج تبعیضآمیز شود.
شرکتهای فناوری باید این چالشها را حل کنند تا هوش مصنوعی مولد بتواند به طور گستردهای پذیرفته شود. با حل این چالشها، هوش مصنوعی مولد میتواند پتانسیل انقلابی در بسیاری از صنایع را داشته باشد.
غولهای فیلمسازی از جمله پارامونت و دیزنی اکنون در حال بررسی استفاده از هوش مصنوعی تولید خلاقانه در سراسر خط تولید فیلم خود هستند
تولید فیلمهای واقعی با هوش مصنوعی: موج دوم انقلاب هوش مصنوعی
تولید تصاویر واقعی با هوش مصنوعی در سالهای اخیر به سرعت پیشرفت کرده و ابزارهایی مانند «دالای» (Dall-E)، اینترنت و فضای مجازی را با تصاویر خیرهکنندهای از هر چیزی، از چهرههای مشهور گرفته تا آثار هنری، پر کردهاند. این فناوری اکنون در حال گسترش به حوزه تولید فیلم است.
اولین فیلمهای کوتاه تولید شده با هوش مصنوعی در سال ۲۰۲۳ منتشر شدند، اما کیفیت آنها هنوز نسبتا پایین بود. با این حال، پیشرفتهای سریع در فناوری تولید خلاقانه هوش مصنوعی، به تولید فیلمهای واقعی و باکیفیت با استفاده از هوش مصنوعی منجر شده است.
«رانوی» (Runway) یک استارتاپ تولیدکننده مدلهای تولید فیلم با هوش مصنوعی، هر چند ماه یک بار نسخههای جدیدی از ابزارهای خود را منتشر میکند. آخرین مدل آن، «جنتو» «Gen-۲» هنوز هم فقط چند ثانیه فیلم تولید میکند، اما کیفیت آن چشمگیر است. بهترین فیلمهای آن چندان با آنچه پیکسار «Pixar» تولید میکند فاصله ندارند.
رانوی، یک جشنواره فیلم سالانه با هوش مصنوعی برگزار کرده است که فیلمهای ساختهشده با استفاده از طیف وسیعی از ابزارهای هوش مصنوعی را به نمایش میگذارد. جشنواره امسال یک جایزه نقدی ۶۰ هزار دلاری دارد و ۱۰ فیلم برتر در نیویورک و لسآنجلس به نمایش گذاشته خواهند شد.
با این اوصاف اصلا تعجبآور نیست که استودیوهای بزرگ به این مهم توجه خاص دارند. غولهای فیلمسازی از جمله «پارامونت» و «دیزنی» اکنون در حال بررسی استفاده از هوش مصنوعی تولید خلاقانه در سراسر خط تولید فیلم خود هستند.
آنها از هوش مصنوعی برای همگامسازی (یا به اصطلاح دوبلورها سینک) لب بازیگران با چندین صداگذاری و ایجاد جلوههای ویژه پیشرفته استفاده میکنند. در سال ۲۰۲۳، فیلم جدید «ایندیانا جونز» (Indiana Jones and the Dial of Destiny) با هنرنمایی «هریسون فورد » جوانتر از طریق «دیپفیک» (deep fake) ساخته شد.
برخی هنرپیشهها نگران شدهاند که استودیوها از فناوری مانند دیپ فیک برای جایگزینی بازیگران با آواتارهای دیجیتال استفاده کنند که هر متنی که به آنها میدهید با فشار دادن یک دکمه تکرار میکنند
چالشهای موج دوم
طبق گزارش ام آی تی، فناوری دیپ فیک برای اهداف بازاریابی یا آموزش نیز در حال استفاده است. به عنوان مثال «سینتزیا» (Synthesia) ابزارهایی را ایجاد میکند که میتوانند یک اجرای یکباره یک بازیگر را به یک جریان بیپایان از آواتارهای دیپفیک تبدیل کنند. طبق گفته این شرکت، فناوری آن اکنون از سوی ۴۴ درصد از شرکتهای Fortune ۱۰۰ استفاده میشود.
از طرفی توانایی تولید فیلمهای واقعی با هزینه بسیار کم پرسشهای جدی را برای بازیگران مطرح میکند. آنها نگرانند که استودیوها از این فناوری برای جایگزینی بازیگران با آواتارهای دیجیتال استفاده کنند که هر متنی را که به آنها میدهید، با فشار دادن یک دکمه تکرار میکنند.
«سوکی مِهدایی» (Souki Mehdaoui) کارگردان مستقل و یکی از بنیانگذاران Bell & Whistle به عنوان متخصص فناوریهای خلاقانه در این باره معتقد است «فیلمسازی از اساس در حال تحول است»
از موارد مهمی که ام آی تی به عنوان یکی از روندهای خاص هوش مصنوعی در سال ۲۰۲۴ به شمار آورده، توانایی افزایش شایعهپراکنیهای انتخاباتی است
افزایش شایعهپراکنی انتخاباتی با هوش مصنوعی
سومین موردی که از سوی ام آی تی به عنوان یکی از روندهای خاص هوش مصنوعی در سال ۲۰۲۴ به شمار آمده، توانایی هوش مصنوعی در افزایش شایعهپراکنیهای انتخاباتی است. در حالی که مشخص نیست این نمونهها تا چه میزان بر نتایج انتخابات تأثیر گذاشتهاند، گسترش آنها یک روند نگران کننده است. تشخیص آنچه در اینترنت واقعی است سختتر از همیشه خواهد بود. در فضای سیاسی ملتهب و دوقطبی موجود در کشورها، این روند میتواند پیامدهای جدی داشته باشد.
چند سال پیش ایجاد یک دیپفیک به مهارتهای فنی پیشرفته نیاز داشت، اما هوش مصنوعی مولد آن را به شدت آسان و قابل دسترس کرده است. از طرفی نیز به تازگی خروجیها به نظر واقعیتر میرسند. حتی منابع معتبر ممکن است برابر محتوای تولید شده با هوش مصنوعی فریب بخورند. برای مثال، تصاویر تولید شده با هوش مصنوعی که به نظر میرسد بحران اسرائیل_غزه را به تصویر میکشد، بازار تصویر سهام مانند Adobe را بسیار کساد کردهاست.
بنابراین سال آینده برای کسانی که می خواهند با گسترش اخبار جعلی مبارزه کنند، سال مهمی خواهد بود. تکنیکهای ردیابی و کاهش اثر محتوا هنوز در مراحل اولیه توسعه هستند. پلتفرمهای رسانههای اجتماعی نیز باید در برداشتن اطلاعات نادرست سریعتر عمل کنند.
رباتهای چندکاره و آیندهای نویدبخش برای هوش مصنوعی
اما آخرین روند خاص پیشبینی شده ام آی تی ظهور و ارتقاء رباتهایی با کاربریهای متعدد است. فرایند یادگیری عمیق میتواند به رباتها کمک کند تا طیف گستردهای از وظایف را انجام دهند. تاکنون، رباتها معمولا برای انجام وظایف خاصی طراحی شدهاند؛ به عنوان مثال فقط مونتاژ صنعتی یا رفتوروب خانگیدر سالهای اخیر، شاهد تحولی در هوش مصنوعی (AI) بودهایم که از استفاده از چندین مدل کوچک برای انجام وظایف خاص به سمت استفاده از یک مدل بزرگ و یکپارچه برای انجام طیف گستردهای از وظایف، تغییر کرده است. این رویکرد به عنوان یادگیری عمیق شناخته میشود و در زمینههای مختلفی از جمله پردازش زبان طبیعی، بینایی کامپیوتری و یادگیری ماشین موفقیتآمیز بوده است.
به تارگی محققان در حال بررسی کاربرد یادگیری عمیق در رباتیک هستند. آنها معتقدند که این رویکرد میتواند به رباتها توانایی انجام طیف گستردهای از وظایف را بدهد؛ از جمله کارهای صنعتی و خانگی.
توضیح آن که تاکنون، رباتها معمولا برای انجام وظایف خاصی طراحی شدهاند. به عنوان مثال، یک ربات صنعتی ممکن است برای مونتاژ یک محصول خاص یا یک ربات خانگی ممکن است برای تمیز کردن خانه طراحی شده باشد. این امر به این دلیل است که آموزش یک ربات برای انجام یک وظیفه خاص، معمولا به مجموعه دادههای بزرگی از نمونههای آن وظیفه نیاز دارد.
با این حال، در دنیای واقعی، رباتها اغلب به انجام چندین وظیفه مختلف نیاز دارند. به عنوان مثال، یک ربات خانگی ممکن است نیاز داشته باشد تا کارهایی مانند تمیزکردن خانه، پختوپز و مراقبت از کودکان را انجام دهد.
یادگیری عمیق میتواند به رباتها کمک کند تا طیف گستردهای از وظایف را انجام دهند. این امر به این دلیل است که یادگیری عمیق روی مجموعه دادههای بزرگی از نمونههای مختلف آموزش مییابد. این امر به رباتها اجازه میدهد تا الگوهای مشابهی را در بین وظایف مختلف بیاموزند و در نتیجه، برای انجام آنها بهتر شوند.
آخرین پیشرفتها، چالشها و چشماندازها
در سالهای اخیر، شاهد پیشرفتهای قابل توجهی در زمینه رباتهای چندکاره بر اساس یادگیری عمیق بودهایم. در سال ۲۰۲۳ «روبوکات ذهن عمیق» (DeepMind Robocat) راهاندازی شد؛ یک ربات چندکاره که میتواند چندین بازوی ربات را کنترل کند. این ربات از یک مدل یادگیری عمیق استفاده میکند که روی مجموعه دادهای از تصاویر و ویدئوهای بازوها آموزش دیده است.
در همان سال DeepMind همچنین یک مدل یادگیری عمیق جدید برای رباتها به نام آرتیایکس «RT-X» منتشر کرد. این مدل روی مجموعه دادهای از کارهای مختلف رباتیک آموزش دیده است و میتواند طیف گستردهای از وظایف را انجام دهد.
محققان دانشگاه نیویورک در حال توسعه تکنیکهایی هستند که به رباتها اجازه میدهد با آزمون و خطا یاد بگیرند. این تکنیکها میتوانند به رباتها کمک کنند تا در محیطهای جدید سازگار شوندتحقیقات دیگری در زمینه رباتهای چندکاره نیز در حال انجام است. به عنوان مثال، محققان در دانشگاه نیویورک در حال توسعه تکنیکهایی هستند که به رباتها اجازه میدهد با آزمون و خطا یاد بگیرند. این تکنیکها میتوانند به رباتها کمک کنند تا در محیطهای جدید سازگار شوند.
با وجود پیشرفتهای قابل توجهی که در زمینه رباتهای چندکاره بر اساس یادگیری عمیق صورت گرفته است، هنوز چالشهایی پیش روی این زمینه وجود دارد. یکی از چالشها، کمبود دادههای آموزشی است. رباتها برای یادگیری طیف گستردهای از وظایف، نیاز به مجموعه دادههای بزرگی از نمونههای مختلف دارند.
چالش دیگر، محدودیتهای سختافزاری است. رباتها برای اجرای مدلهای یادگیری عمیق پیچیده، نیاز به سختافزار قدرتمندی دارند. با وجود چالشها، آینده رباتهای چندکاره بر اساس یادگیری عمیق بسیار امیدوارکننده است. این رباتها میتوانند در طیف گستردهای از کاربردها، از جمله کارهای صنعتی و خانگی، استفاده شوند. رباتهای چندکاره میتوانند به افزایش بهرهوری و کاهش هزینهها کمک کنند. آنها همچنین میتوانند به بهبود کیفیت زندگی افراد یاری برسانند.