۳۰ مهر ۱۴۰۳، ۱۲:۵۸

کد خبرنگار: 757

کد خبر: 85633728

T T

۰ نفر

برچسب‌ها

ابداع شیوه‌ای جدید برای پاسخگویی بهتر مدل‌های بزرگ زبانی

۳۰ مهر ۱۴۰۳، ۱۲:۵۸

کد خبر: 85633728

ابداع شیوه‌ای جدید برای پاسخگویی بهتر مدل‌های بزرگ زبانی

تهران- ایرنا- گروهی از محققان موسسه علم و فناوری ژاپن شیوه جدیدی برای تقویت مدل‌های بزرگ زبانی ابداع کرده‌اند که می‌تواند به ارائه پاسخ‌های کوتاه و روشن حتی در حوزه‌های حساس منجر شود.

به گزارش گروه علمی ایرنا از «تک اکسپلور»، مدل‌های بزرگ زبانی (LLMs) مدل‌های یادگیری ماشین هستند که برای فهم و تولید زبان انسان طراحی شده‌اند. مدل‌های بزرگ زبانی پیشرفته، پتانسیل قابل توجهی در پاسخ به سوالات در حوزه باز (ODQA) نشان داده‌اند؛ جایی که وظیفه این مدل‌ها ارائه پاسخ‌هایی به سوال‌های حقیقی است.

این قابلیت به‌خصوص در حوزه‌هایی مانند مالی، بهداشت و سلامت و آموزش سودمند است با این حال، مدل‌های بزرگ زبانی عموما بر دانش از پیش آموزش‌دیده خود برای پاسخ به سوالات متکی هستند که این دانش در جهان به سرعت در حال تغییر می‌تواند تاریخ گذشته و منسوخ بشود.

از طریق استفاده از «تولید تقویت شده با بازیابی» (RAG) با یک مدل بزرگ زبانی از پیش آموزش‌دیده می‌توان با این محدودیت مقابله کرد. در این رویکرد، سوال با اسنادی از یک پایه دانش تقویت می‌شود. با وجود این پیشرفت‌ها، مدل‌های بزرگ زبانی اغلب پاسخ‌های طولانی تولید می‌کنند به‌طوری‌که با اطلاعات زیادی چهارچوب دریافت پاسخ کوتاه و روشن دشوار می‌شود.

ابداع شیوه‌ای جدید برای پاسخگویی بهتر مدل‌های بزرگ زبانی

برای پرداختن به این محدودیت‍‌ها، یک گروه از محققان از موسسه علوم و فناوری ژاپن با هدایت پروفسور «انگوین لو مین» یک شیوه جدید موسوم به «تولید پاسخ پیشوند» (ANSPRE) ابداع کرده‌اند که می‌تواند کیفیت تولید مدل‌های بزرگ زبانی را ارتقا بدهد و به آنها اجازه می‌دهد که عبارت دقیق پاسخ را مشخص کنند. این شیوه می‌تواند در هر نوع مدل بزرگ زبانی به کار برود.

ایده اصلی در این شیوه جدید، اضافه کردن یک زنجیره از متن به پیام‌واره مدل بزرگ زبانی است که به عبارت پاسخ منجر می‌شود. به این زنجیره متن «پیشوند پاسخ» گفته می‌شود. این شیوه نوآورانه یک گام مهم به جلو برای مدل‌های بزرگ زبانی به شمار می‌رود و می‌تواند به کاربرد گسترده‌تر آنها حتی در حوزه‌های حساس منجر شود.

۰ نفر

برچسب‌ها

اخبار مرتبط

فراموشی گزینشی به یادگیری هوش مصنوعی کمک می‌کند

تهران- ایرنا- تحقیقات جدید نشان داد که پاک کردن اطلاعات کلیدی در جریان آموزش به مدل‌های یادگیری…
هوش مصنوعی با ویرایش ژن انسان به جنگ بیماری‌ها می‌رود

تهران- ایرنا- محققان یک شرکت فناور موفق به ایجاد سامانه‌ای شدند که قادر است با ساخت مولکول‌های…
برای بخش‌بندی دقیق تصاویر پزشکی

روش جدید هوش مصنوعی ابهام در تفسیر تصاویر پزشکی را ازبین‌می‌برد

تهران- ایرنا- محققان دانشگاه «ام آی تی» یک مدل جدید هوش مصنوعی برای بخش‌بندی دقیق و هدفمند…
آیا چت جی پی تی تحقیقات را متحول خواهد کرد؟

تهران - ایرنا - دانشمندان برنده جوایز نوبل معتقدند تاثیرگذاری مدل های زبانی بزرگ مانند برنامه…
استفاده از یادگیری ماشینی برای ایجاد یک سری الکتروشیمیایی مواد معدنی

تهران- ایرنا- محققان موفق شدند از یادگیری ماشین برای ایجاد یک سری الکترو شیمیایی برای مواد…