به گزارش گروه علم و آموزش ایرنا از «تک اکسپلور»، این شیوه موسوم به «بالدور» (Baldur) از نیروی هوش مصنوعی مدلهای زبانی بزرگ استفاده میکند و زمانی که آن را با ابزار پیشرفته «تور» ترکیب میکند، به سطح درستی بیسابقه ۶۶ درصد میرسد.
«یوری بران» استاد کالج اطلاعات و علوم رایانه دانشگاه ماساچوست گفت: ما هر روز از نرم افزارهای خود استفاده می کنیم با این حال این انتظار را هم داریم که ممکن است باگ (ویروس) داشته باشد. نرمافزارهای دارای باگ (ویروس) می توانند تاثیرات ناخوشایند و حتی مخربی داشته باشند.
البته راه هایی برای بررسی نرمافزارها وجود دارد؛ یکی از راه های محبوب که آسانترین راه هم هست، این است که به طور دستی کدها را خط به خط بررسی و تایید کنیم تا هیچ خطایی وجود نداشته باشد. راه دیگر اجرا یا «ران کردن» کد و بررسی کارکرد درست آنها است. مشکل هر دوی این روش ها این است که مستعد خطای انسانی هستند و بررسی همه خطاهای ممکن هم وقتگیر است.
یک راه بهتر اما دشوارتر، ایجاد مدارک ریاضیاتی برای نشان دادن کارکرد درست کد است که این روش «بررسی ماشینی» است.
نوشتن دستی این مدارک (proofs) بسیار وقتگیر است اما با ظهور مدلهای زبانی بزرگ که «چت جیپیتی» معروفترین نمونه آن است، یک راه احتمالی دیگر تلاش برای تولید اتوماتیک چنان مدارکی است.
به گفته «بران»، یکی از مشکلات مدلهای زبانی این است که همیشه صحیح نیستند و به جای اطلاع به شما که یک جای کار ایراد دارد، آنها تمایل به «شکست بیسروصدا» دارند؛ بطوری که یک پاسخ نادرست تولید میکنند اما آن را به عنوان یک پاسخ درست ارائه میدهند.
در اینجا اهمیت شیوه جدید موسوم به بالدور مشخص می شود. این شیوه با یک فرایند جدید بر اساس آموزش با حجم بالایی از دادهها کار میکند و صحت کار را تا حد قابل ملاحظهای بالا میبرد.
ابزار پیشرفته برای تولید اتوماتیک مدارک نیز «تور» نامیده می شود که در کنار بالدور می توانند تا ۶۵.۷ درصد از موارد مدارک لازم را تولید کنند. هر چند هنوز درجه بزرگی از اشتباه وجود دارد اما بالدور بدون شک موثرترین و کارآمدترین شیوهای است که تاکنون برای تایید و راستیآزمایی درست بودن نرمافزارها ابداع شده است.
نظر شما