تاریخ انتشار: ۱۹ دی ۱۴۰۲ - ۱۱:۰۹

ابداع شیوه مبتنی بر هوش مصنوعی برای تایید کد نرم‌افزار

تهران- ایرنا- یک گروه از دانشمندان رایانه با هدایت دانشگاه ماسوچوست شیوه‌ای جدید برای جلوگیری از باگ‌های نرم‌افزاری و تایید صحیح بودن کد زیربنای نرم‌افزار ابداع کردند.

به گزارش گروه علم و آموزش ایرنا از «تک اکسپلور»، این شیوه موسوم به «بالدور» (Baldur) از نیروی هوش مصنوعی مدل‌های زبانی بزرگ استفاده می‌کند و زمانی که آن را با ابزار پیشرفته «تور» ترکیب می‌کند، به سطح درستی بی‌سابقه‌ ۶۶ درصد می‌رسد.

«یوری بران» استاد کالج اطلاعات و علوم رایانه دانشگاه ماساچوست گفت: ما هر روز از نرم افزارهای خود استفاده می کنیم با این حال این انتظار را هم داریم که ممکن است باگ (ویروس) داشته باشد. نرم‌افزارهای دارای باگ (ویروس) می توانند تاثیرات ناخوشایند و حتی مخربی داشته باشند.

البته راه هایی برای بررسی نرم‌افزارها وجود دارد؛ یکی از راه های محبوب که آسان‌ترین راه هم هست، این است که به طور دستی کدها را خط به خط بررسی و تایید کنیم تا هیچ خطایی وجود نداشته باشد. راه دیگر اجرا یا «ران کردن» کد و بررسی کارکرد درست آنها است. مشکل هر دوی این روش ها این است که مستعد خطای انسانی هستند و بررسی همه خطاهای ممکن هم وقت‌گیر است.

یک راه بهتر اما دشوارتر، ایجاد مدارک ریاضیاتی برای نشان دادن کارکرد درست کد است که این روش «بررسی ماشینی» است.

نوشتن دستی این مدارک (proofs) بسیار وقت‌گیر است اما با ظهور مدل‌های زبانی بزرگ که «چت جی‌پی‌تی» معروف‌ترین نمونه آن است، یک راه احتمالی دیگر تلاش برای تولید اتوماتیک چنان مدارکی است.

به گفته «بران»، یکی از مشکلات مدل‌های زبانی این است که همیشه صحیح نیستند و به جای اطلاع به شما که یک جای کار ایراد دارد، آنها تمایل به «شکست بی‌سروصدا» دارند؛ بطوری که یک پاسخ نادرست تولید می‌کنند اما آن را به عنوان یک پاسخ درست ارائه می‌دهند.

در اینجا اهمیت شیوه جدید موسوم به بالدور مشخص می شود. این شیوه با یک فرایند جدید بر اساس آموزش با حجم بالایی از داده‌ها کار می‌کند و صحت کار را تا حد قابل ملاحظه‌ای بالا می‌برد.

ابزار پیشرفته برای تولید اتوماتیک مدارک نیز «تور» نامیده می شود که در کنار بالدور می توانند تا ۶۵.۷ درصد از موارد مدارک لازم را تولید کنند. هر چند هنوز درجه بزرگی از اشتباه وجود دارد اما بالدور بدون شک موثرترین و کارآمدترین شیوه‌ای است که تاکنون برای تایید و راستی‌آزمایی درست‌ بودن نرم‌افزارها ابداع شده است.