به گزارش پایگاه خبری ساینس دیلی، این چارچوب که یک پلتفرم نرمافزاری بوده و با عنوان Lemon شناخته میشود، امکان استخراج اطلاعات مربوط به عملکرد داروها را از بانک اطلاعات پروتئین فراهم میکند.
بانک اطلاعاتی پروتئین که فعلا شامل بیش از ۱۴۰ هزار ساختار مولکولی بوده و هر روز بر تعداد آنها افزوده میشود، یک ابزار ضروری برای تولید داروهای جدید است، اما زمان و انرژی موردنیاز برای مرتبسازی و دستیابی به اطلاعات موردنیاز، یک چالش جدی برای محققان محسوب میشود. فناوری یادگیری ماشین توانایی حل این مشکل را دارد، اما برای استفاده از این فناوری نیز لازم است یک چارچوب توانمند برای تجزیه و تحلیل اطلاعات در اختیار کامپیوتر قرار گیرد.
پلتفرم نرمافزاری Lemon یک کتابخانهC++۱۱ است که با استفاده از کدهای زبان برنامهنویسی Python امکان استخراج اطلاعات موردنظر از بانک اطلاعات پروتئین را تنها در چند دقیقه فراهم میکند. بارگذاری دادههای بانک اطلاعات پروتئین با استفاده از فایلهای سنتی mmCIF حدود ۲۹۰ دقیقه طول میکشد در حالی که Lemon با استفاده از یک پردازشگر ۸ هستهای، این کار را تنها در شش دقیقه انجام میدهد. این پلتفرم امکان تعریف کارکردهای سفارشی و افزودن آن به بسته نرمافزاری را نیز فراهم میکند.
گزارش کامل این تحقیقات در نشریه Bioinformatics منتشر شده است.
تاریخ انتشار: ۲ دی ۱۳۹۸ - ۱۲:۰۱
تهران- ایرنا- محققان دانشگاه پرود واقع در آمریکا چارچوب جدیدی را برای استخراج دادههای موردنیاز به منظور تعلیم مدلهای یادگیری هوشمند توسعه دادند.