تهران- ایرنا- محققان دانشگاه پرود واقع در آمریکا چارچوب جدیدی را برای استخراج داده‌های موردنیاز به منظور تعلیم مدل‌های یادگیری هوشمند توسعه دادند.

به گزارش پایگاه خبری ساینس دیلی، این چارچوب که یک پلتفرم نرم‌افزاری بوده و  با عنوان Lemon شناخته می‌شود، امکان استخراج اطلاعات مربوط به عملکرد داروها را از بانک اطلاعات پروتئین فراهم می‌کند.
بانک اطلاعاتی پروتئین که فعلا شامل بیش از ۱۴۰ هزار ساختار مولکولی بوده و هر روز بر تعداد آن‌ها افزوده می‌شود، یک ابزار ضروری برای تولید داروهای جدید است، اما زمان و انرژی موردنیاز برای مرتب‌سازی و دستیابی به اطلاعات موردنیاز، یک چالش جدی برای محققان محسوب می‌شود. فناوری یادگیری ماشین توانایی حل این مشکل را دارد،‌ اما برای استفاده از این فناوری نیز لازم است یک چارچوب توانمند برای تجزیه و تحلیل اطلاعات در اختیار کامپیوتر قرار گیرد.
پلتفرم نرم‌افزاری Lemon یک کتابخانهC++۱۱ است که با استفاده از کدهای زبان برنامه‌نویسی Python امکان استخراج اطلاعات موردنظر از بانک اطلاعات پروتئین را تنها در چند دقیقه فراهم می‌کند. بارگذاری داده‌های بانک اطلاعات پروتئین با استفاده از فایل‌های سنتی mmCIF حدود ۲۹۰ دقیقه طول می‌کشد در حالی که Lemon با استفاده از یک پردازشگر ۸ هسته‌ای، این کار را تنها در شش دقیقه انجام می‌دهد. این پلتفرم امکان تعریف کارکردهای سفارشی و افزودن آن به بسته نرم‌افزاری را نیز فراهم می‌کند.
گزارش کامل این تحقیقات در نشریه Bioinformatics منتشر شده است.