تهران- ایرنا- محققان دانشگاه صنعتی امیرکبیر موفق به تحلیل تصویر چهره با استفاده از فناوری هوش مصنوعی شدند که می‌تواند حالت چهره را به‌صورت مستقل از شخص در تصاویر کنترل‌نشده شناسایی کند.

به گزارش روز چهارشنبه ایرنا از دانشگاه صنعتی امیرکبیر، حمید صادقی فارغ‌التحصیل این دانشگاه و مجری طرح «شناسایی حالت چهره مستقل از شخص در تصاویر کنترل‌نشده» گفت: تحلیل تصاویر چهره در دنیای امروز کاربردهای زیادی دارد. یکی از تحلیل‌های مهم در چهره، تشخیص یا شناسایی احساسی است که فرد در چهره خود ابراز می‌کند (خشم، تنفر، ترس، شادی، غمگینی، تعجب و عادی) که به آن حالت چهره گفته می‌شود.

وی افزود: حال سوالی که مطرح می‌شود این است که شناسایی حالت چهره چه کاربردی دارد که برای پاسخ به این سوال فرض کنید یک پزشک بخواهد به‌طور مداوم در طول شبانه‌روز شرایط بیمار را ثبت و آمار آن را بررسی کند.

صادقی ادامه داد: با استفاده از یک دوربین و پردازنده می‌توان چهره فرد را همواره به‌صورت خودکار بررسی، حالت چهره آن را شناسایی و برای پزشک ثبت کرد. حالت درد در چهره، یکی از حالت‌هایی است که می توان برای این مسأله متصور بود.

این محقق درباره یکی از ضعف‌های تشخیص حالت چهره گفت: افت کارایی روش‌های موجود در مواجهه با تصاویر دنیای واقعی (غیر آزمایشگاهی) یا به اصطلاح «تصاویر کنترل‌نشده» از ضعف های این حوزه به شمار می‌رود.

وی افزود: به همین دلیل، در این رساله دکتری به دنبال شناسایی حالت چهره در تصاویر کنترل‌نشده بودیم؛ یعنی تصاویری که خارج از شرایط آزمایشگاهی و در محیط واقعی ثبت می‌شود.

صادقی خاطر نشان کرد: در این تحقیق، با استفاده از هوش مصنوعی روش‌های جدیدی ارایه شده که شناسایی حالت چهره هم در تصاویر کنترل‌شده و هم در تصاویر کنترل‌نشده که پیچیدگی بیشتری دارند، با دقت بسیار بهتری نسبت به دیگر سامانه‌های موجود انجام شود.

وی عنوان کرد: روش‌های جدید ارایه ‌شده در این تحقیق، محدود به شناسایی حالت چهره نیست و می‌تواند در مسائل مختلف یادگیری ماشین نیز استفاده شود. این ادعا با آزمایش در مسائل مختلف (مثل تشخیص نوع اشیا) اثبات شده ‌است.

صادقی گفت: یکی از مهم‌ترین تئوری‌هایی که در این تحقیق مطرح شد، یک روش یادگیری متریک برای طبقه‌بندی ویژگی‌های هیستوگرامی است. محققانی که در زمینه بینایی ماشین کار می‌کنند، به‌خوبی می‌دانند ویژگی‌های هیستوگرامی استفاده زیادی در این زمینه دارد و روش ارایه ‌شده در حل این مسائل بسیار مؤثر خواهد بود.

این محقق افزود: چهره‌های تصاویر کنترل‌نشده معمولاً پیچیدگی‌های زیادی دارند. مثلاً تغییرات شدید زاویه سر، پوشیدگی بخش‌های مختلف چهره، شرایط نوری نامناسب، ابعاد کوچک چهره در تصویر و … همگی از عواملی است که دقت شناسایی حالت چهره را تحت تأثیر قرار می‌دهد. با این توصیف، شناسایی حالت چهره در تصاویر کنترل‌نشده مثل یک مسأله بسیار پیچیده است.

وی اظهار داشت: در شناسایی حالت چهره، ابتدا تصویر چهره با مجموعه‌ای از اطلاعاتی که به آن بردار ویژگی گفته می‌شود، توصیف می‌شود. در ادامه از یک روش یادگیری ماشین برای طبقه‌بندی این ویژگی یا تعیین نوع حالت چهره استفاده می‌شود.

صادقی گفت: ویژگی‌هایی که در بینایی ماشین و پردازش تصویر استفاده می‌شود معمولاً از جنس هیستوگرام است. به همین دلیل، در این طرح یک روش جدید یادگیری متریک جدید با هدف طبقه‌بندی ویژگی‌های هیستوگرامی ارائه شد که مبنای ریاضی آن استفاده از فاصله مربع کای است.

وی ادامه داد: برای تحقق این هدف، یک شبکه عصبی کانولوشنی طراحی شد که ویژگی‌هایی از جنس هیستوگرام از تصویر استخراج می‌کند. این شبکه عصبی از تئوری یادگیری متریک بومی ذکر شده برای شناسایی حالت چهره استفاده می‌کند.

 صادقی درباره کاربرد این تحقیقات گفت: تئوری‌های یادگیری متریک و همچنین شبکه عصبی کانولوشنی ارایه شده در این تحقیق در حل مسائل مختلف پردازش تصویر و بینایی ماشین قابل استفاده است. علاوه بر مسائل حوزه بینایی ماشین، روش یادگیری متریک ارایه ‌شده می‌تواند در طبقه‌بندی سایر ویژگی‌های مبتنی بر هیستوگرام نیز استفاده شود.

وی درخصوص مزیت های رقابتی طرح گفت: علاوه بر دقت بالاتر نسبت به روش‌های دیگر، در این پژوهش سعی شده‌ است پیچیدگی محاسباتی در الگوریتم طراحی ‌شده هم پایین باشد تا پیاده‌سازی آن هزینه زیادی دربرنداشته باشد. به‌عنوان مثال، معماری شبکه عصبی پیشنهادی در این تحقیق برمبنای بخشی از شبکه عصبی کانولوشنی شناخته‌شده MobileNet (نه تمام این شبکه عصبی) است که محاسبات نسبتاً کمی دارد.

این محقق با اشاره به کاربردهای این پروژه گفت: معرفی این پروژه را با یک کاربرد پزشکی (تشخیص درد در چهره) انجام شد.

به گزارش ایرنا، این تحقیق می‌تواند کاربردهای مختلفی مانند ساخت ربات‌های با قابلیت تشخیص حالت چهره انسان، ارتباط انسان با رایانه، هوشمندسازی پخش موسیقی متناسب با حالت چهره فرد داشته باشد.