به گزارش روز چهارشنبه ایرنا از دانشگاه صنعتی امیرکبیر، حمید صادقی فارغالتحصیل این دانشگاه و مجری طرح «شناسایی حالت چهره مستقل از شخص در تصاویر کنترلنشده» گفت: تحلیل تصاویر چهره در دنیای امروز کاربردهای زیادی دارد. یکی از تحلیلهای مهم در چهره، تشخیص یا شناسایی احساسی است که فرد در چهره خود ابراز میکند (خشم، تنفر، ترس، شادی، غمگینی، تعجب و عادی) که به آن حالت چهره گفته میشود.
وی افزود: حال سوالی که مطرح میشود این است که شناسایی حالت چهره چه کاربردی دارد که برای پاسخ به این سوال فرض کنید یک پزشک بخواهد بهطور مداوم در طول شبانهروز شرایط بیمار را ثبت و آمار آن را بررسی کند.
صادقی ادامه داد: با استفاده از یک دوربین و پردازنده میتوان چهره فرد را همواره بهصورت خودکار بررسی، حالت چهره آن را شناسایی و برای پزشک ثبت کرد. حالت درد در چهره، یکی از حالتهایی است که می توان برای این مسأله متصور بود.
این محقق درباره یکی از ضعفهای تشخیص حالت چهره گفت: افت کارایی روشهای موجود در مواجهه با تصاویر دنیای واقعی (غیر آزمایشگاهی) یا به اصطلاح «تصاویر کنترلنشده» از ضعف های این حوزه به شمار میرود.
وی افزود: به همین دلیل، در این رساله دکتری به دنبال شناسایی حالت چهره در تصاویر کنترلنشده بودیم؛ یعنی تصاویری که خارج از شرایط آزمایشگاهی و در محیط واقعی ثبت میشود.
صادقی خاطر نشان کرد: در این تحقیق، با استفاده از هوش مصنوعی روشهای جدیدی ارایه شده که شناسایی حالت چهره هم در تصاویر کنترلشده و هم در تصاویر کنترلنشده که پیچیدگی بیشتری دارند، با دقت بسیار بهتری نسبت به دیگر سامانههای موجود انجام شود.
وی عنوان کرد: روشهای جدید ارایه شده در این تحقیق، محدود به شناسایی حالت چهره نیست و میتواند در مسائل مختلف یادگیری ماشین نیز استفاده شود. این ادعا با آزمایش در مسائل مختلف (مثل تشخیص نوع اشیا) اثبات شده است.
صادقی گفت: یکی از مهمترین تئوریهایی که در این تحقیق مطرح شد، یک روش یادگیری متریک برای طبقهبندی ویژگیهای هیستوگرامی است. محققانی که در زمینه بینایی ماشین کار میکنند، بهخوبی میدانند ویژگیهای هیستوگرامی استفاده زیادی در این زمینه دارد و روش ارایه شده در حل این مسائل بسیار مؤثر خواهد بود.
این محقق افزود: چهرههای تصاویر کنترلنشده معمولاً پیچیدگیهای زیادی دارند. مثلاً تغییرات شدید زاویه سر، پوشیدگی بخشهای مختلف چهره، شرایط نوری نامناسب، ابعاد کوچک چهره در تصویر و … همگی از عواملی است که دقت شناسایی حالت چهره را تحت تأثیر قرار میدهد. با این توصیف، شناسایی حالت چهره در تصاویر کنترلنشده مثل یک مسأله بسیار پیچیده است.
وی اظهار داشت: در شناسایی حالت چهره، ابتدا تصویر چهره با مجموعهای از اطلاعاتی که به آن بردار ویژگی گفته میشود، توصیف میشود. در ادامه از یک روش یادگیری ماشین برای طبقهبندی این ویژگی یا تعیین نوع حالت چهره استفاده میشود.
صادقی گفت: ویژگیهایی که در بینایی ماشین و پردازش تصویر استفاده میشود معمولاً از جنس هیستوگرام است. به همین دلیل، در این طرح یک روش جدید یادگیری متریک جدید با هدف طبقهبندی ویژگیهای هیستوگرامی ارائه شد که مبنای ریاضی آن استفاده از فاصله مربع کای است.
وی ادامه داد: برای تحقق این هدف، یک شبکه عصبی کانولوشنی طراحی شد که ویژگیهایی از جنس هیستوگرام از تصویر استخراج میکند. این شبکه عصبی از تئوری یادگیری متریک بومی ذکر شده برای شناسایی حالت چهره استفاده میکند.
صادقی درباره کاربرد این تحقیقات گفت: تئوریهای یادگیری متریک و همچنین شبکه عصبی کانولوشنی ارایه شده در این تحقیق در حل مسائل مختلف پردازش تصویر و بینایی ماشین قابل استفاده است. علاوه بر مسائل حوزه بینایی ماشین، روش یادگیری متریک ارایه شده میتواند در طبقهبندی سایر ویژگیهای مبتنی بر هیستوگرام نیز استفاده شود.
وی درخصوص مزیت های رقابتی طرح گفت: علاوه بر دقت بالاتر نسبت به روشهای دیگر، در این پژوهش سعی شده است پیچیدگی محاسباتی در الگوریتم طراحی شده هم پایین باشد تا پیادهسازی آن هزینه زیادی دربرنداشته باشد. بهعنوان مثال، معماری شبکه عصبی پیشنهادی در این تحقیق برمبنای بخشی از شبکه عصبی کانولوشنی شناختهشده MobileNet (نه تمام این شبکه عصبی) است که محاسبات نسبتاً کمی دارد.
این محقق با اشاره به کاربردهای این پروژه گفت: معرفی این پروژه را با یک کاربرد پزشکی (تشخیص درد در چهره) انجام شد.
به گزارش ایرنا، این تحقیق میتواند کاربردهای مختلفی مانند ساخت رباتهای با قابلیت تشخیص حالت چهره انسان، ارتباط انسان با رایانه، هوشمندسازی پخش موسیقی متناسب با حالت چهره فرد داشته باشد.