تشخيص جنسيت افراد از روي چهره با استفاده از شبكههاي عصبي پرسپترون چند لايه ای با الگوريتم پس انتشار خطا علي يوسفي کامبيز بديع (عضو هيي ت علمي دانشگاه ا زاد واحد همدان (گروه پژوهشی جامعه اطلاعاتی مرکز تحقيقات مخابرات ايران ( (al _ yo02 @ yahoo.co.u (_badie @ itrc.ac.ir چكيده يكي از ابزارهاي هوش مصنوعي شبكه هاي عصبي مصنوعي است كه امروزه مورد توجه بسياري از محققان و دانش پژوهان ميباشد. بدليل قابليتهاي فراوان اين ابزار در كاربردهاي مختلف مدلهاي گوناگوني براي ا ن طرح شده است كه يكي از اين مدلها شبكههاي پرسپترون چند لايه پيشرو است كه با الگوريتم پس انتشار خطا ا موزش داده ميشوند. در اين مقاله هدف استفاده از اين شبكهها جهت تشخيص جنسيت افراد از روي چهره ميباشد. نتايج بدست ا مده در ا زمايشات انجام گرفته مويد ا ن است كه بين ٨٥% الي ٩٥% تشخيص چهرههاي ناا زموده با موفقيت انجام گرفته كه نشان دهنده توانايي مناسب شبكه هاي پرسپترون چند لايه ای در حل مساله تشخيص جنسيت و مساي لي از اين قبيل مي باشد. در اين روش از روشهاي پردازش چهره بعنوان پيش پردازش تصاوير استفاده شده است. همچنين با مقايسه اين روش با ساير روش ها نظير استفاده از حافظه خود القاء وا ناليز مولفه هاي اصلي چهره به كارايي اين روش مي توان پي برد. كليد واژگان: شبكه هاي عصبي پرسپترون چند لايه پيشرو پردازش تصوير پس انتشار خطا ا ناليز مولفه هاي اصلي حافظه خود القاء. ١- مقدمه روش الگوريتميك در پردازش اطلاعات كه به محاسبه برنامهريزي شده مشهور است جهت حل مساي لي كه رويهاي مناسب جهت حل ا ن استنتاج ميشود مناسب ميباشد. در مساي لي كه نتوان رويهاي مشخص اراي ه داد و يا ا نكه اطلاعات ما از دانش مسي له ا نقدر كم باشد كه راه حل دقيق مسي له ممكن نباشد استفاده از روش الگوريتميك مناسب نبوده و بايد از روشهاي غير الگوريتميك بهره جست. يكي از اين روشها استفاده از شبكههاي عصبي مصنوعي است كه در ا ن به دانش قواعد حاكم بر مسي له نياز نيست و در حل مساي لي نظير پردازش چهره و تشخيص ا ن كه الگوريتم مشخصي برای ا ن وجود ندارد ميپردازد. بدليل عدم شناخت كافي تشخيص مشخصههاي چهره توسط ماشين به سادگي قابل انجام نيست. تشخيص جنسيت اشخاص از روي چهره با استفاده از ANN مشكل فوق را نداشته و استخراج ويژگيهاي مطلوب به عهده شبكه ميباشد. در بخشهاي بعدي كارهاي انجام شده در حوزه تشخيص چهره را بيان نموده و سپس ا زمايشات انجام شده به روش شبكههاي پرسپترون چند لايه با الگوريتم پس انتشار را روي تصاوير جمع ا وري شده بيان نموده در پايان به تشريح
نتايج مربوطه می پردازيم. ٢- روش غير الگوريتميك (روش مبتني بر استفاده از شبکة عصبی بر خلاف روش الگوريتميك كه در ا ن غالب ا از مشخصات هندسي چهره استفاده مي شود روش مبتني بر شبکه های عصبي مستقيم ا برروي چهره و اطلاعات ا ن عمل ميكند (شدت نور پيكسلهاي تصوير دو بعدي. لذا در اين روش اطلاعات هندسي تصوير بطور ضمني ذخيره ميشود بعلاوه ا نكه بافت و جزي يات تصوير نيز حفظ ميگردد. يكي از مشكلات اين روش حساس بودن به تغييرات شرايط روشنايي محيط جهت يابي سر و اندازه تصاوير مختلف افراد ميباشد. لذا در اين مقاله براي جلوگيري از بروز اين مشكل يك مرحله پيش پردازش برروي تصاوير (شامل نرمال سازي تغيير اندازه ودوران و... ضروري است اين عمل ميتواند به روشي نسبت ا مشخص مشابه الگوريتمهاي پيدا كردن خودكار موقعيت صورت در تصوير و مقياس بندي ا نجام گيرد [1,2,3]. ٣- دسته بندي روش های مبتنی بر شبکة عصبی جهت پردازش چهره دو گروه عمده از شبكههاي عصبي جهت شبيه سازي يادگيري تصاوير چهره مورد استفاده قرار گرفته است كه گروه اول ١ شبكههاي خودالقاء خطي ميباشندكه به عنوان ا ناليزگر مولفههاي اصلي شناخته شدهاند. اين شبكهها براي كاربردهاي مختلف از قبيل بازشناسي و دستهبندي تصاوير براساس جنسيت مورد استفاده قرار گرفتهاند و در گروه دوم شبكههاي خود ٢ القاي سه لايه غير خطي ميباشند كه باالگوريتم پس انتشار خطا ا موزش ديدهاند و به عنوان شبكههاي فشرده ساز شناخته شدهاند. اين شبكهها طوري ا موزش ميبينند كه ورودي خود را پس از عبور از يك كانال باريك در خروجي مجدد ا بازسازي مينمايند. از لايههاي مياني اين شبكه بعنوان يك فشرده ساز استفاده می شود. خروجي لايه مياني به عنوان وروديهاي يك شبكه ديگر مورد استفاده قرار ميگيرند كه شبكه ثانويه عمل بازشناسي و دستهبندي را به عهده دارد.[ 4,5,6 ] ٣-١- شبکه های پس انتشار خطا و فشرده سازی تصوير برخلاف شبكه هاي خطي خود القا كه در ا ن واحدهاي ورودي مستقيم ا به واحدهاي خروجي متصل هستند شبكه هاي پس انتشار داراي واحدهاي مخفي غير خطي بين لايه ورودي و لايه خروجي مي باشند. الگوريتم پس انتشار در ابتدا توسط Werbos پيشنهاد شد و سپس مستق لا توسط محققان ديگري مانند Parer Rumelhart و Hinton معرفي گرديد. اين الگوريتم به راحتي توسط معادلات ماتريسي قابل توصيف ميباشد. ٣-١-١- توصيف الگوريتم نشانه هاي مورد استفاده به قرار زير ميباشند: K نشان داده ميشود. پاسخ واحدهاي پردازشي مخفي به X به نام مشخصه توسط برداري 1*I I امين تصوير با K امين تصوير به وسيله برداري 1*L به نام h نمايش داده ميشود كه L نمايش دهنده تعداد واحدهاي پردازشي مخفي ميباشد. پاسخ واحدهاي خروجي به نام K امين تصوير توسط برداري 1*J به نام O نمايش داده ميشود كه J نمايش دهنده تعداد واحدهاي خروجي ميباشد. خروجي مطلوب جهت K امين تصوير برداري 1*j به d وضرايب اتصالات بين واحدهاي ورودي و واحدهاي مخفي بوسيله ماتريسي L*I به نام W نشان داده ميشود. ضرايب اتصالات بين واحدهاي مخفي و واحدهاي خروجي بوسيله ماتريسي J*L به نام Z نمايش داده ميشود. توابع مختلفي را ميتوان به عنوان تابع 1 - Principal Component Analiysis 2 - Error Bacpropagation
فعاليت واحدهاي مخفي و خروجي استفاده نمود كه عموميترين ا نها تابع Logistic ميباشد كه نوعي از تابع Sigmoid مي باشد. 1 f (x = رابطه (١ x 1+ e نحوه تنظيم وزنها در شبكه براساس ميزان خطاي واحدهاي خروجي (تفاضل بين خروجي شبكه و خروجي مطلوب ( e = d o و پس انتشار ا ن از لايه خروجي به سمت لايه ورودي انجام ميگيرد. با نشانه های معرفي شده در فوق مي توان فرمول تصحيح وزن ها را به شرح زير نوشت: رابطه (٦ كه در ا ن h = f (Wx O = f (Zh e = ( d o δ = f (Zh Z output, 1 = Z (t + ηδ.(e output, = o.(1 o h = Z (t.(d + Z 1 o δ output مي توانيم از فرمول زير استفاده كنيم: سيگنال خطاي سلول هاي خروجي و ٤- ا زمايشات و نتايج شبيه سازي شده f مشتق تابع فعاليت ميباشد. براي لايههاي مياني نيز δ W hidden, 1 = f (Wx.(Z = h.(1 h = W = W (t (t + ηδ + W δ.(z hidden, 1 output, x δ output, رابطه (٢ رابطه (٣ رابطه (٤ رابطه (٥ رابطه (٧ رابطه (٨ در اين مرحله به جمع ا وري تصاوير و اعمال ا ن به شبكه هاي عصبي بااستفاده از نرم افزارC ومشاهده نتايج مبادرت شده است. ٤-١- ا زمايش اول تشخيص جنسيت در مورد اول شبكه داراي ٤٠٩٦ ورودي (٦٤*٦٤ ٢٠٠ واحد پردازشي (نرون در لايه مياني اول ٢٠ واحد پردازشي (نرون در لايه مياني دوم و ١ خروجي بود اين شبكه از ٣٦٥ مرتبه نمايش كل مجموعه ا موزشي توانست ١٠٠% مجموعه الگوي ا موزشي را به حافظه بسپارد (ياد بگيرد نرخ يادگيري در اين ا زمون ٠/٥٥ و ضريب گشتاور ٠/٢٥ بود. نمودار خطاي اين شبكه در نمودار (١ ا ورده شده است. نمودار (١ در مرحله تست از تعداد ٢٠ عكس نمايش داده نشده به شبكه جهت سنجش قدرت تعميم شبكه استفاده شد. از اين تعداد ١٠ عكس متعلق به زنان و ١٠ عكس متعلق به مردان ميباشد. نتايج حاصله چنين بود كه ٩٠% از كل تصاوير درست تشخيص داده شدند كه از ميزان باقيمانده ٥% از تصاوير ا قايان و ٥% از تصاوير خانمها اشتباه تشخيص داده شد.
همچنين اين شبكه در تشخيص ١٠ تصوير مربوط به زنان و مردان داراي شرايط خاص (ريش و سبيل و عينك در مورد ا قايان و ا رايش چهره و استفاده از عينك در مورد خانمها ١٠٠% دستهبندي درستي اراي ه نمود در شكل (١ نمونههايي از تصاوير خانمها و ا قايان داراي ويژگي خاص نمايش داده شده است. در نمودار (٢ ( نتايج حاصله از ا زمايش مشاهده ميگردد. 0 تشخيص ميزان به حافظه ميانگين تعميم تعميم درمورد تعميم در مورد چهره هاي خاص سپاري زنان مردان شكل (١ نمودار( ٢ ٤-٢- ا زمايش دوم تشخيص جنسيت در مورد دوم كه مشابه ا زمايش قبلي است تعداد وروديها ٤٠٩٦ تعداد خروجي ١ تعداد واحدهاي لايه مياني اول ١٢٨ و لايه مياني دوم ١٦ ميباشد نرخ يادگيري و ضريب گشتاور در اين ا زمون به ترتيب ٠/٧ و ٠/٦ انتخاب شده است. شبكه پس از ١٧٥ بار تكرار همگرا شده و توانسته است که تمامي نمونههاي ا موزشي را ياد گيرد. در مرحله تست نيز ازميان ٢٠ تصوير ناديده ١٦ مورد را درست طبقهبندي نمود (٩٠% كه از اين ميان ٨٥% ا قايان و ٩٥% خانمها مشمول دستهبندي صحيح واقع شده اند. در مورد نمونههاي داراي ويژگيهاي خاص سيستم قادر به تشخيص ٩٠% موارد شد. خطاي سيستم در نمودار (٣ نمايش داده شده است. نمودار (٣ شکل (٢ دو نكته مهم در اين ا زمايش به چشم ميخورد: ١- در مواردي كه شبكه قادر به تشخيص تصاوير نبود (در مرحله تست اكثر ا تصاوير خاص و مشترك بودند گاه ا چشم انسان نيز در تشخيص اينگونه تصاوير دچار اشتباه ميشد. ٢- در مرحله تست اين دو شبكه از تصاوير كودكان نيز استفاده شده كه در هر سيستم از ٥ تصوير مربوط به كودكان ١ تصوير نادرست تشخيص داده ميشد. در نمودار (٤ نتايج حاصل از ا زمايش فوق ملاحظه ميشود.
تشخيص چهرههاي خاص ميزان به حافظه سپاري ميانگين تعميم نمودار (٤ تعميم درمورد زنان تعميم در مورد مردان 0 در سري دوم ا زمايش ها جهت مقايسه ميزان تاثير گذاري تعداد نمونه هاي ا موزش در قدرت تعميم شبكه به ا زمايشاتي با مجموعه ا زمايشي متشكل از ٣٠ تصوير (١٥ تصوير مرد و ١٥ تصوير زن انجام شد كه در نتيجه در مجموع كاهش تعداد تصاوير مجموعه ا موزشي كاهش قابليت تعميم شبكه را در پي داشت كه در اينجا به دو مورد ا ن اشاره مي گردد. ٤-٣- ا زمايش سوم تشخيص جنسيت در مورد اول شبكههاي با ٤٠٩٦ ورودي ٢٢٠ واحد مياني اول ٢٠ واحد مياني دوم و ١ خروجي ميباشد كه اين شبكه پس از ١٩٨ تعداد تكرار همگرا شده و تمامي تصاوير ورودي را به حافظه سپرد. از بين ٢٠ تصوير مجموعه تست تنها قادر به دستهبندي ٨٢/٥% ا نها به طور صحيح (٨٥% از تصاوير خانمها و ٨٠% از تصاوير ا قايان همچنين در خصوص تصاوير با ويژگي خاص شبكه تنها به ٩٠% تصاوير پاسخ صحيح داد. نرخ يادگيري در اين ا زمايش ٠/٨ و ضريب ممان ٠/٥ انتخاب شده است. در نمودار ٥ خطاي سيستم در مرحله ا موزش مشاهده ميشود. 0 تعميم در مورد مردان تعميم درمورد زنان ميزان به حافظه سپاري تشخيص چهرههاي خاص نمودار (٥ ٤-٤- ا زمايش چهارم تشخيص جنسيت در اين ا زمايش كه مشابه به ا زمايش پيشين ميباشد شبكهاي با ٤٠٩٦ ورودي ١٨٠ نرون مياني اول ٢٠ نرون مياني دوم و ١ خروجي شبيه سازي شد كه پس از ٦٢ تكرار همگرا شد. ولي تنها قادر به تشخيص صحيح ٨٢/٥% تصاوير موجود در فايل تست بود. (٨٠% در مورد ا قايان و ٨٥% در مورد زنان اين شبكه نيز در مورد تصاوير خاص تنها قادر به دستهبندي ٩٠% موارد بود. نرخ يادگيري در اين ا زمايش نيز ٠/٨ و ضريب همان ٠/٥ انتخاب شده است. در نمودار ٧ خطاي مربوط به شبكه در ا زمايش فوق و نمودار ٨ نتايج حاصل از ا زمايش
مشاهده مي شود. 0 ٥- نتيجه گيری نمودار (٧ تشخيص چهرههاي ميزان به حافظه خاص سپاري ميانگين تعميم تعميم درمورد زناتنعميم در مورد مردان نمودار (٨ مدل عصبي پس انتشار خطا كه بر خلاف مدل حافظه خود القا از واحدهاي پردازش غيرخطي استفاده ميكند دامنه عملكرد وسيعتري نسبت به روش حافظه خود القاء از خود نشان ميدهد نتايج حاصله در مقايسه با نتايج شبكههاي حافظه خود القاء نشاندهنده قدرت بالا در تعميم و به حافظه سپاري در تشخيص جنسيت از روي چهره دارد همچنين استفاده از الگوريتمهاي بهبود يافته پس انتشار خطا باعث خواهد شد كه بر خلاف شبكههاي خود القاء مساله توقف دركمينههاي محلي و نيز تسريع در فرايند ا موزش از بوجود ا مدن وضعيت برازش بيش از حد و ا موزش بيش از حد جلوگيري نموده كه به نوبه خود باعث افزايش تعميم در تشخيص جنسيت تصاوير ميباشد. (جدول ١. ٦- مراجع [1] Abdi, H., Valentin, D., Edelman B. G. and O oole, J.A. More about the difference between men and women: Evidence form linear neural networds and the principal component approach, perception, vol.24,pp.539-562,1995. [2] Bouattour, H., Soulie, F.F and Viennet, E. Neural nest for human face recognition, In proceedings of International Conference on Neural networs, vol. 3,pp. 0-4, 1992. [3] Valentin, D., Abdi, H., O oole, A.J. and Cottrell. W.G. Connectionist models of face processing: A survey, pattern recognition, vol. 27,pp.19-12,1994. [4] Abdi, H. A generalized approach for connectionist autoassociative memories: Interpertation, implications and illustration for face processing, Artificial intelligence and cognitive sciences, Demongeot, J. ed., Manchester university press, Manchester, 1988. [5] Gutta, S. and Wechsler, H. Face recognition using hybrid classifier systems, In proceedings of International Conference on Neural networs, vol.2,pp. 17-22,1996. [6] Parodi, G. and Passaggio, F. Size adaptive neural networ for image compression, In Proceedings of International Conference on Neural networs, vol. 3,pp. 945-947,1994.
جدول (١- نتايجهاي حاصله از ا زمايشهاي تعيين جنسيت ميانگين قدرت تعميم ميزان تعميم مرد زن قابليت تشخيص تصاوير ويژه ميزان به حافظه سپاري تكرار تا زمان همگرا شدن ضريب ممان نرخ يادگيري ساختار شبكهخروجي مياني دوم مياني اول ورودي تعدادنمونههاي ا موزشي در مرحله يادگيري سايز تصاوير ورودي ٦٤*٦٤ ٣٠ ٤٠ ٤٠٩٦-٢٢٠-٢٠-١ % ٨٠ % ٥٠ ١٨٩ % ١٠٠ % ٩٠ ٤٠٩٦-١٨٠-٢٠-١ % ٨٠ % ٥٠ ٦٢ % ١٠٠ % ١٠٠ ٤٠٩٦-١٢٨-١٦-١ % ٧٠ % ٦٠ ١٧٥ % ١٠٠ % ٩٠ ٤٠٩٦-٢٠٠-٢٠-١ % ٥٥ % ٢٥ ٣٦٥ % ١٠٠ % ١٠٠ %٨٢/٥ % ٨٠ % ٨٥ %٨٢/٥ % ٨٠ % ٨٥ %٩٠ % ٨٥ % ٩٥ %٩٠ % ٩٠ % ٩٠ ٨٥ % ٩٠ % ٨٦/٢ %