Presenting a Multi-Objective Mathematical Optimization Model for Classification in Data Mining

Σχετικά έγγραφα
محاسبه ی برآیند بردارها به روش تحلیلی

روش محاسبه ی توان منابع جریان و منابع ولتاژ

e r 4πε o m.j /C 2 =

ﻞﻜﺷ V لﺎﺼﺗا ﺎﻳ زﺎﺑ ﺚﻠﺜﻣ لﺎﺼﺗا هﺎﮕﺸﻧاد نﺎﺷﺎﻛ / دﻮﺷ

هو الحق دانشکده ي مهندسی کامپیوتر جلسه هفتم

در اين آزمايش ابتدا راهاندازي موتور القايي روتور سيمپيچي شده سه فاز با مقاومتهاي روتور مختلف صورت گرفته و س سپ مشخصه گشتاور سرعت آن رسم ميشود.

V o. V i. 1 f Z c. ( ) sin ورودي را. i im i = 1. LCω. s s s

هر عملگرجبر رابطه ای روی يک يا دو رابطه به عنوان ورودی عمل کرده و يک رابطه جديد را به عنوان نتيجه توليد می کنند.

آزمایش 1: پاسخ فرکانسی تقویتکننده امیتر مشترك

مقاطع مخروطي 1. تعريف مقاطع مخروطي 2. دايره الف. تعريف و انواع معادله دايره ب. وضعيت خط و دايره پ. وضعيت دو دايره ت. وتر مشترك دو دايره

( ) قضايا. ) s تعميم 4) مشتق تعميم 5) انتگرال 7) كانولوشن. f(t) L(tf (t)) F (s) Lf(t ( t)u(t t) ) e F(s) L(f (t)) sf(s) f ( ) f(s) s.

ﻴﻓ ﯽﺗﺎﻘﻴﻘﺤﺗ و ﯽهﺎﮕﺸﻳﺎﻣزﺁ تاﺰﻴﻬﺠﺗ ﻩﺪﻨﻨﮐ

+ Δ o. A g B g A B g H. o 3 ( ) ( ) ( ) ; 436. A B g A g B g HA است. H H برابر

( ) x x. ( k) ( ) ( 1) n n n ( 1) ( 2)( 1) حل سري: حول است. مثال- x اگر. يعني اگر xها از = 1. + x+ x = 1. x = y= C C2 و... و

مقدمه -1-4 تحليلولتاژگرهمدارهاييبامنابعجريان 4-4- تحليلجريانمشبامنابعولتاژنابسته

تصاویر استریوگرافی.

پروژه یازدهم: ماشین هاي بردار پشتیبان

گروه رياضي دانشگاه صنعتي نوشيرواني بابل بابل ايران گروه رياضي دانشگاه صنعتي شاهرود شاهرود ايران

تلفات کل سيستم کاهش مي يابد. يکي ديگر از مزاياي اين روش بهبود پروفيل ولتاژ ضريب توان و پايداري سيستم مي باشد [-]. يکي ديگر از روش هاي کاهش تلفات سيستم

1 ﺶﻳﺎﻣزآ ﻢﻫا نﻮﻧﺎﻗ ﻲﺳرﺮﺑ

هدف:.100 مقاومت: خازن: ترانزيستور: پتانسيومتر:

جلسه 3 ابتدا نکته اي در مورد عمل توابع بر روي ماتریس ها گفته می شود و در ادامه ي این جلسه اصول مکانیک کوانتمی بیان. d 1. i=0. i=0. λ 2 i v i v i.

1- مقدمه است.

آزمایش 8: تقویت کننده عملیاتی 2

تحلیل مدار به روش جریان حلقه

yazduni.ac.ir دانشگاه يزد چكيده: است. ١ -مقدمه

1) { } 6) {, } {{, }} 2) {{ }} 7 ) { } 3) { } { } 8) { } 4) {{, }} 9) { } { }

ﯽﺳﻮﻃ ﺮﯿﺼﻧ ﻪﺟاﻮﺧ ﯽﺘﻌﻨﺻ هﺎﮕﺸﻧاد

مثال( مساله الپالس در ناحیه داده شده را حل کنید. u(x,0)=f(x) f(x) حل: به کمک جداسازی متغیرها: ثابت = k. u(x,y)=x(x)y(y) X"Y=-XY" X" X" kx = 0

اراي ه روشي نوين براي حذف مولفه DC ميراشونده در رلههاي ديجيتال

هدف از انجام این آزمایش بررسی رفتار انواع حالتهاي گذراي مدارهاي مرتبه دومRLC اندازهگيري پارامترهاي مختلف معادله

مقاومت مصالح 2 فصل 9: خيز تيرها. 9. Deflection of Beams

سبد(سرمايهگذار) مربوطه گزارش ميكند در حاليكه موظف است بازدهي سبدگردان را جهت اطلاع عموم در

نيمتوان پرتو مجموع مجموع) منحني

جلسه 9 1 مدل جعبه-سیاه یا جستاري. 2 الگوریتم جستجوي Grover 1.2 مسا له 2.2 مقدمات محاسبات کوانتمی (22671) ترم بهار

آزمایش 2: تعيين مشخصات دیود پيوندي PN

چکيده مقدمه.(FAO, 1976)

آرايه ها و ساختارها سید مهدی وحیدی پور با تشکر از دکتر جواد سلیمی دانشکده مهندسی برق و کامپیوتر

مفاهیم ولتاژ افت ولتاژ و اختالف پتانسیل

Aerodynamic Design Algorithm of Liquid Injection Thrust Vector Control

آزمون مقایسه میانگین های دو جامعه )نمونه های بزرگ(

در اين ا زمايش ابتدا راهاندازي موتور القايي رتور سيمپيچي شده سه فاز با مقاومت مختلف بررسي و س سپ مشخصه گشتاور سرعت ا ن رسم ميشود.

10 ﻞﺼﻓ ﺶﺧﺮﭼ : ﺪﻴﻧاﻮﺘﺑ ﺪﻳﺎﺑ ﻞﺼﻓ ﻦﻳا يا ﻪﻌﻟﺎﻄﻣ زا ﺪﻌﺑ

O 2 C + C + O 2-110/52KJ -393/51KJ -283/0KJ CO 2 ( ) ( ) ( )

پايداری Stability معيارپايداری. Stability Criteria. Page 1 of 8

:نتوين شور شور هدمع لکشم

جلسه 22 1 نامساویهایی در مورد اثر ماتریس ها تي وري اطلاعات کوانتومی ترم پاییز

3 و 2 و 1. مقدمه. Simultaneous كه EKF در عمل ناسازگار عمل كند.

(al _ yahoo.co.uk) itrc.ac.ir) چكيده ١- مقدمه

بررسي علل تغيير در مصرف انرژي بخش صنعت ايران با استفاده از روش تجزيه

پيشنهاد شيوهاي مبتني بر الگوريتم PSO چند هدفه جهت استخراج قوانين انجمني در داده كاوي

تمرین اول درس کامپایلر

- 1 مقدمه كنند[ 1 ]:

یک روش بهینه سازی ترکیبی بر مبنای الگوریتم pso برای حل مسئله زمان بندی

P = P ex F = A. F = P ex A

چكيده 1- مقدمه

برخوردها دو دسته اند : 1) كشسان 2) ناكشسان

بخش غیرآهنی. هدف: ارتقاي خواص ابرکشسانی آلياژ Ni Ti مقدمه

آزمایش 1 :آشنایی با نحوهی کار اسیلوسکوپ

حل J 298 كنيد JK mol جواب: مييابد.

هدف از این آزمایش آشنایی با رفتار فرکانسی مدارهاي مرتبه اول نحوه تأثیر مقادیر عناصر در این رفتار مشاهده پاسخ دامنه

* خلاصه

تا 387 صفحه 1395 زمستان 4 شماره 48 دوره Vol. 48, No. 4, Winter 2016, pp

روشی ابتکاری جهت تولید مدل رقمی زمین برای مناطق جنگلی

هدف: LED ديودهاي: 4001 LED مقاومت: 1, اسيلوسكوپ:

دانشگاه ا زاد اسلامی واحد خمينی شهر

چكيده. Keywords: Nash Equilibrium, Game Theory, Cournot Model, Supply Function Model, Social Welfare. 1. مقدمه

را بدست آوريد. دوران

جلسه 12 به صورت دنباله اي از,0 1 نمایش داده شده اند در حین محاسبه ممکن است با خطا مواجه شده و یکی از بیت هاي آن. p 1

t a a a = = f f e a a

Quick and Accurate Computation of Voltage Stability Margin Using PV Curve Approximation

(,, ) = mq np داريم: 2 2 »گام : دوم« »گام : چهارم«

يا (Automatic Generation Control) AGC

1سرد تایضایر :ميناوخ يم سرد نيا رد همانسرد تلااؤس یحيرشت همان خساپ

فعالیت = ) ( )10 6 ( 8 = )-4( 3 * )-5( 3 = ) ( ) ( )-36( = m n m+ m n. m m m. m n mn

جلسه ی ۱۰: الگوریتم مرتب سازی سریع

چکيده

يک رويکرد جديد مبتني بر ا لفا برشها براي حل مدل تحليل پوششي دادهها با وروديها و خروجيهاي تصادفي فازي

)تاريخ دريافت تير 5331 تاريخ تصويب آذر 5331(

1- مقدمه ماندانا حميدي استفاده از آنها را در طبقهبندي كنندهها آسان كرده است است.

قاعده زنجیره ای برای مشتقات جزي ی (حالت اول) :

a a VQ It ميانگين τ max =τ y= τ= = =. y A bh مثال) مقدار τ max b( 2b) 3 (b 0/ 06b)( 1/ 8b) 12 12

جلسه ی ۳: نزدیک ترین زوج نقاط

یافتن کوتاهترین مسیر شبکه با استفاده از الگوریتم بهینه سازی فاخته در سیستم اطالعات مکانی

چكيده مقدمه SS7 گرديد. (UP) گفته ميشود. MTP وظيفه انتقال پيامهاي SS7 را User Part. Part هاي SS7 هستند. LI I FSN I BSN F

حل يک مدل جديد براي مسأله مسيريابي وسائط نقليه با در نظر گرفتن ايمني در حمل و نقل مواد خطرناک

Downloaded from ijpr.iut.ac.ir at 10:19 IRDT on Saturday July 14th پست الكترونيكي: چكيده ١. مقدمه

No. F-16-EPM مقدمه

تمرینات درس ریاض عموم ٢. r(t) = (a cos t, b sin t), ٠ t ٢π. cos ٢ t sin tdt = ka۴. x = ١ ka ۴. m ٣ = ٢a. κds باشد. حاصل x٢

کاوش قوانين پيوستگي کمي در بازار سهام با استفاده از الگوريتم هاي فراابتکاري چندهدفه مبتني بر الگوريتم ژنتيک

خطا انواع. (Overflow/underflow) (Negligible addition)

شبکه های عصبی در کنترل

چكيده 1- مقدمه درخت مشهد ايران فيروزكوه ايران باشد [7]. 5th Iranian Conference on Machine Vision and Image Processing, November 4-6, 2008

تأثير نوع اتصال عرشه به پايه در انتقال بارهاي ثقلي و

طراحي و بهبود سيستم زمين در ا زمايشگاه فشار قوي جهاد دانشگاهي علم و صنعت

تخمین با معیار مربع خطا: حالت صفر: X: مکان هواپیما بدون مشاهده X را تخمین بزنیم. بهترین تخمین مقداری است که متوسط مربع خطا مینیمم باشد:

Vr ser se = = = Z. r Rr

واحد پنهان داراي رابطه غير خطي است. در برابر آن تبديل فضاي پنهان به فضاي خروجي داراي رابطه خطي است. توجيه رياضياتي انتخاب اين توابع تبديل توسط

مقدمه دسته بندي دوم روش هاي عددي دامنه محدود اهداف: هاي چندجمله اي رهيافت هاي محاسباتي: سعي و خطا دامنه نامحدود

چكيده مقدمه. -*) نويسنده مسي ول: ( 5 - Schuylkill 6- Artificial Neural Network (ANN) 7- Neuro-fuzzy

Transcript:

International Journal of Industrial Engineering & Production Management (2013) February 2013, Volume 23, Number 4 pp. 485-501 Downloaded from ijiepm.iust.ac.ir at 19:36 IRDT on Monday April 23rd 2018 http://ijiepm.iust.ac.ir/ Presenting a Multi-Objective Mathematical Optimization Model for Classification in Data Mining * A. Kazemi & S. Aboutaleb Abolfazl Kazemi, Assistant Professor, Faculty of Industrial and Mechanical Engineering, Qazvin Branch, Islamic Azad University, Siamak Aboutaleb, M.Sc, Faculty of Industrial and Mechanical Engineering, Qazvin Branch, Islamic Azad University, siamak_a84@yahoo.com Keywords Data Mining, Optimization Model of Classification, Multi-Objective Mathematical Programming, Support Vector Machine 1 ABSTRACT In this paper we investigate the issues of data classification (as one of the branches of data mining science) in form of multi-objective mathematical programming model. The model that we present and investigate is a MODM problem. First time, based on support vector machine (SVM) idea (To maximize the margin of two groups), a multi-criteria mathematical programming model was proposed for data mining problems to classified instances in two separated group based on two goals of data discriminate (To maximize the distance between different groups and to minimize the misclassification of observations). Since then, some people have been working on developing the classification models based on mathematical programming methods. Simultaneously and also independently, individuals worked on support vector machine methods to improve them. Regarding to the same philosophy of these two groups of optimization methods, in this paper, to fill the gap between these two research paths, we use the updated and improved SVM methods to present a model for classification in data mining based on multiobjective programming. 2013 IUST Publication, IJIEPM. Vol. 23, No. 4, All Rights Reserved * Corresponding author. Abolfazl Kazemi Email: abkaazemi@qiau.ac.ir

684 9319 شمــاره 4 جلــد 23 اسفند 9319 446 446-059 صفحـــه 059 http://ijiepm.iust.ac.ir/ ISSN: 2008-4870 دادهکاوی * کلمات کلیدی چکیده : دادهکاوي مدل بهينهسازي طبقهبندي برنامهريزي رياضي چندهدفه ماشين بردار پشتيبان. در اين مقاله به بررسي مسائل طبقهبندي دادهها (به عنوان يکي از شاخه هاي علم دادهکاوي) در قالب مدل برنامهريزي رياضي چندهدفه ميپردازيم. مدلي که ارائه و بررسي ميگردد يک مسئله MODM ميباشد. اولين بار بر پايه ايده ماشين بردار پشتيبان ) ( (SVM ماکزيمم کردن حاشيه دو گروه) يک مدل برنامهريزي رياضي چندمعياره براي مسائل دادهکاوي بر پايه طبقهبندي مشاهدات به دو گروه مجزا مبتني بر دو هدف تفکيک دادهها (ماکزيمم کردن فاصله بين گروههاي مختلف و مينيمم کردن طبقهبندي نادرست داده هاي مورد مشاهده) معرفي شد و از آن پس تاکنون ضمن اينکه افراد زيادي روي گسترش مدلهاي طبقهبندي مبتني بر روشهاي برنامهريزي رياضي کار کردهاند همزمان و به صورت مستقل افرادي نيز روي بهبود روشهاي ماشين بردار پشتيبان مطالعه نمودهاند. با توجه به فلسفه يکسان اين دو دسته از روشهاي بهينهسازي در اين مقاله به منظور پر کردن شکاف بين اين دو مسير پژوهش از روشهاي به روز و بهبود يافته SVM جهت ارائه مدلي به منظور طبقهبندي در دادهکاوي مبتني بر برنامهريزي چندهدفه استفاده خواهد شد..9 مقدمه 9 از دهه 08 ميالدي با توسعه علوم و ارتباطات در جوامع بشري و انباشته شدن حجم عظيمي از دادههاي تجاري و علمي نياز به کسب دانش از دادههاي انباشته به صورت قابل مالحظهاي افزايش يافت. اين حجم عظيم دادهها که روز به روز به آنها اضافه ميگردد عموما حاوي اطالعات مهمي بوده که استخراج آنها از پايگاههاي داده و پردازش آنها به آساني امکان پذير نيست. اين نياز روز افزون منجر به رشد سريع دانش دادهکاوي 2 گرديد. دادهکاوي به مفهوم استخراج اطالعات و دانش از پايگاههاي داده در راستاي کشف الگوها و مفاهيمي که به سادگي قابل درک تاریخ وصول 19/9/91 :.1 درک دامنه تعريف مسئله و جمعآوري دادهها تاریخ تصویب 19/8/1 : *نویسنده مسئول مقاله : دکتر ابوالفضل کاظمی استاديار دانشکده صنايع و مکانيک دانشگاه آزاد نيستند ميباشد. دادهکاوي يکي از مراحل فرآيند کشف دانش در پايگاه دادهها )KDD( 3 ميباشد. يکي از بهترين تعاريف براي «کشف دانش در پايگاه داده» توسط Fayyad و همکاران ارائه شده است [.]1 بر اساس اين تعريف KDD يک فرآيند تکرارپذير و تعاملي و داراي چندين مرحله ميباشد که «دادهکاوي» قسمتي از اين فرآيند ميباشد. در تحقيقات صورت گرفته دادهکاوي بيشترين توجه را در بين مراحل مختلف KDD به خود معطوف کرده است و گاها در برخي از روشها با قسمتي از مراحل قبل و بعد از خود ادغام شده است «. کشف دانش در پايگاه داده» فرآيند غيربديهي شناسايي الگوهاي معتبر جديد بالقوه مفيد و سرانجام قابل درک در دادهها ميياشد که در حالت کلي داراي گامهاي زير است [ :]1 اسالمي واحد قزوين قزوين ايران.2 پيش پردازش دادهها (آماده سازي دادهها جهت دادهکاوي).3 دادهکاوي (کشف الگوها از دادهها) abkaazemi@qiau.ac.ir سیامک ابوطالب کارشناسي ارشد مهندسي صنايع دانشکده صنايع و مکانيک دانشگاه آزاد اسالمي واحد قزوين قزوين ايران siamak_a84@yahoo.com Data Mining 2 Knowledge Discovery in Databases 3 ارائه یک مدل بهینهسازی ریاضی چندهدفه برای طبقهبندی در

.4 پس پردازش الگوها (آماده سازي الگوها جهت استفاده از دانش کشف شده) 1 Classification Hyperplane k-nearest Neighbor 4 Naive Bayes 5 Support Vector Machine 2 3 شمار ميآيد در دهه 08 ميالدي توسعه پيدا کرد. استفاده از روشهاي برنامهريزي چندهدفه ( )MOP در طبقهبندي دادهها تقريبا از سال 2888 آغاز گرديد و توسعه اين روشها همچنان ادامه دارد. در کليه اين روشها اهداف مدل به منظور تفکيک دادهها در گروه يا گروههاي مجزا تعريف ميشوند [.]5 در اين مقاله از برنامهريزي رياضي و روشهاي مبتني بر بهينهسازي به منظور ارائه و بررسي مدلهاي يادگيري جهت طبقهبندي دادهها استفاده ميکنيم. با استخراج نقاط مشترک و فلسفه يکسان تعدادي از مشهورترين مدلهاي بهينهسازي رياضي در چند سال گذشته مدل بهينهسازي چند هدفه جامعي پيشنهاد ميگردد. نمايش هندسي مدل به منظور درک سادهتر از خصوصيات مدل ارائه شده خواهد بود. سپس نشان داده ميشود که تعداد زيادي از مدلهاي مورد بررسي در گذشته و حال زير مجموعه و حاالت خاصي از اين مدل جامع پيشنهادي ميباشند و نحوه تبديل مدل جامع پيشنهادي به اين روشها مورد بررسي قرار خواهد گرفت. از اين طريق سعي ميگردد تا شکاف بين مدلهاي جديد برنامهريزي چندهدفه و روشهاي قدرتمند و بهبود يافته SVM که به منظور طبقهبندي در دادهکاوي ارائه ميشوند را پر کرده و مطالعاتي که در راستاي بهبود هر کدام از اين روشها صورت ميگيرد را قابل تعميم به روشهاي ديگر نمود. در اين راستا و در ادامه مقاله زيرمدل جديدي بر پايه مدل جامع ارائه خواهد شد. در ادامه و در بخش دوم به بررسي ادبيات موضوع پرداخته خواهد شد و مطالعات صورت گرفته در زمينه تحقيق مرور ميشود. در بخش سوم مدل جامع پيشنهادي براي طبقهبندي معرفي خواهد شد و در بخش چهارم نحوه تبديل مدل جامع پيشنهادي به حاالت خاص آن بررسي ميشود. اين حاالت خاص شامل مدلهاي معرفي شده توسط ساير محققين و يک زيرمدل جديد پيشنهادي ميباشد. در نهايت در بخش آخر نتايج حاصل از تحقيق جمعبندي شده و تحقيقات آتي مورد بررسي قرار ميگيرد..2 مرور ادبیات در سال Fisher 1031 اولين الگوريتم را براي شناسايي الگو ارائه نمود (الگوريتم تفکيک خطي) [ Vapnik. ]1 و Lerner در سال 1013 الگوريتم تعميم يافتهاي را براي ساخت ابرصفحههاي تفکيککننده با حاشيه بهينه معرفي کردند. الگوريتمي که به عنوان ماشين بردار پشتيبان ارائه شده است تعميم غيرخطي اين الگوريتم ميباشد [. ]7 در سال Mangasarian 1015 يک طبقهبنديکننده با حاشيه بزرگ را با استفاده از تکنيکهاي بهينهسازي به صورت مدل برنامهريزي خطي تنظيم و ارائه کرد [. ]0 بين سالهاي 1008 تا Freed 1008 و Glover چند مدل.5 استفاده از دانش کشف شده و پايش سيستم يکي از کاربردهاي مهم دادهکاوي در طبقهبندي 1 دادهها ميباشد. در مسائل طبقهبندي هر رکورد از مجموعه دادهها در قالب نقاطي در فضاي ورودي يا فضاي ويژگي توسط يک يا چند ابرصفحه 2 از يکديگر جدا ميگردند. اين ايده منجر به طراحي الگوريتمي ميشود که در آن دستهبنديکننده از طريق حل يک مدل برنامهريزي رياضي چند هدفه توليد ميشود [.]2 الگوريتمهاي دادهکاوي که براي ساخت مدل طبقهبنديکننده استفاده ميشوند در زمره الگوريتمهاي يادگيري قرار ميگيرند. يادگيري ماشيني ( )ML به عنوان يکي از شاخههاي وسيع و پرکاربرد هوش مصنوعي ( )AI با استخراج قوانين معنيدار از دادههاي خام ذخيره شده مبناي علمي و فني مناسبي را براي دانش دادهکاوي ايجاد نموده است. روشهاي يادگيري ماشيني شامل شيوهها و الگوريتمهايي ميباشند که بر اساس آنها رايانهها (در کليترين مفهوم آن) به منظور کشف رفتار دادهها توانايي تعل م و يادگيري پيدا ميکنند [.]3 در طبقهبندي از تکنيکهاي گسترده اي مانند درخت تصميم شبکههاي عصبي نزديکترين k همسايه 3 نيو - بيز 4 تحليل تفکيک خطي و غيرخطي و تکنيکهاي بهينهسازي رياضي استفاده ميگردد [.]3 استفاده از روشهاي مبتني بر بهينهسازي منجر به ارتقاي مبناي تئوري و همچنين گسترش کاربرد عملي داده کاوي شده است. تغيير دادن پارامترهاي يک طبقهبنديکننده موجب دوران و حرکت انتقالي ابرصفحه ميشود. با تغيير دادن موقعيت مرز تصميم کيفيت طبقهبنديکننده دچار تغيير و خطاي طبقهبندي کمينه ميشود. کمينه سازي اين خطا از طريق بهينهسازي پارامترهاي طبقهبنديکننده و به کمک يادگيري ميسر ميشود. اگر طبقهبنديکننده يک تابع خطي از پارامترهايش بوده و مشتق پذير باشد ميتوان به يک فرمول از نوع بسته رسيد. ممکن است که راه حلي با چنين ويژگي يک کمينه سراسري را براي شاخص عملکرد به دست دهد. اگر مساله در حقيقت غير خطي باشد استفاده از تکنيکهاي بهينهسازي نظير تکنيکهاي مبتني بر گراديان بهينهسازي تکاملي و غيره اجتناب ناپذير خواهد بود. ميتوان معروفترين الگوريتم مبتني بر 5 بهينه سازي رياضي ارائه شده تاکنون را ماشين بردار پشتيبان ( )SVM دانست [.]4 اين تکنيک که يکي از روشهاي يادگيري به 681

688 Shi و همکارانش در سال 2885 روش برنامهريزي غير خطي چند معياره چندگروهي ) (MC-MCQP را براي مسائل تصميم گيري در طبقهبندي داده کاوي ارائه نمودند [.]20 در سال Kou 2881 و همکارانش يک روش برنامهريزي درجه دوم محدب چند معياره ( )MCCQP معرفي نمودند و از آن در تجزيه و تحليل ريسک کارتهاي اعتباري استفاده کرده و نتايج مقايسه آن با چند روش ديگر را نيز ارائه نمودند [. ]20 در سال 2887 Zhang و Shi يک چارچوب جامع بهينهسازي براي طبقهبندي ارائه کرده و چند مدل مشهور بهينهسازي طبقهبندي (مدلهاي LP و )MCLP را به عنوان حاالت خاصي از مدل جامع ارائه دادند. آنها در ادامه چند مدل جديد بهينهسازي طبقهبندي را مبتني بر مدل جامع توسعه دادند (از جمله مدلهاي MCVQP MCCQP و. ]38[ )MCIQP Li و همکارانش در سال 2880 روش برنامهريزي خطي چند معياره جريمه بسته شده ) (PMCLP را در راستاي بهبود روش MCLP پيشنهاد نمودند و کارايي اين مدل را در مقايسه با دو مدل توسعه يافته ديگر متد MCLP با استفاده از نمونههاي آزمايشي بررسي کردند ].[20 در سال Kou 2880 و همکارانش يک مدل برنامهريزي رياضي درجه دو چند هدفه را براي طبقهبندي چند گروهي ارائه کردند MC-MCQP(. يا )MC2MP سپس به جاي جستجوي جواب بهينه براي حل يک مسئله برنامهريزي رياضي محدب نشان داده شد که محاسبه پاسخ بهينه مدل ارائه شده تنها نياز به محاسبات ماتريسي دارد [ Ben-Hur.]31 و Weston در سال 2818 مروري بر الگوريتمهاي ماشين بردار پشتيبان و انتخاب پارامترها داشتند [.]32 در سال Zhang 2811 و همکاران مدلهاي طبقهبندي MCLP را با سيستمهاي خبره ادغام کردند تا نقاط ضعف هرکدام از اين روشها را بپوشانند [. ]33 استفاده از روشهاي مبتني بر بهينهسازي منجر به ارتقاي مبناي تئوري و همچنين گسترش کاربرد عملي دادهکاوي (به خصوص در زمينه طبقهبندي دادهها) شده است. در قالب يک دستهبندي کلي تاکنون دو دسته از روشهاي طبقهبندي مبتني بر بهينه سازي مورد مطالعه قرار گرفته اند : دسته اول مطالعات اوليهاي است که در دهه 18 توسط Vapnik و همکارانش و همچنين Mangasarian و همکارانش صورت گرفت و سپس در دهه 08 در قالب ماشين بردار پشتيبان ) (SVM به بلوغ رسيد و سپس به مرور به تکامل دست يافت. دسته دوم شامل مطالعاتي است که اولين بار توسط Freed و Glover در دهه 08 ارائه شد و از سال 2888 توسط Shi و همکارانش در قالب روشهاي برنامهريزي رياضي چندهدفه خطي و غيرخطي بسط داده شد. در طول اين مدت تاکنون افراد مختلفي روي بهبود اين روشها برنامهريزي خطي را به منظور حل مسائل تفکيککننده با نمونه کوچک دادهها ارائه نمودند [. ]0 ماشين بردار پشتيبان به شکل نزديک به روش فعلي براي اولين بار در قالب يک مقاله در سال 1002 توسط Boser و همکاران معرفي شد. آنها همچنين در اين مقاله راهي را براي ساخت طبقهبنديکنندههاي غيرخطي با حداکثر حاشيه با استقاده از کاربرد Kernel Trick در نگاشت غيرخطي ابرصفحههاي بهينه به فضاي ويژگي (با ابعاد بيشتر) ارائه کردند. الگوريتم PCG-Chunking جهت حل مدل ارائه گرديد [.]18 در سال Cortes 1005 و Vapnik ايده حداکثر حاشيه اصالح شده را مطرح نمودند. در اين روش خطاي طبقهبندي نادرست در مدل SVM در نظر گرفته شده است و الگوريتم حداکثر حاشيه با تعريف متغير کمبود در مدل بهينهسازي به مسائلي که بصورت خطي جدا پذير نيستند تعميم داده شد ( C-.]11[ )SVC در سال Osuna 1007 و همکاران رسما اولين الگوريتم تجزيه براي آموزش مسائل با دادههايي در ابعاد بزرگ را براي SVM ارائه نمودند. آنها همچنين روشي را جهت برخورد با کالسهاي نامتعادل ارائه نمودند [.]12 در سال 1000 Mangasarian مدل ن رم اول SVM را ارئه کرد [.]13 در سال Suykens 1000 و Vandewalle مدل LS-SVC را ارئه کردند [.]14 در سال Schölkopf 2888 و همکاران مدل ν-svc را ارئه کردند [ Mangasarian.]15 و همکاران در سال 2881 تعدادي الگوريتم براي SVM ارائه کردند. از جمله ميتوان به PSVM RSVM LSVM ASVM SSVM اشاره کرد. آنها همچنين از روش Newton Armijo براي حل تعدادي از مدلهاي خود استفاده کردند [. ]28-11 در سال Shi 2881 و همکاران از يک رويکرد مبتني بر برنامهريزي چندمعياره به منظور معرفي مدل MCLP استفاده کردند و به اين ترتيب استفاده از مدلهاي بهينهسازي رياضي را در مسائل دادهکاوي گسترش دادند [.]21 در سال Bugera 2882 و همکاران يک تابع مطلوبيت درجه دوم محدب را براي SVM معرفي کردند و از آن براي مدل سازي مسئله طبقهبندي حساب کارتهاي اعتباري استفاده کردند [.]22 Peng و همکارانش در سال 2882 بهبود يافته روش برنامهريزي خطي Shi را براي طبقهبندي چند گروهي پيشنهاد دادند ( MC- Hsu.]23[ )MCLP و همکاران در سال 2883 يک رويکرد مبتني بر فرآيند براي استفاده از SVM ارائه کردند [.]24 در سال Bi 2883 مدل C-SVM را در قالب يک مسئله برنامهريزي چندهدفه ارائه نمود و از روش ε-constraint براي حل آن استفاده کرد [.]25 در سال Perez-Cruz 2883 و همکاران مدل ν-svc را به مدل Eν-SVC توسعه دادند [ Asada.]21 و همکاران در سال 2884 از رويکرد برنامهريزي آرماني ( )GP در طبقهبندي توسط SVM استفاده کردند [.]27

مطالعه نمودهاند. مطالعات صورت گرفته در دو زمينه «ارائه يا توسعه مدلهاي بهينهسازي» و «ارائه يا توسعه الگوريتم حل مدلها» بوده است. در اين ميان نکته قابل توجه فلسفه يکسان هر دو دسته از روشهاي طبقهبندي مبتني بر بهينهسازي ميباشد. ماتريس ضرايب بردار ضرايب (بردار قائم بر ابرصفحه جداکننده ام) مقدار ضريب خصيصه ام نسبت به ابرصفحه جداکننده ام در اين بخش پس از تعريف نمادهاي مشترک محدوديتها و توابع هدف مدل جامع طبقهبنديکننده را به صورت هندسي و همچنين در قالب برنامهريزي رياضي مدلسازي خواهيم کرد. مدل جامع طبقهبندي به گونهاي طراحي شده است که مدلهاي اوليه و بهبود يافته SVM و همچنين مدلهاي برنامهريزي رياضي يک و چندهدفه خطي و غيرخطي که تاکنون ارائه شدهاند را به عنوان حاالت خاصي از خود دربرگيرد و همچنين ايجاد حاالت خاص جديد نيز امکانپذير باشد..9-3 نمادگذاری ام نسبت به ابرصفحه جداکننده ام بردار مرزي باياس اسکالر مرزي باياس جدا کننده کالسهاي ام و ام ماتريس انحراف فاصله امتياز رکورد ام با طبقهبندي نادرست يا خطاي حاشيه از ابرصفحه مرزي تنظيم شده فاصله امتياز رکورد ام با طبقهبندي نادرست يا خطاي حاشيه از ابرصفحه مرزي تنظيمشده جداکننده ام ماتريس انطباق فاصله امتياز رکورد ام با طبقهبندي صحيح يا صحت حاشيه از ابرصفحه مرزي تنظيم شده به منظور ايجاد قابليت مقايسه بين مدلهاي مختلف و بررسي سادهتر آنها نمادهاي مشترکي را تعريف نموده و از قالب اين نمادگذاري در طول مقاله استفاده خواهد شد. جداکننده ام تعداد خصيصهها.2-3 فرموله کردن مسئله و محدودیتهای مدل جامع بردار خصيصهها پیشنهادی خصيصه ام بطوري که : تعداد رکوردها ماتريس رکوردها رکورد ام بطوري که : مقداري که رکورد اختيار کرده است ام به ازاي خصيصه ام تعداد ابرصفحههاي جدا کننده (که همواره يکي کمتر از تعداد کالسها ميباشد) بردار برچسبها (مشخصکننده وضعيت عضويت - درکالسهاي فاصله امتياز رکورد ام با طبقهبندي صحيح يا صحت حاشيه از ابرصفحه مرزي تنظيمشده با داشتن مجموعه دادههاي آموزشي با n رکورد و r خصيصه و همچنين با دانستن اين موضوع که هر رکورد ( ) از اين مجموعه متعلق به کدام کالس از پيش تعريف شده ميباشد ) مسئله طبقهبندي دادهها در قالب مدل ( رياضي معرفي ميگردد. به منظور پيدا کردن تابع تصميم اسکالرهاي مرزي باياس ( ) و بردار ضرايب ( ) در ) با تصديق در ابرصفحههاي طبقهبنديکننده ( شناسايي ميشوند : نامساويهاي زير به ازاي ( )1 ) برچسب ام بطوري که : ماتريس برچسبها برچسب حقيقي رکورد ام مقداري که برچسب حقيقي رکورد ام نسبت به ابرصفحه جداکننده ام اختيار کرده است بطوري که : نامساويهاي فوق را ميتوان به ازاي به شکل زير تبديل کرد : ( )2 امتیاز طبقهبندی رکورد.3 مدل جامع بهینهسازی پیشنهادی 681

619 به عنوان امتياز طبقهبندي ا مين شايان ذکر است رکورد دادهها نسبت به ابرصفحه جداکننده ام در نظر گرفته ميشود که ترکيب آن با تابع تصميم را ميسازد. عالمت نشانگر ضرب نقطهاي دو بردار ميباشد : ابرصفحههاي طبقهبنديکنندهاي که بتوانند نقاط را از هم جدا کنند منحصر به فرد نميباشند. بر اساس تئوري ]34[ 1VC به منظور افزايش توانايي تعميم ابرصفحهاي انتخاب ميشود که حاشيه را به مقدار بهينه خود برساند. حاشيه از ديدگاه هندسي عبارت است از فاصله موجود بين ابرصفحه طبقهبنديکننده و نزديکترين نمونه آموزشي. به منظور ساخت حاشيه بهينه دو ابرصفحه مرزي تنظيم شده موازي با ابرصفحه طبقهبنديکننده ) آن دو را به يک اندازه ام رسم کرده ( آنقدر از هم دور ميکنيم که به دادهها برخورد کنند. ابرصفحه طبقهبنديکنندهاي که بيشترين فاصله را از ابرصفحات مرزي داشته باشد بهترين طبقهبنديکننده خواهد بود. به منظور جلوگيري از قرار گرفتن نقاط داده در داخل حاشيه به ازاي محدوديتهاي زير را اضافه ميکنيم : ( )4 فراهم ميکنيم. به منظور تکميل محدوديتهاي تفکيک دادهها ميبايست تعدادي از متغيرها معرفي شوند. فرض ميکنيم تا مرز تنظيمشده به مفهوم فاصله از به صورت نادرست طبقهبنديکننده ام است در صورتي که در گروه ديگري طبقهبندي شده باشد و يا در حاشيه مثبت قرار خطاي طبقهبندي نادرست و گرفته باشد. در حالت اول به در حالت دوم به آن خطاي حاشيه ميگوييم. به عبارت ديگر اين فاصله ميزان انحراف يک نمونه را از وضعيت ايدهآل تفکيک پذيري ميسنجد. بنابراين با در نظر گرفتن اين مقدار خطا به صورت زير نامساويهاي فوق به ازاي درميآيند : ( )5 تا مرز به مفهوم فاصله از فرض ميکنيم به تنظيمشده طبقهبنديکننده ام است در صورتي که صورت صحيح طبقهبندي شده باشد و يا در حاشيه منفي قرار گرفته باشد (صحت حاشيه). به عبارت ديگر اين فاصله ميزان انطباق يک نمونه را با وضعيت ايدهآل تفکيک پذيري ميسنجد. با محدوديتها از حالت نامساوي به حالت اضافه کردن تساوي تبديل ميگردند به ازاي به صورت زير درميآيند : ( ) 1 شکل.9 ابرصفحه طبقهبندیکننده با حاشیه بهینه زماني که تفکيک خطي نمونهها بطور کامل شدني نباشد و تعدادي از نقاط متعلق به کالسهاي مختلف با يکديگر مخلوط شده باشند (در اکثر مسائل واقعي) اين امکان وجود دارد که فضاي حل موجه مسئله با محدوديتهاي فوق تهي باشد. بنابراين با کاستن از شدت نامساويهاي فوق و ايجاد حاشيه انعطافپذير ( 2 ن رم) امکان وجود دادههاي حاوي اختالل را نيز Vapnik Chervonenkis Theory Soft Margin 1 2 شکل.2 نمایش هندسی در طبقهبندیکننده ام با حاشیه انعطافپذیر متعلق به کداميک از کالسهاي از پيش با دانستن اين که ) برچسب کالس تعريف شده ميباشد ( ( )3

و به نسبت به ابرصفحه جداکننده ام در قالب صورت زير قابل تعريف است : ( )7 619 مدلهاي طبقه بندي مبتني بر بهينهسازي مقدار حاشيه در نظر گرفته شده است که در نتيجه اين تابع در هدف مدل انعکاس نخواهد داشت. اکثر روشهاي برنامهريزي رياضي چندهدفه جزو اين دسته از مدلها ميباشند. بنابراين با داشتن رکوردهاي مجموعه آموزشي ( ) و برچسبهاي آنها ( ) ميتوان مساويهاي فوق را در قالب يک محدوديت بازنويسي کرد : ( )0 به منظور تکميل محدوديتهاي مدل مييايست موارد زير را نيز در نظر گرفت : ( )0.3-3 توابع هدف مدل جامع پیشنهادی در روشهاي طبقهبندي مبتني بر بهينهسازي توابع هدف مدلهاي برنامهريزي رياضي از ترکيب اهداف زير حاصل ميگردند : الف) بهینهسازی حاشیه بین ابرصفحات مرزی تنظیم شده موازی با ابرصفحات طبقهبندیکننده اولين تابع مورد بررسي ريشه در تئوري VC و روشهاي مبتني بر SVM دارد. با توجه به اينکه بردار ضرايب ( ) بردار قائم بر ابرصفحات طبقهبنديکننده ميباشد پس بر ابرصفحات مرزي تنظيم شده موازي نيز عمود است لذا فاصله بين اين دو ابرصفحه خواهد بود. با که همان پهناي حاشيه ميباشد مضربي از استفاده از محاسبات هندسي ساده پهناي حاشيه براي ابرصفحه جداکننده تابع ام برابر با است. منظور از ن رم ا م ميباشد که به توان رسيده است. ( )18 در مدلهاي طبقهبندي مبتني بر بهينهسازي عالوه بر استفاده از ن رمهاي مختلف برخوردهاي مختلفي نيز با تابع بهينه ساز حاشيه شده است : الف )1- ماکزيمم کردن حاشيه مثبت ( :)PM-Max در اين حالت ميباشد. فرض بر اين است که الف )2- مينيمم کردن حاشيه منفي ( :)NM-Min در اين حالت ميباشد. ضمنا در تعدادي از فرض بر اين است که و خطای حاشیه دومين تابع مورد بررسي که يکي از نقاط مشترک هر دو دسته از روشهاي طبقهبندي مبتني بر بهينهسازي ميباشد بيشترين وزن را در بين ساير توابع مسئله بهينهسازي دارا است. خطاي حاشيه در مدلهاي ماکزيمم حاشيه مثبت اتفاق ميافتد. در اين حالت مشاهده در فضاي حاشيه قرار گرفته است که ميبايست از اين حالت نيز اجتناب کرد. به منظور کنترل ميزان انحراف مشاهدات از وضعيت ايدهآل تفکيک پذيري آنها مقدار تجميعي خطاي طبقهبندي نادرست را ن رم مينيمم ميکنيم. منظور از با استفاده از تابع ا م ماتريس ميباشد که به توان رسيده است. از آنجايي که ميباشد تابع فوق به شکل زير در تابع هدف ظاهر ميشود : ( )11 در مدلهاي طبقهبندي مبتني بر بهينهسازي از ن رمهاي مختلفي براي تابع خطا استفاده شده است. تنها در صورتي ميتوان از اين ) که در مسئله طبقهبندي تمامي تابع صرف نظر کرد ( نقاط کامال به صورت خطي تفکيکپذير باشند. در غير اين صورت فضاي حل موجه مسئله تهي شده و حل مسئله بهينهسازي امکانپذير نميباشد. ضريبي که به اين تابع در هدف مدل اختصاص مييابد جريمه خطا بوده و از پارامترهاي با اهميتي ميباشد که بر ايجاد تعادل بين پيچيدگي و دقت طبقهبندي تاثير بسزايي دارد. هرچه اين ضريب بزرگتر باشد حساسيت بيشتري نسبت به خطاهايي که اجازه ميدهيم اتفاق بيافتد در نظر گرفته ميشود. در حقيقت اين ضريب يک مصالحه بين پهناي حاشيه و جداسازي اشتباه است. به اين ضريب پارامتر تنظيمکننده نيز گفته ميشود که ميبايست توسط DM انتخاب شود. ج) بهینهسازی پاداش تجمیعی موفقیت در طبقهبندی صحیح و صحت حاشیه سومين تابع هدف مختص روشهاي برنامهريزي رياضي بوده و در مسائل کالسيک SVM مشاهده نميشود. اين تابع پاداش تجميعي موفقيت در طبقهبندي صحيح و صحت حاشيه را ماکزيمم ميکند. ب) بهینهسازی جریمه تجمیعی خطای طبقهبندی نادرست

612 ن رم ا م ماتريس ماکزيمم ميکنيم. منظور از ميباشد که به توان رسيده است. از آنجايي که ميباشد تابع فوق به شکل زير در تابع هدف ظاهر ميشود : ( )12 در مدلهاي طبقهبندي مبتني بر بهينهسازي از ن رمهاي مختلفي براي تابع خطا استفاده شده است. ضريبي که به اين تابع در هدف مدل اختصاص مييابد پاداش طبقهبندي بوده و مقدار کوچکتري از جريمه خطا دارد که ميبايست توسط DM انتخاب شود. در مسائل طبقهبندي چندگروهي نقش اين تابع در برخي مدلها پررنگتر ميشود و بعضا نقش يک محدوديت جهت کنترل موقعيت گروههاي مجاور و يا تضمين کننده ساخت تعداد کافي گروهها با تفکيک پذيري مناسب را ايفا ميکند. اين نقش معموال از مقادير تعريف شدهاي ( ) با مينيمم کردن اختالف صورت ميگيرد. در اين حالت تابع سوم در قالب دو قسمت در تابع هدف ظاهر ميشود. به طوريکه قسمت اول اين تابع در محدوده ابرصفحات اول و آخر و قسمت دوم آن در محدوده بين ابرصفحات فعال ميگردد : ( )13 استفاده از ترکيبي از اهداف ذکر شده منجر به ايجاد مدلهاي مختلفي ميگردد. اين ترکيب اغلب به يکي از سه حالت زير مشاهده ميشود :.1 ترکيبي از هدف اول و دوم (در مدلهاي SVM رايج است )..2 ترکيبي از هدف دوم و سوم (در مدلهاي برنامهريزي رياضي رايج است )..3 ترکيبي از اهداف اول دوم و سوم (در مدلهاي توسعه يافته اخير استفاده ميشود ). کارايي نهايي طبقهبنديکننده به بهينهسازي همزمان توابع هدف مورد استفاده در مدل بستگي دارد. وجود دو يا سه تابع هدف در مدل منجر به استفاده از روشهاي برنامهريزي رياضي چندهدفه ( )MOP ميگردد. به منظور حل اين مدل چندهدفه از روشهاي مختلفي استفاده شده است : روش شاخص جهاني ( ) يا راه حل سازشي (در مدلهاي MCLP و MC-MCLP در [ ]21 و [ )]23 روش تابع مطلوبيت (معرفي يک تابع مطلوبيت درجه دوم محدب براي مسئله SVM در [ (]22 روش برنامهريزي آرماني (در مسئله تفکيک خطي در [ ]35 و براي مسئله SVM در [ )]27 روش قيد (در مدل C-SVM در [ )]25 روش وزندهي (در حاالت خاص مدل جامع پيشنهادي بررسي ميگردند) از بين روشهاي مذکور متداولترين روش متد وزندهي ميباشد. با استفاده از اين روش مدل چند هدفه با استفاده از اختصاص ضريب وزني مثبت به توابع هدف به يک مسئله يک هدفه بهينهسازي مجموع وزني توابع تبديل ميگردد. اين روش به DM اجازه ميدهد تا بر اساس اولويتها و پس از هر تکرار اوزان را اصالح نمايد. اين روش در مدلهاي برنامهريزي خطي و محدب کارايي مناسبي دارد و نقطه ضعف آن در فضاهاي غيرمحدب ميباشد. ضمنا توزيع يکنواخت اوزان در هر تکرار لزوما منجر به ارائه مجموعه پاسخهاي يکنواخت نميگردد..6 حاالت خاص مدل جامع پیشنهادی و نحوه تبدیل ) بر اهداف مدل استفاده از ن رمهاي مختلف ( طبقهبندي تاثيرگذار است و منجر به ايجاد مسائل بهينهسازي خطي و غيرخطي (درجه دوم محدب درجه دوم مقعر و درجه دوم نامعين) ميشود. بستگي به اينکه مدل بهينهسازي به چه شکلي ساخته شود روش حل مدل پيشنهاد ميگردد. بعضا به منظور حل يک مدل خاص چند روش حل نيز ارائه شده است. حل مسئله اصلي يا دوگان و استفاده از روشهاي مستقيم يا متدهاي تجزيه 1 در کنار ساختار حل در شکلگيري روشهاي حل مدل تاثيرگذار است. برخي از اين متدها جواب بهينه سراسري و برخي ديگر پاسخ بهينه محلي مدل را پيدا ميکنند. اين حاالت خاص و نحوه تبديل مدل جامع پيشنهادي به آنها به تفکيک مدلهاي دو کالسي و چند کالسي در اين بخش بررسي خواهند شد و در انتها زيرمدل جديد پيشنهادي ارائه ميگردد..9-6 زیرمدلهای دوکالسی در مدل هاي دو کالسي که حالت خاصي از مدل جامع ارائه شده ميباشند تنها دو کالس ( و ) و يک طبقهبنديکننده و در ). در نتيجه يک ابرصفحه جداکننده ساخته ميشود ( اين حالت انديس کاربرد نداشته و در نمادگذاري نمايش داده نخواهد شد. ضمنا بر اساس تعريف قبلي و به عنوان يک حالت نسبت به تنها ابرصفحه جداکننده به خاص برچسب کالس صورت زير قابل تعريف است : Decomposition Methods 1 صحت حاشيه در مدلهاي مينيمم حاشيه منفي اتفاق ميافتد. در اين حالت مشاهده در فضاي حاشيه منفي قرار گرفته است که مي بايست از اين حالت نيز اجتناب کرد. به منظور کنترل ميزان انطباق مشاهدات با وضعيت ايدهآل تفکيک پذيري آنها مقدار تجميعي موفقيت در طبقهبندي صحيح را با استفاده از تابع

613 ( )14.3-9-9-6 مدل - 1-Norm-SVC مدل ن رم اول طبقهبندی.9-9-6 زیرمدلهای مبتنی بر SVM مدلهاي مبتني بر SVM اغلب با ترکيبي از توابع اول و دوم ساخته ميشوند. با توجه به اهميت اساسي بحث حاشيه در اين مشاهده ميشود. مدلها در کليه آنها تابع کننده بردار پشتیبان با حاشیه سخت (انعطاف ناپذیر) اين مدل اولين بار در سال 1002 توسط Boser و همکاران ارائه شد [ ]18 و فقط شامل هدف اول ميباشد که به صورت ماکزيمم کردن حاشيه مثبت ظاهر ميگردد. بنابراين اين مدل تنها قادر به حل مسائلي ميباشد که کامال به صورت خطي تفکيکپذير ميشود و اين مدل اولين بار در سال 1000 توسط Mangasarian ارائه شد [.]13 تفاوت اين مدل با مدل C-SVC در ن رم تابع هدف اول استفاده شده ميباشد. در اين مدل از ن رمهاي است. همانند دو مدل قبلي تابع هدف اول در قالب ماکزيمم.9-9-9-6 مدل -SVC مدل پایهای و مقدماتی طبقهبندی باشند. در اين مدل کننده بردار پشتیبان به صورت ثابت در نظر گرفته به صورت ثابت در نظر کردن حاشيه مثبت ظاهر شده و گرفته ميشود و تابع هدف دوم با روش وزن دهي و با ضريب وزني به شکل به تابع هدف اول اضافه شده است ( )17 مينيمم ميگردد. در اين مدل از ن رم استفاده شده است. ( )15.6-9-9-6 مدل - LS-SVC مدل کوچکترین مربعات طبقهبندی کننده بردار پشتیبان.2-9-9-6 مدل - C-SVC مدل کالسیک طبقهبندی کننده بردار پشتیبان با حاشیه ن رم (انعطاف پذیر) اين مدل اولين بار در سال 1005 توسط Cortes و Vapnik ارائه شد [ ]11 و با اضافه کردن هدف دوم به مدل SVC منجر به ايجاد حاشيه انعطاف پذير شده است. همانند مدل SVC تابع هدف اول در قالب ماکزيمم کردن حاشيه مثبت ظاهر شده و به صورت ثابت در نظر گرفته ميشود. تابع هدف دوم با روش وزن دهي و با ضريب وزني به تابع هدف اول اضافه شده است. در اين مدل از ن رمهاي استفاده شده است. اين مدل مبناي توسعههاي آتي روشهاي مبتني بر SVM ميباشد. اين مدل اولين بار در سال 1000 توسط Suykens و Vandewalle ارائه شد [. ]14 تفاوت اين مدل با مدل C-SVC در ن رم تابع هدف دوم ميباشد. در اين مدل از ن رمهاي استفاده شده است. همانند مدلهاي قبلي تابع هدف اول به در قالب ماکزيمم کردن حاشيه مثبت ظاهر شده و صورت ثابت در نظر گرفته ميشود و تابع هدف دوم با روش وزن دهي و با ضريب وزني به شکل به تابع هدف اول اضافه شده است. ( )10 به عنوان امتياز طبقهبندي ا مين رکورد بر همين اساس دادهها نسبت به ابرصفحه جداکننده در نظر گرفته مي شود که ترکيب آن با تابع تصميم را ميسازد. ( )11

616 ( )28 پشتیبان اين مدل اولين بار در سال 2888 توسط Schölkopf و همکاران ارائه شد [.]15 در اين مدل همانند مدل C-SVC از ن رمهاي استفاده شده است. همانند مدلهاي قبلي تابع هدف اول در قالب ماکزيمم کردن حاشيه مثبت ظاهر ميگردد اما تفاوت اين مدل با مدلهاي قبلي در ثابت فرض نکردن مقدار ميباشد. در اين مدل همزمان با مينيمم کردن نيز ماکزيمم ميشود يا به عبارت ديگر مقدار ميشود و با ضريب وزني مينيمم به تابع هدف اضافه ميگردد. همچنين تابع هدف دوم نيز با ضريب وزني به شکل به تابع هدف اول اضافه شده است : (. تعداد رکوردها). ( )10.1-9-9-6 مدل - MOP-SVC قالب برنامهریزی چند 9 هدفه طبقهبندیکننده بردار پشتیبان اين مدل اولين بار در سال 2884 توسط Asada و همکاران ارائه شد [. ]27 به منظور توسعه مدلهاي مبتني بر SVM تابع هدف سوم معرفي و به توابع اول و دوم اضافه گرديده است. تابع هدف سوم که در قالب ماکزيمم سازي معرفي شده است به صورت مينيمم نمودن منفي آن تابع در هدف مدل ظاهر ميشود. در استفاده شده اين مدل از ن رمهاي است. تابع هدف اول همانند مدل کالسيک در قالب ماکزيمم کردن به صورت ثابت در نظر گرفته حاشيه مثبت ظاهر شده و ميشود. با روش وزن دهي تابع هدف دوم با ضريب وزني به تابع و تابع هدف سوم با ضريب وزني هدف اول اضافه شده است..4-9-9-6 مدل -Eν-SVC نوع جدید توسعه یافته طبقهبندی کننده بردار پشتیبان ( )21 اين مدل اولين بار در سال 2883 توسط Perez-Cruz و همکاران ارائه شد [. ]21 در اين مدل همانند مدلهاي C-SVC و ν- استفاده شده است. بر SVC از ن رمهاي خالف مدلهاي مورد بررسي در اين مدل تابع هدف اول در قالب مينيمم کردن حاشيه منفي ظاهر ميگردد. در اين مدل به صورت ثابت در نظر گرفته ميشود در تابع هدف مينيمم با ضريب وزني و مقدار ميگردد. همچنين تابع هدف دوم با روش وزن دهي و با ضريب وزني به شکل.2-9-6 زیرمدلهای مبتنی بر برنامهریزی ریاضی چندهدفه مدلهاي مبتني بر برنامهريزي رياضي چندهدفه اغلب با ترکيبي از توابع دوم و سوم ساخته ميشوند. به تابع هدف اول اضافه شده است : (. تعداد رکوردها) MultiObjective Programming 1.5-9-9-6 مدل - ν-svc نوع جدید طبقهبندیکننده بردار

.9-2-9-6 مدل -MCLP مدل برنامهریزی خطی چند هدفه 9 تابع هدف مدل ظاهر شده اند. در اين مدل از ن رمهاي استفاده شده است در اين مدل از ن رمهاي که منجر به ايجاد يک مدل بهينهسازي درجه دوم مقعر شده است. همانند مدلهاي قبلي تابع دوم با ضريب وزني در تابع هدف مدل ظاهر و تابع سوم با ضريب وزني شده اند. استفاده شده است. تابع هدف سوم که در قالب ماکزيمم سازي معرفي شده است به صورت مينيمم نمودن منفي آن تابع در هدف مدل ظاهر ميشود. ( )24 ( )22.6-2-9-6 مدل - MCIQP مدل برنامهریزی درجه دوم نامعین چند هدفه 6 اين مدل اولين بار در سال 2887 توسط Zhang و Shi ارائه شد [. ]38 تفاوت اين مدل با مدل خطي در ن رم توابع هدف دوم و.2-2-9-6 مدل - MCVQP مدل برنامهریزی درجه دوم محدب چند هدفه 2 اين مدل اولين بار در سال 2887 توسط Zhang و Shi ارائه شد [. ]38 تفاوت اين مدل با مدل خطي در ن رم تابع هدف دوم استفاده ميباشد. در اين مدل از ن رمهاي شده است که منجر به ايجاد يک مدل بهينهسازي درجه دوم محدب شده است. همانند مدل خطي تابع دوم با ضريب وزني در تابع هدف مدل و تابع سوم با ضريب وزني ظاهر شدهاند. سوم ميباشد. در اين مدل از ن رمهاي استفاده شده است که منجر به ايجاد يک مدل بهينهسازي درجه دوم نامعين شده است. همانند مدلهاي قبلي تابع دوم با ضريب در تابع و تابع سوم با ضريب وزني وزني هدف مدل ظاهر شده اند. ( )25 ( )23.5-2-9-6 مدل - MCMP مدل برنامهریزی ریاضی چند هدفه -3-2-9-6 مدل - MCCQP مدل برنامهریزی درجه دوم مقعر چند هدفه 3 اين مدل اولين بار در سال 2887 توسط Zhang و Shi ارائه شد [. ]38 تفاوت اين مدل با مدل خطي در ن رم تابع هدف سوم ميباشد. 5 اين مدل اولين بار در سال 2881 توسط Kou و همکاران ارائه شد [. ]20 به منظور توسعه مدلهاي مبتني بر برنامهريزي رياضي چند هدفه تابع هدف اول معرفي و به توابع دوم و سوم اضافه گرديده است. تابع هدف اول در قالب ماکزيمم کردن حاشيه مثبت ظاهر شده و ميشود و به صورت ثابت در نظر گرفته مينيمم ميگردد. 1 Multiple Criteria Linear Programming Multiple Criteria Convex Quadratic Programming 3 Multiple Criteria Concave Quadratic Programming 2 4 Multiple Criteria Indefinite Quadratic Programming 5 Multiple Criteria Mathematical Programming اين مدل اولين بار در قالب مدل LP در سال 1001 توسط Freed و Glover ارائه [ ]0 و سپس در سال 2881 توسط Shi و همکاران در قالب مدل MCLP توسعه داده شد [. ]21 تابع دوم در و تابع سوم با ضريب وزني با ضريب وزني 615

614 استفاده در اين مدل از ن رمهاي شده است که منجر به ايجاد يک مدل بهينهسازي درجه دوم شده است. با روش وزن دهي تابع هدف دوم با ضريب وزني برنامهريزي رياضي چند هدفه نيز به منظور حل اين گونه از مسائل توسعه يافتهاند. به تابع ( )21.2-6 زیرمدلهای چند کالسی شکل.3 نمایش هندسی مدل جامع طبقهبندی در حالت عموميترين روشهاي طبقهبندي مبتني بر بهينهسازي در بر گيرنده مسائل دو کالسي بوده که به ايجاد برچسبهاي ميانجامد. اين در حالي است که غالبا در محيطهاي واقعي طبقهبندي بر روي چند کالس صورت ميگيرد که با توسعه مدلهاي دو کالسي به چند کالسي قابل حل ميباشند. يکي از قديميترين و سادهترين روشهاي پياده سازي طبقهبندي چند کالسي روش one against all ميباشد که براي هر کالس به تعداد کالسها ( ميکند. طبقهبنديکننده سه کالسی مدلهاي چند کالسي مبتني بر برنامهريزي رياضي چند هدفه که در ادامه مورد بررسي قرار ميگيرند حالت خاصي از مدل جامع ارائه شده ميباشند. برخالف مدلهاي دو کالسي انديس ميگردد. در اين مسائل در اين مدلها فعال کالس ( )و ) طبقهبنديکننده دو کالسي ايجاد در نتيجه طبقهبنديکننده (ابرصفحه جداکننده) وجود دارد. در دو مدل اول مورد بررسي فرض بر اين است که براي کليه ام را از ساير کالسها تفکيک ) که طبقهبنديکنندهها يک بردار ضرايب وجود دارد ( بر کليه ابرصفحات جداکننده عمود ميباشد. بر همين اساس ام کالس ) طبقهبندي ميکند و با ادامه اين روند ( ساير کالسها نيز صورت ميگيرد. از روشهاي ديگر طبقهبندي چند کالسي ميتوان به روش one به عنوان امتياز طبقهبندي ا مين رکورد دادهها همچنان نسبت به ابرصفحات جداکننده در نظر گرفته مي شود که ترکيب کالس توابع تصميم را ميسازد. ضمنا بر against one اشاره نمود. در اين روش براي طبقهبنديکننده دو کالسي ايجاد ميشود به طوري که هر ترکيب دو کالسي از دادهها مورد تفکيک قرار ميگيرند. ترکيب خروجي اين طبقهبنديکنندهها کالس هر رکورد را تعيين ميکند. روش پيشنهادي در مدل جامع فقط نيازمند ايجاد طبقهبنديکننده دو کالسي به ازاي اين روش طبقهبنديکننده کالس ميباشد. در ام اجتماع کالسهاي آن با مقادير مختلف باياس اساس تعريف قبلي برچسب کالس جداکننده به صورت زير تعريف ميشود : نسبت به ابرصفحات ( )27 را تفکيک مينمايد. اين از اجتماع کالسهاي در حالي است که کليه توابع تصميم با حل تنها يک مسئله بهينهسازي چندهدفه حاصل ميشوند. همانطور که حل مسائل طبقهبندي چند کالسي در مدلهاي مبتني بر SVM مورد توجه قرار گرفته است مدلهاي مبتني بر اين مدل اولين بار در سال 2885 توسط Shi و همکاران ارائه شد [. ]20 تابع دوم با ضريب وزني وزني از ن رمهاي و تابع سوم با ضريب در تابع هدف مدل ظاهر شده اند. در اين مدل استفاده شده است. و تابع هدف سوم با ضريب وزني هدف اول اضافه شده است.

مجاور ( ) اجرا ميگردد. ( )20.3-2-6 مدل پیشنهادی MC-MO-CQP برنامهریزی درجه دوم محدب چند هدفه چند کالسی مدل 9 بر خالف مدلهاي MC-MCQP و MC-MCMP با فعال شدن انديس براي هر طبقهبنديکننده يک بردار ضرايب ( )20 وجود دارد ( ) که بر ابرصفحه جداکننده ام عمود ميباشد. بر اين اساس ا مين رکورد به عنوان امتياز طبقه بندي دادهها نسبت به ابرصفحه جداکننده ام در نظر گرفته مي شود که ترکيب آن با تابع تصميم را ميسازد. به ازاي برچسب کالس ابرصفحات جداکننده به صورت زير تعريف ميشود : اين مدل اولين بار در سال 2880 توسط Kou و همکاران ارائه شد [.]31 تفاوت اصلي اين مدل با مدل MC-MCQP در تعريف و اضافه شدن تابع هدف اول به توابع دوم و سوم ميباشد. تابع هدف اول در قالب ماکزيمم کردن حاشيه مثبت ظاهر شده و نسبت به ( )38 به صورت ثابت در نظر گرفته ميشود و مينيمم ميگردد. ضمنا ن رم قسمت اول تابع هدف سوم نيز نسبت به مدل قبلي تغيير کرده است. در اين مدل از ن رمهاي استفاده شده است که منجر به ايجاد يک مدل بهينهسازي درجه دوم محدب شده است. با روش وزن دهي تابع هدف دوم با ضريب وزني به تابع هدف اول اضافه تابع هدف سوم با ضريب وزني شده است. همانند مدل قبلي قسمت دوم تابع هدف سوم با مينيمم کردن از وسط دو ابرصفحه جداکننده مجاور تفکيک اختالف پذيري مناسب گروههاي مجاور را کنترل ميکند. در مدل پيشنهادي تابع هدف اول در قالب ماکزيمم کردن حاشيه مثبت ظاهر شده و گرفته ميشود و به صورت ثابت در نظر با ن رم مينيمم ميگردد. در تابع هدف دوم مقدار تجميعي خطاي طبقهبندي نادرست را با مينيمم نموده و در قسمت اول با ن رم استفاده از تابع هدف سوم مقدار تجميعي موفقيت در طبقهبندي صحيح را نسبت به ابرصفحات اول و آخر ( با ن رم ) با استفاده از ماکزيمم ميکنيم. Multi Class Multiple Objective Convex Quadratic Programming 1 تابع هدف سوم که در قالب ماکزيمم سازي معرفي شده است به صورت مينيمم نمودن منفي آن تابع در هدف مدل ظاهر ميشود. در قسمت اول اين تابع فواصل نسبت به ابرصفحات اول و آخر محاسبه ميگردد. قسمت دوم تابع هدف سوم نقش يک محدوديت جهت کنترل تفکيک پذيري مناسب گروههاي مجاور را ايفا ميکند. اين نقش از وسط دو ابرصفحه جداکننده با مينيمم کردن اختالف 611

618 قسمت دوم تابع هدف سوم با مينيمم کردن اختالف از تفکيکپذيري مناسب گروههاي مجاور را کنترل ميکند بطوريکه ( ن رم ) و به اين منظور از استفاده ميگردد. با روش وزن دهي تابع هدف دوم به تابع هدف اول اضافه شده است. تابع هدف سوم در قالب مينيمم نمودن منفي آن در هدف مدل ظاهر ميشود. طبقهبندي روي مجموعه آزمايشي) ميباشد. با پيادهسازي مدل پيشنهادي روي مثال عددي با استفاده از کدنويسي در محيط نرمافزار Lingo11 نتايج زير حاصل گرديده است : جدول.9 نتایج دقت طبقهبندی مدل پیشنهادی (روی مثال عددی) دقت طبقه بندي ( )% مجموعه آموزشي مجموعه آزمايشي کلي 0093 0791 کالس L 0092 0590 کالس B 18898 18898 کالس R 0092 0098 ( )31 با توجه به ن رمهاي مورد استفاده اين مدل به يک مسئله برنامهريزي غيرخطي مقيد چندهدفه (مدل بهينهسازي درجه دوم محدب) تبديل ميگردد که پيدا کردن پاسخ بهينه سراسري آن با استفاده از روالهاي شناختهشده و نرمافزارهاي موجود امکانپذير است. اين مدل قادر به حل مسائل طبقهبندي چندکالسي و در حالت خاص آن مسائل دوکالسي ميباشد..5 پیاده سازی مدل پیشنهادی روی مثال عددی و مقایسه با سایر الگوریتمها در اين قسمت مدل پيشنهادي بر روي مجموعه دادههاي استاندارد پياده ميشود. به اين منظور مجموعه دادههاي وزن و 2 1 فاصله مقياس تعادلي از مخزن يادگيري ماشيني دانشگاه UCI استخراج شده است ].[31 اين دادهها به صورت از پيش طبقهبندي شده هستند و کالس متناظر با هر رکورد مشخص شده است. در اين مجموعه 125 نمونه موجود با 4 مشخصه در سه کالس ) (L,B,R توزيع شدهاند. معيار مورد استفاده در اين مقاله که به منظور اعتبارسنجي مدل پيشنهادي مورد استفاده قرار ميگيرد دقت پيشبيني (دقت Balance Scale Weight & Distance Database University of California, Irvine Machine Learning Repository 1 2 در اين مقاله پنج مورد از معروفترين الگوريتمهاي طبقهبندي در دادهکاوي انتخاب شده تا از آنها به منظور مقايسه با مدل پيشنهادي استفاده گردد : نسخه 0 درخت تصميم )J 4.8( C4.5 مدل احتمالي استاندارد نيو بيز ( )NB مدل استاندارد نزديکترين k همسايه ( )KNN شبکه عصبي به روش انتشار بازگشتي )NN( 3 ماشين بردار پشتيبان به روش بهينهسازي حداقل متوالي )SMO-SVC( 4 پس از پياده سازي هر يک از الگوريتمهاي فوق در محيط نرم افزار Weka دقت طبقهبندي کل و هر کالس را روي مجموعه آزمايشي مثال فوق محاسبه کرده و نتايج را در جدول 2 نشان ميدهيم. جدول.2 مقایسه نتایج دقت پیشبینی الگوریتمهای مختلف طبقهبندی (مجموعه آزمایشی مثال عددی) طبقهبندی دقت طبقهبندی هر کالس ( )% دقت طبقهبندی کننده L B R کلی ( )% J 4.8 %0393 %1295 %0091 %0890 NB %0098 %898 %18898 %0190 KNN %0390 %193 %0098 %0094 NN %0098 %1295 %0297 %0393 SMO-SVC %0790 %0193 %0098 %0791 MC-MO-CQP %0590 %18898 %0098 %0791 Backpropagation Sequential Minimal Optimization 3 4 با ضريب وزني و تابع هدف سوم با ضريب وزني

.4 نتیجهگیری و پیشنهاد تحقیقات آتی در اين مقاله به بررسي مسائل طبقهبندي دادهها در قالب مدل برنامهريزي رياضي چندهدفه پرداختيم. در قالب يک دستهبندي کلي تاکنون دو دسته از روشهاي طبقهبندي مبتني بر بهينهسازي مورد مطالعه قرار گرفتهاند : دسته اول مطالعات اوليهاي است که در دهه 18 توسط Vapnik و همکارانش و همچنين Mangasarian و همکارانش صورت گرفت و سپس در دهه 08 در قالب ماشين بردار پشتيبان ) (SVM به بلوغ رسيد و سپس به مرور به تکامل دست يافت. دسته دوم شامل مطالعاتي است که اولين بار توسط Freed و Glover در دهه 08 ارائه شد و از سال 2888 توسط Shi و همکارانش در قالب روشهاي برنامهريزي رياضي چندهدفه خطي و غيرخطي بسط داده شد. از زمان ارائه اولين مدلهاي برنامهريزي براي مسائل طبقهبندي افراد زيادي به صورت مستقل و همزمان روي گسترش مدلهاي طبقهبندي مبتني بر روشهاي برنامهريزي رياضي و روشهاي ماشين بردار پشتيبان مطالعه نمودهاند. در اين ميان نکته قابل توجه فلسفه يکسان هر دو دسته از روشهاي طبقهبندي مبتني بر بهينهسازي ميباشد. در اين مقاله به منظور پر کردن شکاف بين اين دو مسير پژوهش مدل جامعي به منظور طبقهبندي در دادهکاوي مبتني بر برنامهريزي چندهدفه ارائه گرديد که مدلهاي اوليه و بهبود يافته SVM و همچنين مدلهاي برنامهريزي رياضي يک و چندهدفه ارائه شده حاالت خاصي از اين مدل جامع پيشنهادي باشند. ارائه اين مدل جامع برنامهريزي چندهدفه ( )MOP مطالعاتي که به صورت مستقل در راستاي بهبود هر کدام از اين روشها صورت گرفته است را قابل تعميم به روشهاي ديگر گرديد. غالبا در محيطهاي واقعي طبقهبندي بر روي چند کالس صورت ميگيرد که با توسعه مدلهاي دو کالسي به چند کالسي قابل حل ميباشند. در روش پيشنهادي در مدل جامع با استفاده از رويکرد حل يکجا و همزمان مسائل طبقهبندي چند گروهي کليه توابع تصميم با حل تنها يک مسئله بهينهسازي چندهدفه حاصل ميشوند. تبديل مدل جامع پيشنهادي به چندين زيرمدل دو يا چند کالسي مبتني بر ماشين بردار پشتيبان و مبتني بر برنامهريزي رياضي چند هدفه مورد بررسي قرار گرفت. در ادامه با استفاده از ترکيب تجربيات حاصل از توسعه روشهاي مبتني بر ماشين بردار پشتيبان و روشهاي مبتني بر برنامهريزي رياضي چند هدفه يک زيرمدل پيشنهادي جديد ( MC-MO- ) CQP بر پايه مدل جامع و به عنوان حالت خاص جديدي از آن ايجاد کرديم. اين زيرمدل که يک مسئله برنامهريزي درجه دوم محدب مقيد چندهدفه را تشکيل ميدهد قادر به حل مسائل طبقهبندي چندکالسي ميباشد. از جمله ويژگيهاي اين زيرمدل حصول پاسخ بهينه سراسري ميباشد. در پايان مدل پيشنهادي و چند الگوريتم متداول طبقهبندي روي مجموعه دادههاي معتبر نمونه پياده گرديدند تا ميزان کارايي مدل با استفاده از بانک دادههاي نمونه در مقايسه با نتايج چند الگوريتم ديگر طبقه بندي مورد ارزيابي و اعتبارسنجي قرار گيرد. معيار مورد استفاده در اين مقاله که به منظور مقايسه روشهاي اشاره شده مورد استفاده قرار گرفت دقت پيشبيني بوده است. نتايج پيادهسازي الگوريتم و محاسبه دقت طبقهبندي کل و هر کالس روي مجموعه آزمايشي مثال عددي اثبات ميکند که مدل پيشنهادي در مقايسه با ساير متدها تفکيک مناسبي از وضعيت دادههاي جديد حاصل ميکند. از جمله مزاياي مدل طبقهبندي پيشنهادي ميتوان به موارد زير اشاره کرد : حصول دقت باالي پيشبيني برچسب کالس دادههاي جديد حصول پاسخ بهينه سراسري از حل مدل بهينهسازي استقرار الگوريتم بر پايه اصول نظري منسجم و برخورداري از ويژگيهاي هندسي قابليت طبقهبندي مسائل چند کالسي با توجه متداول شدن روشهاي مبتني بر بهينهسازي و بهکارگيري آنها در بيشتر ابزارهاي دادهکاوي در اين مقاله با برقراري ارتباط بين مدلهاي مختلف طبقهبندي مبتني بر بهينهسازي مسير هموارتري به منظور گسترش مدلهاي جديد طبقهبندي گشوده شد. با توجه به مطالعات صورت گرفته امکان ايجاد زيرمدلهاي کاراتر بر مبناي مدل جامع طبقهبندي فراهم گرديده است. به عنوان پيشنهاداتي براي تحقيقات آتي ميتوان به مطالعه بر روي نحوه انتخاب موثر ضرايب وزني توابع هدف مدل و توسعه زيرمدل پيشنهادي به نحوي که قادر به حل مسائل طبقهبندي مجموعه دادههاي با پيچيدگي غيرخطي نيز باشد اشاره کرد. در نهايت الزم به ذکر است که پيادهسازي مدلهاي مختلف روي مسائل متفاوت دنياي واقعي قابليت تفکيکپذيري دادهها را توسط اين الگوريتمها در حوزههاي مختلف مشخص ميکند. همانطور که در جدول 2 مشخص ميباشد پيادهسازي مدل طبقهبنديکننده پيشنهادي روي مثال عددي نسبت به ساير الگوريتمهاي مورد بررسي دقت کلي باالتري را ارائه نموده است. الگوريتم SMO-SVC که از خانواده روشهاي مبتني بر بهينهسازي ميباشد پس از الگوريتم پيشنهادي باالترين دقت را داشته است. تنها الگوريتم NN از نظر دقت پيشبيني با روشهاي مبتني بر بهينهسازي قابل رقابت ميباشد. 611

Downloaded from ijiepm.iust.ac.ir at 19:36 IRDT on Monday April 23rd 2018 599 [16] Lee, Y., Mangasarian, O., RSVM: Reduced Support Vector Machines, Presented at SIAM International Conference on Data Mining, Chicago, USA, 2001. [1] [17] Lee, Y.J., Mangasarian, O.L., SSVM: A Smooth Support Vector Machine for Classification, Computational Optimization and Applications, Vol. 20, No. 1, 2001, pp. 5-22. Fayyad, U., Piatetsky-Shapiro, G., Smyth, P., The KDD Process for Extracting Useful Knowledge from Volumes of Data, Communications of the ACM, Vol. 39, No. 11, 1996, pp. 27-34. [2] Han, J., Kamber, M., Data Mining: Concepts and Techniques (2 ed.), Morgan Kaufmann, 2006. [3] Witten, I., Frank, E., Data Mining: Practical Machine Learning Tools and Techniques (2 ed.), Morgan Kaufmann Pub, 2005. [4] Olson, D., Delen, D., Advanced Data Mining Techniques, Springer Verlag, 2008. [20] Mangasarian, O., Wild, E., Proximal Support Vector Machine Classifiers, Presented at International Conference on Knowledge Discovery & Data Mining (KDD), San Francisco, USA, 2001. [5] Zhang, J., Shi, Y., Zhang, P., Several Multi-Criteria Programming Methods for Classification, Computers & Operations Research, Vol. 36, No. 3, 2009, pp. 823-836. [21] Shi, Y., et al., Data Mining in Credit Card Portfolio Management: a Multiple Criteria Decision Making Approach, Presented at International Conference on Multiple Criteria Decision Making (MCDM), Ankara, Turkey, 2001. [6] Fisher, R., The use of Multiple Measurements in Taxonomic Problems, Annals of Eugenics, Vol. 7, No. 2, 1936, pp. 179-188. [7] Vapnik, V., Lerner, A., Pattern Recognition using Generalized Portrait Method, Automation and Remote Control, Vol. 24, No. 6, 1963, pp. 774-780. [8] Mangasarian, O., Linear and Nonlinear Separation of Patterns by Linear Programming, Operations Research, Vol. 13, No. 3, 1965, pp. 444-452. [9] Freed, N., Glover, F., A Linear Programming Approach to the Discriminant Problem, Decision Sciences, Vol. 12, No. 1, 1981, pp. 68-79. [18] Mangasarian, O., Musicant, D., Lagrangian Support Vector Machine, Journal of Machine Learning Research, Vol. 1, 2001, pp. 161-177. [19] Mangasarian, O., Musicant, D., Active Support Vector Machine Classification, Advances in Neural Information Processing Systems, Vol. 13, 2001, pp. 577-583. [22] Bugera, V., Konno, H., Uryasev, S., Credit Cards Scoring with Quadratic Utility Functions, Journal of Multi-Criteria Decision Analysis, Vol. 11, No. 4-5, 2002, pp. 197-211. [23] Peng, Y., Shi, Y., Xu, W., Classification for ThreeGroup of Credit Cardholders Behavior Via a Multiple Criteria Approach, Advanced Modeling and Optimization, Vol. 4, 2002, pp. 39-56. [24] Hsu, C., Chang, C., Lin, C., A Practical Guide to Support Vector Classification 9 Department of Computer Science, National Taiwan University, Taipei 106, Taiwan, 2003. [25] Bi, J., Multi-Objective Programming in SVMs, Presented at International Conference on Machine Learning (ICML), Washington DC, USA, 2003. [26] Perez-Cruz, F., et al., Extension of the nu-svm Range for Classification, Nato Science Series Sub Series, Computer And Systems Sciences, Vol. 190, 2003, pp. 179-196. منابع [10] Boser, B., Guyon, I., Vapnik, V., A Training Algorithm for Optimal Margin Classifiers, Presented at Annual Conference on Learning Theory (COLT), New York, USA, 1992. [11] Cortes, C., Vapnik, V., Support-Vector Networks, Machine Learning, Vol. 20, No. 3, 1995, pp. 273-297. [12] Osuna, E., Freund, R., Girosi, F., Support Vector Machines: Training and Applications, Massachusetts Institute of Technology, 1997. [13] Mangasarian, O., Generalized Support Vector Machines, Advances in Neural Information Processing Systems, Vol. 10, 1999, pp. 135-146. [27] Asada, T., et al., Pattern Classification by Goal Programming and Support Vector Machines 9 Computational Management Science, Vol. 1, No. 3, 2004, pp. 211-230. [14] Suykens, J., Vandewalle, J., Least Squares Support Vector Machine Classifiers, Neural processing letters, Vol. 9, No. 3, 1999, pp. 293-300. [28] Shi, Y., et al., Classifying Credit Card Accounts for Business Intelligence and Decision Making: A [15] Schölkopf, B., et al., New Support Vector Algorithms, Neural Computation, Vol. 12, No. 5, 2000 9pp. 1207-1245. 6 شماره -23 جلد -9319 9319 اسفند نشریه بین المللی مهندسی صنایع و مدیریت تولید

599 Downloaded from ijiepm.iust.ac.ir at 19:36 IRDT on Monday April 23rd 2018 Multiple-Criteria Quadratic Programming Approach, International Journal of Information Technology & Decision Making (IJITDM), Vol. 4, No. 04, 2005, pp. 581-599. [29] Kou, G., et al., A New Multi-Criteria Convex Quadratic Programming model for Credit Analysis, Presented at International Conference on Computational Science (ICCS), Reading, UK, 2006. [30] Zhang, J., Shi, Y., A Framework of Optimization Method for Classification, Presented at International Symposium on Optimization and Systems Biology (OSB), Beijing, China, 2007. [31] Kou, G., et al., Multiple Criteria Mathematical Programming for Multi-Class Classification and Application in Network Intrusion Detection, Information Sciences, Vol. 179, No. 4, 2009, pp. 371381. [32] Ben-Hur, A., Weston, J., A User's Guide to Support Vector Machines, Methods in Molecular Biology, Vol. 609, 2010, pp. 223-239. [33] Zhang, D., Tian, Y., Shi, Y., A Group of Knowledge-Incorporated Multiple Criteria Linear Programming Classifiers, Journal of Computational and Applied Mathematics, In Press, 2011. [34] Vapnik, V., Chervonenkis, A., On the Uniform Convergence of Relative Frequencies of Events to Their Probabilities, Theory of Probability and its Applications, Vol. 16, No. 2, 1971, pp. 264-280. [35] Freed, N., Glover, F., Simple But Powerful Goal Programming Models for Discriminant Problems, European Journal of Operational Research, Vol. 7, No. 1, 1981, pp. 44-60. [36] Machine Learning Repository, Center for Machine Learning and Intelligent Systems, University of California, Irvine, Available from: http://archive.ics.uci.edu/ml/index.html. 6 شماره -23 جلد -9319 9319 اسفند نشریه بین المللی مهندسی صنایع و مدیریت تولید

592