پروژه یازدهم: ماشین هاي بردار پشتیبان

Σχετικά έγγραφα
محاسبه ی برآیند بردارها به روش تحلیلی

روش محاسبه ی توان منابع جریان و منابع ولتاژ

تصاویر استریوگرافی.

آزمایش 8: تقویت کننده عملیاتی 2

آزمایش 1: پاسخ فرکانسی تقویتکننده امیتر مشترك

جلسه 9 1 مدل جعبه-سیاه یا جستاري. 2 الگوریتم جستجوي Grover 1.2 مسا له 2.2 مقدمات محاسبات کوانتمی (22671) ترم بهار

جلسه ی ۱۰: الگوریتم مرتب سازی سریع

جلسه 3 ابتدا نکته اي در مورد عمل توابع بر روي ماتریس ها گفته می شود و در ادامه ي این جلسه اصول مکانیک کوانتمی بیان. d 1. i=0. i=0. λ 2 i v i v i.

مفاهیم ولتاژ افت ولتاژ و اختالف پتانسیل

هو الحق دانشکده ي مهندسی کامپیوتر جلسه هفتم

جلسه 12 به صورت دنباله اي از,0 1 نمایش داده شده اند در حین محاسبه ممکن است با خطا مواجه شده و یکی از بیت هاي آن. p 1

جلسه 15 1 اثر و اثر جزي ی نظریه ي اطلاعات کوانتومی 1 ترم پاي یز جدایی پذیر باشد یعنی:

جلسه 2 1 فضاي برداري محاسبات کوانتمی (22671) ترم بهار

2/13/2015 حمیدرضا پوررضا H.R. POURREZA 2 آخرین گام در ساخت یک سیستم ارزیابی آن است

باسمه تعالی آزمون نهایی درس یادگیری ماشین به همراه پاسخ کوتاه ترم اول 29-29

تحلیل مدار به روش جریان حلقه

جلسه 14 را نیز تعریف کرد. عملگري که به دنبال آن هستیم باید ماتریس چگالی مربوط به یک توزیع را به ماتریس چگالی مربوط به توزیع حاشیه اي آن ببرد.

جلسه 2 جهت تعریف یک فضاي برداري نیازمند یک میدان 2 هستیم. یک میدان مجموعه اي از اعداد یا اسکالر ها به همراه اعمال

جلسه 22 1 نامساویهایی در مورد اثر ماتریس ها تي وري اطلاعات کوانتومی ترم پاییز

جلسه ی ۳: نزدیک ترین زوج نقاط

جلسه دوم سوم چهارم: مقدمه اي بر نظریه میدان

تحلیل الگوریتم پیدا کردن ماکزیمم

جلسه 28. فرض کنید که m نسخه مستقل یک حالت محض دلخواه

مدار معادل تونن و نورتن

جلسه 16 نظریه اطلاعات کوانتمی 1 ترم پاییز

1) { } 6) {, } {{, }} 2) {{ }} 7 ) { } 3) { } { } 8) { } 4) {{, }} 9) { } { }

ﯽﺳﻮﻃ ﺮﯿﺼﻧ ﻪﺟاﻮﺧ ﯽﺘﻌﻨﺻ هﺎﮕﺸﻧاد

فصل چهارم : مولتی ویبراتورهای ترانزیستوری مقدمه: فیدبک مثبت

دانشکده ی علوم ریاضی جلسه ی ۵: چند مثال

مثال( مساله الپالس در ناحیه داده شده را حل کنید. u(x,0)=f(x) f(x) حل: به کمک جداسازی متغیرها: ثابت = k. u(x,y)=x(x)y(y) X"Y=-XY" X" X" kx = 0

تلفات خط انتقال ابررسی یک شبکة قدرت با 2 به شبکة شکل زیر توجه کنید. ژنراتور فرضیات شبکه: میباشد. تلفات خط انتقال با مربع توان انتقالی متناسب

شاخصهای پراکندگی دامنهی تغییرات:

عنوان: رمزگذاري جستجوپذیر متقارن پویا

معادلهی مشخصه(کمکی) آن است. در اینجا سه وضعیت متفاوت برای ریشههای معادله مشخصه رخ میدهد:

هادي ويسي. دانشگاه تهران - دانشکده علوم و فنون نوين نیم سال اول

( )= ( ) ( ) ( 1) ( d) d w و ( ) =

6- روش های گرادیان مبنا< سر فصل مطالب

تخمین با معیار مربع خطا: حالت صفر: X: مکان هواپیما بدون مشاهده X را تخمین بزنیم. بهترین تخمین مقداری است که متوسط مربع خطا مینیمم باشد:

آزمون مقایسه میانگین های دو جامعه )نمونه های بزرگ(

جلسه ی ۴: تحلیل مجانبی الگوریتم ها

Angle Resolved Photoemission Spectroscopy (ARPES)

محاسبات کوانتمی 1 علم ساخت و استفاده از کامپیوتري است که بر پایه ي اصول مکانیک کوانتم قرار گرفته است.

جلسه ی ۵: حل روابط بازگشتی

تئوری جامع ماشین بخش سوم جهت سادگی بحث یک ماشین سنکرون دو قطبی از نوع قطب برجسته مطالعه میشود.

به نام خدا. الف( توضیح دهید چرا از این تکنیک استفاده میشود چرا تحلیل را روی کل سیگنال x[n] انجام نمیدهیم

جلسه ی ۲۴: ماشین تورینگ

اراي ه روشی جدید جهت تشخیص فاز خطا در خطوط جبرانشده با STATCOM

حفاظت مقایسه فاز خطوط انتقال جبرانشده سري.

تمرینات درس ریاض عموم ٢. r(t) = (a cos t, b sin t), ٠ t ٢π. cos ٢ t sin tdt = ka۴. x = ١ ka ۴. m ٣ = ٢a. κds باشد. حاصل x٢

دبیرستان غیر دولتی موحد

هدف از این آزمایش آشنایی با رفتار فرکانسی مدارهاي مرتبه اول نحوه تأثیر مقادیر عناصر در این رفتار مشاهده پاسخ دامنه

تابع هزینه حداقل میانگین مربعات توأم با حداقل واریانس خطا

همبستگی و رگرسیون در این مبحث هدف بررسی وجود یک رابطه بین دو یا چند متغیر می باشد لذا هدف اصلی این است که آیا بین

قاعده زنجیره ای برای مشتقات جزي ی (حالت اول) :

طراحی و تجزیه و تحلیل کنترل کننده منطق فازي براي کنترل فرکانس بار در سیستم هاي قدرت

سايت ويژه رياضيات درسنامه ها و جزوه هاي دروس رياضيات

مسائل. 2 = (20)2 (1.96) 2 (5) 2 = 61.5 بنابراین اندازه ی نمونه الزم باید حداقل 62=n باشد.

بسم اهلل الرحمن الرحیم آزمایشگاه فیزیک )2( shimiomd

- - - کارکرد نادرست کنتور ها صدور اشتباه قبض برق روشنایی معابر با توجه به در دسترس نبودن آمار و اطلاعات دقیق و مناسبی از تلفات غیر تاسیساتی و همچنین ب

هندسه تحلیلی و جبر خطی ( خط و صفحه )

شبکه های عصبی در کنترل

ﺶﯾ : ﺎﻣزآ مﺎﺠﻧا ﺦﯾرﺎﺗ

مدلسازي انتشار ترك انشعابی زیرنافذهاي کند در سنگ با استفاده از روش المان مرزي نامحدود

مقدمه در این فصل با مدل ارتعاشی خودرو آشنا میشویم. رفتار ارتعاشی به فرکانسهای طبیعی و مود شیپهای خودرو بستگی دارد. این مبحث به میزان افزایش راحتی

OFDM ﻢﺘﺴﯿﺳ ﯽﻫدزﺎﺑ ﺮﺑ لﺎﻧﺎﮐﺮﯿﺧﺎﺗ هﺮﺘﺴﮔ ﺮﯿﺛﺎﺗ

ICME Computed Torque Control

فهرست مطالب جزوه ی فصل اول مدارهای الکتریکی مفاهیم ولتاژ افت ولتاژ و اختالف پتانسیل تحلیل مدار به روش جریان حلقه... 22

ویرایشسال 95 شیمیمعدنی تقارن رضافالحتی

نحوه سیم بندي استاتورآلترناتور

بررسی خرابی در سازه ها با استفاده از نمودارهاي تابع پاسخ فرکانس مجتبی خمسه

ارزیابی نسبت حداکثرتغییر مکان غیرالاستیک به الاستیک در رابطه تغییر مکان هدف در تحت شتاب نگاشتهاي ایران و شتاب نگاشت هاي مصنوعی

دانشکده علوم ریاضی دانشگاه گیلان آزمون پایان ترم درس: هندسه منیفلد 1 باشد. دهید.f (gx) = (gof 1 )f X شده باشند سوالات بخش میان ترم

پیشنهاد پروژه کارشناسی ارشد گروه مخابرات سیستم عنوان پروژه:

فصل پنجم زبان های فارغ از متن

مارکوف 1.مقدمه: سید مهدی صفوی محمد میکاییلی محمد پویان چکیده ما با مطالعه مدل مخفی میدان تصادفی مارکوف از الگوریتم EM

بسمه تعالی «تمرین شماره یک»

فصل دهم: همبستگی و رگرسیون

کنترل جریان موتور سوي یچ رلوکتانس در سرعت هاي بالا بر مبناي back-emf

هﺪﻧﻮﺷاﺮﯿﻣ DC ﻪﻔﻟﻮﻣ فﺬﺣ ﺎﺑ ژﺎﺘﻟو ﺶﻫﺎﮐ ﻊﺒﻨﻣ عﻮﻧ و ﯽﺒﺴﻧ ﻞﺤﻣ ﺺﯿﺨﺸﺗ

مقایسه کارایی آنالیز مولفه های اصلی و تبدیل کسینوسی گسسته در شناسایی چهره با استفاده از تبدیل موجک و ماشین بردار پشتیبان

ˆ ˆ ˆ. r A. Axyz ( ) ( Axyz. r r r ( )

Delaunay Triangulations محیا بهلولی پاییز 93

1 دایره فصل او ل کاربردهای بسیاری داشته است. یک قضیۀ بنیادی در هندسه موسوم با محیط ثابت دایره دارای بیشترین مساحت است. این موضوع در طراحی

Spacecraft thermal control handbook. Space mission analysis and design. Cubesat, Thermal control system

مقدمه الف) مبدلهای AC/DC ب) مبدلهای DC/AC ج) مبدلهای AC/AC د) چاپرها. (Rectifiers) (Inverters) (Converters) (Choppers) Version 1.0

بهینه سازي تقطیع تصویر مبتنی بر گراف با استفاده از الگوریتم رقابت استعماري

هندسه تحلیلی بردارها در فضای R

جلسه ی ۱۸: درهم سازی سرتاسری - درخت جست و جوی دودویی

تمرین اول درس کامپایلر

مکانيک جامدات ارائه و تحليل روش مناسب جهت افزایش استحکام اتصاالت چسبي در حالت حجم چسب یکسان

فناوري اطلاعات و ارتباطات ایران

جریان نامی...

Nonparametric Shewhart-Type Signed-Rank Control Chart with Variable Sampling Interval

هدف آزمایش: مطالعه طیف اتم هیدروژن و بدست آوردن ثابت ریدبرگ مقدمه: ثابت پلانگ تقسیم بر 2 است. است که در حالت تعادل برابر نیروي جانب مرکز است.

تجزیهی بندرز مقدمه کشور هستند. بدین سبب این محدودیتهای مشترک را محدودیتهای پیچیده

نویسنده: محمدرضا تیموری محمد نصری مدرس: دکتر پرورش خالصۀ موضوع درس سیستم های مینیمم فاز: به نام خدا

Answers to Problem Set 5

Support Vector Machines: A survey

طرح یافتن مکان خطا در خطوط انتقال چندترمینالی با استفاده از اندازه گیریهای ناهمگام )آسنکرون(

یونیزاسیون اشعهX مقدار مو ثر یونی را = تعریف میکنیم و ظرفیت مو ثر یونی نسبت مقدار مو ثر یونی به زمان تابش هدف آزمایش: مقدمه:

Transcript:

پروژه یازدهم: ماشین هاي بردار پشتیبان 1 عموما براي مسایلی که در آنها دو دسته وجود دارد استفاده میشوند اما ماشین هاي بردار پشتیبان روشهاي متفاوتی براي ترکیب چند SVM و ایجاد یک الگوریتم دستهبندي چند کلاس پیشنهاد شده است. در این الگوریتم دستهبندي دو صفحه در مرز دو کلاس دادهها قرار گرفته میشود و مسي له یافتن مرز حداکثري بین این دو صفحه و در نتیجه بین دو دسته دادهها میباشد. به این صورت که دو صفحه آنقدر از هم دور شوند که به دادهها برخورد کنند. همانطور که در شکل نشان داده شده است هدف یافتن دو صفحهاي است که بیشترین فاصله را دارد و در نتیجه صفحه بین این دو صفحه بهترین جداکننده خواهند بود. شکل : قرار گرفتن صفحات در ماشین بردار پشتیبان ماشین بردار پشتیبان دسته بندي است که جزء شاخه روشهاي هستهاي در یادگیري ماشین محسوب میشوند. SVM از دقت تعمیمدهی بالایی برخوردار است. از کاربردهاي SVM میتوان به تشخیص اشاره کرد. ایده اصلی در SVM این است که با فرض جداپذیري خطی کلاسها از هم ابرصفحاتی که قادر به جدانمودن کلاسها از هم باشند را بدست میآورد. در مسایلی که دادهها به صورت خطی جداپذیر نباشند با استفاده از هستههاي غیرخطی دادهها را به فضاي با ابعاد بیشتر نگاشت میدهیم تا بتوان آنها را در این فضاي جدید به صورت خطی جدا نمود. براي SVM از هستههاي متفاوتی میتوان استفاده نمود مانند RBF و LINEAR که در این پروژه از RBF استفاده میکنیم. Support vector machine

شکل : نحوه اعمال کرنل در SVM همانطور که در شکل نشان داده شده است با استفاده از هسته θ(x) نمونههاي ورودي به فضایی جدید نگاشت داده میشوند که در این فضا نمونهها به صورت خطی قابل جداسازي باشند. شکل حوه انتقال از فضاي دو بعدي با استفاده از کرنل تي وريهایی بر مبناي ابعاد VC وجود دارند که اثبات میکنند SVM در کاهش خطاي تعمیم مفید است. البته استفاده تجربی از این روش در حیطههاي مختلف نشان دهنده این است که این روش کارایی خیلی خوبی دارد. الگوریتم SVM قدرت تعمیم خوبی به روش خواهد داد و از بیش از اندازه متناسب شدن به علت در نظر گرفتن بیشترین مرز تا حد زیادي پرهیز میکند.

ماشینهاي بردار پشتیبان با اراي ه یک مدل آماري به عنوان یکی از شناختهشدهترین روشها در زمینه دستهبندي دادهها مطرح است. یکی از مساي لی که در اراي ه یک ماشین دستهبندي کننده غیرخطی بردار پشتیبان با آن مواجه هستیم نحوه تعریف هسته و پارامترهاي مرتبط با آن است. دسته شناخته شدهاي از توابع هسته همچون هسته چندجملهاي گوسی و سیگموي ید معرفی شدهاند که نیازمند تنظیم شدن پارامترها جهت کارایی مطلوب هستند. روش کمینه سازي مینیمال ترتیبی یکی از روشهاي شناخته شده جهت آموزش این ماشین دستهبندي در یک زمان مطلوب میباشد. بیش از عمل دستهبندي در این بخش در ابتدا در مورد نحوه آمادهسازي سندهاي خام براي ایجاد یک ماتریس نمونه ویژگی صحبت خواهیم کرد. ماتریس سند کلمه یک ماتریس بسیار بزرگ و تنگ است. سپس به مکانیزمهایی چون انتخاب و استخراج ویژگی براي کاهش پیچیدگی محاسباتی و کاهش نویز نیاز داریم. سپس به معرفی تعدادي معیار براي ارزیابی دستهبنديکنندههاي متون میپردازیم تا بتوانیم براساس آن نسبت به عملکرد دستهبنديکنندههاي مختلف قضاوت کنیم. ماشینهاي بردار پشتیبان در حالت چندکلاسه ماشینهاي بردار پشتیبان در حقیقت طبقهبنديکنندههاي دوکلاسه هستند. در بسیاري از کاربردها از جمله طبقهبندي واکهها نیاز به روشهاي طبقهبندي چندکلاسه میباشد. براي تعمیم ماشینهاي بردار پشتیبان به حالت چندکلاسه روشهاي مختلفی وجود دارد. معمولا با توجه به شرایط مسا له تعداد کلاسها و میزان دادههاي آموزشی روش مناسب انتخاب میشود. در ادامه به دو روش متداول براي تعمیم ماشینهاي بردار پشتیبان به حالت چندکلاسه اشاره خواهیم کرد. روش یکی در مقابل همه در این روش هر کلاس در مقابل سایر کلاسها آموزش داده میشود. به دادههاي مربوط به خود کلاس برچسب 1+ و دادههاي سایر کلاسها برچسب 1- نسبت داده میشود. اگر تعداد کلاسها N باشد N ماشین بردار پشتیبان آموزش داده میشود که هر یک متناظر با یکی از کلاسها میباشد. پس از آموزش کلاسها در مرحله تست هر یک از نمونههاي تست به تمامی N ماشین بردار پشتیبان ااعمال میشود کلاس برنده کلاسی است که SVM ان بیشترین میزان خروجی را داشته باشد. در صورت زیاد بودن دادههاي آموزشی و تعداد کلاسها زمان آموزش ماشین بردار پشتیبان طولانی خواهد بود.

روش یکی در مقابل یکی در این روش هر ماشین بردار پشتیبان براي تمایز یک کلاس در مقابل یک کلاس دیگر آموزش میبیند. ي ر مجموعه آموزشی به دادههاي کلاس موردنظر برچسب 1+ و به دادههاي کلاس دیگر برچسب 1- داده میشود. بنابراین اگر تعداد کلاسها N باشد N(N-1)/2 ماشین بردار پشتیبان باید آموزش داده شود. تعداد ماشینهاي بردار پشتیبان در این روش نسبت به روش یکی در مقابل همه بسیار بیشتر است اما مجموعه آموزشی هر ماشین بردار پشتیبان در مقایسه با روش قبل کوچکتر است (فقط دادههاي دو کلاس را شامل میشود) در فاز تست هر یک از نمونههاي تست به تمامی N(N-1)/2 ماشین بردار پشتیبان اعمال میشود. اگر SVM مربوط به جفت کلاس ij نمونه تست را متعلق به کلاس i بداند درجه کلاس i یک واحد افزایش مییابد در غیر اینصورت درجه کلاس j یک واحد افزایش خواهد یافت. پس از اعمال نمونه تست به کلیه کلاسها کلاسی که داراي بالاترین درجه باشد به عنوان کلاس برنده انتخاب میشود. در صورتی که دو کلاس داراي درجه برابر باشند کلاسی که اندیس کوچکتري دارد انتخاب میشود. نکات تمام مولفههاي بردارهاي ویژگی در یک محدوده خاص نرمالیزه شوند. از همان روشی که براي نرمالیزاسیون دادههاي آموزشی استفاده میشود باید براي دادههاي تست نیز استفاده شود. روش Cross-Validation در توابع RBF تنها پارامتري که باید تعیین شود پارامتر γ میباشد. هدف این است که مقادیر بهینه دو پارامتر C و γ براي کاربرد موردنظر مشخص شود به گونهاي که ماشین بتواند دادههاي نامعلوم تست) را با دقت خوبی پیشگویی کند. ) مثلا دادههاي باید توجه کرد که لزوما دستیابی به درصد صحت بالا در دادههاي آموزش براي رسیدن به این هدف مفید نمیباشد. بنابراین یک روش معمول این است که دادههاي آموزش به دو سمت در نظر گرفته شود. یک سمت براي آموزش سیستم استفاده شود و سمت دیگر براي ارزیابی سیستم مورد استفاده قرار گیرد. درصد صحت اندازهگیري شده در این قسمت میتواند معیار خوبی براي ارزیابی سیستم مورد استفاده قرار گیرد. درصد صحت اندازهگیري شده در این قسمت میتواند معیار خوبی براي ارزیابی عملکرد سیستم هنگام پیشگویی دادههاي نامعلوم باشد. شیوه پیشرفته این ایده cross- روش validation میباشد. در روش vتایی cross-validation ابتدا دادههاي آموزش به v زیرمجموعه مساوي تقسیم میشوند. 1-v زیرمجموعه براي آموزش استفاده میشوند و یک مجموعه براي ارزیابی عملکرد سیستم مورد استفاده قرار

میگیرد. این عمل vبار تکرار میشود و در هر بار یک زیرمجموعه به عنوان زیرمجموعه ارزیابی در نظر گرفته میشود. به این ترتیب تمام دادههاي آموزشی یک بار براي ارزیابی استفاده میشوند. این روش از مسا له over fitting جلوگیري میکند. در شکل این مسا له نشان داده شده است. دایره و مثاثهاي توپر به عنوان دادههاي آموزش و توخالی به عنوان دادههاي تست در نظر گرفته شدهاند. در شکل a مسا له over fitting رخ داده است بنابراین با وجود اینکه خطا در دادههاي آموزش صفر میباشد درصد صحت روي دادههاي تست خوب نیست. حال اگر دادههاي b را به عنوان زیرمجموعه ارزیابی استفاده کنیم ملاحظه میشود که عملکرد سیستم در دادههاي تست بهتر میشود. تبدیل خروجی SVM به احتمال یکی از مشکلات این است که خروجی SVM یک فاصله است که براي مقایسه طبقهبنديکنندهها استفاده میشود. اما اکثر کاربردهاي پردازش سیگنالی نیاز به احتمال posterior دارند. این مشکل به ویژه در بازشناسی گفتار مهم است به دلیل اینکه همپوشانی قابل ملاحظهاي در فضاي ویژگی وجود دارد مشکل این است که یک رابطه مستقیم بین فاصله از حاشیه و احتمال posterior کلاس وجود ندارد. یک روش بسیار ساده استفاده از هسیتوگرام خروجی SVM است. در شکل هیستوگرام خورجی SVM براي نمونههاي مثبت و منفی با استفاده از روش CV نشان داده شده است. یک روش دیگر که در بسیاري از مقالات به آن اشاره شده استفاده از تابع توزیع سگیامیوي یدي به صورت زیر P y = 1 f = 1 1 + exp(af + B) نکته: هر چه پارامتر C بزرگتر انتخاب شود خطاي آموزش کمتر خواهد شد اما در عوض قدرت تعمیمدهی ماشین نیز کمتر میشود. پارامتر γ در واقع عکس واریانس تابع RBF است انتخاب مقادیر بزرگ براي این پارامتر موجب میشود خطاي آموزش کمتر شود اما قدرت تعمیمدهی سیستم نیز پایین میآید. بنابراین براي ایجاد مصالحه میان قدرت تمایز و قدرت تعمیمدهی باید مقادیر میانهاي براي این پارامترها انتخاب شود. از روش cross-validation براي تعیین مقادیر بهینه γ و C استفاده میشود.