درهم سازی سید مهدی وحیدی پور ارایه سوم: درهمسازی روشها و کاربردها

Σχετικά έγγραφα
محاسبه ی برآیند بردارها به روش تحلیلی

روش محاسبه ی توان منابع جریان و منابع ولتاژ

جلسه ی ۱۰: الگوریتم مرتب سازی سریع

تصاویر استریوگرافی.

مثال( مساله الپالس در ناحیه داده شده را حل کنید. u(x,0)=f(x) f(x) حل: به کمک جداسازی متغیرها: ثابت = k. u(x,y)=x(x)y(y) X"Y=-XY" X" X" kx = 0

آزمایش 8: تقویت کننده عملیاتی 2

جلسه ی ۱۸: درهم سازی سرتاسری - درخت جست و جوی دودویی

آزمایش 1: پاسخ فرکانسی تقویتکننده امیتر مشترك

مدار معادل تونن و نورتن

1) { } 6) {, } {{, }} 2) {{ }} 7 ) { } 3) { } { } 8) { } 4) {{, }} 9) { } { }

تحلیل مدار به روش جریان حلقه

آزمون مقایسه میانگین های دو جامعه )نمونه های بزرگ(

جلسه ی ۵: حل روابط بازگشتی

مفاهیم ولتاژ افت ولتاژ و اختالف پتانسیل

جلسه 3 ابتدا نکته اي در مورد عمل توابع بر روي ماتریس ها گفته می شود و در ادامه ي این جلسه اصول مکانیک کوانتمی بیان. d 1. i=0. i=0. λ 2 i v i v i.

جلسه ی ۲۴: ماشین تورینگ

شاخصهای پراکندگی دامنهی تغییرات:

هو الحق دانشکده ي مهندسی کامپیوتر جلسه هفتم

قاعده زنجیره ای برای مشتقات جزي ی (حالت اول) :

Angle Resolved Photoemission Spectroscopy (ARPES)

جلسه ی ۴: تحلیل مجانبی الگوریتم ها

فصل چهارم : مولتی ویبراتورهای ترانزیستوری مقدمه: فیدبک مثبت

همبستگی و رگرسیون در این مبحث هدف بررسی وجود یک رابطه بین دو یا چند متغیر می باشد لذا هدف اصلی این است که آیا بین

ﻞﻜﺷ V لﺎﺼﺗا ﺎﻳ زﺎﺑ ﺚﻠﺜﻣ لﺎﺼﺗا هﺎﮕﺸﻧاد نﺎﺷﺎﻛ / دﻮﺷ

جلسه 12 به صورت دنباله اي از,0 1 نمایش داده شده اند در حین محاسبه ممکن است با خطا مواجه شده و یکی از بیت هاي آن. p 1

دانشکده ی علوم ریاضی جلسه ی ۵: چند مثال

جلسه ی ۳: نزدیک ترین زوج نقاط

جلسه دوم سوم چهارم: مقدمه اي بر نظریه میدان

جلسه 9 1 مدل جعبه-سیاه یا جستاري. 2 الگوریتم جستجوي Grover 1.2 مسا له 2.2 مقدمات محاسبات کوانتمی (22671) ترم بهار

جلسه 22 1 نامساویهایی در مورد اثر ماتریس ها تي وري اطلاعات کوانتومی ترم پاییز

جلسه 14 را نیز تعریف کرد. عملگري که به دنبال آن هستیم باید ماتریس چگالی مربوط به یک توزیع را به ماتریس چگالی مربوط به توزیع حاشیه اي آن ببرد.

هر عملگرجبر رابطه ای روی يک يا دو رابطه به عنوان ورودی عمل کرده و يک رابطه جديد را به عنوان نتيجه توليد می کنند.

ﯽﺳﻮﻃ ﺮﯿﺼﻧ ﻪﺟاﻮﺧ ﯽﺘﻌﻨﺻ هﺎﮕﺸﻧاد

جلسه 28. فرض کنید که m نسخه مستقل یک حالت محض دلخواه

عنوان: رمزگذاري جستجوپذیر متقارن پویا

بسم اهلل الرحمن الرحیم آزمایشگاه فیزیک )2( shimiomd

تئوری جامع ماشین بخش سوم جهت سادگی بحث یک ماشین سنکرون دو قطبی از نوع قطب برجسته مطالعه میشود.

تمرین اول درس کامپایلر

Top Down Parsing LL(1) Narges S. Bathaeian

یدنب هشوخ یاه متیروگلا

ویرایشسال 95 شیمیمعدنی تقارن رضافالحتی

تلفات خط انتقال ابررسی یک شبکة قدرت با 2 به شبکة شکل زیر توجه کنید. ژنراتور فرضیات شبکه: میباشد. تلفات خط انتقال با مربع توان انتقالی متناسب

ﻴﻓ ﯽﺗﺎﻘﻴﻘﺤﺗ و ﯽهﺎﮕﺸﻳﺎﻣزﺁ تاﺰﻴﻬﺠﺗ ﻩﺪﻨﻨﮐ

تخمین با معیار مربع خطا: حالت صفر: X: مکان هواپیما بدون مشاهده X را تخمین بزنیم. بهترین تخمین مقداری است که متوسط مربع خطا مینیمم باشد:

پروژه یازدهم: ماشین هاي بردار پشتیبان

سلسله مزاتب سبان مقدمه فصل : زبان های فارغ از متن زبان های منظم

جلسه 16 نظریه اطلاعات کوانتمی 1 ترم پاییز

تمرینات درس ریاض عموم ٢. r(t) = (a cos t, b sin t), ٠ t ٢π. cos ٢ t sin tdt = ka۴. x = ١ ka ۴. m ٣ = ٢a. κds باشد. حاصل x٢

محاسبات کوانتمی 1 علم ساخت و استفاده از کامپیوتري است که بر پایه ي اصول مکانیک کوانتم قرار گرفته است.

Delaunay Triangulations محیا بهلولی پاییز 93

جلسه 15 1 اثر و اثر جزي ی نظریه ي اطلاعات کوانتومی 1 ترم پاي یز جدایی پذیر باشد یعنی:

هندسه تحلیلی بردارها در فضای R

جلسه 2 جهت تعریف یک فضاي برداري نیازمند یک میدان 2 هستیم. یک میدان مجموعه اي از اعداد یا اسکالر ها به همراه اعمال

Spacecraft thermal control handbook. Space mission analysis and design. Cubesat, Thermal control system

Beta Coefficient نویسنده : محمد حق وردی

به نام خدا. الف( توضیح دهید چرا از این تکنیک استفاده میشود چرا تحلیل را روی کل سیگنال x[n] انجام نمیدهیم

سايت ويژه رياضيات درسنامه ها و جزوه هاي دروس رياضيات

1 دایره فصل او ل کاربردهای بسیاری داشته است. یک قضیۀ بنیادی در هندسه موسوم با محیط ثابت دایره دارای بیشترین مساحت است. این موضوع در طراحی

دبیرستان غیر دولتی موحد

جلسه 2 1 فضاي برداري محاسبات کوانتمی (22671) ترم بهار

فصل سوم جریان های الکتریکی و مدارهای جریان مستقیم جریان الکتریکی

فصل دهم: همبستگی و رگرسیون

تحلیل الگوریتم پیدا کردن ماکزیمم

فهرست جزوه ی فصل دوم مدارهای الکتریکی ( بردارها(

در اين آزمايش ابتدا راهاندازي موتور القايي روتور سيمپيچي شده سه فاز با مقاومتهاي روتور مختلف صورت گرفته و س سپ مشخصه گشتاور سرعت آن رسم ميشود.

تعیین محل قرار گیری رله ها در شبکه های سلولی چندگانه تقسیم کد

باشند و c عددی ثابت باشد آنگاه تابع های زیر نیز در a پیوسته اند. به شرطی که g(a) 0 f g

معادلهی مشخصه(کمکی) آن است. در اینجا سه وضعیت متفاوت برای ریشههای معادله مشخصه رخ میدهد:

Answers to Problem Set 5

پایگاه داده جلسه 8 محمد علی فرجیان مدرس :محمد علی فرجیان 1

يﺎﻫ ﻢﺘﻳرﻮﮕﻟا و ﺎﻫ ﺖﺧرد فاﺮﮔ ﻲﻤﺘﻳرﻮﮕﻟا ﻪﻳﺮﻈﻧ :سرد ﻲﺘﺸﻬﺑ ﺪﻴﻬﺷ هﺎﮕﺸﻧاد ﺮﺗﻮﻴﭙﻣﺎﻛ مﻮﻠﻋ هوﺮﮔ ﻪﻴﻟوا ﺞﻳﺎﺘﻧ و ﺎﻫﻒ ﻳﺮﻌﺗ

برخوردها دو دسته اند : 1) كشسان 2) ناكشسان

فهرست مطالب جزوه ی فصل اول مدارهای الکتریکی مفاهیم ولتاژ افت ولتاژ و اختالف پتانسیل تحلیل مدار به روش جریان حلقه... 22

هادي ويسي. دانشگاه تهران - دانشکده علوم و فنون نوين نیم سال اول

فصل 5 :اصل گسترش و اعداد فازی

1- مقدمه ای بر شبیه سازی< سر فصل مطالب

نظریه زبان ها و ماشین ها

هدف از این آزمایش آشنایی با رفتار فرکانسی مدارهاي مرتبه اول نحوه تأثیر مقادیر عناصر در این رفتار مشاهده پاسخ دامنه

6- روش های گرادیان مبنا< سر فصل مطالب


آشنایی با پدیده ماره (moiré)

فصل پنجم زبان های فارغ از متن

e r 4πε o m.j /C 2 =

تئوری رفتار مصرف کننده : می گیریم. فرض اول: فرض دوم: فرض سوم: فرض چهارم: برای بیان تئوری رفتار مصرف کننده ابتدا چهار فرض زیر را در نظر

راهنمای کاربری موتور بنزینی )سیکل اتو(

مسائل. 2 = (20)2 (1.96) 2 (5) 2 = 61.5 بنابراین اندازه ی نمونه الزم باید حداقل 62=n باشد.

تجزیهی بندرز مقدمه کشور هستند. بدین سبب این محدودیتهای مشترک را محدودیتهای پیچیده

فصل اول هدف های رفتاری: پس از پایان این فصل از هنرجو انتظار می رود: 5 روش های اجرای دستور را توضیح دهد. 6 نوارهای ابزار را توصیف کند.

ارزیابی بهره وری متقاطع DEA بر پایه بهبود پارتو

آموزش SPSS مقدماتی و پیشرفته مدیریت آمار و فناوری اطالعات -

به نام خدا. Sparse Coding ستاره فرامرزپور

فعالیت = ) ( )10 6 ( 8 = )-4( 3 * )-5( 3 = ) ( ) ( )-36( = m n m+ m n. m m m. m n mn

جلسه ی ۱۱: درخت دودویی هرم

هدف:.100 مقاومت: خازن: ترانزيستور: پتانسيومتر:

این اسالید ها بر مبنای نکات مطرح شده در فرادرس تهیه شده است. faradars.org/fvsft106

3 لصف یربج یاه ترابع و ایوگ یاه ناوت

+ Δ o. A g B g A B g H. o 3 ( ) ( ) ( ) ; 436. A B g A g B g HA است. H H برابر

1 ﺶﻳﺎﻣزآ ﻢﻫا نﻮﻧﺎﻗ ﻲﺳرﺮﺑ

پردازش تصاویر دیجیتالی سید علی اصغر بهشتی شیرازی

مقدمه در این فصل با مدل ارتعاشی خودرو آشنا میشویم. رفتار ارتعاشی به فرکانسهای طبیعی و مود شیپهای خودرو بستگی دارد. این مبحث به میزان افزایش راحتی

Transcript:

درهم سازی سید مهدی وحیدی پور ارایه سوم: درهمسازی روشها و کاربردها

درهم سازی درهم سازی تابع h(k) است که کلید k بازیابي رکوردها استفاده ميشود. را به یك آدرس انتقال مي دهد. از این آدرس به عنوان مبنایي برای ذخیره و رکورد آدرس k=lowellکلید 1 به آدرس 4 آدرس خانگي گفته مي شود. 2 h(k) 3 آدرس 4 4 LOWELL 5

تفاوت درهم سازی و انديس سازی آدرسهای به دست آمده از درهم سازی تصادفي هستند. با درهم سازی دو کلید مختف ممكن است به یك آدرس انتقال داده شوند.که در آن صورت برخورد( Collision ) مي دهد. رخ

چندين روش مختلف برای كاهش تعداد برخوردها پراكنده كردن ركوردها بتوانیم الگوریتمي پیدا کنیم که رکوردها را به صورت تصادفي و پراکنده بین آدرس ها توزیع کند که تعداد زیادی ازرکوردها در اطراف یك آدرس مشخص تجمع نكند. استفاده از حافظه اضافي در مقابل تعداد رکورد از حافظه بیشتری کمك مي گیریم که پیدا کردن الگوریتم در هم سازی سادهتر باشد. قرار دادن بيشتر از يك ركورد دريك آدرس فایل به اندازه کافي بزرگ باشد تا چندین رکورد را در خود ذخیره کند. به آدرس هایي که چندین رکورد را نگهداری مي کنند باکت گفته مي شود.

1 2 3 4 5 6 7 8 1 2 3 4 5 6 7 8 1 2 3 4 5 6 7 8 A B C D E F G A B C D E F G A B C D E F G نیرتهب دروکر سردآ دروکر سردآ دروکر سردآ نیرتدب لوبق لباق اه سردآ نيب رد اهدروكر عيزوت

روش های درهم سازی جستجو در كليد براي يافتن يك الگو: اگر استفاده را نشان دهد. ميتوان از تابع درهمسازی بعضي از قسمتهای یك کلید یك الگو واقعي قابل استفاده کرد که آن بخش از کلید را استخراج کند. از کلید استخراج آنها را به و سپس مي کند تا كردن قسمت هايي از كليد: عددهایي را از قسمتهایي به هم اضافه ميکند. این روش الگوهای اولیه را خراب ميکند. اندازه آدرس را بر یك عدد تقسیم و از مي کنیم باقیمانده ی آن استفاده تقسيم يك كليد بر يك عدد: ميکنیم. مجذور كردن كليد و گرفتن عدد مياني تبديل مبنا

پيش بينی توزيع ركوردها P(x)= (r/n)x e -(r/n) X! توزيع پواسون N تعداد ادرسهای موجود R تعداد رکوردهایي که باید ذخیره شوند. X تعداد رکوردهایي که به یك ادرس مشخص اختصاص داده شدهاند. P(0) = 10 e -1 0! P(1) = 11 e -1 1! P(2) = 12 e -1 2! =0.368 =0.368 =0.184 احتمال اینكه هیچ کلیدی در یك ادرس مشخص درهم سازی نشود: احتمال اینكه دقیقا یك دو یا سه کلید در یك ادرس مشخص در هم سازی شوند: P(3) = 10 3 e -1 3! =0.061

دانسيته فشردگی تعداد رکورد ها تعداد فضا دانسیته فشردگي =R/N= اندازه فضای استفاده شده در فایل را نشان مي دهد و تنها راه تخمین کارایي محیط درهم سازی است.

دانسيته فشردگی- ادامه اثر اگر دانسیته فشردگي 50 درصد باشد وهر ادرس تنها قادر باشد یك رکورد را در خود ذخیره کند انتظار داریم که 21 درصد تعداد کل رکورد ها در جایي غیر از ادرس خانگي خودشان ذخیره شوند. دانسیته فشردگي نسبت به رکورد هایي که در ادرس خانگي خود ذخیره نشده اند: مترادف ها به صورت درصدی از رکوردها دانسیته فشردگي)درصد( 10 30 50 70 80 90 100 از تابع پواسون و دانسيته نتيجه ميشود كه برخورد اجتناب ناپذير است در نتيجه بايد به روشهاي رفع برخورد بيانديشيم. 4.8 13.6 21.4 28.1 31.2 34.1 36.8

روش های رفع برخورد online )کلید موجود نیست( ادرس باز خطي درجه دوم دوگانه دامنه محدود روشهای کاهش تعداد برخوردها توزیع رکورد ها بین ادرس ها.1 زنجیره ای انواع روشهای درهمسازی Offline.2 )کلید موجود 1 ست( perfect )بدون تصادم( minimal perfect preserving order MPHF توزیع پواسون و دانسیته فشردگي ذخیره کردن بیشتر از یك رکورد در هر ادرس)باکت( پیوند با ناحیه سرریز جدول های پراکندگي:اندیس سازی

H l (k,i) = (h(k) +c*i) mod m, i = 0,1, فرمول کلي درهم سازی آدرس دهی باز درهم سازي خطي برای کلید k k مقدار کلید h(k) یك تابع در هم ساز ساده i نشان دهنده تعداد تكرار تولید آدرس مشكالت: 1 _خوشه بندی اولیه: به ازای مقدار ثابت c وتمام مقادیر اولیه برای تابع ( h(k,i)=h(kیك دنباله ادرس مشخص بر اساس میزان جابجایي cتولید خواهد نمود. 2 _خوشه بندی ثانویه: به ازای دو کلید مختلف kو 1 k 2 رابطه ) 2 h(k 1 )=h(k برقرار باشد در این صورت تمام ادرسهای دو دنباله یكسان خواهد بود.

درهم سازی آدرس دهی روش سرريز فزاينده باز درهم سازی خطي با 1=c اگر به یك رکورد آدرسي تخصیص داده شود که قبال توسط رکوردی بعدی مورد جستجو قرار مي گیرند تا اولین آدرس خالي پیدا شود. اشغال شده است آدرس های آدرس 2 روال درهم سازي yorkکلید 1 2 3 4 5 Novak Rosen Jasper york 6 york هنگام جستجو کلید york جستجو از آدرس 2 زیرا مي شود شروع هنوز در آدرس 2 درهم سازی مي شود.

روش های مختلف جانشين سازی FCFS :کلید قدیمي در سلول نگه داشته میشود و کلید جدید سلول های بعدی را بررسي ميکند. LCFS :کلید جدید وارد سلول میشود و کلید قدیمي سلول های دیگر را بررسي مي کند. hood Robin :در بین دو کلید کلیدی که بزرگترین تغییر مكان را دارد در سلول نگه داشته کلید دیگر سلولهای دیگر را بررسي میكند. مي شود و

درهم سازی آدرس دهی درهم سازي دوگانه باز فرمول کلي HD (k,i) = (g(k) + ih(k)) mod m k مقدار کلید h(k) و g(k) توابع درهم ساز ساده k نشان دهنده تعداد تكرار تولید آدرس برای کلید i ركورد هاي سرريز در آدرس دورتري از آدرس خانگي قرار دارند. هنگام ايجاد برخورد تابع در هم سازي ديگري روي كليد عمل ميكند. مشكالت: محلي بودن را نقض ميکند تولید آدرسهای یكسان و تكراری در دنباله های ادرس.

S. M. Vahidipour UoK درهم سازی آدرس دهی باز درهم سازي دامنه محدود به منظور استفاده از روش دامنه محدود روند زیر برای بدست آوردن آدرس کلید K در فضایي با =m p n مكان اجرا مي شود. عدد اول و 1 n. P به ازای هر کلید k دو عدد a,b را محاسبه کنید: a= k mod m, b = k mod (m-2) واضح است که روابط 0 a m-1 0 b m-2, برقرار مي شود. مجموعه S را یك مجموعه دامنه محدود ) n GF(Pمينامند. هر چند جملهای از محدوده( GF(P n را با n عدد ضریب ان نشان میدهند. =a. ( a 1-n, a 2-n,..., a 0 ) P لذا یك عدد Nرقمي در مبنای P نشان دهنده یك چند جمله ای در محدوده ) N GF(Pاست. اعداد a وb درمبنای p بر اساس محدودهی ) نشان دهندهی دو چندجملهای به نامهای (X) g k و (X) h GF(p n k مي- باشند. a= ( a n-1, a n-2,..., a 0 ) P b= ( b n-1, b n-2,..., b 0 ) P g k (X)= a n-1 X n-1 + a n-2 X n-2 + + a 0 h k (X)= b n-1 X n-1 + b n-2 X n-2 + + b 0

شماره دنباله آدرس ها که نشان دهنده ی چندمین آدرس تولیدی است را نیز در مبنای p (x) f i در فضای ) n GF(p تولید مي شود. نمایش داده و چندجمله ای i= ( i n-1, i n-2,..., i 0 ) P S. M. Vahidipour UoK درهم سازی آدرس دهی باز درهم سازي دامنه محدود f i (X)= i n-1 X n-1 + i n-2 X n-2 + + i 0 (X) GF(p n λ و با در نظر گرفتن f به عنوان چند جمله ای ثابت در فضای ) n GF(pرابطه زیر حال بر اساس قوانین حاکم بر ) نشان دهنده تابع در هم ساز جدید است. H f (k,i) = (g k (X) + f λ (X) f i (X) h k (X)) mod t(x) (k,i) H f چندجمله ای از فضای ) n GF(p مي باشد که ضرایب آن نشان دهنده عددی است در مبنای p که همان آدرس تولید شده تابع درهمساز است. t(x) چندجملهای تجزیه ناپذیر در مبنای p مانند

ذخيره كردن بيشتر از يك ركورد در يك آدرس: باكت ها گاهي ذخیرهسازی گروهي از رکوردها در بلوكها در واقع چند رکورد از آدرس مشترك دارند. بهتر از ذخیره سازی تك تك آنها است. برای جستو یك رکورد کل باکت در حافظه قرار ميشوند. رکوردهای و مي گیرد موجود در باکت جستجو حالت سرریز در باکت وجود دارد اما احتمال وقوع آن بسیار کمتر است.

حذف فایل پیچیده تر از اضافه کردن آن است زیرا: محل رکورد حذف شده نباید مانع جستجو های بعدی شود. امكان استفاده از فضای آزاد شده باید وجود داشته باشد. راه حل: استفاده از عالئم ویژه حذف ركورد Adams Jones ###### Smith

سرريز فزاينده زنجيره ای رکورد های مترادف در یك لیست پیوندی قرار ميگیرند. یعني هر آدرس خانگي حاوی عددی است که محل رکورد بعدی که در این آدرس خانگي قرار دارد مشخص ميکند. آدرس خانگي آدرس واقعي داده آدرس مترادف بعدی طول جستجو 20 20 Adams 22 1 21 21 Bates 23 1 20 22 Cole 25 2 21 23 Dean -1 2 20 24 Evans -1 1 24 25 Flint -1 3 در مزيت: هر جستجو فقط متوسط طول جستجو: 1.7 رکوردهایي که دارای کلیدهای مترادف هستند دستیابي مي شوند.

پيوند با ناحيه سرريز تمام رکورد های سرریز را به یك ناحیه سرریز منتقل مي کنیم. مجموعه آدرس های خانگي ناحيه سرريز نام دارد. ناحيه داده اصلي و مجموعه آدرس های سرریز ناحیه سرریز ناحیه داده اصلي آدرس خانگي 20 Adams 0 0 Cole 2 21 Bates 1 1 Dean -1 22 2 Flint -1 23 3 24 Evans -1

جدول های پراكندگی:انديس سازی فایل در هم سازی حاوی هیچ رکوردی نیست و فقط حاوی اشاره گرهایي به رکوردهاست. این فایل مانند یك اندیس است که توسط درهم سازی جستجو ميشود. 20 21 22 23 24 Adams Bates Evans Cole Dean