طبیعة وأنواع البیانات Nature and Types of Data طبیعة البیانات Nature of Data یقصد بطبیعة البیانات في هذه الحالة أنواع المتغیرات ومستویات قیاسها. من الضروري للباحث أن یحدد نوع المتغیر الذي یقوم بدراسته قبل عمل أي تحلیل إحصاي ي فنوع المتغیر له علاقة بنوع التحلیل الا حصاي ي الذي یرید استخدامه الباحث وان أي إخلال بذلك یؤثر على الافتراضات الا ساسیة الخاصة بكل تحلیل إحصاي ي ویؤدى إلى خلل كبیر في نتاي ج التحلیل الا حصاي ي. وتنقسم المتغیرات عند قیاسها إلى أربعة أنواع ري یسة وهي: المتغیرات الاسمیة الترتیبیة الفتریة والنسبیة. سنتناول فیما یلي تفاصیل كل منها..4. المتغیرات الاسمیة Nominal Variables إن القیم الخاصة بالمتغیر الاسمي تختلف عن بعضها البعض في النوعیة لا في الكمیة ومن الممكن أن تكون التصنیفات عبارة عن الا نواع المختلفة لظاهرة ما ویسمى مستوى القیاس هنا " القیاس التصنیفي أو الا سمى" لا نه یتم تصنیف الا شیاء إلى في ات على أساس تجانسها في خاصیة أو صفة معینة. وتستخدم الا عداد لتحدید هویة المفردات وفى هذه الحالة لا یكون للعدد ذلك المدلول الكمي الذي یفهم منه عادة. مثلا: یمكننا استعمال العددین لیدلا على متغیر الجنس فنجعل الصفر لیدل على الذكر والعدد یدل على الا نثى نلاحظ أن العددین لا یدلان على القیم العددیة ولذلك لا ت جرى علیها العملیات الحسابیة الا ربعة (الجمع الطرح الضرب والقسمة) كما لا تستخدم فیها مقاییس النزعة المركزیة باستثناء المنوال فقط حیث یشیر إلى القیمة الا كثر تكرارا وتستخدم معها الاختبارات غیر المعلمیة فقط. وأمثلة (3 أخرى على هذا النوع من المتغیرات: متغیر الحالة الاجتماعیة (متزوج= أعزب= غیر ذلك = الخ. متغیر منطقة السكن متغیر نوع المدرسة متغیر التخصص في الكلیة فصیلة الدم الدیانة الجنسیة
.4. المتغیرات التر یت بیة Ordinal Variables المتغیرات الترتیبیة تقع في مستوى أعلى من المتغیرات في المستوى الا سمى بالا ضافة إلى خواص القیاس الاسمي فا ن القیاس في هذا المستوى یسمح بالمفاضلة أي ترتیب القیم (الفي ات) حسب سلم معین (بحسب درجة امتلاك الصفة المقاسة). فلو أخذنا مستویات: عال متوسط ومنخفض فیمكننا القول با ن مستوى الدخل العالي أكبر من الدخل المتوسط ولكن لا نستطیع تحدید كم یزید الدخل العالي عن المتوسط. هذه البیانات بالرغم من أنها غیر عددیة استطعنا أن نرتبها وفق ترتیبي هرمي. ومن أمثلة القیاس الترتیبي: المستوى التعلیمي (ابتداي ي إعدادي ثانوي جامعي) مستوى الدخل (متدن متوسط عال) الرتبة العسكریة (جندي نقیب... لواء) الرتبة الا كادیمیة (مدرس أستاذ مساعد أستاذ مشارك أستاذ) المؤهل العلمي (ثانویة عامة فما دون دبلوم بكالوریوس ماجستیر دكتوراه) ترتیب الا فراد حسب الطول ترتیب الطلبة حسب الدرجات... الخ. وهذا النوع من المتغیرات لا یستخدم معه أي من العملیات الحسابیة الا ربعة (الجمع الطرح الضرب والقسمة) ویستخدم معها كلا من الوسیط والمنوال فقط كمؤشرات لمقاییس النزعة المركزیة كما یستخدم معها الاختبارات غیر المعملیة فقط. 3.4. المتغیرات الفتریة Interval Variables المتغیرات الفتریة تقع في مستوى أعلى من المتغیرات في المستوى الرتبى فبالا ضافة إلى خواص القیاس و الا سمى الرتبى فا ن القیاس في هذا المستوى یتضمن خاصیة تساوي المسافات بین الرتب والمسافات المتساویة تدل على مقادیر متساویة من الخاصیة التي یتم قیاسها ولذا یسمي في بعض الا حیان " مقیاس المسافة" والا رقام التي یتم استخدامها لفي ات المتغیر تدل على نوع المعدود ترتیبه وكمه ومن أمثلة هذا النوع من القیاس ذكاء الطلبة درجات الحرارة الخ. ویلاحظ في المتغیرات الفتریة أن الصفر لا یشیر إلى غیاب وجود الظاهرة المراد دراستها فدرجة الحرارة إذا كانت صفرا لا تعنى عدم وجود حرارة وكذلك حصول طالب على صفر في الا حصاء لا یعني أنه لا یعرف شیي ا في هذا المقرر وهذا الصفر یسمى بالصفر النسبي أو الافتراضي ولیس صفرا مطلقا. وللعلم یستخدم هذا
المقیاس بشكل كبیر في العلوم التربویة والنفسیة والاجتماعیة. وهذا التدریج یسمح لنا با عطاء معنى لمقدار الفرق بین مشاهدتین. ومن أمثلة ذلك درجة الحرارة المي ویة. فمثلا درجة الحرارة الحرارة o 5 مي ویة. o 35 مي ویة أكبر من درجة وهذا النوع من المقاییس لا تطبق علیه جمیع العملیات الحسابیة إذ یطبق فقط كل من عملیات الجمع والطرح ویمكن هنا استخدام مقاییس النزعة المركزیة والتشتت المختلفة كما یمكن استخدام الاختبارات المعلمیة بالا ضافة إلى الاختبارات غیر المعلمیة بشرط أن یكون توزیع البیانات طبیعیا أو حجم العینة كبیر بما فیه الكفایة 3) (الحد الا دنى وذلك حسب نظریة النهایة المركزیة وكذلك أن تكون القیاسات (البیانات) دقیقة. 4.4. المتغیرات النسبیة Ratio Variables تا خذ المتغیرات النسبیة مكانا أعلى من المتغیرات السابقة فمستوى القیاس النسبي یقع في أعلى مستویات القیاس أو في قمتها حیث یتضمن فضلا عن خصاي ص المستویات السابقة (تصنیف وترتیب ومسافات " متساویة) خاصیة النسبیة وهى تنسیب الا رقام أو العناصر إلى بعضها إضافة إلى وجود الصفر الحقیقي المطلق". فمثلا متغیر السرعة یقع ضمن هذا المستوى حیث أن درجات السرعة ( 3 الخ) فیها تصنیف وترتیب والمسافات بینتها متساویة إضافة إلى وجود الصفر الحقیقي الذي یشیر إلى غیاب وجود الظاهرة المراد دراستها فسرعة السیارة عندما تكون صفرا یعنى أنها واقفة. وللعلم یستخدم هذا المقیاس بشكل كبیر في العلوم الطبیعیة. ومن أمثلة ذلك أیضا الطول الوزن العمر عدد أفراد الا سرة الدخل عدد الا طفال عند عاي لة وعدد الحوادث الا سبوعیة عند مفترق طرق ما. فمثلا إذا كان لدینا شخص وزنه 8 كجم وشخص آخر وزنه 4 كجم فا ننا نقول با ن وزن الشخص الا ول ضعف وزن الشخص الثاني. لكن عندما نقول با ن درجة الحرارة o o 5 مي ویة و درجة الحرارة 3 مي ویة فهذا لا یعني با ن درجة الحرارة الا ولى ضعف الثانیة في الا ثر ولكن أكبر منها. 5. أنواع البیانات Types of Data تنقسم البیانات إلى أربعة أنواع ري یسة هي: 3 بیانات السلاسل الزمنیة Data) (Time Series
البیانات المقطعیة "اللحظیة" Data) (Cross-sectional البیانات المقطعیة المجمعة (Pooled Cross Sections) البیانات الطولیة المجمعة سنتناول فیما یلي تفاصیل كل من هذه البیانات..(Panel or Longitudinal Data).5. بیانات السلاسل الزمنیة Time Series Data یقصد بالسلسلة أو المتسلسلة الزمنیة با نها متتابعة من القیم المشاهدة لظاهرة عشواي یة مرتبة مع الزمن. هي أو علیها الحصول یمكن التي البیانات بصورة تكراریة من صیاغتها یمكن مما منظمة مع تتغیر سلسلة شكل على الزمن. من الناحیة الریاضیة نقول أن متغیر الزمن المستقل t والقیم المناظرة له المتغیر التابع في الزمن t y وان كل قیمة یقابلها قیم للمتغیر التابع y فا ن y دالة في الزمن t أي f(t) y. = من أهم السلاسل الزمنیة تلك الخاصة بالمؤشرات الاقتصادیة والمبیعات السنویة للشركات والتعلیم والصحة وحجم السكان وغیرها. ومن أمثلة بیانات السلاسل الزمنیة ما یلي: حجم صادرات قطاع غزة من الفراولة سنویا. معدل سقوط الا مطار على فلسطین سنویا.. سنویا العاطلین عدد عن العمل حجم المبیعات من سلعة ما. شهریا. أسبوعیا مرضى العیادات النفسیة المترددین شهریا. عدد الوحدات المطلوبة من إنتاج سلعة معینة. یومیا سعر إقفال سهم بنك القدس قراءة درجات حرارة المریض في ساعة لمدة یوم واحد. 4
مثال (.): جدول (.) یمثل بیانات متعلقة بكمیة الطلب على الا سماك للفرد الواحد (بالطن) سعر السمك سعر اللحم.3-98 الدخل المتاح مقاسة وجمیعها (بالشیقل) وذلك في الفترة السنة 98 98 3 الدخل المتاح 6 73 7 96 جدول (.): مثال على بیانات السلاسل الزمنیة سعر اللحم سعر السمك كمیة الطلب على الا سماك 5 5 7 3 5 55 43 7 57 5.5. البیانات المقطعیة Cross-Sectional Data (اللحظیة) یقصد بالبیانات المقطعیة نقطة زمنیة في ظاهرة أو متغیر عن تؤخذ التي البیانات تلك هي من النوع وهذا معینة البیانات شاي ع الاستخدام الدراسات كافة في البحوث أو التعدادات سواء المیدانیة الاجتماعیة أو الاقتصادیة. السلاسل وبین بینها والفرق وحدات عن تعبر أنها الزمنیة المجتمع المطلوب دراسته في نقطة معینة من الزمن وتوضح البیانات المقطعیة عند نقطة زمنیة ما عینة لمفردات بالنسبة ما متغیر یا خذها التي القیاسات معینة. وتوضح البیانات ومن الزمن من النقطة نفس عند لا خرى مفردة من ما متغیر قیمة تغیر مدى بذلك المقطعیة البیانات أمثلة المقطعیة ما یلي: بیانات خاصة بالدخل لعینة من المستهلكین عند نقطة زمنیة معینة. الاستهلاك الشهري للسلع الضروریة لمجموعة من الا سر. الدخل القومي لمجموعة من دول العالم في سنة معینة. 5
مثال (.): 3 والمتعلقة جدول (.) یمثل بیانات لعینة مؤلفة من 3 موظفا في إحدى الشركات أخذت في سنة =) بالراتب الشهري (بالشیقل) عدد سنوات التعلیم (بالسنوات) الخبرة (بالسنوات) الحالة الاجتماعیة متزوج = غیر ذلك) والجنس (= ذكر أنثى). = جدول (.): مثال على البیانات المقطعیة الرقم الراتب الشهري التعلیم الخبرة الحالة الاجتماعیة الجنس 3 6 75. 6 8 4. 7 57.3 8 375.4 4 8 385.99 5 4 45.3 أن وتفترض لا خرى مفردة من المتغیر سلوك في التغیر أثر تتجاهل الزمنیة السلسلة بیانات كانت إذا الا فراد یتصرفون بالطریقة ذاتها خلال ظاهرة معینة البیانات فا ن المقطعیة المتغیر قیم في التغیر أثر تتجاهل من فترة زمنیة لا خرى وتفترض أن سلوك الا فراد لا یتغیر عبر الزمن أما البیانات المقطعیة فتحتوي على الا ثرین (أثر وأثر في الزمن التغیر والطولیة المجمعة من البیانات المهمة وخصوصا في والطولیة المجمعة التغیر في المشاهدات المقطعیة) لذلك تعتبر البیانات المقطعیة الدراسات الاقتصادیة والطبیة. ویستخدم هذا النوع من البیانات عادة لتكبیر حجم العینة عندما لا تتوافر بیانات كافیة من نوع السلسلة الزمنیة أو من نوع البیانات المقطعیة كل على حدة. لذلك یمكن القول با ن الفاي دة الري یسة من استخدام البیانات المقطعیة 6 في والطولیة المجمعة هي زیادة التنبؤ من خلال زیادة عدد المشاهدات عن طریق ربط عدد المشاهدات المقطعیة بعدد الفترات الزمنیة. الدقة
3.5. البیانات المقطعیة المجمعة (Pooled Cross Sections) تحتوي البیانات المقطعیة المجمعة على مزیج من بیانات السلسلة الزمنیة والبیانات المقطعیة فهي تعطي بیانات عن مجموعات مختلفة من المفردات عبر سلسلة زمنیة. فمثلا قامت إحدى المؤسسات با جراء ثلاثة مسوح حول و.3 الا سر الفقیرة في قطاع غزة وذلك في السنوات حیث أنه في سنة تم اختیار عینة من الا سر لا جراء المسح المطلوب حول متغیرات مثلا الدخل الادخار حجم الا سرة عدد العاطلین عن العمل لا فراد الا سرة فوق 8 سنة... في سنة وهكذا. تم أخذ عینة جدیدة من الا سر وتم جمع بیانات حول نفس متغیرات المسح السابق وهكذا في سنة 3. من أهم ما یمیز البیانات المقطعیة الم جمعة خلال فترة زمنیة معینة أنها تعتبر طریقة فعالة لتحلیل تا ثیرات سیاسة جدیدة للحكومة على الوضع الاقتصادي خلال الفترة الزمنیة التي تم إجراء المسح خلالها. ومن أمثلة البیانات المقطعیة الم جمعة ما یلي: دراسة الدخل لمجموعات مختلفة من الا سر خلال العشر سنوات الماضیة. دراسة الاستهلاك الشهري لمجموعات مختلفة من الا سر خلال الستة شهور الا ولى من الماضیة. :(3.) مثال 5 جدول (3.) یمثل بیانات متعلقة با سعار البیوت (بالدولار) في السنتین 3 قبل وبعد الحصار 5 منزلا (3.) المفروض على قطاع غزة منذ 7 وحتى الا ن. البیانات الموضحة في الجدول تمثل أسعار في سنة 5 و 8 منزلا في سنة 3. بحیث أن المشاهدات من - 5 للبیوت المباعة في 5 والمشاهدات من - 5 33 للبیوت المباعة في 3. مع ملاحظة أن ترتیب المشاهدات غیر مهم ولكن من الضروري مراعاة السنة لكل مشاهدة ولهذا السبب تم تخصیص "السنة" كمتغیر منفصل. 7
(3.): مثال على البیانات المقطعیة المجمعة المساحة (م ( عدد الغرف الرقم السنة جدول السعر عدد الحمامات 4 8 35 5 3 45 6 7 85 5 5 5 3 4 75 65 3 5 3 5 65 47 5 3 3 5 33 4.5. البیانات الطولیة المجمعة (Panel or Longitudinal Data) تحتوي البیانات الطولیة المجمعة على مزیج من بیانات السلسلة الزمنیة والبیانات المقطعیة فهي تعطي بیانات عن مجموعة من المفردات عبر سلسلة زمنیة. أي أنها تحتوي على سلسلة زمنیة لكل بیانات مقطعیة عن كل مفردة في العینة موضع الدراسة. فمثلا قامت إحدى المؤسسات با جراء مسحا حول الا سر الفقیرة في قطاع غزة خلال السنوات الثلاثة و 3. حیث تم اختیار نفس الا سر لا جراء المسح المطلوب حول متغیرات معینة مثلا الدخل الادخار حجم الا سرة عدد العاطلین عن العمل لا فراد الا سرة فوق وهكذا. من أهم ما یمیز البیانات الطولیة المجمعة عن البیانات المقطعیة المجمعة أن نفس المفردة هذا المثال) تم متابعتها خلال الفترة الزمنیة حتى 3. ومن أمثلة البیانات ما یلي: الطولیة المجمعة 8 سنة... دراسة الدخل لمجموعة من الا سر خلال العشر سنوات الماضیة. (الا سرة في 5 دراسة الاستهلاك الشهري لمجموعة من الا سر خلال الستة شهور الا خیرة من الماضیة. البیانات في الجدول (3.) لا تعتبر بیانات طولیة مجمعة 8 لا ن البیانات المباعة في السنتین 3 مختلفة.في حالة وجود تكرارات للبیوت فغالبا یكون عددها صغیرا ویمكن إهمال ذلك.
مثال (4.): جدول (4.) یمثل بیانات متعلقة بصافي الا رباح وداي ع العملاء وحجم الاستثمارات في الا وراق المالیة وحجم 3 5 التسهیلات الاي تمانیة وجمیعها مقاسة (بالملیون دولار) وذلك خلال السنتین لعشرة بنوك تجاریة. مع ملاحظة أن ترتیب المشاهدات غیر مهم ولكن من الضروري مراعاة اسم (رقم) البنك والسنة لكل مشاهدة ولهذا السبب تم تخصیص "السنة" و"البنك" كمتغیرین منفصلین. تم تخصصین المشاهدتین الا ولى والثانیة (السطرین الا ول والثاني) لبیانات البنك الا ول المشاهدتین الثالثة والرابعة (السطرین الثالث والرابع) لبیانات البنك وهكذا الثاني... البنك جدول السنة (4.): مثال على البیانات الطولیة المجمعة الا رباح الوداي ع الاستثمارات التسهیلات 65 7 7 5 5 65 78 8 4 3 7 95 9 4.5 5 9 9 3.5 3 7 4 5 5 5 78 78 5 6 3 5 عندما تكون المشاهدات المقطعیة مقاسة لنفس الفترات الزمنیة عندي ذ یطلق على البیانات الطولیة با نها بیانات طولیة متزنة Data) (Balanced Panel كما في مثال (4.). ولو فرضنا با ن أحد البنوك قد تم تسجیل مشاهداته المقطعیة لثلاث سنوات وباقي البنوك لسنتین عندي ذ یطلق على هذه البیانات بالبیانات الطولیة غیر المتزنة Data).(Unbalanced Panel 9
6. المتغیرات الوهمیة Dummy Variables (الثناي یة) یعرف المتغیر الوهمي على أنه المتغیر النوعي Qualitative variable الذي یعبر عن صفة معینة كاللون والدیانة والجنس والجنسیة والفقر والمنطقة والحرفة وغیرها من الصفات. وفي حالة المتغیر الوهمي نعطي القیمة () واحد صحیح () للدلالة على وجود صفة معینة والصفر على عدم وجودها. مثال ذلك بافتراض لدینا عینة لمیزانیة الا سرة في بلد ما فیه الریف والحضر ولتقدیر دالة الطلب على سلعة ما كمتغیر تابع ومستوى () الدخل كمتغیر مستقل وبذلك نستخدم القیمة () للدلالة على سكان الحضر والقیمة للدلالة على سكان الریف. ویمكن كتابة هذه العلاقة بالصیغة التالیة: Y = β + β X + β D + ε حیث أن: الكمیة المطلوبة من السلعة X: مستوى الدخل :Y D: المتغیر الوهمي للمنطقة ویا خذ القیمتین التالیتین: = D للدلالة على سكان الریف = D للدلالة على سكان الحضر. ε: حد الخطا العشواي ي أو العنصر العشواي ي. 7. المتغیرات الموسمیة Seasonal Variables المتغیرات الموسمیة تتعلق بالتغیرات الموسمیة التي تطرأ على الظاهرة على مدار المواسم المختلفة للفترة الزمنیة موضوع القیاس قد تكون یومیة أسبوعیة شهریة ربعیة. وهي تغیرات تتمیز بالطبیعة الدوریة بشرط ألا یزید طول الدورة المتكررة عن سنة واحدة كحد أعلى. وتنشا المتغیرات الموسمیة عادة خلال فترات خاصة كالا عیاد بدایة العام الدراسي بدایة الصیف أو الشتاء مثلا حیث یكثر بیع سلعة معینة وتعد هذه الفترات مجالا جیدا عادة للدراسة. الطقس والتقالید والاحتفالات الدینیة كالحج والا عیاد الوطنیة قد تقوم بالتا ثیر على التغیر الموسمي الذي لا یزید طول فترته عن السنة فقد یكون أسبوعیا لبیع إحدى المجلات أسبوعیا أو یومیا للصحف الیومیة أو إنتاج البیض كل أربعة أشهر إنتاج إحدى الشركات خلال ثلاث سنوات وكانت كمیة الا نتاج ما خوذة كل ثلاثة شهور (السنة مقسمة إلى أربعة أرباع).