إستضافة و تحليل و معالجة قواعد البيانات

تحليل و معالجة قواعد البيانات

التعالق والانكفاء

 مقدمة

 

تدعى التوزعات التي يتم فيها قياس متحول واحد فقط بالتوزعات أحادية المتحول, مثل إيجاد المتوسط الحسابي لأطوال مجموعة من الطلاب. ولكن، إذا سجلنا طول ووزن كل طالب, أي متحولين, فإن التوزع يدعى في هذه الحالة بالتوزع ثنائي المتحولات.

 

وإذا ما رسمت مجموعة من القيم الملاحظة كهذه بشكل بياني مقابل بعضها البعض فإن المخطط البياني الناتج يدعى مخطط التبعثر أو الانتثار. وقد يكون هناك علاقة ما بين طول ووزن كل طالب, فمثلاً، يكون الطلاب الأطول أثقل. تدعى هذه العلاقة بالتعالق.

 

المخططات التبعثرية

 

ما تحتوي المعطيات التي يتم الحصول عليها من الاستبيانات الإحصائية أو التجارب على أخطاء في الملاحظة والقياس.

 

وغالباً ما يمكن عند رسم النقط بيانيا إظهار الخط المستقيم أو المنحني الذي يشكل تقريبا للمعطيات. تدعى هذه المخططات مخططات التبعثر أو الانتثار.

  

التعالق

 

يتم قياس درجة العلاقة بين متحولين بوساطة عدد يدعى معامل التعالق.

 

يتراوح معامل التعالق بين -1 إلى +1. وتأخذ العلاقة المباشرة, أو الموجبة, قيمة تنحى نحو +1. بينما تأخذ العلاقة العكسية, أو السالبة, قيمة تنحى نحو -1. وعندما لا تكون هناك أية علاقة يأخذ معامل التعالق القيمة صفر.

 

يعطى مقدار التعالق بقيمة عدية (بغض النظر عن الإشارة). ويبين نوع التعالق (مباشر أو عكسي) بوساطة الإشارة + أو - . وفي الحياة العملية, لا تظهر القيم صفر أو 1 إلا نادراً جداً وتتوضع معظم القيم بين 0.6 و 0.9 . فكلما ازدادت القيمة كلما كان التعالق أفضل.

 

فإذا ما كانت القيمة بين -0.3 و +0.3، يعتبر التعالق غير مهم, فعملياً، ولايكون هناك أية تعالق. على أن درجة التعالق تعتمد بأية حال على قيمة وعدد الملاحظات المأخوذة بعين الاعتبار.

  

معامل التعالق Product Moment

 

يدعى هذا المعامل أحياناً بمعامل Pearson وهو مقدار التعالق الخطي الذي يحاول إظهار مقدار قرب العلاقة بين متحولين.

  

استخدام Excel لحساب التعالق

 

إن الميزة القائمة في Excel لحساب معامل التعالق هي جزء من بريمجة تحليل المعطيات Data Analysis الإضافية.

 

فإذا كانت هذه البريمجة الإضافية منصبة، فستظهر في قائمة الأدوات Tools. وإذا لم تظهر, تكون هذه البريمجة الإضافية غير منصبة على أجهزتكم، وستحتاجون لتنصيبها قبل البدء باستخدامها. يمكنكم معرفة التعليمات الضرورية لعملية التنصيب هذه من الوحدة التعليمية /11/.

 

 حساب التعالق باستخدام Excel

 

انقروا على أدوات Tools ثم على تحليل المعطيات Data Analysis لعرض قائمة بأدوات تحليل المعطيات المتوافرة.

 

اختاروا أداة التعالق Correlation.

 

ادخلوا مؤشر مجال الخلايا التي تريدون تحليله. يجب أن يتألف المؤشر من مجالين متجاورين أو أكثر من المعطيات المرتبة وفق الأسطر أو الأعمدة.

 

حددوا فيما إذا كانت المعطيات مرتبة وفق الأسطر أو وفق لأعمدة.

 

حددوا فيما إذا ما كان مجال معطيات الدخل يحتوي على رقع.

 

اختاروا كيفية عرض جدول الخرج (واحد من ثلاث خيارات):

 

·        ادخلوا مؤشر الخلية اليسرى العليا في وريقة العمل الحالية؛

 

·        انقروا لإدخال وريقة عمل جديدة في مصنف العمل الحالي والصقوا النتائج بدءا من الخلية A1 في وريقة العمل الجديدة. لتسمية وريقة العمل الجديدة, اكتبوا الاسم في المربع؛

 

·        انشأوا مصنف عمل جديد والصقوا النتائج في وريقة عمل جديدة في مصنف العمل الجديد.

 

لاحظوا أن Excel يحسب فقط نصف الجدول، هذا لأن التعالق بين مجالي المعطيات مستقل عن الترتيب الذي تمت معالجة المجالات وفقه.

 

تحوي خلايا جدول الخرج التي لها رقمي عامود وسطر متماثلين القيمة 1 لأن كل مجموعة معطيات تتعالق بالضبط مع نفسها.

 

 الانكفاء

 الانكفاء هو تقنية لإيجاد المعادلة التي تمثل المعطيات بأفضل طريقة...

 

 الانكفاء الخطي

 

يمكن أن يكون المخطط التبعثري وسيلة مفيدة في تحديد قوة العلاقة بين متحولين. فإذا لم يكن هناك أية علاقة بين التعليل المطروح والمتحولات التابعة (أي أن المخطط التبعثري لايظهر أي تزايد أو تناقص), فإن ملائمة نموذج الانكفاء الخطي مع المعطيات قد لا تشكل نموذجاً مفيداً.

 

يعد معامل التعالق قياساً عددياً هاماً للعلاقة بين متحولين, تتراوح قيمته بين -1 و +1، محدداًً قوة العلاقة بين المعطيات المقاسة أو الملاحظة لكلا المتحولين.

 

يهدف الانكفاء إلى إظهار العلاقة بين المتحولين، وذلك عن طريق الخط الذي يحدد اتجاه إحداثيات الرسم البياني. يمكن تثبيت القيم لأجل x (المتحول على المحور الأفقي) ويتم إيجاد الخط الذي يخفض المسافة العمودية بين الإحداثيات، وهذا الخط إلى الحد الأدنى. وهذا الخط هو خط انكفاء y على x، ويعطي قيمة تقريبية للمتحول y لأجل قيمة معروفة للمتحول x.

 

وبالعكس, يمكن أن تثبت القيم على المحور y (المتحول على المحور العمودي)، ويتم إيجاد الخط الذي يخفض المسافة الأفقية بين الإحداثيات وهذا الخط إلى الحد الأدنى. وهذا الخط هو خط انكفاء x على y، ويعطي قيمة تقريبية للمتحول x لأجل قيمة معروفة للمتحول y.

 

تدعى هذه الخطوط في بعض الأحيان "بمستقيمات الملائمة الأفضل". وفي المتسلسلات الزمنية يكون أحد المتحولين هو الزمن والذي غالباً ما يتزايد بمعدل ثابت. ليس لعامل الزمن قيمة, إلا أنه من الممكن ترقيم السنوات (الأشهر, الأسابيع، أو الأيام) بالترتيب بحيث تزيد كل منها عن الأخيرة بواحد.

 

وعندما لا يكون المتحول x متحول زمني, فإن المستقيم الذي تولده طريقة المربعات الأصغرية يدعى مستقيم الانكفاء. وكلما تمت موافقة نموذج الانكفاء الخطي مع مجموعة من المعطيات, يجب أن تتم ملاحظة مجال المعطيات بانتباه كبير.

 

غالباً ما يكون من غير الملائم أن نحاول استخدام معادلة الانكفاء لتوقع القيم خارج هذا المجال, الأمر الذي قد يؤدي إلى إجابات خاطئة.

 

يعرف هذا الأسلوب في التوقع بالاستقراء.

 

خذوا, مثلاً, نموذجاً خطياً يربط الوزن المكتسب مع العمر، وذلك بالنسبة للأطفال الصغار. إن تطبيق هذا النموذج على البالغين, أو حتى المراهقين, سيكون منافياً للعقل, حيث أن العلاقة بين الوزن المكتسب والعمر ليست ثابتة بالنسبة لجميع الفئات العمرية.

 

يرجى أخذ العلم بأنه ليس من السهل تفسير وشرح الأشكال المولدة باستخدام أداة تحليل الانكفاء في Excel، والتي قد تكون غير صحيحة (القوا نظرة على وثيقة مشاكل استخدام Microsoft Excel في حساب الإحصائيات)، هذا، وينصح بعدم الاعتماد على Excel والقيام بالتحليل الانكفائي يدوياً.

 

التعالق في الانكفاء الخطي

 يعتبر مربع معامل التعالق قيمة مفيدة في الانكفاء الخطي.

 تمثل هذه القيمة جزء التغير في أحد المتحولات والذي يمكن أن يشرحه متحول آخر.

 لذلك, إذا تمت ملاحظة تعالق بقيمة 0.8 بين متحولين (مثلاً, الطول والوزن), فإن قيمة التغير في نموذج الانكفاء الخطي الذي يسعى لشرح أحد المتحولين بالنسبة للآخر ستكون 64%، أي مربع 0.8.

 وبسبب أن خط الانكفاء في طريقة المربعات الأصغرية يمر دوماً من متوسطي x و y, يمكن توصيف خط الانكفاء بشكل كامل بوساطة المتوسطات, والانحرافات المعيارية, وتعالق المتحولين قيد الدراسة.


تحليل قواعد المعطيات مواقع صور