إستضافة و تحليل و معالجة قواعد البيانات

تحليل و معالجة قواعد البيانات

توزيع التواتر: التوزع التواتري

 

تمثيل المعطيات

 إن الهدف الأساسي هو إيصال المعلومات، حيث يجب ترتيب، وتمثيل، وتقديم المعطيات بطريقة ما قبل القيام بتفسير المعلومة المحتواة في هذه المعطيات. هذا، وتعتمد طريقة التقديم على متطلبات الأفراد الذين طلبوا هذه المعلومات. يتوجب أخذ النقاط التالية بعين الاعتبار:

 

·          تمثيل واضح للموضوع؛

 

·          توضيح أهم النقاط في المعطيات؛

 

·          أخذ هدف التقديم بعين الاعتبار؛

 

·          أخذ كمية التفاصيل ونسبة الدقة المطلوبة بعين الاعتبار؛

 

·          استخدام أكثر الطرق ملائمة للعرض التقديمي.

  

طرائق التمثيل: تقديم العرض

 

الطرائق الرئيسية هي:

 

الجداول

تستخدم هذه الطرق للمساعدة في إدراك وفهم تعقيد المعطيات الرقمية. يتطلب استخدام الجدوال التصنيف, والذي هو عملية معالجة تقوم بربط العناصر المنفصلة ضمن المعطيات. يمكن أن تكون المتحولات ضمن الجدول متقطعة أو منفصلة (تقاس بواحدات مفردة, كالأشخاص أو السيارات) أو مستمرة (تقاس بواحدات القياس, كدرجة الحرارة, والطول، والوزن).

 

توزيعات التواتر

تظهر هذه تواتر مرات ظهور متحول معين. تتضمن التوزعات التواترية فواصل الصف. التوزع التواتري المجمّع هو التوزع الذي يتم فيه تجميع التواترات حسب الرقم في التصنيف, وذلك لتقديم ملخص يساعد في إيضاح وإظهار التوزيع.

 

التمثيل الصوري

إن الهدف من تقديم المعطيات بشكل صوري هو لإعطاء انطباع وتأثيير فوريين. هذا، وتتضمن العروض التقديمية الصورية المخططات البيانية الشريطية, المخططات البيانية المسطحة, المخططات الصورية والرسوم البيانية.

 

 

 المخططات الجدولية البيانية

 

تعرف المعطيات التي تم جمعها ولم يتم ترتيبها بأي ترتيب بالمعطيات السطرية. أحد طرق تنظيم المعطيات وفق ترتيب ما هي باستخدام التوزعات الترديية. إن أفضل طريقة للقيام بذلك هي استخدام المخططات الجدولية البيانية.

 

لتوليد المخططات الجدولية البيانية، ينبغي عليكم أن تولدوا جدولاً يحتوي على قائمة بنتائج الاختبار الممكنة، على أن تضعوا بعد ذلك بجوار كل واحدة من المعطيات السطرية علامة (بشكل عصا) على أن تكون بجوار نتيجة الاختبار المناسبة. غالباً ما توضع العلامة الخامسة في كل نتيجة اختبار بشكل قطري مائل وتحزم بذلك العلامات التي بشكل عصا لتشكل مجموعات من خمس. وعندما ينتهي تسجيل هذه العلامات يتم حسابها وتسجيلها في عامود التواتر.

  

توزيع التواترات المجمعة

 

من المفيد عند التعامل مع مجال من المعطيات أن يتم تجميع المعلومات ضمن صفوف أو أصناف، حيث يمكننا أن نحدد بذلك عدد العناصر التي تنتمي إلى كل صف ليكون لدينا توزيع تواتري مجمّع.

 

إن الفائدة الأساسية من التجميع هي توليد صورة كلية واضحة للتوزع، على أن وجود الكثير من المجموعات سيشّوه نموذج التوزيع، كما ان قلة عدد المجموعات سيؤدي إلى تشويه العديد من التفاصيل المتوافرة في المعطيات السطرية.

 

يتراوح عدد الصفوف بين /5/ و /20/ صفاً، وذلك حسب حجم المعطيات.

 

يدعى المتحول الذي يمكنه أخذ أي قيمة محصورة بين قيمتين بالمتحول المستمر. وهكذا, فإن طول الإنسان هو متحول مستمر. أما المتحول الذي يمكن أن يأخذ قيماً محددة فقط، فيدعى بالمتحول القطعي. لذا، فإن عدد الأطفال في عائلة ما هو متحول قطعي، حيث أنه يمكن أن يأخذ فقط القيم 0, 1, 2, 3, الخ...

 

 المخططات البيانية النسيجية

 

تستخدم هذه المخططات في تمثيل وعرض توزعات التواتر. يتألف المخطط البياني النسيجي من مجموعة من المستطيلات التي تمثل مساحتها تواترات الصفوف المختلفة. فإذا كان لجميع الصفوف العرض نفسه، يكون لجميع المتسطيلات في المخطط العرض نفسه أيضاً، ويتم تمثيل التواترات بارتفاعات المستطيلات.

 

 مضلعات التواتر

 

توفر هذه المضلعات طريقة أخرى لتمثيل التوزع التواتري. ويتم رسم مضلع تواتر بوصل النقاط المتوسطة لقمم المتسطيلات في المخطط البياني النسيجي بخطوط مستقيمة. يمثل المخطط المعروض مضلع تواتر يغطي توزع التواتر للجدول السابق الذي يمثل العلامات التي حصل عليها /100/ مئة طالب في الامتحان.

 

 

مضلعات التواتر المقارنة

 

تعدّ مضلعات التواتر مفيدة جداً عندما تودون مقارنة مجموعات المعطيات.

  

منحنيات التواتر

 

يمكن النظر إلى المعطيات التي تم جمعها على أنها تشكل عينة تم أخذها من تعداد كبير جداً. فإذا كانت العديد من الملاحظات ضمن التعداد ممكنة, فيمكننا عندئذ ولأجل المعطيات المستمرة اختيار فواصل صفوف صغيرة جداً، ونستطيع بنفس الوقت المحافظة على عدد معقول من الملاحظات التي تنتمي لكل صف. يصبح عرض المستطيلات التي تشكل المخطط البياني النسيجي صغيرة جداً وتتجه مضلعات التواتر لتأخذ شكل منحني. يدعى هذا المنحني بمنحني التواتر, ويتمتع من الناحية العملية بهذه الخصائص:

 

·         متناظر أو جرسي الشكل؛

·         مائل نحو اليمين (ميل موجب)؛

·         مائل نحو اليسار (ميل سالب)؛

·         بشكل حرف J / بشكل حرف J معكوس؛

·         بشكل حرف U.

 

 متناظر أو جرسي الشكل

يدعى ببعض الأحيان بالتوزع الطبيعي، ويحدث بشكل طبيعي عند أخذ عينات كبيرة جداً ورسمها.

 

مائل

يحدث غالباً عند أخذ عينة صغيرة تحوي على بعض القيم الحدية أو الشاذة. يمكن ان تحدث التوزعات ذات الميل الموجب (عندما يتجه المنحني نحو اليمين), مثال ذلك, توزع الدخل على دولة بأكملها.

 

لاتحدث التوزعات ذات الميل السالب إلا بشكل نادر جداً (عندما يتجه المنحني نحو اليسار). فعندما تحصلون على منحني من هذا الشكل، فغالباً ما يشكل هذا انحيازاً.

 

بشكل حرف J

إن النوع الموجب (بشكل حرف J معكوس) هو شائع أكثر من النوع السالب. ومن الأمثلة عن هذين التوزعين: مخطط حياة الأجهزة الإلكترونية، وأوقات إيقاف المركبات في الشارع.

 

بشكل حرفU

إن هذه التوزعات نادرة للغاية. ومن الأمثلة على ذلك، عدد السيارات التي تمر على أحد الطرق خلال اليوم، حيث يكون عدد السيارات كبير جداً في ساعات الازدحام الصباحية، ومن ثم يتناقص هذا العدد ليصل إلى حده الأدنى قبيل فترة الغداء، و يعود عدد السيارات للارتفاع مجدداً حتى ساعات الازدحام المسائية.

 
 

توزعات التواترات التراكمية

 

هي طريقة بديلة لتمثيل توزعات التواتر. حيث يتحول جدول التواترات إلى جدول تواترات تراكمية بإضافة كل تواتر إلى مجموع التواترات السابقة له. وبهذا, يتم حساب التواترات التراكمية بشكل تصاعدي إلى حد الصف الأعلى لكل صف.

  

قياس الانتشار

 

المجال

 

تحتاجون في بعض الأحيان لمعرفة كيفية توزع المعطيات وتجمعها حول القيمة المتوسطة، وفيما إذا كانت تتجمع بشكل متلاصق حوله، أو أنها تنتشر بشكل أوسع. إن أحد طرق قياس الانتشار هي أخذ مجال المعطيات بعين الاعتبار، وتتم ببساطة من خلال حساب المعيطات الأكبر ضمن مجموعة المعطيات، مطروحاً منها المعطيات الأصغر.

 ويمكن أن تتسبب قيمة صغيرة شاذة بانحراف المجال بكامله, إلا أن لهذه الطريقة تطبيقات عديدة، ولاسيما في التحكم بنوعية المنتجات الصناعية, حيث يستخدم حساب متوسط المجال على سلسلة من العينات الصغيرة لتأثيره الكبير على مخططات التحكم.

  

الأرباع

 

يمكن تقسيم قيم التوزع إلى أربع أقسام متساوية بوساطة الأرباع، والتي يرمز إليها غالباً بالرموز: Q1 و Q2 و Q3، حيث يمثل Q1 الربع الأول أو الأدنى، في حين يمثل Q3 الربع الثالث أو الأعلى، في حين تنطبق القيمة Q2 على المنصف.

 

وبالمثل, فإن قيم المتحولات التي تقسم التوزع إلى عشرة أقسام متساوية تدعى بالقيم العشارية.

اما القيم المئوية فهي قيم المتحولات التي تقسم التوزع إلى مئة قسم متساوي.

 تدعى الأرباع العشاريات والمئويات عادة بـ Quantiles (وهي عناصر محددة (س) في المجال المتغير الذي يحويها (س)).

 نتجه في العديد من المواقف التجريبية إلى الارتياب بالقياسات الحدية، وكنتيجة لذلك، فغالباً ما تهمل نتائج هذه القياسات. وقد أدى هذا النمط من التفكير إلى إصدرات محسّنة من طريقة المجال، تعرف بمجال Interquartile (وهو مجال المسافة بين النسبة 75% والنسبة 25%)، أي مابين Q1-Q3، ومن ثم هناك مجال Semi-Interquartile (وهو مجال قياس التوزع أو التشتت)، ويتم حسابه بالمعادلة (Q3-Q1)/2.

 

فمثلاً, إذا كان ينبغي حساب مجال دخول الموظفين، فمن الممكن الارتياب بالقيم الحدية، ويكون من الأفضل استخدام معادلة المجال Semi-Interquartile، حيث أنه لا يتشوه بسهولة بالقيم الحدية.

 

الأضلاع المنحرفة

 

يمكن تمثيل توزعات التواترات التراكمية بشكل صوري برسم حدود الصفوف العليا المقابلة للترددات التراكمية، ويدعى المخطط النتائج من جمع هذه النقط بخطوط مستقيمة بمضلع التواتر التراكمي.

 وإذا أمكن تجميع هذه النقط لتشكل منحنياً، فإن المخطط الناتج يدعى بمنحني التواتر التراكمي, والذي يدعى أيضاً بالمضلع المنحرف.


تحليل قواعد المعطيات مواقع صور