تحليل “كروسكال واليس” أحادي الاتجاه للتباين باستخدام الرتب
2012 استخدام الإحصاء لفهم البيئة
فيليب ويذر وبني أ.كوك
KFAS
تحليل كروسكال واليس أحادي الاتجاه للتباين باستخدام الرتب الرياضيات والهندسة الهندسة
حيث إن تحليل التباين ANOVA البارامتري يفترض أن البيانات موزعة توزيعاً طبيعياً وأن التباينات متساوية للبيانات التي لا تلائم هذه المتطلبات (ولا يمكن تحويلها بملاءمتها) أو يتم قياسها على مقياس ترتيبي، فإن البديل غير البارامتري (غير المعلمي) قد يكون مطلوباً.
وبنفس الأسلوب عندما يقدم اختبار مان ويتني U بديلاً غير بارامتري للاختبار t لعينتين، فإن اختبار كروسكال واليس للتحليل أحادي الاتجاه للتداين باستخدام الرتب هو بديل غير معلمي (غير بارامتري يستخدم حيث تتم مقارنة أكثر من عينتين.
وكما هو الحال في العديد من هذه الاختبارات غير البارامترية فإن الحسابات تتم على رتب البيانات وليس على قيم البيانات الفعلية نفسها. وتماماً كما هو الحال في اختبار مان ويتني U في الفصل 4 فإن البيانات يتم ترتيبها عبر الجدول بأكمله (أي بوضع جميع البيانات في ترتيب تصاعدي مع تجاهل العينات المنفصلة للقيم الحالية وتقديم القيم المتوسطة للبيانات المرتبطة – انظر المربع 4 – 4).
ثم يتم حساب إجماليات الرتب لكل عينة بشكل منفصل (كما في اختبار مان ويتني U)، والمؤشر الإحصائي الذي يتم حسابه باختبار كروسكال واليس يسمى H والصيغة الحسابية للحساب مبينة في المربع 7 – 4.
وكما هو الحال مع المؤشر الإحصائي الاختباري X2 (الفصل 6) فإن H يتم تقريبها إلى توزيع كاي تربيع، وإننا نقارن قيمة H التي قمنا بحسابها مع جدول كاي تربيع (ويوجد اقتباس منه مبين في الجدول 7 – 6) عند درجات الحرية 1 – k حيث k عددد العينات التي يتم مقارنتها.
إذا كانت القيمة المحسوبة H أكبر من القيمة في جدول كاي تربيع، فإن هذا يدل على وجود فروق ذات دلالة بين المتوسطات، وتختلف الخطوات عندما تكون العينات الثلاثة جميعها ذات مشاهدات أقل من 5 مشاهدات (انظر زيجيل وكاستلان، 1988).
وفي هذه الحالة فإن المؤشر الإحصائي لا يقوم بالتقريب إلى توزيع كاي تربيع والجداول البديلة H يجب الرجوع إليها (انظر النصوص مثل زيجيل وكاستلان 1988).
وعلى الرغم من أن الأمر لا يبدو مكاناً من الصيغة الحسابية في المربع 7 – 4 فإن اختبار كروسكال واليس مماثل لتحليل التباين ANOVA البارامتري الأحادي الاتجاه والذي يتم أداؤه على رتب البيانات (على الرغم من أنه مؤشر إحصائي اختباري مختلف بالقيمة H بدلاً من القيمة F هي التي يتم حسابها في النهاية).
والصيغة الحسابية في المربع 7 – 4 أكثر سهولة في الاستخدام من تحليل التباين البارامتري ANOVA للرتب وذلك لأنها تمثل صيغة مبسطة تفترض عدم وجود روابط.
ولكن إذا كانت هناك رتب مرتبطة فإن الاختبار متحفظ بدرجة زائدة قليلاً (أي أن الخطأ من النوع 2 يزداد احتماله)، وإذا كان برنامج الكمبيوتر لديك يعرض قيمة H المصححة للروابط وقيمة P المرتبطة بها.
فعليك في هذه الحالة تسجيلها. ووجود الروابط يمثل أهمية عادة فقط إذا حصلت على نتيجة ليست ذات دلالة على المستوى الهامشي (أي النتيجة حيث القيمة المحسوبة H أقل من القيمة في جدول كاي تربيع مباشرة وذلك عند درجات الحرية 1 – k).
وفي هذه الحالة قد يكون من المفيد إعادة الحساب باستخدام تحليل التباين البارامتري ANOVA للرتب وإيجاد H بقسمة SSbetween على MStotal (انظر الصيغة الحسابية في نهاية المربع 7 – 4). وفي هذه الأحوال قد تجد النتيجة التي حصلت عليها ذات دلالة إحصائية في النهاية
ومن أجل عرض اختبار كروسكال واليس، سنحلل إجابات الثلاث عينات من الأشخاص الذين تم تقديم أسئلة إليهم حول مشاعرهم بخصوص تأثيرات محطة ضخمة لتكرير البترول ومخاطرها على البيئة.
وهناك مجموعة واحدة تعمل في محطة تكرير البترول وتعيش بالقرب منها والمجموعة الثانية تعيش أيضاً بالقرب من المكان ولكن تعمل في مكان آخر أما المجموعة الأخيرة والنهائية فلا تعمل في المحطة ولا تعيش بالقرب من المكان.
وطلب من الذين أجابوا عن الأسئلة تسجيل درجات اتجاهاتهم على مقايس مكون من خمس نقاط (حيث تشير نقطة (1) إلى عدم وجود أخطار والنقطة (5) تشير إلى وجود العديد من الأخطار)، وتم تسجيل البيانات ورتب البيانات وحساب H في المثال 7 – 3 أ.
وتم حساب الرتب كما هو مبين في المربع 4 – 4، وعلى الرغم من أن مثالنا له أحجام متساوية للعينات، ولكن هذا ليس ضروري لهذا الاختبار، لاحظ أن البيانات في المثال العملي 7 – 3 أ مذكورة في ثلاثة أعمدة منفصلة (1 لكل عينة).
وإذا استخدمت برنامج كمبيوتر لحساب اختبارات كروسكال واليس الخاصة بك فإن هذا النموذج للبيانات لن يكون مناسباً عادة. انظر الجدول ب – 6 (الملحق ب) لتفاصيل مدخلات البيانات للتحليل الإحصائي باستخدام الكمبيوتر.
ومن البيانات في المثال العملي 7 – 3 أ فإن المؤشر الإحصائي H يتم حسابه بالقيمة 8.63، وعند المقارنة مع جداول كاي تربيع عند k – 1 (وهو هنا 3 – 1 = 2) لدرجات الحرية (انظر المساحة المظللة في الجدول 7 – 6)، فإننا نجد أن الاحتمالات بأن الافتراض الصفري صحيح تقع بين P = 0.05 (X2 = 5.991) و P = 0.01 (X2 = 9.210)، ولذلك يمكننا أن نرفض الافتراض الصفري ونقول:
يوجد فرق جوهري له دلالة في تقديرات الأشخاص للمخاطر البيئية الناتجة عن محطة ضخمة لتكرير البترول فيما بين الأشخاص من ذوي الارتباطات المختلفة بالمحطة (من حيث معيشتهم وعملهم) (H = 8.627, df = 2, P < 0.05).
ولقد كان هناك عدد كبير من الأربطة في بياناتنا، ولذلك فإن قيمة H التي حسبناها متحفظة، وحيث أننا قد رفضنا الافتراض الصفري على جميع الأحوال فإن هذا لا يعدل من النتيجة الرئيسة.
ولكن إذا وضعنا في الاعتبار القيم المرتبطة، فإن H ستصبح 9.25 (يتم حسابها باستخدام تحليل التباين ANOVA البارامتري للرتب – انظر الصيغة الحسابية في نهاية المربع 7 – 4) ويمكننا رفض الافتراض الصفري بدرجة ثقة أكبر (P<0.05).
يمكننا الآن أن نقول أن هناك فرق في المفاهيم والتقديرات لدى المجموعات الثلاثة من الأشخاص نحو المخاطر على البيئة الناتجة من محطة تكرير البترول ولكن لا يمكننا أن نقول بالتحديد أين توجد هذه الفروق.
ولذلك فإننا نحتاج لاختبارات مقارنة متعددة مناسبة. وكما هو الحال مع المكافئات البارامترية، يوجد اختبار مختلف لأحجام العينات المتساوية (اختبار نيميني) والعينات غير المتساوية (اختبار دون)، ولاحظ أن معظم برامج الكمبيوتر لا تحسب اختبارات نيميني أو اختبارات دون.
[KSAGRelatedArticles] [ASPDRelatedArticles]