أمثلة توّضح كيفية استنتاج الفروق بين عينتين
2012 استخدام الإحصاء لفهم البيئة
فيليب ويذر وبني أ.كوك
KFAS
كيفية استنتاج الفروق بين عينتين الرياضيات والهندسة الهندسة
عندما نقوم بفحص الفرق المحتمل بين عينتين فإن اختيار الاختبار يعتمد على طبيعة البيانات (أي ما إذا كانت موزعة توزيعاً طبيعياً أم لا وما إذا كانت في شكل أزواج أم لا). وهذا الفصل يغطي:
– الاختبار t للبيانات غير المتوافقة والموزعة توزيعاً طبيعياً.
– اختبار مان ويتني U للبيانات غير المتوافقة والتي يتم قياسها على الأقل على مقياس ترتيبي.
– اختبار t المزدوج الفروق الموزعة توزيعاً طبيعياً بين البيانات المتوافقة.
– اختبار ويلكوكسون للأزواج المتوافقة بخصوص الفروق بين البيانات المتوافقة المقاسة عدى الأقل على المقياس الترتيبي.
يغطي هذا الفصل كيفية تحديد ما إذا كان هناك فرق له أهمية إحصائية بين النزعة المركزية لعينتين (وهناك اختبارات مكافئة لكل من البيانات الطبيعية والبيانات الترتيبية أو غير الطبيعية).
والنمط المتسع الاستخدام في هذا الاختبار والذي نستخدمه يعتمد على ما إذا كانت البيانات متوافقة أو غير متوافقة.
دعونا ننظر لمثالنا من الفصل 1 حيث كنا مهتمين بمستويات الرصاص في الكرنب الذي ينمو في قطع أراضي قريباً وبعيداً من الطرق الرئيسة.
وأمكننا قياس مستويات الرصاص في الكرنب من مساحات الأراضي والتي أمكننا تعريفها على أنها قريبة من الطرق الرئيسة ومساحات الأراضي البعيدة الطرق الرئيسة مع إعداد البيانات المبينة في الجدول 4 – 1 أ. وأمكننا مشاهدة أن هذه البيانات غير متوافقة.
بمعنى أن مستوى الرصاص من الكرنب من المساحة الأولى بالقرب من الطريق الرئيسة (0.04 مجم لكل كجم) ليس مرتبطاً بأي شكل من الأشكال بالقطعة الأولى البعيدة عن الطريق الرئيسي (بالقيمة 0.03 مجم لكل كجم). ونقوم بتحليل هذه البيانات باستخدام اختبارات للمقارنات غير المتوافقة.
وهناك تصميم مسح بديل يتمثل في تعريف أزواج الساحات، واحدة قريبة من طريق معين والآخرى بعيدة عن نفس الطريق (وليست قريبة لأي طريق رئيسي آخر).
والبيانات في الجدول 4 – 1 ب في أزواج لطريق معين. على سبيل المثال فإن المساحة القريبة من طريق كرديف مرتبطة بمساحة أخرى بعيدة عن طريق كرديف، ولذلك فإن هذه العينات تعتبر متوافقة.
وسنقوم أيضاً بتحليل هذه البيانات باستخدام اختبارات المقارنات المتوافقة والتي تسمح لنا بفحص الفروق بين قطع الأراضي القريبة والبعيدة من الطرق ونرى في الاعتبار في نفس الوقت الفروق بين الطرق.
على سبيل المثال فإن طرق كرديف ولندن يبدو أن بها مستويات عالية من الرصاص. وهذه الفروق يمكن أن تكون كنتيجة لمعدلات المرور على الطرق أو الفروق في البيئة المحلية (مثل وجود الرصاص بصورة طبيعية) أو الأحوال المناخية المحلية (والتي قد تؤثر على تشتت الرصاص).
المقارنات غير المتوافقة:
ولندرس مثالنا من الفصل 3 حيث قمنا بفحص نشاط الاسترانشيوم 90 في اللبن من المزارع القريبة من نوعين من المحطات النووية. وهذا التصميم غير متوافق، وذلك لأن كل مزرعة مستقلة عن الأخرى.
وتصور أنه كان هناك تباين قليل جداً في نشاط الاسترانشدوم 90 في اللبن من المزارع القريبة من محطات بارو جاش ومحطات رى زووم مع وجود مستويات مختلفة للنشاط.
فإذا قمنا بتقدير المعلومات (المتغيرات) (أي المتوسط والانحراف المعياري) لاستخدام بيانات العينة لكل نوع لمواقع المزارع، فإن التوزيعات الطبيعية المثالية لها قد تبدو مثل تلك في الشكل 4 – 1.
ومن الواضح أنه لا يوجد أي تداخل بالمرة بين العينتين وهكذا فإن المجتمعين مختلفان. ولكن في الواقع فإن البيانات البيئية تكون عادة أكثر تفاوتاً بدرجة كبيرة وعندئذٍ فإن قطع الأراضي المثالية بالتوزيع الطبيعي لدينا من شأنها أن تبدو مثل تلك المبينة في الشكل 4 – 2 أ.
واللبن من المزارع بالقرب من محطات باور جاش له قيمة متوسطة أقل وذلك بالقيمة 0.263 Bq1-1 بينما اللبن من المزارع القريبة من محطات ري زووم بالمتوسط 0.411 Bq1-1، ولكن يمكننا أن نلاحظ تداخلاً كبيراً بين هذه العينات.
والسؤال الذي نرغب في سؤاله ما إذ كانت هذه العينات تأتي حقيقة من مجتمعين مختلفين بهذه القيم المتوسطة المختلفة، أو أنها في الحقيقة تأتي من مجتمع واحد مبين في الشكل 4 – 2 ب ولغرض تحديد أي من السيناريوهين يكون أكثر احتمالاً (أي ما إذا كانت العيننتان تختلفان اختلافاً جوهرياً) فإننا نحتاج لاستخدام اختبار إحصائي مع الافتراض الصفري بأن العينات تأتي من نفس المجتمع (أي المصور في الشكل 4 – 2 ب).
وفي الوضع مثل الوضع السابق حيث تأتي البيانات من عينة واحدة (على سبيل المثال المزارع بالقرب من محطات باور جاش) وهي مستقلة عن البيانات في العينة الأخرى (على سبيل المثال المزارع بالقرب من محطات رى زووم) فإننا نستخدم اختباراً احصائياً للعينات غير المتوافقة (وتسمى في بعض الأحيان غير مزدوجة أو مستقلة).
وبالنسبة للعينات بالتوزيع الطبيعي فإننا نستخدم الاختبار t وبالنسبة للبيانات غير الطبيعية أو الترتيبية فإننا نستخدم اختبار مان ويتني U.
وبالطبع سيكون لدينا وضع حيث نرغب في مقارنة أكثر من العينتين (وربما أيضاً إذا كانت لدينا عينة من المزارع بالقرب من نوع ثالث من محطات الطاقة النووية). وتوجد مجموعة من الاختبارات الإحصائية لتحليل هذه البيانات مبينة في الفصل 7
[KSAGRelatedArticles] [ASPDRelatedArticles]