ההבדל בין T-TEST ו- ANOVA ההבדל בין

Anonim

T-TEST לעומת ANOVA

איסוף נתונים סטטיסטיים וחישובם כדי להשיג את הממוצע הוא לעתים קרובות תהליך ארוך ומייגע. מבחן ה- t והניתוח החד-כיווני של השונות (ANOVA) הם שני המבחנים הנפוצים ביותר המשמשים למטרה זו.

מבחן ה- T הוא מבחן היפותזה סטטיסטית, שבו הסטטיסטיקה של המבחן עוקבת אחר הפצה של התלמיד אם השערת האפס נתמכת. בדיקה זו מיושמת כאשר נתון הבדיקה עוקב אחר התפלגות נורמלית, וערך מונח הסילום בנתון הבדיקה ידוע. אם המונח קנה מידה אינו ידוע, הוא מוחלף על ידי אומדן המבוסס על הנתונים הזמינים. הנתונים הסטטיסטיים של המבחן יבוצעו לפי חלוקת התלמיד.

ויליאם סילי Gosset הציג את t- סטטיסטיקה בשנת 1908. Gosset היה כימאי למבשלת ב Guinness בדבלין, אירלנד. מבשלת הבירה של גינס היתה מדיניות של גיוס הבוגרים הטובים ביותר מאוקספורד וקיימברידג', ובחירה מאלה שיכולים לספק יישומים של ביוכימיה וסטטיסטיקה לתהליכים התעשייתיים של החברה. ויליאם סילי גוסט היה בוגר אחד כזה. בתהליך זה, ויליאם Sealy Gosset המציא את המבחן t, אשר היה במקור חזה כדרך לפקח על איכות השמן (הבירה כהה מבשלת מייצרת) בצורה חסכונית. גוסט פירסם את המבחן תחת שם העט "סטודנט" בביומטריקה, בערך 1908. הסיבה לשמו של העט היתה התעקשותו של גינס, שכן החברה רצתה לשמור על מדיניותם בנוגע לשימוש בסטטיסטיקות כחלק מ"סודות הסחר" שלהם.

הנתונים הסטטיסטיים של מבחן T בדרך כלל עוקבים אחר טופס T = Z / s, כאשר Z ו- s הם פונקציות של הנתונים. המשתנה Z נועד להיות רגיש להיפותזה האלטרנטיבית; למעשה, גודל משתנה ה- Z גדול יותר כאשר ההיפותזה האלטרנטיבית נכונה. בינתיים, 's' הוא פרמטר קנה מידה, ומאפשר את הפצה של T ייקבע. ההנחות העומדות בבסיס מבחן t הן ש- A) Z () עוקב אחר התפלגות נורמלית רגילה לפי השערת האפס; ב) PS2 עוקב אחרי התפלגות Δ ‡ 2 עם דרגות p של חופש תחת השערת האפס (כאשר p הוא קבוע חיובי); ג) שווי הערך ו - S הם בלתי תלויים. בסוג מסוים של מבחן t, תנאים אלה הם תוצאות של האוכלוסייה הנחקרת, כמו גם את האופן שבו הנתונים נדגמים.

לעומת זאת, ניתוח השונות (ANOVA) הוא אוסף של מודלים סטטיסטיים. בעוד עקרונות של ANOVA נוצלו על ידי חוקרים וסטטיסטיקאים במשך זמן רב, זה לא היה עד 1918 כי סר רונלד פישר עשה הצעה למסד ניתוח של שונות במאמר שכותרתו "המתאם בין קרובי משפחה על הנחת מורשת מורשת".מאז, ANOVA הורחבה בהיקפה ויישומה. Anova הוא למעשה misnomer, כפי שהוא אינו נגזר הבדלים של שונות אלא מן ההבדלים בין קבוצות של קבוצות. הוא כולל את הפרוצדורות המקושרות שבהן השונות הנבדקת במשתנה מסוים מחולקת לחלקים המיוחסים למקורות שונות של וריאציה.

בעיקרו של דבר, ANOVA מספק מבחן סטטיסטי כדי לקבוע אם האמצעים של מספר קבוצות שווים, וכתוצאה מכך, הכללת t מבחן ליותר משתי קבוצות. ANOVA יכול להיות שימושי יותר מאשר מבחן מדגם שני, שכן יש לו סיכוי נמוך יותר לבצע שגיאה מסוג I. לדוגמה, לאחר מספר רב של בדיקות מדגם שני יהיה סיכוי גדול יותר לבצע שגיאה מאשר ANOVA של אותם משתנים המעורבים כדי להשיג את הממוצע. המודל זהה וסטטיסטיקת הבדיקה היא יחס F. במונחים פשוטים, בדיקות T הן רק מקרה מיוחד של ANOVA: לעשות ANOVA תהיה אותה תוצאה של מספר בדיקות T. ישנם שלושה סוגים של מודלים ANOVA: א) מודלים קבועים השפעה אשר מניחים את הנתונים בא אוכלוסיות נורמלי, שונה רק באמצעים שלהם; ב) מודלים של השפעות אקראיות המניחים את הנתונים מתארים היררכיה של אוכלוסיות שונות, שההבדלים ביניהם מוגבלים;) ג מודלים מעורבים, שהם מצבים בהם קיימים השפעות קבועות ואקראיות.

סיכום:

מבחן t משמש בעת קביעת אם שני ממוצעים או אמצעי זהים או שונים. ANOVA מועדף בעת השוואת שלושה ממוצעים או יותר.

  1. T-test יש יותר סיכויים לבצע שגיאה יותר אמצעים משמשים, ולכן Anova משמש כאשר משווים שניים או יותר אמצעים.