מהו ניתוח השונות (ANOVA)?
ניתוח השונות (ANOVA) הוא כלי ניתוח המשמש בסטטיסטיקה המפצל משתנות מצטברת שנצפתה בתוך מערך נתונים לשני חלקים: גורמים שיטתיים וגורמים אקראיים. לגורמים השיטתיים יש השפעה סטטיסטית על מערך הנתונים הנתון, ואילו הגורמים האקראיים אינם. אנליסטים משתמשים במבחן ANOVA כדי לקבוע את ההשפעה שיש למשתנים עצמאיים על המשתנה התלוי במחקר רגרסיה.
שיטות הבדיקה t ו- z שפותחו במאה העשרים שימשו לניתוח סטטיסטי עד שנת 1918, אז יצר רונלד פישר את ניתוח שיטת השונות. ANOVA נקראת גם ניתוח פישר של שונות, והיא הרחבה של מבחני ה- t- וה- z. המונח התפרסם בשנת 1925, לאחר שהופיע בספרו של פישר, "שיטות סטטיסטיות לעובדי מחקר." זה הועסק בפסיכולוגיה ניסיונית והתרחב בהמשך לנושאים מורכבים יותר.
הנוסחה ל- ANOVA היא:
Deen F = MSEMST איפה: F = מקדם ANOVA MST = סכום ממוצע של ריבועים עקב טיפול MSE = סכום ממוצע של ריבועים עקב שגיאה
מה חושף ניתוח השונות?
מבחן ה- ANOVA הוא הצעד הראשוני בניתוח גורמים המשפיעים על מערך נתונים נתון. לאחר סיום הבדיקה, אנליסט מבצע בדיקות נוספות על הגורמים השיטתיים התורמים באופן מדיד לחוסר העקביות של מערך הנתונים. המטפל משתמש בתוצאות הבדיקה של ANOVA במבחן f כדי לייצר נתונים נוספים המתאימים למודלי הרגרסיה המוצעים.
מבחן ה- ANOVA מאפשר השוואה של יותר משתי קבוצות בו זמנית כדי לקבוע אם קיים קשר ביניהם. התוצאה של נוסחת ANOVA, סטטיסטיקת F (נקראת גם יחס ה- F), מאפשרת ניתוח של קבוצות נתונים מרובות כדי לקבוע את השונות בין דגימות בתוך דגימות.
אם לא קיים הבדל ממשי בין הקבוצות שנבדקו, הנקראת השערת האפס, התוצאה של נתוני יחס ה- F של ה- ANOVA תהיה קרובה ל 1. תנודות בדגימה שלה עשויות לעקוב אחר התפלגות פישר F. זוהי למעשה קבוצה של פונקציות חלוקה, עם שני מספרים אופייניים, הנקראים דרגות החופש של המונה ומכנות דרגות החופש.
Takeaways מפתח
- ניתוח השונות, או ANOVA, הוא שיטה סטטיסטית המפרידה בין נתוני השונות שנצפו לרכיבים שונים לשימוש בבדיקות נוספות. ANOVA חד כיוונית משמשת לשלוש קבוצות נתונים או יותר, כדי להשיג מידע על הקשר בין התלוי לבין משתנים עצמאיים. אם אין שונות בין הקבוצות, יחס ה- F של ה- ANOVA אמור להיות שווה קרוב ל -1.
דוגמה לשימוש ב- ANOVA
חוקר יכול, למשל, לבחון סטודנטים ממכללות מרובות כדי לבדוק אם סטודנטים מאחת המכללות עולה בהדרגה על תלמידים מהמכללות האחרות. ביישום עסקי, חוקר מו"פ עשוי לבדוק שני תהליכים שונים של יצירת מוצר כדי לראות אם תהליך אחד טוב יותר מהשני מבחינת יעילות עלות.
סוג בדיקת ANOVA המשמשת תלוי במספר גורמים. זה מיושם כאשר נתונים צריכים להיות ניסיוניים. ניתוח השונות נעשה אם אין גישה לתוכנה סטטיסטית המביאה לחישוב ANOVA ביד. זה פשוט לשימוש ומתאים ביותר לדגימות קטנות. עם הרבה עיצובים ניסויים, גדלי הדגימה צריכים להיות זהים עבור שילובי רמת הגורמים השונים.
ANOVA מועיל לבדיקת שלושה משתנים או יותר. זה דומה לבדיקות t דו-מדגמיות מרובות. עם זאת, התוצאה היא פחות שגיאות מסוג I ומתאימה למגוון בעיות. ANOVA מקבצת הבדלים על ידי השוואה בין האמצעים של כל קבוצה וכוללת הפצת השונות למקורות מגוונים. זה מועסק עם נבדקים, קבוצות מבחן, בין קבוצות ותוך קבוצות.
ANOVA חד כיווני לעומת ANOVA דו כיוונית
ישנם שני סוגים של ANOVA: חד כיוונית (או חד כיוונית) ושני כיוונים. חד כיווני או דו כיווני מתייחס למספר המשתנים העצמאיים בניתוח בדיקת השונות שלך. ANOVA חד כיווני מעריך את ההשפעה של גורם יחיד על משתנה התגובה היחיד. זה קובע אם כל הדגימות זהות. ANOVA החד-כיוונית משמשת לקביעת האם יש הבדלים מובהקים סטטיסטית בין האמצעים של שלוש קבוצות עצמאיות או יותר (לא קשורות).
ANOVA דו כיוונית היא הרחבה של ANOVA חד כיוונית. בכיוון אחד יש לך משתנה עצמאי אחד המשפיע על משתנה תלוי. עם ANOVA דו כיוונית, ישנם שני עצמאים. לדוגמה, ANOVA דו כיוונית מאפשרת לחברה להשוות את תפוקת העובדים על בסיס שני משתנים עצמאיים, כמו שכר ומיומנות. הוא משמש כדי להתבונן באינטראקציה בין שני הגורמים ובודק את ההשפעה של שני גורמים בו זמנית.
