מהו הומוסקדסטי?
הומוסקדסטית (מאויתת גם "הומוסצסטאטית") מתייחסת למצב בו השונות של מונח השאריות או השגיאה במודל רגרסיה היא קבועה. כלומר, מונח השגיאה אינו משתנה במידה והערך של משתנה החיזוי משתנה. עם זאת, היעדר ההומוסקדסטיות עשוי לרמז שמודל הרגרסיה עשוי להזדקק לכלול משתני חיזוי נוספים כדי להסביר את ביצועי המשתנה התלוי.
Takeaways מפתח
- הומוסקדקטיות מתרחשת כאשר השונות של מונח השגיאה במודל רגרסיה היא קבועה. אם השונות של מונח השגיאה הומוסקיסטית, המודל היה מוגדר היטב. אם יש שונות רבה מדי, יתכן שהמודל לא מוגדר היטב. הוספת משתני חיזוי נוספים יכולה לעזור להסביר את הביצועים של המשתנה התלוי. באופן מוחשי, הטרוססקדסטיות מתרחשת כאשר השונות של מונח השגיאה אינה קבועה.
איך עובד הומוסקדסטי
הומוסקדסטיות היא הנחה אחת של דוגמנות רגרסיה לינארית. אם שונות השגיאות סביב קו הרגרסיה משתנה במידה רבה, מודל הרגרסיה עשוי להיות מוגדר בצורה גרועה. ההפך מ"הומוסקדסטיות "הוא הטרוסדקדסטיות בדיוק כמו ההפך מ"הומוגני" הוא "הטרוגני". הטרוססקדסטיות (מכונה גם "heteroscedasticity") מתייחסת למצב בו השונות של מונח השגיאה במשוואת רגרסיה אינה קבועה.
כאשר בוחנים כי שונות היא ההבדל הנמדד בין התוצאה החזויה לבין התוצאה בפועל של מצב נתון, קביעת הומוסקדסטיות יכולה לעזור לקבוע אילו גורמים צריכים להתאים לדיוק.
שיקולים מיוחדים
מודל רגרסיה פשוט, או משוואה, מורכב מארבעה מונחים. בצד שמאל נמצא המשתנה התלוי. הוא מייצג את התופעה שהמודל מבקש "להסביר". בצד ימין יש משתנה קבוע, משתנה מנבא ומונח שיורי או שגיאה. מונח השגיאה מראה את כמות השונות במשתנה התלוי שאינו מוסבר על ידי משתנה החיזוי.
דוגמה להומוסקדסטית
לדוגמה, נניח שרצית להסביר את ציוני מבחן התלמידים תוך שימוש בפרק הזמן שכל סטודנט בילה בלימודים. במקרה זה, ציוני הבדיקה יהיו המשתנה התלוי והזמן שהשקיע בלימוד יהיה משתנה החיזוי.
מונח השגיאה יראה את כמות השונות בציוני הבדיקה שלא הוסבר על פי משך זמן הלימוד. אם השונות היא אחידה, או הומוסקדסטית, אז הדבר יכול לרמז על כך שהמודל יכול להוות הסבר נאות לביצועי הבדיקה - הסבר זאת במונחים של זמן שהוקדש ללימודים.
אבל השונות עשויה להיות הטרוסקדסטית. עלילה של נתוני מונחי השגיאה עשויה להראות כי כמות זמן רבה של המחקר התכתבה מאוד עם ציוני הבדיקה הגבוהים, אולם ציוני מבחן זמן המחקר הנמוכים השתנו באופן נרחב ואף כלל כמה ציונים גבוהים מאוד. כך ששונות הציונים לא תוסבר היטב פשוט על ידי משתנה מנבא אחד - משך זמן הלימוד. במקרה זה, ככל הנראה גורם אחר פועל, וייתכן שיהיה צורך לשפר את המודל כדי לזהות אותו או אותם. בדיקה נוספת עשויה לגלות כי כמה סטודנטים ראו את התשובות למבחן לפני כן או שלקחו בעבר מבחן דומה, ולכן לא היו צריכים ללמוד למבחן הספציפי הזה.
כדי לשפר את מודל הרגרסיה, החוקר יוסיף אפוא משתנה הסבר נוסף המציין אם סטודנט ראה את התשובות לפני המבחן. לאחר מכן היו למודל הרגרסיה שני משתנים מסבירים - לימוד זמן והאם לתלמיד היה ידע קודם בתשובות. עם שני המשתנים הללו, תוסבר יותר מהשונות של ציוני הבדיקה והשונות של מונח השגיאה עשויה להיות הומוסקיסטית, מה שמצביע על כך שהמודל מוגדר היטב.
