מהו גורם אינפלציה של שונות?
גורם אינפלציה משתנה fFariant אינפלציה (VIF) הוא מדד לכמות ריבוי הקולינריות במערכת של משתני רגרסיה מרובים. מבחינה מתמטית, ה- VIF עבור משתנה מודל רגרסיה שווה ליחס בין שונות הדגם הכללית לשונות של מודל הכולל רק את המשתנה היחיד העצמאי. יחס זה מחושב לכל משתנה עצמאי. VIF גבוה מצביע על כך שהמשתנה הבלתי תלוי המשויך קשור באופן הדדי עם המשתנים האחרים במודל.
Takeaways מפתח
- גורם אינפלציה של שונות (VIF) מספק מדד לרב-קולינריות בין המשתנים הבלתי תלויים במודל רגרסיה מרובה. איתור רב-קולינריות הוא חשוב מכיוון שהוא אמנם אינו מקטין את עוצמת ההסבר של המודל, אך הוא מצמצם את המשמעות הסטטיסטית של המשתנים הבלתי תלויים. VIF גדול על משתנה עצמאי מציין קשר קולינרי מאוד עם המשתנים האחרים שיש לקחת בחשבון או להתאים אותם במבנה המודל ובחירת המשתנים הבלתי תלויים.
הבנת גורם אינפלציה של שונות
רגרסיה מרובה משמשת כאשר אדם רוצה לבדוק את ההשפעה של מספר משתנים על תוצאה מסוימת. המשתנה התלוי הוא התוצאה שמופעלים על ידי המשתנים הבלתי תלויים, שהם התשומות למודל. רב-קולינריות קיימת כאשר יש קשר לינארי, או מתאם, בין אחד או יותר מהמשתנים או התשומות העצמאיים. רב-קולינריות יוצרת בעיה ברגרסיה המרובה מכיוון שמכיוון שהתשומות כולן משפיעות זו על זו, הן אינן עצמאיות, וקשה לבדוק עד כמה השילוב של המשתנים העצמאיים משפיע על המשתנה התלוי, או התוצאה, במודל הרגרסיה.. במונחים סטטיסטיים, מודל רגרסיה מרובה שיש בו רב-קולינריות גבוהה יקשה על הערכת הקשר בין כל אחד מהמשתנים הבלתי תלויים לבין המשתנה התלוי. שינויים קטנים בנתונים המשמשים או במבנה של משוואת המודל יכולים לייצר שינויים גדולים ובלתי-ארטיים במקדמים המשוערים על המשתנים הבלתי תלויים.
כדי להבטיח כי המודל מוגדר כהלכה ומתפקד כראוי, ישנן בדיקות שניתן לבצע עבור ריבוי-קולינריות. גורם אינפלציה שונות הוא כלי מדידה כזה. שימוש בגורמי אינפלציה שונות מסייע בזיהוי חומרתם של כל סוגיות רב-קוליניות, כך שניתן יהיה להתאים את המודל. גורם אינפלציה משתנה מודד עד כמה ההתנהגות (השונות) של משתנה עצמאי מושפעת, או מנופחת, על ידי האינטראקציה / המתאם שלו עם שאר המשתנים הבלתי תלויים. גורמי אינפלציה של שונות מאפשרים למדוד במהירות כמה משתנה תורם לטעות הסטנדרטית ברגרסיה. כאשר קיימים סוגיות משמעותיות רב-קוליניות, גורם האינפלציה השונות יהיה גדול מאוד עבור המשתנים המעורבים. לאחר זיהוי משתנים אלה ניתן להשתמש במספר גישות בכדי לחסל או לשלב משתנים קולניאריים, כדי לפתור את הבעיה הרב-קולינרית.
בעוד שרב-קולינריות לא מפחיתה את כוח החיזוי הכולל של מודל, היא יכולה לייצר הערכות של מקדמי הרגרסיה שאינם משמעותיים סטטיסטית. במובן מסוים ניתן לחשוב על זה כסוג של ספירה כפולה במודל. כששני משתנים עצמאיים או יותר קשורים זה לזה או מודדים כמעט אותו דבר, אזי ההשפעה הבסיסית שהם מודדים מקבלים דין וחשבון פעמיים (או יותר) על פני המשתנים, ונעשה קשה או בלתי אפשרי לומר איזה משתנה באמת משפיע על משתנה בלתי תלוי. זו בעיה מכיוון שמטרתם של מודלים אקונומטריים רבים היא לבדוק בדיוק סוג כזה של קשר סטטיסטי בין המשתנים הבלתי תלויים למשתנה התלוי.
לדוגמא, אם כלכלן רוצה לבדוק האם יש קשר מובהק סטטיסטית בין שיעור האבטלה (כמשתנה עצמאי) לבין שיעור האינפלציה (כמשתנה התלוי). כולל משתנים בלתי תלויים נוספים הקשורים לשיעור האבטלה, טענות ראשונות חדשות כאלה, חסרי עבודה, עלולים להכניס למודל רב-קולינריות. המודל הכולל עשוי להראות עוצמת הסבר חזקה ומספיקה סטטיסטית אך לא יוכל לזהות אם ההשפעה נובעת בעיקר משיעור האבטלה או מהתביעות הראשונות לחסרי העבודה. זה מה ש- VIF יגלה, והוא יציע אולי להפיל את אחד המשתנים מהמודל או למצוא דרך לאחד אותם כדי לתפוס את השפעתם המשותפת, תלוי באיזו השערה ספציפית החוקר מעוניין לבדוק.
