מהי רגרסיה לינארית מרובה - MLR?
רגרסיה לינארית מרובה (MLR), המכונה גם פשוט רגרסיה מרובה, היא טכניקה סטטיסטית המשתמשת בכמה משתני הסבר כדי לחזות את התוצאה של משתנה תגובה. המטרה של רגרסיה לינארית מרובה (MLR) היא לדגמן את הקשר הליניארי בין המשתנים המסבירים (הבלתי תלויים) לבין משתנה התגובה (התלוי).
במהותה, רגרסיה מרובה היא הרחבה של רגרסיה רגילה פחות-ריבועים (OLS) המערבת יותר ממשתנה הסבר אחד.
הנוסחה ל רגרסיה לינארית מרובה היא
Deen Y = β0 + β1 xi1 + β2 xi2 +… + βp xip + ϵ היכן, עבור i = n תצפיות: yi = משתנה תלוי = משתנים מרחיבים β0 = יירוט y (קבוע מונח) βp = מקדמי שיפוע לכל משתנה מסבירϵ = מונח השגיאה של המודל (הידוע גם כשאריות)
הסבר רגרסיה לינארית מרובה
רגרסיה לינארית פשוטה היא פונקציה המאפשרת לאנליטיקאי או סטטיסטיקאי לבצע תחזיות לגבי משתנה אחד על סמך המידע הידוע על משתנה אחר. רגרסיה לינארית ניתנת לשימוש רק כאשר יש לאחד שני משתנים רציפים - משתנה עצמאי ומשתנה תלוי. המשתנה הבלתי תלוי הוא הפרמטר המשמש לחישוב המשתנה או התוצאה התלויה. מודל רגרסיה מרובה משתרע על כמה משתני הסבר.
מודל הרגרסיה המרובה מבוסס על ההנחות הבאות:
- יש קשר לינארי בין המשתנים התלויים לבין המשתנים הבלתי תלויים. המשתנים הבלתי תלויים אינם מתואמים יותר מדי זה עם זה. תצפיות i i נבחרות באופן עצמאי ובאופן אקראי מהאוכלוסייה. יש לחלק את הנבדקים בדרך כלל עם ממוצע של 0 ושונות σ.
מקדם הקביעה (ריבועי R) הוא מדד סטטיסטי המשמש למדידת כמה מהשונות בתוצאה ניתן להסביר על ידי השונות במשתנים העצמאיים. R 2 תמיד עולה ככל שמוסיפים יותר מנבאים למודל MLR למרות שהנבאים לא קשורים למשתנה התוצאה.
כך, לא ניתן להשתמש ב- R 2 בפני עצמו כדי לזהות אילו מנבאים צריכים להיכלל במודל ואילו יש להחריג. R 2 יכול להיות רק בין 0 ל -1, כאשר 0 מציין כי לא ניתן לחזות את התוצאה על ידי אף אחד מהמשתנים הבלתי תלויים ו- 1 מציין כי ניתן לחזות את התוצאה ללא שגיאה מהמשתנים הבלתי תלויים.
כאשר מפרשים את התוצאות של רגרסיה מרובה, מקדמי בטא תקפים תוך כדי קביעת כל המשתנים האחרים ("כל השאר שווה"). ניתן להציג את הפלט מרגרסיה מרובה אופקית כמשוואה, או אנכית בצורה טבלה.
דוגמה באמצעות רגרסיה לינארית מרובה
לדוגמא, אנליסט עשוי לרצות לדעת כיצד תנועת השוק משפיעה על מחירו של אקסון מוביל (XOM). במקרה זה, למשוואה הליניארית שלו יהיה ערך מדד S&P 500 כמשתנה העצמאי, או כמנבא, ומחירו של XOM כמשתנה התלוי.
במציאות ישנם גורמים רבים המנבאים את התוצאה של אירוע. תנועת המחירים של אקסון מוביל, למשל, תלויה ביותר מסתם בביצועי השוק הכולל. מנבאים אחרים כמו מחיר הנפט, שיעורי הריבית ותנועת המחירים של עתיד נפט יכולים להשפיע על מחיר ה- XOM ועל מחירי המניות של חברות נפט אחרות. כדי להבין קשר בו קיימים יותר משני משתנים, משתמשים ברגרסיה לינארית מרובה.
רגרסיה לינארית מרובה (MLR) משמשת לקביעת קשר מתמטי בין מספר משתנים אקראיים. במונחים אחרים, MLR בודק כיצד משתנים עצמאיים מרובים קשורים למשתנה תלוי אחד. לאחר שנקבע כל אחד מהגורמים הבלתי תלויים לחזות את המשתנה התלוי, ניתן להשתמש במידע על המשתנים המרובים כדי ליצור חיזוי מדויק על רמת ההשפעה שיש להם על משתנה התוצאה. המודל יוצר קשר בצורת קו ישר (לינארי) המתקרב בצורה הטובה ביותר לכל נקודות הנתונים הבודדות.
בהתייחס למשוואת MLR לעיל, בדוגמה שלנו:
- y i = משתנה תלוי: מחיר XOMx i1 = שיעורי ריבית x i2 = מחיר נפט x i3 = ערך S&P 500 indexx i4 = מחיר עתיד נפט B 0 = יירוט ייר בזמן אפס B 1 = מקדם רגרסיה המודד שינוי יחידה בתלות משתנה כאשר x i1 משתנה - השינוי במחיר ה- XOM כאשר הריבית משתנה B 2 = ערך מקדם המודד שינוי יחידה במשתנה התלוי כאשר x i2 משתנה - השינוי במחיר ה- XOM כשמחירי הנפט משתנים
הערכות הפחות ריבועים, B 0, B 1, B 2… B p, מחושבות בדרך כלל על ידי תוכנה סטטיסטית. כיוון שניתן לכלול משתנים רבים במודל הרגרסיה בו כל משתנה עצמאי מבדיל למספר - 1, 2, 3, 4… p. מודל הרגרסיה המרובה מאפשר לאנליטיקאי לחזות תוצאה על סמך מידע המסופק על משתני הסבר מרובים.
ובכל זאת, המודל לא תמיד מדויק לחלוטין מכיוון שכל נקודת נתונים יכולה להיות שונה מעט מהתוצאה שחזה המודל. הערך השיורי, E, שהוא ההבדל בין התוצאה בפועל לתוצאה החזויה, נכלל במודל כדי להסביר על שינויים כה קלים.
בהנחה שאנו מנהלים את מודל הרגרסיה של מחיר ה- XOM שלנו באמצעות תוכנת חישוב סטטיסטי המחזירה תפוקה זו:
אנליסט יפרש את התפוקה כמשמעות אם משתנים אחרים מוחזקים קבועים, מחיר ה- XOM יעלה ב -7.8% אם מחיר הנפט בשווקים יעלה ב -1%. המודל מראה גם שמחיר ה- XOM יירד ב -1.5% בעקבות עליית הריבית של 1%. R 2 מעיד כי ניתן להסביר 86.5% מהשינויים במחיר המניות של אקסון מוביל על ידי שינויים בשיעור הריבית, מחיר הנפט, עתיד הנפט ומדד S&P 500.
Takeaways מפתח
- רגרסיה לינארית מרובה (MLR), המכונה גם רגרסיה מרובה, היא טכניקה סטטיסטית המשתמשת בכמה משתני הסבר כדי לחזות את התוצאה של משתנה תגובה. רגרסיה מרובה היא הרחבה של רגרסיה ליניארית (OLS) המשתמשת רק במשתנה הסבר אחד. MLR נעשה שימוש נרחב בתחום האקונומטריה וההשלכות הכספיות.
ההבדל בין רגרסיה לינארית ומרובת ריבוי
רגרסיה לינארית (OLS) משווה את התגובה של משתנה תלוי בהינתן שינוי במשתנה מסביר כלשהו. עם זאת, נדיר שמשתנה תלוי מוסבר על ידי משתנה אחד בלבד. במקרה זה, אנליסט משתמש ברגרסיה מרובה, שמנסה להסביר משתנה תלוי באמצעות יותר ממשתנה עצמאי אחד. רגרסיות מרובות יכולות להיות לינאריות ולא לינאריות.
רגרסיות מרובות מבוססות על ההנחה שיש קשר לינארי בין המשתנים התלויים והבלתי תלויים. זה גם לא מניח שום מתאם עיקרי בין המשתנים הבלתי תלויים.
