מהי רגרסיה לינארית?
רגרסיה לינארית היא עלילת נתונים המתרשמת את הקשר הליניארי בין משתנה עצמאי למשתנה תלוי. בדרך כלל משתמשים בו כדי להראות חזותית את חוזק הקשר ואת פיזור התוצאות - הכל לצורך הסבר ההתנהגות של המשתנה התלוי.
נניח שרצינו לבדוק את חוזק הקשר בין כמות הגלידה שנאכלת והשמנה. היינו לוקחים את המשתנה הבלתי תלוי, כמות הגלידה, ומייחסים אותו למשתנה התלוי, השמנת יתר, כדי לבדוק אם היה קשר. בהינתן רגרסיה היא תצוגה גרפית של קשר זה, ככל שהשונות בנתונים נמוכה יותר, הקשר חזק יותר ומתאים יותר לקו הרגרסיה.
Takeaways מפתח
- רגרסיה לינארית מדגמנת את הקשר בין משתנה תלוי ועצמאי. ניתן להשיג ניתוח רגרסיה אם המשתנים אינם תלויים, אין הטרוסצסטיות, ותאמת השגיאה של המשתנים אינה מתואמת. דוגמת רגרסיה לינארית ב- Excel קלה יותר עם כלי ניתוח הנתונים.
שיקולים חשובים
יש כמה הנחות קריטיות לגבי מערך הנתונים שלך שחייבים להיות נכונים כדי להמשיך בניתוח רגרסיה:
- המשתנים חייבים להיות עצמאיים באמת (באמצעות מבחן צ'י-ריבוע). על הנתונים לא להיות שונות של טעויות שונות (זה נקרא heteroskedasticity (נקרא גם heteroscedasticity). תנאי השגיאה של כל משתנה חייבים להיות לא מתואמים. אם לא, פירוש הדבר כי המשתנים מתואמים סדרתי.
אם שלושת הדברים האלה נשמעים מורכבים, הם כן. אולם ההשפעה של שאחד מאותם שיקולים אינה נכונה היא הערכה מוטה. בעיקרון, היית טועה במערכת היחסים שאתה מודד.
מוצא רגרסיה באקסל
השלב הראשון בהפעלת ניתוח רגרסיה באקסל הוא לבדוק פעמיים כי התקנת ה- Excel ניתוח נתונים ToolPak בחינם מותקנת. תוסף זה הופך את חישוב מגוון הסטטיסטיקות לקל מאוד. זה לא נדרש לתאר קו רגרסיה לינארית, אך זה הופך את יצירת טבלאות הסטטיסטיקה לפשוטות יותר. כדי לאמת אם מותקן, בחר "נתונים" בסרגל הכלים. אם "ניתוח נתונים" הוא אפשרות, התכונה מותקנת ומוכנה לשימוש. אם לא מותקן, אתה יכול לבקש אפשרות זו על ידי לחיצה על כפתור Office ובחירת "אפשרויות Excel".
בעזרת ToolPak ניתוח נתונים, יצירת פלט רגרסיה היא רק כמה לחיצות.
המשתנה הבלתי תלוי עובר בטווח ה- X.
בהתחשב בתשואות S&P 500, נניח שאנו רוצים לדעת אם נוכל להעריך את חוזקו ויחסיה של החזרי המניות של ויזה (V). מלאי הויזה (V) מחזיר נתונים מאכלסים את העמודה 1 כמשתנה התלוי. S&P 500 מחזיר נתונים מאכלסים את העמודה 2 כמשתנה הבלתי תלוי.
- בחר "נתונים" בסרגל הכלים. התפריט "נתונים" מציג. בחר "ניתוח נתונים". תיבת הדו-שיח ניתוח נתונים - כלי ניתוח מוצגת. מהתפריט, בחר "רגרסיה" ולחץ על "אישור". בתיבת הדו-שיח רגרסיה, לחץ על התיבה "טווח Y קלט" ובחר את נתוני המשתנים התלויים (ויזה (V)). חוזר). לחץ על התיבה "טווח X קלט" ובחר את הנתונים המשתנים הבלתי תלויים (מחזירה S&P 500). לחץ על "אישור" כדי להפיק את התוצאות.
פרש את התוצאות
אנו משתמשים בנתונים אלה (זהים ממאמר ריבועי ה- R שלנו), אנו מקבלים את הטבלה הבאה:
ערך ה- R 2, המכונה גם מקדם הקביעה, מודד את שיעור השונות במשתנה התלוי שמוסבר על ידי המשתנה הבלתי תלוי או עד כמה מודל הרגרסיה מתאים לנתונים. ערך ה- R 2 נע בין 0 ל -1, וערך גבוה יותר מצביע על התאמה טובה יותר. ערך ה- p, או ערך ההסתברות, נע גם הוא בין 0 ל -1 ומציין אם הבדיקה משמעותית. בניגוד לערך R 2, ערך p קטן יותר הוא חיובי מכיוון שהוא מצביע על מתאם בין המשתנים התלויים והבלתי תלויים.
תרשים רגרסיה ב- Excel
אנו יכולים לתאר רגרסיה באקסל על ידי הדגשת הנתונים ותמונתם כעלילת פיזור. כדי להוסיף שורת רגרסיה, בחר "פריסה" מהתפריט "כלי תרשים". בתיבת הדו-שיח, בחר "קו קו מגמה" ואז "קו קו מגמה ליניארי". כדי להוסיף את ערך ה- R 2, בחר "אפשרויות טרנד קו נוספות" מתוך "תפריט קו המגמה. לבסוף, בחר" הצג ערך ריבועי R בתרשים. התוצאה החזותית מסכמת את חוזק הקשר, אם כי על חשבון לא לספק פרטים כמו הטבלה למעלה.
