מה מקדם הקביעה?
מקדם הקביעה הוא מדד המשמש בניתוח סטטיסטי המעריך עד כמה מודל מסביר ומנבא תוצאות עתידיות. זה מעיד על רמת השונות המוסברת במערך הנתונים. מקדם הנחישות, המכונה גם "ריבוע R", משמש כקו מנחה למדידת דיוק הדגם.
אחת הדרכים לפרש נתון זה היא לומר כי המשתנים הכלולים במודל נתון מסבירים כ- x% מהשונות שנצפתה. לכן, אם ה- R 2 = 0.50, אז המודל יכול להסביר כמחצית מהשונות שנצפתה.
R-Squared
Takeaways מפתח
- מקדם הנחישות הוא רעיון מורכב שבמרכזו הניתוח הסטטיסטי של מודל נתונים עתידי. מקדם הקביעה משמש כדי להסביר כמה משתנות של גורם אחד יכולה להיגרם בגלל הקשר שלו לגורם אחר.
הבנת מקדם הקביעה
מקדם הקביעה משמש כדי להסביר כמה משתנות של גורם אחד יכולה להיגרם בגלל הקשר שלו לגורם אחר. הוא מסתמך מאוד על ניתוח מגמות ומוצג כערך בין 0 ל -1.
ככל שהערך קרוב יותר ל -1, כך ההתאמה, או הקשר, בין שני הגורמים טובים יותר. מקדם הקביעה הוא ריבוע מקדם המתאם, המכונה גם "R", המאפשר לו להציג את מידת המתאם הליניארי בין שני משתנים.
מתאם זה ידוע כ"טוב הכושר ". ערך 1.0 מצביע על התאמה מושלמת, ולכן זהו מודל אמין מאוד לתחזיות עתידיות, מה שמצביע על כך שהמודל מסביר את כל הווריאציות שנצפו. ערך של 0 לעומת זאת, יצביע על כך שהמודל לא מצליח לבצע מודל מדויק של הנתונים בכלל. עבור מודל עם מספר משתנים, כמו מודל רגרסיה מרובה, ה- R 2 המותאם הוא מקדם קביעה טוב יותר. בכלכלה, ערך R 2 מעל 0.60 נתפס כראוי.
יתרונות ניתוח מקדם הקביעה
מקדם הקביעה הוא ריבוע המתאם בין הציונים החזוי במערך נתונים לעומת קבוצת הציונים בפועל. זה יכול להתבטא גם בריבוע המתאם בין ציוני X ו- Y, כאשר ה- X הוא המשתנה הבלתי תלוי וה- Y הוא המשתנה התלוי.
ללא קשר לייצוג, ריבוע R שווה ל- 0 פירושו שלא ניתן לחזות את המשתנה התלוי באמצעות המשתנה הבלתי תלוי. לעומת זאת, אם זה שווה ל 1, זה אומר שתלות משתנה תמיד ניבאה על ידי המשתנה הבלתי תלוי.
מקדם נחישות הנופל בטווח זה מודד את המידה שהמשתנה הבלתי תלוי ניבא למשתנה התלוי בו. ריבוע R של 0, 20 למשל, אומר ש- 20% מהמשתנה התלוי ניבא על ידי המשתנה הבלתי תלוי.
טוב ההתאמה, או מידת המתאם הליניארי, מודד את המרחק בין קו מותאם בגרף לבין כל נקודות הנתונים המפוזרות סביב הגרף. מערך הנתונים הצמוד יהיה בעל קו רגרסיה הקרוב מאוד לנקודות ובעל רמת התאמה גבוהה, כלומר המרחק בין הקו לנתונים קטן מאוד. בכושר טוב יש ריבוע R שקרוב ל 1.
עם זאת, ריבוע R אינו מסוגל לקבוע אם נקודות הנתונים או התחזיות הם מוטים. זה גם לא אומר למטפל או למשתמש אם מקדם קביעת הערך טוב או לא. לדוגמא, ריבוע R נמוך הוא לא רע, וזה תלוי באדם לקבל החלטה על בסיס מספר ריבוע R.
אין לפרש את מקדם הנחישות בתמימות. לדוגמה, אם מדווחים על ריבוע R של דגם 75%, השונות של טעויותיו היא 75% פחות מהשונות של המשתנה התלוי, וסטיית התקן של הטעויות שלו היא 50% פחות מסטיית התקן של התלוי משתנה. סטיית התקן של טעויות המודל היא כשליש מגודל סטיית התקן של השגיאות שתקבלו באמצעות מודל קבוע בלבד.
לבסוף, גם אם ערך ריבועי R הוא גדול, יתכן שלא תהיה משמעות סטטיסטית של משתני ההסבר במודל, או שהגודל האפקטיבי של משתנים אלה עשוי להיות קטן מאוד מבחינה מעשית.
