מהי רגרסיה צעד צעד?
ניתוח רגרסיה הוא גישה סטטיסטית נפוצה המבקשת לזהות קשרים בין משתנים. הרעיון הוא לאגר נתונים רלוונטיים לקבלת החלטות מושכלות יותר והוא נוהג מקובל בעולם ההשקעה. רגרסיה שלב הוא הבנייה האיטראטיבית שלב אחר שלב של מודל רגרסיה הכולל בחירה אוטומטית של משתנים עצמאיים. הזמינות של חבילות תוכנה סטטיסטיות מאפשרת רגרסיה של צעד אפשרי, אפילו בדגמים עם מאות משתנים.
סוגי רגרסיה צעד צעד
המטרה הבסיסית של רגרסיה צעד צעד היא דרך סדרת בדיקות (מבחני F, בדיקות t) למצוא קבוצה של משתנים עצמאיים המשפיעים באופן משמעותי על המשתנה התלוי. הדבר נעשה באמצעות מחשבים באמצעות איטרציה, שהיא תהליך ההגעה לתוצאות או החלטות על ידי מעבר סיבובים חוזרים או מחזורי ניתוח. לערוך בדיקות באופן אוטומטי בעזרת חבילות תוכנה סטטיסטיות יש יתרון של חיסכון בזמן עבור האדם.
Takeaways מפתח
- ניתוח רגרסיה הוא גישה סטטיסטית המבקשת להבין ולמדוד קשרים בין משתנים עצמאיים ותלויים. רגרסיה בשפה היא שיטה הבוחנת את המשמעות הסטטיסטית של כל משתנה עצמאי בתוך המודל. גישת הבחירה קדימה מוסיפה משתנה ואז בודקת את המשמעות הסטטיסטית. שיטת החיסול לאחור מתחילה במודל עמוס משתנים רבים ואז מסירה משתנה אחד בכדי לבחון את חשיבותו ביחס לתוצאות הכוללות. לרגרסיה בשפה יש מבקרים רבים, שכן מדובר בגישה שמתאימה נתונים למודל כדי להשיג תוצאה רצויה.
ניתן להשיג רגרסיה שלב אחר באמצעות ניסוי משתנה עצמאי אחד בכל פעם, וכללתו במודל הרגרסיה אם הוא מובהק סטטיסטית, או על ידי הכללת כל המשתנים הפוטנציאליים העצמאיים במודל וביטול אלה שאינם מובהקים סטטיסטית. יש המשתמשים בשילוב של שתי השיטות ולכן קיימות שלוש גישות לרגרסיה צעד צעד:
- בחירת קדימה מתחילה ללא משתנים במודל, בודקת כל משתנה כפי שהוא מתווסף למודל, ואז שומרת על אלה שנחשבים למשמעותיים ביותר מבחינה סטטיסטית - חוזרת על התהליך עד לקבלת התוצאות האופטימליות. חיסול אחורי מתחיל עם קבוצה של משתנים עצמאיים, מחיקה אחת בכל פעם, ואז בדיקה כדי לראות אם המשתנה שהוסר הינה מובהקת סטטיסטית. חיסול הכיוון הוא שילוב של שתי השיטות הראשונות הבודקות אילו משתנים יש לכלול או לכלול.
דוגמה לרגרסיה צעד צעד בשיטת חיסול לאחור תהיה ניסיון להבין את צריכת האנרגיה במפעל באמצעות משתנים כמו זמן הפעלת ציוד, גיל הציוד, גודל הצוות, הטמפרטורות בחוץ וזמן השנה. המודל כולל את כל המשתנים - ואז כל אחד מהם מוסר, אחד בכל פעם, בכדי לקבוע מהם הכי פחות מובהק סטטיסטית. בסופו של דבר, הדגם עשוי להראות כי זמן השנה והטמפרטורות הם המשמעותיים ביותר, ואולי עולה כי צריכת האנרגיה בשיאה במפעל היא כאשר השימוש במזגן הוא הגבוה ביותר.
מגבלות של רגרסיה צעד צעד
ניתוח הרגרסיה, הן ליניארית והן מרובת משתנים, נמצא בשימוש נרחב בעולם ההשקעות כיום. הרעיון הוא לרוב למצוא דפוסים שהיו קיימים בעבר שעלולים לחזור גם בעתיד. רגרסיה לינארית פשוטה, למשל, עשויה להסתכל על יחסי מחיר לרווח ותשואות מניות לאורך שנים רבות כדי לקבוע אם מניות עם יחסי רווח / רווח נמוכים (משתנה עצמאי) מציעות תשואות גבוהות יותר (משתנה תלוי). הבעיה בגישה זו היא שתנאי השוק משתנים לעיתים קרובות וקשרים שקיימו בעבר אינם בהכרח נכונים בהווה או בעתיד.
בינתיים, בתהליך הרגרסיה צעד צעד יש מבקרים רבים ויש אפילו קריאות להפסיק להשתמש בשיטה לחלוטין. הסטטיסטיקאים מציינים כמה חסרונות בגישה, כולל תוצאות שגויות, הטיה מובנית בתהליך עצמו והצורך בכוח מחשוב משמעותי לפתח מודלים של רגרסיה מורכבים באמצעות איטרציה.
