מה מתאם מרשים
בסטטיסטיקה מתאם, או זימה, מתייחס לקשר בין שני משתנים שנראים סיבתיים אך אינם. קשרים מפוארים לרוב נראים כמו משתנה אחד המשפיע על אחר. מתאם מזויף זה נגרם לעתים קרובות על ידי גורם שלישי שאינו ניכר בעת הבדיקה, המכונה לעיתים גורם מבלבל.
Takeaways מפתח
- מתאם מפואר, או סקרנות, הוא כאשר שני גורמים נראים קשורים כלאחר יד אך אינם קשורים. הופעת קשר סיבתי נובעת לעתים קרובות מתנועה דומה בתרשים שמתברר כי היא מקרית או נגרמת על ידי גורם "מבלבל" שלישי. לעיתים קרובות יכול להיגרם על ידי גדלי מדגם קטנים או נקודות קצה שרירותיות.
איך מתאם מפואר
כאשר שני משתנים אקראיים עוקבים זה אחר זה מקרוב בתרשים, קל לחשוד במתאם, או בקשר בין שני הגורמים, כאשר שינוי משפיע על האחר. אם ניתן להניח "סיבתיות", נושא אחר, התבוננות זו יכולה לגרום לקורא התרשים להאמין שתנועתו של משתנה A קשורה לתנועה במשתנה B או להפך. אך לעיתים, בבדיקה סטטיסטית מדוקדקת יותר, התנועות המתואמות מקריות או נגרמות על ידי גורם שלישי המשפיע על השניים הראשונים. זה מתאם מזויף. מחקר שנעשה עם גדלי מדגם קטן או נקודות קצה שרירותיות הוא ייחודי לרגישות.
דוגמה להתאמות מפוארות
זה לא מאתגר מדי לגלות קשרים מעניינים. עם זאת, רבים יתבררו כזיורים. עבור המינים הזכריים בוול סטריט, שני קשרים מזויפים פופולריים כוללים נשים וספורט. מקורו בשנות העשרים של המאה העשרים הוא תיאוריית אורך החצאית, הגורסת כי אורך חצאית וכיוון שוק המניות קשורים זה לזה. אם אורכי החצאית ארוכים, פירוש הדבר ששוק המניות יורד; אם הם קצרים, השוק עולה. בסביבות סוף חודש ינואר מדברים על מה שמכונה אינדיקטור הסופרבול, שמציע כי ניצחון של צוות AFC פירושו ככל הנראה ששוק המניות יירד בשנה הקרובה, ואילו ניצחון של צוות ה- NFC מעלה עלייה ב שוק. מאז 1966 שיעור המדויק הוא 80%. זהו קטע שיחה מהנה אך ככל הנראה לא משהו שיועץ פיננסי רציני ימליץ עליו כאסטרטגיית השקעה עבור לקוחות.
להלן כמה דוגמאות נוספות למתאמים נפוצים:
- טביעה עולה כאשר מכירות הגלידה עולות. נראה כי עלייה במכירות הגלידה גורמת לטביעה רבה יותר, אך במציאות, עלייה בחום עשויה לגרום ליותר אנשים לשחות, כמו גם לקנות יותר גלידות. שיעור הרצח בארה"ב בשנים 2006-2011 ירד באותו קצב של Microsoft Internet Explorer שימוש. מנהלים שאומרים בבקשה ותודה לעיתים קרובות יותר נהנים מביצועים טובים יותר לשתף. אנשים הלובשים ציוד צוות של אוקלנד ריידרס נוטים יותר לבצע פשעים.
כיצד לאתר התאמות מפוארות
סטטיסטיקאים ומדענים אחרים שמנתחים נתונים חייבים כל הזמן לחפש מערכות יחסים מזויפות. ישנן מספר שיטות בהן הם משתמשים, כולל:
- הבטחת מדגם מייצג ראוי. השגת גודל מדגם מתאים. היזהר מנקודות קצה שרירותיות. שליטה על כמה שיותר משתנים חיצוניים. שימוש בהשערת אפס ובדיקת ערך p חזק.
