מהי סטטיסטיקה לא-פרמטרית?
נתונים סטטיסטיים לא פרמטריים מתייחסים לשיטה סטטיסטית בה הנתונים אינם נדרשים להתאמה להתפלגות רגילה. נתונים סטטיסטיים לא-פרמטריים משתמשים בנתונים שהם לרוב מסודרים, כלומר הם אינם מסתמכים על מספרים, אלא על דירוג או סדר. לדוגמה, סקר המציג העדפות צרכנים הנע בין אהבתי לאהוב ייחשב לנתונים רגילים.
נתונים סטטיסטיים לא-פרמטריים כוללים נתונים סטטיסטיים תיאוריים לא-פרמטריים, מודלים סטטיסטיים, הסקה ובדיקות סטטיסטיות. מבנה המודל של דגמים לא פרמטריים אינו מוגדר מראש, אלא נקבע על פי נתונים. המונח לא פרמטרי לא נועד לרמוז שמודלים כאלה חסרים פרמטרים לחלוטין, אלא שמספר ואופי הפרמטרים גמישים ולא קבועים מראש. היסטוגרמה היא דוגמא לאומדן לא-פרמטרי של התפלגות ההסתברות.
הבנת סטטיסטיקות לא-פרמטריות
בסטטיסטיקה, סטטיסטיקה פרמטרית כוללת פרמטרים כמו הממוצע, החציון, סטיית התקן, שונות וכו '. סוג זה של נתונים סטטיסטיים משתמש בנתונים שנצפו כדי להעריך את פרמטרי ההתפלגות. על פי נתונים סטטיסטיים פרמטריים, ההנחה היא שהנתונים יתאימו להתפלגות נורמלית עם פרמטרים לא ידועים μ (ממוצע אוכלוסייה) ו- σ 2 (שונות אוכלוסייה), אשר נאמדים אז בעזרת ממוצע המדגם ושונות המדגם.
נתונים סטטיסטיים לא-פרמטריים אינם מניחים הנחה לגבי גודל המדגם או האם הנתונים שנצפו הם כמותיים.
נתונים סטטיסטיים לא-פרמטריים אינם מניחים כי הנתונים נובעים מהתפלגות רגילה. במקום זאת, צורת החלוקה נאמדת תחת צורה זו של מדידה סטטיסטית. אמנם ישנם מצבים רבים בהם ניתן להניח חלוקה רגילה, אך ישנם גם כמה תרחישים בהם לא ניתן יהיה לקבוע אם הנתונים יופצו בדרך כלל.
דוגמאות לסטטיסטיקה לא-פרמטרית
בדוגמה הראשונה, שקול חוקר שרוצה הערכה של מספר התינוקות בצפון אמריקה שנולדו עם עיניים חומות עשוי להחליט לקחת מדגם של 150, 000 תינוקות ולבצע ניתוח על מערך הנתונים. המדידה שהם מפיקים תשמש כאומדן של כלל אוכלוסיית התינוקות עם העיניים החומות שנולדו בשנה שלאחר מכן.
לדוגמא שנייה, שקול חוקר אחר שרוצה לדעת האם השינה מוקדם או מאוחר קשורה לתדירות שבה אדם חולה. בהנחה שהמדגם נבחר באופן אקראי מהאוכלוסייה, ניתן להניח כי התפלגות גודל המדגם של תדירות המחלה תקינה. עם זאת, לא ניתן להניח כי ניסוי המודד את עמידותו של גוף האדם לזן של חיידקים הוא בעל תפוצה תקינה.
הסיבה לכך היא שנתוני מדגם שנבחרו באופן אקראי עשויים להיות עמידות בפני המתח. מצד שני, אם החוקר שוקל גורמים כמו איפור גנטי ומוצא אתני, הוא עשוי לגלות כי גודל מדגם שנבחר בעזרת מאפיינים אלה עשוי לא להיות עמיד בפני הזן. מכאן שאי אפשר להניח חלוקה נורמלית.
שיטה זו שימושית כאשר לנתונים אין פרשנות מספרית ברורה וכדאי להשתמש בה עם נתונים שיש להם דירוג מיני. לדוגמא, במבחן הערכת אישיות עשוי להיות דירוג של הערכים שלה כמוגדר מאוד, לא מסכים, אדיש, מסכים ומסכים מאוד. במקרה זה, יש להשתמש בשיטות לא פרמטריות.
שיקולים מיוחדים
נתונים סטטיסטיים לא-פרמטריים זכו להערכה בגלל קלות השימוש בהם. עם הקלת הצורך בפרמטרים, הנתונים הופכים ליישומים יותר למגוון גדול יותר של בדיקות. ניתן להשתמש בסוג זה של נתונים סטטיסטיים ללא הממוצע, גודל המדגם, סטיית התקן או הערכה של פרמטרים קשורים אחרים כאשר אף אחד מאותם מידע אינו זמין.
מכיוון שהסטטיסטיקה הלא-פרמטרית מניחה פחות הנחות לגבי נתוני המדגם, יישומה רחב יותר בהשוואה לסטטיסטיקה פרמטרית. במקרים בהם הבדיקה הפרמטרית מתאימה יותר, השיטות הלא-פרמטריות יהיו יעילות פחות. הסיבה לכך היא כי לתוצאות שהתקבלו מסטטיסטיקה לא-פרמטרית דרגת ביטחון נמוכה יותר מאשר אם התוצאות התקבלו באמצעות סטטיסטיקה פרמטרית.
Takeaways מפתח
- נתונים סטטיסטיים לא פרמטריים קלים לשימוש אך אינם מציעים את הדיוק המדויק של מודלים סטטיסטיים אחרים. סוג ניתוח זה המתאים ביותר כאשר בוחנים את הסדר של משהו, כאשר גם אם הנתונים המספריים משתנים, התוצאות ככל הנראה יישארו זהות.
