מה המשמעות של Winsorized?
ממוצע Winsorized הוא שיטת ממוצע המחליפה בתחילה את הערכים הקטנים והגדולים ביותר בתצפיות הקרובות להם. זה נעשה כדי להגביל את ההשפעה של ערכים קיצוניים חריגים, או מחיקים, על החישוב. לאחר החלפת הערכים, משתמשים אז בנוסחת ממוצע אריתמטי לחישוב הממוצע שאושר.
הנוסחה לממוצע הנסור הוא
Deen ממוצע Winsorized = Nxn… xn + 1 + xn + 2… xn איפה: n = מספר הפרטים הגדולים והקטנים ביותר שיש להחליף בתצפית
אמצעים ויזוריים באים לידי ביטוי בשתי דרכים. ממוצע "k n " זוכה להתייחסות להחלפה של התצפיות הקטנות והגדולות ביותר "k", כאשר 'k' הוא מספר שלם. ממוצע "X%" זוכה בממוצע כולל החלפת אחוז מסוים של ערכים משני קצוות הנתונים.
כיצד לחשב את הממוצע הזוכה
הממוצע המנצח מחושב על ידי החלפת נקודות הנתונים הקטנות והגדולות ביותר, ואז סיכום כל נקודות הנתונים וחלוקת הסכום במספר הכולל של נקודות נתונים.
מה אומר לך Winsorized?
הממוצע המנצח פחות רגיש למוצאים מכיוון שהוא יכול להחליף אותם בערכים פחות קיצוניים. כלומר, הוא פחות רגיש למתארים לעומת הממוצע. עם זאת, אם לפיזור יש זנבות שומן, ההשפעה של הסרת הערכים הגבוהים והנמוכים ביותר בתפוצה תשפיע מעט בגלל המספר הגבוה של משתנות בנתוני החלוקה.
Takeaways מפתח
- שיטת ממוצעת הכוללת החלפת הערכים הקטנים והגדולים ביותר בתצפיות הקרובות להם. פחות רגישים למחשבים משום שהיא יכולה להחליף אותם בערכים פחות קיצוניים. זה לא דומה לממוצע הגזום, הכרוך בהסרת נקודות נתונים - אם כי התוצאה של השניים נוטים להיות קרובים.
דוגמה לשימוש בממוצע Winsorized
ניתן לחשב את הממוצע המנצח בגודל הנתונים הבא: 1, 5, 7, 8, 9, 10, 14. בדוגמה זו אנו מניחים שהממוצע המנצח הוא בסדר הראשון, אנו מחליפים את הערכים הקטנים והגדולים ביותר שלהם התצפיות הקרובות ביותר.
מערך הנתונים מופיע כעת כדלקמן: 5, 5, 7, 8, 9, 10, 10. נקיטת ממוצע אריתמטי של הסט החדש מייצרת ממוצע מנצח של 7.7, או (5 + 5 + 7 + 8 + 9 + 10 + 10) חלקי 7.
לחלופין, שקלו ממוצע של 20% זוכה בחזית הגוברת את 10% הראשונים ואת 10% התחתונים ומחליף אותם בערכם הבא הקרוב ביותר. אנו נבחן במערך הנתונים הבא: 2, 4, 7, 8, 11, 14, 18, 23, 23, 27, 35, 40, 49, 50, 55, 60, 61, 61, 62, 75. השניים נקודות הנתונים הקטנות והגדולות ביותר, או 10%, יוחלפו בערך הקרוב ביותר שלהן. לפיכך מערך הנתונים החדש הוא: 7, 7, 7, 8, 11, 14, 18, 23, 23, 27, 35, 40, 49, 50, 55, 60, 61, 61, 61, 61. המנצחים זכו הממוצע הוא 33.9, או סך כל הנתונים (678) חלקי המספר הכולל של נקודות הנתונים (20).
ההבדל בין ממוצע זורם לממוצע חתוך
הממוצע המנצח כולל שינוי נקודות נתונים ואילו הממוצע הקצוץ כרוך בהסרת נקודות נתונים. זה נפוץ שהממוצע המנצח והגזום הוא קרוב.
מגבלות השימוש בממוצע Winsorized
החיסרון העיקרי באמצעים המנצחים הוא שהם מכניסים הטיה למערך הנתונים. עם זאת, מערך הנתונים הוא פחות מוטה לאחר השינוי מאשר אם היו נותרים מחיצים.
למידע נוסף על ממוצע ניצחונות
לקבלת תובנות קשורות, על ההבדלים בין חישובי ממוצע מפתח.
