מהי הפצת דגימה?
התפלגות דגימה היא חלוקת הסתברות לנתון המתקבל באמצעות מספר גדול של דגימות שנמשכו מאוכלוסיה ספציפית. התפלגות הדגימה של אוכלוסייה נתונה היא התפלגות התדרים של מגוון תוצאות שונות שיכולות להתרחש לנתון של אוכלוסייה.
הבנת הפצת הדגימה
הרבה נתונים שנמשכים ומשתמשים על ידי אנשי אקדמיה, סטטיסטיקאים, חוקרים, משווקים, אנליסטים וכו 'הם למעשה דגימות, ולא אוכלוסיות. מדגם הוא תת-קבוצה של אוכלוסייה. לדוגמה, חוקר רפואי שרצה להשוות את המשקל הממוצע של כל התינוקות שנולדו בצפון אמריקה בשנים 1995-2005 לבין אלה שנולדו בדרום אמריקה באותה תקופה לא יכול למשוך זמן סביר את הנתונים עבור כלל האוכלוסייה של יותר ממיליון לידות שהתרחשו במהלך פרק הזמן של עשר שנים. במקום זאת הוא ישתמש רק במשקל של, למשל, 100 תינוקות, בכל יבשת כדי להסיק מסקנה. משקלם של 200 תינוקות בהם נעשה שימוש הוא המדגם והמשקל הממוצע המחושב הוא הממוצע המדגם.
כעת נניח שבמקום לקחת מדגם אחד בלבד של 100 משקולות שזה עתה נולד מכל יבשת, החוקר הרפואי לוקח דגימות אקראיות חוזרות ונשנות מהאוכלוסייה הכללית ומחושב את ממוצע הדגימה עבור כל קבוצת דגימות. אז לגבי צפון אמריקה הוא אוסף נתונים עבור 100 משקולות של יילודים שנרשמו בארה"ב, קנדה ומקסיקו באופן הבא: ארבע 100 דגימות מבתי חולים נבחרים בארה"ב, חמש 70 דגימות מקנדה ושלושה 150 רשומות ממקסיקו, בסך הכל מתוך 1200 משקולות של תינוקות שזה עתה נולדו בקבוצה ב 12 סטים. הוא גם אוסף נתוני מדגם של 100 משקולות לידה מכל אחת מ -12 המדינות בדרום אמריקה.
לכל מדגם ממוצע מדגם משלה והתפלגות אמצעי המדגם מכונה חלוקת המדגם.
המשקל הממוצע המחושב עבור כל מערך מדגם הוא חלוקת הדגימה של הממוצע. לא רק את הממוצע ניתן לחשב מדגם. ניתן לחשב נתונים סטטיסטיים אחרים, כגון סטיית התקן, השונות, הפרופורציה והטווח. סטיית התקן והשונות מודדים את השונות של חלוקת הדגימה.
מספר התצפיות באוכלוסייה, מספר התצפיות במדגם והנוהל המשמש לציור מערכי המדגם קובעים את השונות של חלוקת הדגימה. סטיית התקן של חלוקת דגימה נקראת שגיאת התקן. בעוד הממוצע של חלוקת הדגימה שווה לממוצע האוכלוסייה, השגיאה התקנית תלויה בסטיית התקן של האוכלוסייה, בגודל האוכלוסייה ובגודל המדגם.
הידיעה עד כמה הפיזור הממוצע של כל אחת מהמדגמים הוא אחד מהשני ומממוצע האוכלוסייה ייתן אינדיקציה עד כמה ממוצע המדגם קרוב לאוכלוסיית הממוצע. השגיאה הסטנדרטית של חלוקת הדגימה פוחתת ככל שגודל המדגם גדל.
שיקולים מיוחדים
אוכלוסיה או קבוצת מספרים מדגם אחת תהיה חלוקה נורמלית. עם זאת, מכיוון שחלוקת הדגימה כוללת מספר קבוצות של תצפיות, היא לא בהכרח תהיה בעלת צורה מפותלת.
בעקבות הדוגמה שלנו, למשקל הממוצע של האוכלוסייה של תינוקות בצפון אמריקה ובדרום אמריקה יש התפלגות נורמלית מכיוון שחלק מהתינוקות יהיו בתת משקל (מתחת לממוצע) או בעודף משקל (מעל הממוצע), כאשר מרבית התינוקות נופלים בין (בערך הממוצע)). אם המשקל הממוצע של הילודים בצפון אמריקה הוא 7 פאונד, המשקל הממוצע של המדגם בכל אחת מ -12 קבוצות התצפיות המדגמיות שנרשמו לצפון אמריקה יהיה קרוב לשבעה קילוגרמים גם כן.
עם זאת, אם תרשים את כל הממוצעים המחושבים בכל אחת מ -1, 200 קבוצות הדגימה, הצורה המתקבלת עשויה לגרום להתפלגות אחידה, אך קשה לחזות בוודאות מה תהיה הצורה בפועל. ככל שיותר מדגמים שהחוקר משתמש בהם מהאוכלוסייה של יותר ממיליון נתוני משקל, הגרף יתחיל ליצור התפלגות רגילה.
- התפלגות דגימה היא חלוקת הסתברות לנתון המתקבל באמצעות מספר גדול של דגימות שנשאבו מאוכלוסיה ספציפית. חלוקת הדגימה של אוכלוסייה נתונה היא התפלגות התדרים של מגוון תוצאות שונות שיכולות להתרחש לנתון של אוכלוסייה. הרבה נתונים שנמשכים ומשתמשים על ידי אקדמאים, סטטיסטיקאים, חוקרים, משווקים ואנליסטים הם למעשה דגימות, ולא אוכלוסיות.
