מהי סטטיסטיקה תיאורית?
סטטיסטיקות תיאוריות הם מקדמים תיאוריים קצרים המסכמים מערך נתונים נתון, שיכול להיות ייצוג של כולו או מדגם של אוכלוסייה. סטטיסטיקות תיאוריות מחולקות למדדים של נטייה מרכזית ומדדים להשתנות (התפשטות). מדדים של נטייה מרכזית כוללים את הממוצע, החציון והמצב, ואילו מדדי השונות כוללים את סטיית התקן, השונות, המשתנים המינימליים והמקסימליים ואת הקורטוזה והשינויים.
מהי סטטיסטיקה תיאורית?
הבנת סטטיסטיקה תיאורית
סטטיסטיקה תיאורית, בקיצור, עוזרת לתאר ולהבין את התכונות של מערך נתונים ספציפי על ידי מתן סיכומים קצרים על המדגם ומדדי הנתונים. הסוגים המוכרים ביותר של סטטיסטיקה תיאורית הם מדדי מרכז: הממוצע, החציון והמצב, המשמשים כמעט בכל רמות המתמטיקה והסטטיסטיקה. הממוצע, או הממוצע, מחושב על ידי הוספת כל הדמויות בערכת הנתונים ואז חלוקה במספר הדמויות בערכה. לדוגמה, סכום מערך הנתונים הבא הוא 20: (2, 3, 4, 5, 6). הממוצע הוא 4 (20/5). מצב מערך נתונים הוא הערך המופיע בתדירות הגבוהה ביותר, והחציון הוא הנתון שנמצא באמצע מערך הנתונים. זו הנתון המפריד בין הנתונים הגבוהים יותר לבין המספרים התחתונים בתוך מערך נתונים. עם זאת, ישנם סוגים פחות נפוצים של נתונים סטטיסטיים תיאוריים שעדיין חשובים מאוד.
אנשים משתמשים בסטטיסטיקה תיאורית כדי להחזיר את התובנות הכמותיות הקשות להבנה על פני נתונים גדולים שנקבעו לתיאורים בגודל נשיכה. ממוצע נקודות הציון של התלמיד (GPA), למשל, מספק הבנה טובה של נתונים סטטיסטיים תיאוריים. הרעיון של GPA הוא שלוקח נקודות נתונים ממגוון רחב של בחינות, שיעורים וציונים, וממוצע אותן יחד בכדי לספק הבנה כללית של יכולותיו האקדמיות הכוללות של התלמיד. ה- GPA האישי של הסטודנט משקף את הביצועים האקדמיים הממוצע שלו.
Takeaways מפתח
- סטטיסטיקה תיאורית מסכמת או מתארת מאפיינים של מערך נתונים. נתונים סטטיסטיים תיאוריים מורכבים משתי קטגוריות בסיסיות של מדדים: מדדים של נטייה מרכזית ומדדים של שונות או התפשטות. מדידות של נטייה מרכזית מתארות את מרכז מערך הנתונים. אמצעים של שונות או התפשטות מתארים פיזור הנתונים בתוך הסט.
מדדים לסטטיסטיקה תיאורית
כל הנתונים הסטטיסטיים התיאוריים הם מדדים לנטייה מרכזית או מדדים להשתנות, הידועים גם כמדדי פיזור. מדידות של נטייה מרכזית מתמקדות בערכים הממוצעים או האמצעיים של מערכי נתונים; ואילו מדדי השונות מתמקדים בפיזור הנתונים. שני מדדים אלה משתמשים בגרפים, טבלאות ודיונים כלליים כדי לעזור לאנשים להבין את משמעות הנתונים שניתחו.
מדדים של נטייה מרכזית מתארים את המיקום המרכזי של התפלגות עבור מערך נתונים. אדם מנתח את התדירות של כל נקודת נתונים בהתפלגות ומתאר אותה באמצעות הממוצע, החציון או המצב, המודד את הדפוסים הנפוצים ביותר של מערך הנתונים המנותח.
מדידות שונות או מדדי התפשטות מסייעות בניתוח עד כמה ההתפשטות היא עבור מערך נתונים. לדוגמה, בעוד שמדדי הנטייה המרכזית עשויים לתת לאדם את הממוצע של מערך נתונים, הוא אינו מתאר כיצד הנתונים מופצים בתוך הסט. לכן, בעוד שממוצע הנתונים עשוי להיות 65 מתוך 100, עדיין יכולות להיות נקודות נתונים הן ב -1 והן ב 100. מדדי השונות עוזרים לתקשר זאת על ידי תיאור הצורה והתפשטות של מערך הנתונים. טווח, רביעיות, סטייה מוחלטת ושונות הם כולם דוגמאות למדדים להשתנות. שקול את מערך הנתונים הבא: 5, 19, 24, 62, 91, 100. הטווח של מערך הנתונים הוא 95, שמחושב על ידי הפחתת המספר הנמוך ביותר (5) בערכת הנתונים מהגבוהה (100).
