מהן דרגות חופש?
דרגות חופש מתייחס למספר המרבי של ערכים עצמאיים מבחינה לוגית, שהם ערכים שיש להם חופש להשתנות, במדגם הנתונים.
Takeaways מפתח
- מעלות חופש מתייחסת למספר המרבי של ערכים עצמאיים מבחינה לוגית, שהם ערכים שיש להם חופש להשתנות, במדגם הנתונים. מדינות חופש נדונות בדרך כלל ביחס לצורות שונות של בדיקות השערה בסטטיסטיקה, כמו צ'י ריבוע. חישוב דרגות חופש הוא המפתח כשמנסים להבין את החשיבות של נתון צ'י-ריבוע ואת תקפות השערת האפס.
הבנת דרגות חופש
הדרך הקלה ביותר להבין רעיונות של דרגות חופש היא באמצעות דוגמא:
- קחו לדוגמא נתונים שמורכבת, לשם הפשטות, חמישה מספרים שלמים חיוביים. הערכים יכולים להיות כל מספר ללא קשר ידוע ביניהם. תיאורטית, לדוגמה, יש חמש דרגות חופש. ארבעה מהמספרים במדגם הם {3, 8, 5 ו- 4} והממוצע של מדגם הנתונים במלואו מתגלה כ- 6. זה חייב להיות כי המספר החמישי צריך להיות 10. זה לא יכול להיות שום דבר אחר. אין לה את החופש להשתנות. אז מעלות החופש עבור מדגם נתונים זה הוא 4.
הנוסחה לתארים של חופש שווה לגודל מדגם הנתונים מינוס אחד:
Deen Df = N − 1 איפה: Df = דרגות חופש N = גודל מדגם
דרגות חופש נדונות בדרך כלל ביחס לצורות שונות של בדיקות השערה בסטטיסטיקה, כמו כיכר צ'י. חיוני לחשב דרגות חופש כשמנסים להבין את החשיבות של נתון צ'י-ריבוע ואת תקפות השערת האפס.
מבחני צ'י-ריבוע
ישנם שני סוגים שונים של מבחני צ'י-סקוור: מבחן העצמאות, ששואל שאלה של מערכת יחסים, כמו "האם יש קשר בין ציוני מגדר לציון SAT?"; והמבחן של התאמה טובה, ששואל משהו כמו "אם מטילים מושלכים 100 פעמים, האם הוא יעלה בראש 50 פעמים ויזנב 50 פעמים?"
לבדיקות אלה משתמשים בדרגות חופש כדי לקבוע אם ניתן לדחות השערה אפסית מסוימת על בסיס המספר הכולל של המשתנים והדגימות בתוך הניסוי. לדוגמה, כאשר בוחנים סטודנטים ובחירת הקורס, סביר להניח שגודל מדגם של 30 או 40 סטודנטים אינו גדול מספיק כדי לייצר נתונים משמעותיים. קבלת תוצאות זהות או דומות ממחקר שנעשה בגודל מדגם של 400 או 500 סטודנטים, תקף יותר.
היסטוריה של דרגות חופש
הרעיון המוקדם והבסיסי ביותר של דרגות חופש צוין בראשית 1800, שזור בעבודותיו של המתמטיקאי והאסטרונום קרל פרידריך גאוס. השימוש המודרני וההבנה של המונח הוסבר לראשונה על ידי ויליאם סילי גוסת, סטטיסטיקאי אנגלי, במאמרו "השגיאה המוצלחת של אמצעי", שפורסם בביומטריקה בשנת 1908 תחת שם עט כדי לשמור על אנונימיותו.
בכתביו, גוסת לא השתמש באופן ספציפי במונח "מעלות חופש". עם זאת, הוא נתן הסבר למושג לאורך כל פיתוחו של מה שידוע בסופו של דבר כחלוקת ה- T של התלמיד. המונח בפועל לא נעשה פופולרי עד שנת 1922. הביולוג והסטטיסטיקאי האנגלי רונלד פישר החל להשתמש במונח "מעלות חופש" כשהחל לפרסם דוחות ונתונים על עבודתו בפיתוח ריבועים צ'י.
