מהי נתון צ'י-ריבוע?
ריבוע צ'י ( χ 2) נתונים סטטיסטיים הם מבחן המודד את השוואה בין הציפיות לנתונים שנצפו בפועל (או תוצאות המודל). הנתונים המשמשים בחישוב נתון צ'י-ריבוע חייבים להיות אקראיים, גולמיים, בלעדיים הדדית, נמשכים ממשתנים עצמאיים, ונשאבים ממדגם גדול מספיק. לדוגמה, תוצאות השלכת מטבע פי 100 עומדות בקריטריונים אלה.
בדיקות צ'י-מרובע משמשות לרוב בבדיקת השערה.
הנוסחה לכיכר צ'י היא
χc2 = ∑ (Oi − Ei) 2 איפה: c = דרגות חופש O = ערך נצפה E = ערך צפוי (ים) begin {יישור} & \ chi ^ 2_c = \ sum \ frac {(O_i - E_i) ^ 2} {E_i} \ & \ textbf {איפה:} \ & c = \ text {דרגות חופש} \ & O = \ text {ערכים נצפים} \ & E = \ text {ערכים צפויים) } \ \ סוף {מיושר} χc2 = ∑Ei (Oi −Ei) 2 איפה: c = דרגות חופש O = ערך נצפה E = ערך צפוי (ים)
מה אומר לך סטטיסטיקת צ'י-ריבוע?
ישנם שני סוגים עיקריים של מבחני צ'י-מרובע: מבחן העצמאות, ששואל שאלה של קשר, כמו "האם יש קשר בין ציוני מגדר לציון SAT?"; והמבחן של התאמה טובה, ששואל משהו כמו "אם מטילים מושלכים 100 פעמים, האם הוא יעלה בראש 50 פעמים ויזנב 50 פעמים?"
לבדיקות אלה משתמשים בדרגות חופש כדי לקבוע אם ניתן לדחות השערה אפסית מסוימת על בסיס המספר הכולל של המשתנים והדגימות בתוך הניסוי.
לדוגמה, כאשר בוחנים סטודנטים ובחירת הקורס, סביר להניח שגודל מדגם של 30 או 40 סטודנטים אינו גדול מספיק כדי לייצר נתונים משמעותיים. קבלת תוצאות זהות או דומות ממחקר שנעשה בגודל מדגם של 400 או 500 סטודנטים, תקף יותר.
בדוגמה אחרת, שקול להשליך מטבע 100 פעמים. התוצאה הצפויה של השלכת מטבע הוגן 100 פעמים היא שראשים יעלו 50 פעמים וזנבות יעלו 50 פעמים. התוצאה בפועל עשויה להיות שראשים עולים 45 פעמים וזנבות עולים 55 פעמים. הנתון הצ'י-מרובע מראה כל אי-התאמה בין התוצאות הצפויות לתוצאות בפועל.
דוגמה לבדיקת צ'י בריבוע
תאר לעצמך סקר אקראי נערך על פני 2, 000 מצביעים שונים, גברים ונשים כאחד. האנשים שהגיבו סווגו לפי מגדרם והאם הם רפובליקנים, דמוקרטים או עצמאיים. תארו לעצמכם רשת עם העמודים שכותרתם רפובליקנית, דמוקרטית ועצמאית, ושתי שורות עם תווית זכר ונקבה. נניח שהנתונים של 2, 000 הנשאלים הם כדלקמן:
הצעד הראשון לחישוב נתון ריבועי הצ'י הוא מציאת התדרים הצפויים. אלה מחושבים עבור כל "תא" ברשת. מכיוון שישנן שתי קטגוריות של מגדר ושלוש קטגוריות של השקפה פוליטית, ישנם שישה תדרים צפויים בסך הכל. הנוסחה לתדר הצפוי היא:
E (r, c) = n (r) × c (r) מקום: r = שורה בשאלהc = עמודה בשאלה = סך הכל המתאים \ begin {ישר} & E (r, c) = \ frac {n (r) פעמים c (r)} {n} \ & \ textbf {איפה:} \ & r = \ text {שורה בשאלה} \ & c = \ text {עמודה בשאלה} \ & n = \ text {סה"כ המקביל} \ \ סוף {מיושר} E (r, c) = nn (r) × c (r) איפה: r = שורה בשאלה c = עמודה בשאלה = סך הכל המקביל
בדוגמה זו התדרים הצפויים הם:
- E (1, 1) = (900 x 800) / 2, 000 = 360E (1, 2) = (900 x 800) / 2, 000 = 360E (1, 3) = (200 x 800) / 2, 000 = 80E (2, 1) = (900 x 1, 200) / 2, 000 = 540E (2, 2) = (900 x 1, 200) / 2, 000 = 540E (2, 3) = (200 x 1, 200) / 2, 000 = 120
בשלב הבא משתמשים בערכים אלה לחישוב נתון ריבועי הצ'י באמצעות הנוסחה הבאה:
צ'י-ריבוע = ∑2E (r, c) איפה: O (r, c) = נצפו נתונים עבור השורה והעמודה \ {{}} = \ text {Chi-square = = sum \ frac {^ 2} {E (r, c)} \ & \ textbf {איפה:} \ & O (r, c) = \ text {צפו בנתונים לשורה והעמודה הנתונים} \ \ end {lined} Chi-squared = ∑E (r, c) 2 איפה: O (r, c) = נתונים שנצפו עבור השורה והעמודה הנתונים
בדוגמה זו הביטוי לכל ערך שנצפה הוא:
- O (1, 1) = (400 - 360) 2/360 = 4.44O (1, 2) = (300 - 360) 2/360 = 10O (1, 3) = (100 - 80) 2/80 = 5O (2, 1) = (500 - 540) 2/540 = 2.96O (2, 2) = (600 - 540) 2/540 = 6.67O (2, 3) = (100 - 120) 2/120 = 3.33
נתון ריבועי הצ'י שווה אז לסכום הערך הזה, או 32.41. לאחר מכן אנו יכולים להסתכל על טבלת נתונים סטטיסטיים בריבוע צ'י כדי לראות, בהינתן דרגות החופש במערך שלנו, אם התוצאה היא מובהקת סטטיסטית או לא.
