מהו מבחן דו-זנב?
בסטטיסטיקה, מבחן דו-זנב הוא שיטה בה התחום הקריטי של התפלגות הוא דו צדדי ובודק אם מדגם גדול או פחות מטווח ערכים מסוים. זה משמש בבדיקות ובדיקות של השערה אפסית לצורך חשיבות סטטיסטית. אם המדגם שנבדק נופל לאחד התחומים הקריטיים, ההשערה החלופית מתקבלת במקום השערת האפס. המבחן הדו-זנב מקבל את שמו מבדיקת האזור בשני הזנבות של התפלגות רגילה, אם כי ניתן להשתמש במבחן בהפצות אחרות שאינן נורמליות.
Takeaways מפתח
- בסטטיסטיקה, מבחן דו-זנב הוא שיטה בה התחום הקריטי של התפלגות הוא דו-צדדי ובודק אם מדגם גדול או פחות ממגוון מסוים של ערכים. משתמשים בו בבדיקות ובבדיקות של השערה null. אם המדגם הנבדק נופל לאחד התחומים הקריטיים, ההשערה האלטרנטיבית מתקבלת במקום השערת האפס. על פי האמנה משתמשים במבחנים דו-זנביים כדי לקבוע משמעות ברמת 5%, כלומר כל צד של ההפצה נחתכת ב 2.5%.
הקפד לציין אם מבחן סטטיסטי הוא חד או שנתי, שכן הדבר ישפיע רבות על פרשנות המודל.
מבחן דו-זנב למשמעות. Investopedia
איך עובד מבחן דו-זנב
מושג בסיסי של סטטיסטיקות הסבר הוא בדיקת ההשערה, שמתבצעת כדי לקבוע אם טענה נכונה או לא, בהתחשב בפרמטר אוכלוסייה. בדיקה שתוכנתה להראות אם הממוצע של מדגם גדול באופן משמעותי מממוצע אוכלוסייה ומכוון פחות משמעותית מכונה בדיקה דו-זנבית.
מבחן דו-זנב נועד לבחון את שני הצדדים של טווח נתונים מוגדר כמוגדר על ידי חלוקת ההסתברות המעורבת. חלוקת ההסתברות צריכה לייצג את הסבירות לתוצאה מוגדרת על בסיס סטנדרטים שנקבעו מראש. זה דורש קביעת מגבלה המציינת את הערכים המשתנים הגבוהים ביותר (או העליונים) והנמוכים ביותר (או התחתונים) הכלולים בטווח. כל נקודת נתונים הקיימת מעל הגבול העליון או מתחת לגבול התחתון נחשבת מחוץ לטווח הקבלה ובאזור המכונה טווח הדחייה.
אין תקן מובנה ביחס למספר נקודות הנתונים שחייבות להתקיים בטווח הקבלה. במקרים בהם נדרש דיוק, כגון ביצירת תרופות תרופתיות, יתכן כי יושם שיעור דחייה של 0.001% ומטה. במקרים שבהם הדיוק פחות קריטי, כמו מספר פריטי המזון בשקית מוצר, יתכן ששיעור הדחייה של 5% יתאים.
דוגמא למבחן דו-זנב
כדוגמה היפותטית, דמיין כי מתווך חדש (XYZ) טוען כי דמי התיווך שלו נמוכים משל דמי המתווך הנוכחיים שלך (ABC). נתונים הזמינים מחברת מחקר עצמאית מצביעים על כך שהממוצע וסטיית התקן של כל לקוחות המתווכים של ABC הם 18 $ ו 6 $ בהתאמה.
נלקח מדגם של 100 לקוחות של ABC ומחויב תיווך מחושב לפי התעריפים החדשים של מתווך XYZ. אם הממוצע של המדגם הוא 18.75 $ וסטיית התקן של המדגם היא 6 $, האם ניתן להסיק מה ההבדל בחשבון התיווך הממוצע בין ABC למתווך XYZ?
- H 0: השערה אפסית: ממוצע = 18H 1: השערה אלטרנטיבית: ממוצע <> 18 (זה מה שאנחנו רוצים להוכיח.) אזור דחייה: Z <= - Z 2.5 ו- Z> = Z 2.5 (בהנחה של רמת משמעות של 5%, פיצול 2.5 כל אחד משני הצדדים).Z = (ממוצע מדגם - ממוצע) / (std-dev / sqrt (מספר דגימות)) = (18.75 - 18) / (6 / (sqrt (100)) = 1.25
ערך Z מחושב זה נופל בין שני המגבלות שהוגדרו על ידי: - Z 2.5 = -1.96 ו- Z 2.5 = 1.96.
זה מסיק כי אין מספיק ראיות להסיק כי יש הבדל כלשהו בין שיעורי המתווך הקיים למתווך החדש. לחלופין, ערך ה- p = P (Z <-1.25) + P (Z> 1.25) = 2 * 0.1056 = 0.2112 = 21.12%, שהוא גדול מ- 0.05 או 5%, מוביל לאותה מסקנה.
שיקולים מיוחדים: דגימה אקראית
ניתן להשתמש במבחן דו-זנב גם באופן מעשי במהלך פעילויות ייצור מסוימות במשרד, כמו למשל לייצור ואריזה של סוכריות במתקן מסוים. אם מתקן הייצור מייעד 50 סוכריות לשקית כמטרה שלה, עם חלוקה מקובלת של 45 עד 55 סוכריות, כל שקית שנמצאת עם כמות מתחת לגיל 45 ומעלה נחשבת לטווח הדחייה
כדי לאשר שמנגנוני האריזה מכוילים כראוי בכדי לעמוד בתפוקה הצפויה, ניתן לבצע דגימה אקראית לאישור הדיוק. כדי שמנגנוני האריזה ייחשבו כמדויקים, רצוי בממוצע 50 סוכריות לשקית עם חלוקה מתאימה. בנוסף, מספר השקיות שנמצאות בטווח הדחייה צריך ליפול בגבול חלוקת ההסתברות שנחשב מקובל כשיעור שגיאה.
אם יתגלה שיעור דחייה פסול, או שממוצע החורג רחוק מדי מהממוצע הרצוי, יתכן ויהיה צורך בהתאמות למתקן או לציוד הנלווה לתיקון השגיאה. שימוש קבוע בשיטות בדיקה דו-זנביות יכול לעזור להבטיח שהייצור נשאר בגבולות לאורך זמן.
מבחן דו-זנב לעומת מבחן חד-זנב
כאשר מוגדרת בדיקת השערה כדי להראות שממוצע המדגם יהיה גבוה או נמוך יותר מממוצע האוכלוסייה, מכנים זאת מבחן חד-זנב. המבחן החד-זנב מקבל את שמו מבדיקת האזור שמתחת לאחד הזנבות (הצדדים) של התפלגות רגילה. כאשר משתמשים במבחן חד-זנב, אנליסט בודק את האפשרות של מערכת היחסים לכיוון אחד של עניין, ומתעלם לחלוטין מהאפשרות של מערכת יחסים לכיוון אחר.
אם המדגם שנבדק נופל לתחום הקריטי החד צדדי, ההשערה האלטרנטיבית תתקבל במקום השערת האפס. מבחן חד-זנב ידוע גם כהשערה כיוונית או מבחן כיווני.
