שונות היא מדידה של ההתפשטות בין המספרים בערכת נתונים. השונות מודדת כמה רחוק כל מספר בערכה מה הממוצע.
בעזרת תרשים מערך נתונים, אנו יכולים לראות מה הקשר הקווי של נקודות הנתונים או המספרים השונים. אנו עושים זאת על ידי ציור קו רגרסיה, המנסה למזער את המרחק של כל נקודת נתונים פרטנית מהקו עצמו. בתרשים שלהלן נקודות הנתונים הן הנקודות הכחולות, הקו הכתום הוא קו הרגרסיה והחצים האדומים הם המרחק מהנתונים שנצפו וקו הרגרסיה.
תמונה מאת ג'ולי באנג © Investopedia 2020
כאשר אנו מחשבים שונות, אנו שואלים, בהתחשב במערכת היחסים של כל נקודות הנתונים הללו, כמה מרחק אנו מצפים לנקודת הנתונים הבאה ? "מרחק" זה נקרא מונח השגיאה, וזה מה ששונות מודדת.
כשלעצמו השונות אינה מועילה לעתים קרובות מכיוון שאין לה יחידה, מה שמקשה על מדידה והשוואה. עם זאת, שורש השונות הריבועי הוא סטיית התקן, וזה גם מעשי כמדידה.
חישוב שונות באקסל
חישוב השונות ב- Excel קל אם קיימת כבר מערך הנתונים בתוכנה. בדוגמה להלן נחשב את השונות של 20 יום של תשואות יומיות בקרן הנסחרת בבורסה (ETF) הפופולרית ביותר בשם SPY, שמשקיעה ב- S&P 500.
- הנוסחה היא = VAR.S (בחר נתונים)
הסיבה שאתה רוצה להשתמש ב- VAR.S ולא ב- VAR.P (שזו נוסחה אחרת המוצעת) היא שלעתים קרובות אין לך את כל אוכלוסיית הנתונים למדידה. לדוגמה, אם היו לנו כל ההחזרות בהיסטוריה של תעודת סל ה- SPY בטבלה שלנו, נוכל להשתמש במדידת האוכלוסייה VAR.P, אך מכיוון שאנחנו מודדים רק את 20 הימים האחרונים כדי להמחיש את המושג, אנו נשתמש ב- VAR.S.
כפי שאתה יכול לראות, ערך השונות המחושב של.000018674 מספר לנו מעט על מערך הנתונים, בפני עצמו. אם היינו ממשיכים לשורש הריבוע הזה כדי לקבל את סטיית התקן של החזרות, זה היה מועיל יותר.
