ביום 5.4.2023 כתב הדר חורש במוסף דה-מרקר לפסח מאמר בשם ״הדרך לדירה מתארכת״. את הכתבה מלווה גרף ענקי, שמתאר את מחירי הדירות בשנים האחרונות, וגם את השכר באותה תקופה. הגרף תומך לכאורה בתיזה של הכתבה, שהיא התייקרות הדיור מעבר לעליה בשכר. רק כדי להבהיר, אני מאמין לחורש שהמשפחה הממוצעת בישראל מתקשה יותר ויותר לקנות דירה. התלונה העיקרית שלי כאן היא לגבי הגרף. אני שם אותו כאן כדי שתוכלו לנסות למצוא את הבעיה בעצמכם:
מה רואים? קודם כל, איורים דרמטיים של אנשים מטפסים ונופלים, מה שקרוי בשפה מקצועית chartjunk. אבל לא בזה נתעסק היום. מעבר לזה, יש פה שני צירי Y שונים – אחד לשכר והשני לנדל״ן. וזה תמיד חשוד, ובהמשך נראה שהחשדות מוצדקים. אבל לפני כן, מה מתואר בצירים:
- ציר השכר – מתאר את השכר הממוצע
- ציר הנדלן – מתאר את שיעור השינוי במדד
אז כבר כאן יש בעיה. ״שיעור השינוי״, כלומר, נגזרת, הבדל משנה לשנה. וזאת לעומת השכר, שמבוטא כמספר טהור. מה ההבדל? נניח שמדד מסוים (שכר, מחיר הדלק, מספר החזירים ברחוב, לא משנה מה) מתחיל בשנה מסוימת במספר 100. עכשיו נניח שהוא עולה ב-10% בכל שנה. מה יהיה ערכו כעבור שנתיים? התשובה: 121, וזאת כי התוספת של 10% בשנה השניה מתיחסת כבר לערך המוגדל של 110 שבסוף השנה הראשונה. ולכן, למרות שגרף הנגזרת יראה כקו אופקי (10% ללא שינוי משנה לשנה), גרף המדד יראה עליה יפה.
אבל זו לא הבעיה העיקרית. הבעיה היא קנה המידה השונה של הצירים. שימו לב לטווח של שני המספרים (הערך הקטן ביותר והגדול ביותר האפשריים בגרף):
- עבור השכר – 9 עד 15 (באלפי שקלים)
- עבור מדד הדיור – מינוס 5 עד 20 (באחוזים). זה לא נראה בצילום בגלל קיפול של הדף שלא הצלחתי ליישר. תאמינו לי.
וזה כשלעצמו משנה את היחס בין שני הקוים בגרף (הכחול והכתום). מי שבחר לאפשר בציר השכר מספרים עד 15, השאיר המון מרווח בין הקו לבין קצה הגרף העליון. ואז נראה שהקו שטוח יותר. הנה, לדוגמה, איך גרף כזה יראה בתוכנה דמוית אקסל, בלי שום מניפולציה. התוכנה בוחרת את הטווח 10 עד 13, כי אלו מספרים עגולים שכוללים את כל הערכים:
מדובר באותם מספרים בדיוק כמו שיש בגרף המקורי של דה-מרקר. רק קנה המידה השתנה, והנה ההבדל נעשה הרבה פחות דרמטי. להמחשה, שיניתי ידנית את הטווח לערכים 9 עד 15 כמו בעיתון, וזה נראה כך:
עכשיו יש הבדל, והקו הכחול תופס פער מהקו הכתום (או התיבות הכתומות). אבל זו אשליה אופטית ותו לא. אפשר לשחק עם זה עוד קצת: בואו נבחר טווח של מינוס 4 עד 16, בדיוק כמו הטווח של המדד. איך זה יראה עכשיו?
בהצגה כזאת, נראה אמנם שהכחול עולה והכתום יציב, אבל רוב האנשים יאמרו שהכחול מדביק פער למול הכתום. ושוב, מדובר בדיוק באותם מספרים שמוצגים בכל הגרפים שפה. ההבדל ביניהם הוא קנה המידה, ולב הבעיה הוא שיש קני מידה שונים לציר ה Y הימני ולציר ה Y השמאלי.
ומה הלקח? בכל פעם שרואים גרף שבו יש שני צירי Y, צריך להגדיל את מידת החשדנות לפני שאנחנו ניגשים לפרש את הנתונים, וזה תופס גם בלי תוספות של איורים דרמטיים. חג שמח.
כתיבת תגובה