הדשא של השכן

ביום 25.4.2022 כתבו שחר אילן ושלמה טייטלבאום בכלכליסט על שכר במשרדי הממשלה. יש שם גרף שמשווה בין שכר העובדים במגזר הציבורי והפרטי, וציוני הפסיכומטרי שלהם. ציוני הפסיכומטרי הם אינדיקטור לכישרון. זה לא ממש מובן מאליו להחליט כך, אבל זו דוגמה לנתונים שהיינו רוצים שיהיו לנו, אבל חסרים. ולפעמים אין ברירה אלא לנסות להוציא את המיטב מהנתונים שכן תחת ידנו.

גירסה ראשונה של הגרף מופיעה בטוויטר, כנראה צילום מהפרינט:

זה לא גרף טוב. בשביל לקבל אישוש ויזואלי לטענה שיש הבדלים ביחס בין שכר וכישרון, העין שלנו צריכה לטייל מהחלק השמאלי (ציון – כישרון), להשאר באותה שורה (כלכלה/הנדסה/משפטים וכולי), ולעבור לחלק הימני (שכר). בנוסף לכל זה, צריך להתרשם מההבדלים באורך העמודות משמאל (כחול חורג יותר ימינה – כלומר הכחולים יותר בציון), ולזכור אותו כשאנחנו עושים את אותה ההשוואה בחלק השמאלי (אדום חורג יותר ימינה – כלומר הכחולים פחות בשכר). אלו המון פעולות קוגניטיביות, וצריך לחזור עליהן עבור כל שורה בנפרד. זה מסובך. אולי זו יכולה להיות שאלה בפסיכומטרי!?

אבל לא באתי רק להשמיץ פה. יש בדיגיטל גרסה טובה בהרבה של אותו הגרף. הנה כך:

זה הרבה יותר נקי. בואו נבחן מה עשו כאן:

  • הסירו את כל הסדרה של ״משרדי הממשלה״. קשה להשוות בין שלושה דברים שונים, אז החליטו לפשט לנו ולהשאיר רק מגזר ציבורי ומגזר פרטי.
  • הסירו את הקטגוריות ״הנדסה״ ו״מדעי החברה״. זה בהחלט מפשט, אם כי מעלה סוגיות אחרות שלא אכנס אליהן כרגע.
  • הכותרות של תחום הלימוד עברו כולן לימין, והנתונים נמצאים לשמאלן, כך שהעין עושה רק מעבר אחד, מימין לשמאל.

בסך הכל, גרף הרבה יותר טוב. איך אפשר לשפר אותו עוד? כרגע, הנתונים של הפסיכומטרי הם בצורת טבלה. כדי להבין מה הפער אנחנו צריכים לחשב בראש את ההפרש (618 פחות 612), ואז לזכור אם התוצאה חיובית או שלילית, ולסחוב את זה בראש עד שנראה את העמודות ונשווה את ההבדלים ביניהם מסתדרים עם הסימן של ההפרש. עדיין די מורכב.

הדבר הראשון שאפשר לעשות זה להראות את היחס בין רמות השכר, במקום את המספרים עצמם. (זה נקרא ״לנרמל״ – עשינו את זה כבר בעבר). זה יפנה לנו את המוח להבחין בנתון הרלבנטי. אפשר לעשות זאת גם בציוני הפסיכומטרי, עם שינוי קטן: פה נשתמש בהפרש ולא ביחס.

עכשיו יש לנו שני מספרים לכל תחום לימוד:

  • הפער בשכר
  • הפער בציון

והתצפית המעניינת של הכתבה היא שלא תמיד שניהם חיוביים או שניהם שליליים. כדי לצפות בשני נתונים יחד אפשר להשתמש ב scatter plot (״תרשים פיזור). גם את זה ראינו כבר בבלוג. וזה יראה כך:

זה כבר הרבה יותר מרווח, ויש שיגידו דליל. אבל רואים מיד שבוגרי המשפטים מצטיינים ומתוגמלים, בוגרי המתמטיקה מדשדשים בשני התחומים, ובוגרי הכלכלה חזקים בציון, אבל מקופחים בשכר. מסקנה חדה במבט אחד, בלי לעשות חישובים בראש.

מקובל להמחיש דברים כאלה ברבעונים, כלומר למרכז את הגרף בראשית הצירים (אפס אם מחסרים, אחד אם מחלקים), ואז יש רבעון אחד של ״חזק/חזק״, אחד של ״חזק/חלש״, אחד של ״חלש/חזק״ ואחד של ״חלש/חלש״. אם ננסה את זה בגרף שלנו נקבל את זה:

אז כאן באמת קל לראות ש״כלכלה״ נמצע ברביע לא טבעי. אבל נכנסה לנו בעיה חדשה: המרחק האופקי של ״כלכלה״ מקו הייחוס הוא די קטן (6 נקודות הבדל בפסיכומטרי), ואם ננסה לתקן זאת ב״מתיחה״ של ציר ה-X, הרבעונים יצאו מלבניים ולא ריבועיים. הבעיה היסודית כאן היא לא ויזואלית, אלא הנתונים עצמם: 6 נקודות פסיכומטרי זה כנראה לא הרבה. יש כלים סטטיסטיים לבדוק את במדגם הנתון זה משמעותי או לא, אבל זה כבר דיון שחורג מהבלוג הזה.


Comments

כתיבת תגובה

האימייל לא יוצג באתר. שדות החובה מסומנים *