ביום 10.4.2022 פירסם ליאור דטל ב- the marker כתבה מצוינת על התפוקה העלובה של מערכת החינוך בישראל, ובמיוחד לאור ההשקעה האדירה בה. לפני שנצלול לעיקר, משעשע אותי הציטוט של בנק ישראל שאומר שמערכת החינוך פוגעת בכלכלת המדינה. אני יכול לדמיין איך כלכלן יגיע למסקנה כזאת. ועדיין – הצהרות כאלה בדיוק הן שהובילו לאמרה שכלכלן הוא אחד שיודע את המחיר של כל דבר, אבל את הערך של שום דבר.
בחזרה לענייננו – גרפים. הנה הגרף המרכזי בכתבה – מופיע ראשון בדיגיטל, בראש העמוד בפרינט, וגם מצוטט חלקית בעמוד השער בפרינט:
זה גרף מאוד מורכב, וננסה לפרק אותו בצורה שהעין שלנו מעבדת אותו. מה שתופס הכי הרבה שטח, וגם מצוין בצבעים בולטים, הוא הנתון של ההשקעה. ככזה, הגרף לא מוסיף לנו הרבה אינפורמציה: התיבות הירוקות הן כמעט באותו הגודל, עם הבדל קטן של 22% בין הנמוך (אסטוניה) לגבוה (קנדה). בנתונים של ה OECD יש מדינות עם נתונים יותר קיצוניים (החל מ-3000 למקסיקו ועד 21000 ללוקסמבורג). אפשר היה להכניס אותן לגרף הזה ואז לקבל ניצול יותר טוב של השליש האופקי האמצעי, שהוא כרגע כולו ירוק אחיד. אפשר לנחש שבחירת המדינות נעשתה דווקא לפי רמת השקעה שהיא דומה לישראל (שדרך אגב, היא במקום טוב באמצע מהבחינה הזאת). זה לגיטימי לגמרי, אבל במקרה כזה לא צריך בכלל לטרוח לציין את רמת ההשקעה – היא הרי אותו הדבר לכולן. וודאי שלא לבזבז עליה כל כך הרבה שטח.
יש בגרף גם נתונים מספריים בתוך עיגולים צהובים בולטים (שיעור הצמיחה מאז 2008). אני חושב שהנתון הזה לא תורם בכלל לסיפור שהכתבה מעבירה, ומקומו לא בגרף. אם מאוד רוצים, אפשר לציין את הנתון של ישראל (82%) בגוף הטקסט.
שני הנתונים הנותרים – דירוג במתמטיקה ודירוג בקריאה – הם בלב של הצנטרום של המוקד של הכתבה. אבל בגרף הם ממוקמים כלאחר יד. יש הרבה דברים שמפריעים להם לספר את הסיפור שלהם. מאיפה נתחיל?
- הם נמצאים בצד
- אין ייצוג גרפי לגודל של המספרים. הם נתונים בצורת טקסט. זה מתאים לטבלה, אבל לא לגרף
- הסמלילים שמבדילים ״מתמטיקה״ מול ״קריאה״ חוזרים על עצמם, לא תורמים לסיפור, תופסים שטח יקר, ובנוסף קטנים מכדי להיות ברורים
- המספרים עצמם הם הפוכים לאינטואיציה. לרוב מקובל שמספר גדול מציין דבר טוב. אבל כשמדובר בדירוג, המספר הכי קטן (1) הוא התוצאה הטובה ביותר (מקום ראשון)
- בנוסף, המספר עצמו (41 ו-37 לישראל, בהתאמה) הוא לא משמעותי. מה שמעניין אנשים זה הדירוג היחסי: האם אנחנו במקום גרוע, בינוני, או טוב?. וכמו שלא מעניין אותנו הציון הגולמי של ישראל (470 נקודות בקריאה, ו-463 נקודות במתמטיקה, לפי נתוני ה OECD מ-2018, ונכון שלא הייתם צריכים לדעת את זה?), כך גם לא מעניין אותנו הדירוג עצמו
אז איך אפשר לספר את הסיפור הזה יותר טוב?
נתחיל בתיאור התפוקות – הדירוג של ישראל במבחנים. יש פה שני ציונים (מתמטיקה וקריאה). בחירה אחת שאפשר לעשות היא לדבר על אחד מהם בלבד, וזאת במידה והוא מייצג גם את השני. מיד תראו שאכן זה המצב. אבל גם אם נתעקש להראות את שניהם, יש דרך מקובלת לזה ושמה scatter plot. לכל נתון, שני המספרים הם הקואורדינטות של הנקודה שמייצגת אותו. לגבי התשומות – רמת ההשקעה, כבר אמרנו שזה פחות משמעותי פה. אבל אפשר לדחוף אותה לגרף בעזרת הגודל של הנקודה – ככל שההשקעה גדולה יותר, הנקודה (או העיגול) גדולים יותר. וזה יראה כך:
אז זה כבר מראה לנו ש:
- ניצול המקום השתפר בהרבה. למעשה, יש לנו מקום להכניס את כל המדינות בדירוג, ועדיין לא להעמיס
- ישראל בפינה, כלומר במקום די רע בשני הדירוגים (דיברנו כבר על כך שדירוג רע זה אומר בעצם מספר גבוה, אבל קצת סבלנות ומיד נטפל גם בזה)
- ישראל במקום טוב באמצע מבחינת ההשקעה (גודל הנקודה)
- חמש מדינות ההשוואה שהעורך בחר (רמת השקעה דומה לישראל) הן בפינה הנגדית לישראל, הפינה של המנצחים
- ואחרון אחרון חביב, רוב הנקודות לא מתרחקות מהאלכסון, כלומר לשני המדדים (מתמטיקה וקריאה) יש ציונים די דומים בכל מדינה (טכנית: קורלציה חיובית וגבוהה). אז אם נמצא את עצמנו לחוצים במקום או בזמן לספר את הסיפור, נוכל לוותר על כל אחד מהם ולא לחטוא הרבה לאמת
מה עדיין לא מסתדר? הפינה של המנצחים אמורה להיות מימין למעלה. זו הקונבנציה. אז בואו נטפל בזה – פשוט נהפוך את הדירוג מהסוף להתחלה. הדירוג האחרון (42 כמובן) יהיה המספר הקטן ביותר, והדירוג הראשון (1) הגדול ביותר. מספרית אפשר פשוט להכפיל את כל הדירוג במינוס אחת (הערכים עצמם קיימים רק בטבלאות הפנימיות שלנו, אבל לא בגרף שמספר את הסיפור). וזה כבר יראה כך:
זה סיפור הרבה יותר ברור, גם למי שזורק מבט חטוף מבלי להתעמק בפרטים.
מה עוד אפשר לעשות? אפשר להתמקד רק בציון אחד (מתמטיקה או קריאה) בכל גרף. אנחנו נייצר את שני הגרפים, ונוכל אם נרצה להציג אותם זה ליד זה (מה שגם יתאים לחלון הנמוך והרחב שהגרף המקורי קיבל בפרינט). נישאר בצורת scatter plot, ונבחר את ציר Y לציון במבחן, ואת ציר X לרמת ההשקעה. וזה יראה כך:
מה אנחנו רואים בשני הגרפים? מבחינת ההשקעה, ישראל באמצע. אבל מבחינת התמורה, ישראל במקום נמוך. שזו בדיוק המסר של הכתבה. מ.ש.ל.
במאמר מוסגר, הטקסט של הכתבה עשיר מאוד ומכסה המון מעבר למה שתיארתי פה. בפרט, ליאור דטל מפרט על מה הולך הכסף ואיך ההוצאה מנוהלת. המספרים שמצוירים פה הם חלק קטן ושולי מהענין הזה. אבל בבלוג הזה אני מתעסק במספרים ובגרפים – אז סליחה.
מוזמנים להוסיף תובנות פה בהערות או ישירות אלי.
כתיבת תגובה