עמוד הבית

  • צבעי רכב

    אוטו צהוב! למי שלא מכיר, חוקי משחק הילדים הם שהראשון שמבחין באוטו צהוב נותן כאפה לאחיו המעצבן שיושב לידו. וכמה רכבים צהובים יש סביבנו? התשובה היא בערך 0.2%. (כל הנתונים הם באדיבות משרד התחבורה, וכוללים כלי רכב עד משקל 3.5 טון, כלומר לא אוטובוסים ולא משאיות).

    זוכרים את המכוניות הירוקות של שנות ה-90? הכוונה לא לאוטובוסים, אלא למה שנקרא אז פרייבט. למה לא רואים אותן יותר? ומה עם כחולות? עדיין יש? התפלגות צבעי המכוניות בישראל לפי שנים נתונה כאן:

    די ברור שעם הזמן, הצבעים נהיים משעממים יותר: הירוקים והצהובים כמעט ונכחדו. יש הרבה פחות כחולים, והצבעים השולטים הם מה שנקרא grayscale: לבן, אפור, שחור וכסף. מדובר במגמה עולמית. אולי אנשים חוששים שרכב בצבע בולט יאבד ערך כיד שניה. ויש גם ממצאים שמראים שמכוניות לבנות מעורבות פחות בתאונות דרכים, אם כי מדובר באפקט חלש, ביחס לשאר הגורמים לתאונות.

    מה לגבי צבע מטאלי? צבעי רכב שמכילים את המילה מטאלי (או מטלי) הפכו לאופנתיים בתחילת שנות ה-2000, הגיעו לשיא ב-2012, ירדו ומאז 2016 הם יציבים סביב 17% מהכלים שנמצאים על הכביש. כך זה נראה בגרף:

    בכבישי ישראל יש השפעה חזקה של שוק הליסינג. איך נראים הצבעים שם? להלן ההתפלגות בקרב מכוניות שלא נמכרו לקונה פרטי (כלומר ליסינג והשכרה):

    באופן כללי המצב גם שם דומה – לבן, אפור, ושחור בעיקר. ומה עם הבשורה החשמלית? להלן המצב בקרב מכוניות חשמליות:

    יש קצת יותר ייצוג לגווני הכחול והתכלת, אבל לא בהרבה. לא מכאן תבוא הישועה הססגונית.

    מי היצרן הכי משעמם? אפשר להגדיר מתמטית את רמת ההפתעה של התפלגות – זה נקרא אנטרופיה. היצרן עם האנטרופיה הקטנה ביותר בישראל, כלומר עם הצבעים האחידים ביותר, הוא Geely הסיני. כ-60% מהמכוניות שלו על כבישי ישראל לבנות, והשאר אפורות או כחולות בהסתברות די שווה. ובצד השני של הטבלה, היצרן עם האנטרופיה הגבוהה ביותר של הצבעים הוא סוזוקי, עם ההתפלגות המרהיבה הזאת:

  • ספקולנטים ברכב חשמלי?

    מכוניות חשמליות עולות בפופולריות שלהן בקצב מרשים. באפריל, כמעט כל מכונית שישית שעלתה על הכביש בישראל היתה חשמלית. מה יקרה כאשר הן יגיעו לשוק המשומשות? ואולי הן בשוק כבר עכשיו?

    חיפוש זריז באתרי יד שניה, מראה שיש היצע גדול של רכבים חשמליים עם קילומטרז׳ מאוד נמוך (מתחת 10,000 ק״מ ולא פעם גם מתחת 5000). כמובן, יש כאלה גם במכוניות בנזין, אבל מה היקף התופעה? צללתי לנתוני משרד התחבורה (שוב) כדי לבדוק.

    לגבי נתח השוק, הנה הוא כגרף:

    עד מרץ 2021, מכירות החשמליות (וההיברידיות) היו אפסיות. ואז התחילה עליה מתמדת, עד שכרגע 23% מהמכירות ללקוחות פרטיים הן של רכב חשמלי. אם מסתכלים על מכירות כולל חברות השכרה וליסינג, השיעור הוא 17% לחשמלי. העליה היא על חשבון רכבי הבנזין, בעוד ההיברידיים ומנועי הדיזל נשארים ללא שינוי משמעותי. יש גם שיאים נקודתיים בחודשי דצמבר שאין לי הסבר עבורם – השערות יתקבלו בברכה.

    כמה מהר המכונית יוצאת לשוק המשומשות? בנתונים של משרד התחבורה אפשר לראות תאריכי העברת בעלות, וגזרתי מהם את הגרף הבא:

    הגרף סופר רק מכוניות שנמכרו ללקוחות פרטיים ועלו על הכביש החל מ-2020. לכל סוג דלק, הגרף מציין את המספר היחסי של הרכבים שנמכרו, בנפרד למכירה שארעה עד שנה מעליית הרכב על הכביש, ובנפרד למכירה מאוחרת יותר. העמודה ״מקורי״ מציינת את המכוניות ללא רישומי העברת בעלות (כלומר נשארו בידי הקונה המקורי). המסקנה הראשונה היא שרכב חשמלי מחזיק יותר זמן בידי הקונה המקורי: 91% מכלי הרכב החשמליים לעומת 87% ברכב בנזין.

    אבל אם מסתכלים על היחס בין המכירות של רכב כמעט חדש (עד שנה) למכירות של רכב ותיק יותר, (גודל התיבה הירוקה לעומת האדומה) מסתמן הבדל בכיוון ההפוך: מבין הרכבים שנמכרים, החשמליים נוטים יותר להמכר מוקדם. בואו ננסה לחדד את ההבדל הזה.

    לכל מכירת רכב, נסמן את המועד שלה (כמשך הזמן שעבר מעליית הרכב לכביש). המועד הוא מספר חיובי כלשהו של חודשים. אם נשאל ״כמה מהמכוניות נמכרו תוך פחות מעשרים שנה״?, אז התשובה תהיה 100%. אם נשאל ״כמה מהמכוניות נמכרו תוך חודש״? אז התשובה תהיה אחוז נמוך כלשהו. הגרף כאן מראה את התשובה לשאלה, עבור כל מספר של חודשים (בציר ה-X). כלומר הנקודה עבור X חודשים אומרת את שיעור המכוניות שנמכרו לאחר X חודשים או פחות. הגרף הזה לא יכול לרדת (כי כל חודש מכיל את הקודמים לו), מתחיל ב-0 ומסתיים ב-100%. זה נקרא פונקצית התפלגות מצטברת ובאנגלית CDF. והנה הגרף:

    כמו שרואים, הקו הירוק (חשמל) עולה מהר יותר והוא מעל הקו הכחול (בנזין). מה שזה אומר, שהמכוניות החשמליות שיוצאות לשוק, יוצאות מוקדם יותר מאשר מכוניות הבנזין שנמכרות.

    אני רוצה להדגיש פה נקודה: ההתפלגות המצטברת בגרף למעלה היא רק מתוך המכוניות שנמכרו. המכוניות שנשארו בידי הקונה המקורי בכלל לא מופיעות בגרף. אם רוצים, אפשר לדמיין אותן בצד ימין, מאוד מאוד רחוק בעתיד. המכוניות החשמליות, הן כרגע נשארות בידי הקונה המקורי יותר מאשר מכוניות הבנזין. זה צפוי מכיוון שרובן די חדשות (כזכור, לפני אפריל 2021 כמעט ולא היו כאלה בישראל). מה שהגרף מראה זה את תזמון המכירה, בתנאי שהרכב אכן נמכר. אפשר אולי להסביר את זה בתרשים זרימה. או שני תרשימים – אחד לחשמל ואחד לבנזין:

    וזה אומר שבמידה והרכב יוצא למכירה, אז רכב חשמלי יוצא מהר יותר. זה מסביר את התצפית שיש הרבה מכוניות חשמליות עם מעט קילומטרים ביד 2. למה בדיוק זה קורה – זו כבר שאלה אחרת.

  • נומרולוגיה בלוחיות רישוי

    לוחיות רישוי בישראל הן בנות 7 או 8 ספרות. לכולם ברור שהמספרים עליהם הם לא אקראיים. אבל עד כמה? איך זה, למשל, שמתוך כמעט 4 מיליון המספרים שעל הכביש, רק 47 אחוז הם זוגיים? צללתי שוב אל קובץ נתוני משרד התחבורה.

    להלן, התפלגות הספרות בכל מיקום של המספר. נתחיל במספרים בני 8 ספרות, שמונפקים החל מיולי 2017 (מספרים בני 7 ספרות מתוארים בהמשך). יש פה 8 היסטוגרמות, החל מהספרה השמאלית ביותר (מיקום 0), ועד לימנית ביותר (מיקום 7).

    מה אנחנו רואים? הספרה הראשונה אינה 0, שזה די ברור, וגם הערך 9 עבורה מאוד נדיר. רוב המכוניות האלה עלו על הכביש בשנים 2015-2018, עם נוכחות מכובדת של דגמי סקודה אוקטביה ורנו פלואנס.

    שתי הספרות האחרונות הן אך ורק מתוך הצירופים: 01, 02, 03. ויקיפידיה מלמדת אותנו שאלו ספרות שמייצגות סדרה כללית לכל הארץ, וכשתתמלא מכסת המכוניות מסדרה 03 תתחיל סדרה 04, וכן הלאה. נכון לעכשיו, סדרות 01 ו-02 די דומות בשכיחות, אבל סדרה 03 מטה את הכף לטובת המספרים האי-זוגיים.

    לגבי מספרים בני 7 ספרות, ההתפלגות היא כך:

    גם כאן אין 0 בספרה הראשונה (ברור). ובספרה הלפני אחרונה יש תבנית מרעננת (מה שקוראים ״אנטרופיה גבוהה״). הספרות הנפוצות שם הן 3, 5 ,6, ו-7. הספרות הנדירות הן 9 (בלי מופעים בכלל) וגם 4, שממנה יש מופע אחד בדיוק. מדובר באיסוזו פיק-אפ 2017 עם מספר רישוי 1272040, ונכון לעכשיו הוא ללא טסט בתוקף, כך שקטן הסיכוי שתראו אותו על הכביש. מעניין יהיה לשמוע את הסיפור שמאחורי הנפקת המספר הזה.

  • מאזן צבעוני

    ביום 18.4.2024 כתב נתי טוקר בדה-מרקר על תחזית הכנסות והוצאות למשקי בית לאור ההפיכה המשטרית. הכתבה סובבת סביב מספר נתונים שמרוכזים בגרפיקה הבאה:

    מה יש לנו פה?

    • טבלה עם המון מספרים
    • גם בשורת הכותרת (העליונה) יש מספרים
    • יש הרבה מאוד צבעים בולטים מאוד בצד ימין
    • חלק מהצבעים הם ירוק ואדום, שזו מוסכמה ל״טוב״ מול ״רע״ (או לניגוד מובהק אחר)
    • הרקעים של השורות הם בגוונים שהם ברובם גרסה חיוורת של הצבע בעמודה הימנית בשורה, אבל…..
    • …השורות בשליש התחתון הם בגווני אפור למרות שהעמודה הימנית אדומה

    מי שהכין את הטבלה הזאת מתח ממש את יכולות הגרפיקה. אבל במבט שני, רוב העיטורים לא מתייחסים בכלל לנתונים:

    • הרבה מספרים הם סכומים או הפרשים של מספרים אחרים (לדוגמה: מאזן = הכנסות פחות הוצאות)
    • המספרים בשורה העליונה בעצם מציינים תתי-קבוצות באוכלוסיה (מעמד נמוך, בינוני, וגבוה)
    • הצבעים בצד ימין לא מקודדים שום דבר ורק מסיטים את המבט מהעובדות החשובות. למעשה, היתה הזדמנות לקודד בירוק את שורות ההכנסה, ובאדום את שורות ההוצאה, אבל זה לא קורה פה
    • הרקעים של השורות לא מקודדים שום דבר

    איך נוכל לשפר את זה?

    אפשרות ראשונה: טבלה עם אותם הנתונים, רק קצת פחות ססגונית:

    קודדנו את ההכנסות בירוק ואת ההוצאות באדום. המאזן כחול, ושאר השורות פחות בולטות כדי לתת לעין להתמקד ולמוח לעכל. אפשר לשקול לצבוע גם את השורה התחתונה, שהיא בלב עיסוק הכתבה. (לחדי העין: המספרים פה קצת שונים, אבל בדקתי ונראה לי שהגרסה פה יותר מדויקת).

    אפשרות שניה: בגרף עמודות אופקי, ונציב את ההכנסות מימין לאפס ואת ההוצאות משמאל לאפס, כך:

    מה היתרונות? אפשר לראות שעבור כל קבוצה, רכיב ההכנסות יורד, ורכיב ההוצאות עולה.

    מה החסרונות? קשה לראות את המאזן (הכנסות פחות הוצאות), וקשה יותר (עד בלתי אפשרי) לראות את ההפרש במאזן. וגם יצרנו שישה אלמנטים עבור שלוש קבוצות אוכלוסיה (לכל קבוצה יש ״לפני״ ו״אחרי״). אפשר לנסות ולתקן על-ידי המחשה של המאזן, שהוא ההפרש בין המספרים. גרפית, הוא יהיה הגודל של המלבן שנשאר אחרי שמניחים את מלבן ההוצאות על מלבן ההכנסות. אם ההסבר מעורפל, אולי זה יעזור:

    הרכיב של ״הכנסות״ קיים (באורך המלבן) אבל לא מסומן בגרף. החלק האדום מסמל את מה שנשאר אחרי ההוצאות. כאן כבר קל לראות שזה שלילי עבור קבוצות מסוימות. אבל, עדיין נשארנו עם שישה אלמנטים עבור שלוש קבוצות אוכלוסיה. ואולי גם כדאי שהמלבנים האדומים יתחילו מציר האפס גם כשהמאזן חיובי?

    אפשרות נוספת נקראת גרף מפל (waterfall chart). זה כלי סטנדרטי להמחיש סדרת מספרים שכל אחד מהם הוא תוספת (או הפחתה) של המספר הקודם. משתמשים בו לדברים כמו מאזנים של חברות, ושם מפרטים את מקורות ההכנסה השונים, שמצטברים זה לזה, ואת ההוצאות השונות, שגורעות מההכנסה שנצברה. כל מספר מחובר לסכום שלפניו בקו אופקי, שמסמל את הקשר בין שתי התיבות. התיבות עצמן לא מתחילות מציר האפס אלא מהסכום בעמודה הקודמת, ולכן נראה שהן מרחפות באויר, מה שנתן לגרף את הכינוי ״גרף מריו״. במקרה שלנו, אפשר לתאר את ההפחתות השונות במאזן של משפחה ממוצעת כך:

    זה דוגמה עבור המעמד הבינוני, אז נזדקק לעוד שני גרפים דומים כדי לתאר את כל האוכלוסיה. עוד דבר שאפשר לעשות זה לצמצם את הסיפור לשני מספרים בלבד (הכנסות והוצאות). יש שישה סיפורים כאלה (3 קבוצות אוכלוסיה, לכל אחת ״לפני״ ו״אחרי״), ולהציג אותם במטריצה שנקראת small multiple, להלן:

    האם זה יותר ברור? לדעתי, לא. אבל אולי אפשר לקחת את זה כנקודת התחלה ולשפר מכאן. אשמח להצעות.

  • תוי נכים ודגמים

    דודג׳ ראם בגובה של פיל עם תו נכה זה הגיוני? ואיך זה שיש כל-כך הרבה טויוטה קורולה עם תו נכה? בעקבות דיון בטוויטר שמקשר בין תווי נכה ובין דגמי מכוניות שנושאים אותם, צללתי אל הנתונים.

    השאלה הראשונה שעולה היא האם רכבי נכה נוטים להיות מדגמי יוקרה. לא שיש לי טענה כלפי אדם שבוחר לקנות רכב מפואר, בין אם הוא נכה ובין אם לאו. אבל מוקד הדיון היה על זה, ובפרט אם שיעור רכבי הפאר שנושאי תו נכה הוא מוגזם, ביחס לכלל המכוניות (השיעור הכללי של תוי נכה הוא די גבוה מלכתחילה – כ-14% מהמכוניות בכבישי ישראל נושאות תו נכה, לפי נתוני משרד התחבורה).

    אם נבדוק באיזה דגם ספציפי שיעור תווי הנכה הוא הגבוה ביותר, אז יצוצו כמה מכוניות מפוארות, שלא לומר מנקרות עיניים. אבל כפי שציין דניאל בחמט, זה כשלעצמו לא מפתיע, ויכול להתרחש, מסיבות סטטיסטיות, גם לדגמים עם שיעור תווי נכה הנמוך ביותר. אחד הדברים שאפשר לעשות כדי לקבל מושג על הבעיה, הוא לצייר גרף פיזור של הדגמים, ובצירים יהיו מצד אחד מחיר הדגם, ובצד השני שיעור תווי הנכים של המכוניות שנמכרו מאותו הדגם. זה יראה כך:

    (לשם פשטות, בחרנו רק דגמים עם יותר מ-50 יחידות). בצד הימני יש את הדגמים שבהם שיעור (אחוז) תווי הנכה גבוה ביותר. בצד הגבוה יש את הדגמים היקרים ביותר. מה אנחנו רואים? מצד אחד, הדגמים היקרים ביותר (חצי מיליון שקל ומעלה) הם עם שיעור תווי נכה באיזור ה-14%. ומצד שני, יש דגמים שהם פופולריים לנכים בטווח המחירים של 300-400 אלף שקל, שזה בהחלט לא זול (מחיר מכונית חציוני בישראל הוא 133 אלף שקל). אבל בחינה יותר מדוקדקת מראה שאלה בעיקר רכבי הסעות, שהם יותר ״גדולים״ מאשר ״יוקרתיים״: מרצדס ויטו, רנו טראפיק, פולקסווגן קראוול וקאדי, וכדומה. זה בדיוק מה שצריך אם, למשל, רוצים להתקין מעלית לכסא גלגלים ולהסיע אותו בתוך הרכב. בגרף, צבעתי בכתום את הדגמים שהמרכב שלהם מוגדר על-ידי משרד התחבורה כ-״משא״ או ״ואן/נוסעים״, וקל לראות שאלה הדגמים עם מירב תוי הנכה.

    מבחינת המחיר הממוצע, רכבים עם תו נכה עולים 162 אלף שקל, ושאינם כאלה 152 אלף שקל. זה הבדל מובהק, אבל אפשר להסביר אותו בהטבת המס שמקבלים נכים בקנית רכב. גם השנתון הממוצע מעט חדש יותר, ושוב, יש פה סיבה ברורה, שהיא הטבת המס שניתנת לכל נכה מדי 3 שנים, ומעודדת החלפת רכב. גם רמת האבזור הבטיחותי וקבוצת הזיהום די דומות.

    מה עוד אפשר לבדוק שיהיה אינדיקטיבי לשימוש של נכה? נתון אחד שנמצא בקבצי משרד התחבורה הוא גובה הרכב. אמנם מדובר בגובה גג הרכב, ולא בגובה מפתן הכניסה. ועדיין, אפשר להניח שמי שמתקשה בתנועה לא יצליח להשתחל לתוך משהו כמו BMW i8, שגובהה 130 ס״מ, וגם מרווח הגחון שלה – 11 ס״מ בקירוב, לא בדיוק מעודד חניה על מדרכות.


    לצורך הבדיקה נצייר את התפלגות הגבהים של כל הדגמים, בנפרד לרכבי נכה (מימין) ושאינם כאלה (שמאל). ציר ה Y הוא גובה הדגם, ורוחב הפס מבטא את השכיחות (כלומר כמה נפוצים הדגמים בגובה הנתון). גרף כזה נקרא ״גרף כינור״.

    אפשר לראות שהרכבים הגבוהים יותר (1.90 מטר עד 2 מטר), שהם גם נוחים יותר לכניסה ויציאה, הם יותר פופולריים ברכבי הנכה, מה שמחזק את הטענה שהקונה אכן מוגבל בתנועה.

    בדקנו עוד תכונות שעלו בדיונים בטוויטר, וטענות קשורות אליהן, וגם ביצענו מבחן סטטיסטי לתקף את ההבדלים, במידה וקיימים. להלן:

    • רכב חדש: רכבים משנתון 2021 ומעלה, שיעורם 19.6% ברכבי נכה לעומת 18.6% בשאר הרכבים (מובהק).
    • רכב יקר (מעל 220 אלף ש״ח): 12.2% ברכבי נכה לעומת 9.6% בשאר הרכבים (מובהק).
    • רכב גבוה מאוד (מעל 2.20 מטר) ורכב נמוך מאוד (מתחת 1.60 מטר): נבדק, אבל יש מעט מדי מכדי לגזור מסקנות.
    • רכב חזק (מעל 204 כוח סוס): 5.5% ברכבי נכה לעומת 4.4% בשאר הרכבים (מובהק). דוגמאות פופולריות: טסלה 3, יונדאי איוניק, קיה קרניבל וג׳יפ גרנד צ׳ירוקי.
    • טסלה: כ-3.8% אחוז בשני המקרים, ההבדל אינו מובהק.
    • רכב עם מספר ״מגניב״ (ראה דיון בלוחיות רישוי בפוסט קודם): 5.2% לרכבי נכה לעומת 4.7% בשאר הרכבים (מובהק).
    • רכב רב נוסעים (7 מושבים או יותר): 8.8% לרכבי נכה לעומת 7% בשאר הרכבים (מובהק). דוגמאות פופולריות: מיצובישי אאוטלנדר וגרנדיס, מאזדה 5.
    • רכב ״מפלצת״, הוגדר כ:גובה מעל 1.80 מטר, הנעה 4×4, נפח מנוע מעל 2000, ופחות משבעה מושבים. אין הרבה כאלה – 0.4% ברכבי הנכה לעומת 0.8% בשאר הרכבים, אבל ההבדל מובהק. דוגמאות נפוצות: טויוטה היילקס, יונדאי טראקן, מיצובישי פאג׳רו.
    • תיבת הילוכים ידנית: 3.3% לרכבי נכה לעומת 6.6% בשאר הרכבים (מובהק).
    • לגבי ואנים, שהסיוע מביטוח לאומי מאפשר החלפה שלהם כל 5 שנים לזכאים: 39% מהואנים שהם עם תו נכה הם בני פחות מ-5 שנים, לעומת 27% מהואנים האחרים (מובהק).

    סיכום: רכבים עם תו נכה הם אכן חדשים ויקרים יותר. אבל זה מובן, וגם מובנה בהטבת המס שהמחוקק החליט לתת לנכים. מצד אחד, יש מאפייני רכב שמחזקים את הצרכים של מוגבלי תנועה, כמו גובה מעל 1.90 מטר, רכבי הסעות, וגיר אוטומטי. אבל אי אפשר לשלול את המקרים שבהם קונה הרכב חושק בסמל סטטוס עתיר פינוקים, וכאחת התוספות מצליח לקבל גם אישור לתו נכה, יחד עם כל הטבות החניה הקשורות בכך. המאפיינים שמחזקים את הצד הזה הם: מנועים חזקים ומספר רישוי בהזמנה אישית. דברים כאלה תמיד יהיו, ולדעתי אין בהם נזק ברמה שמצדיקה פגיעה באוכלוסית הנכים שבאמת זקוקה לעזרה, בצורת תו רכב ובצורות אחרות.

    לסיום אני רוצה להודות לצייצנים שהוסיפו היפותזות לבדיקה, ובנוסף מאחל לכולנו שלעולם לא נזדקק לתו נכה.

  • ענין של קנה מידה

    ביום 5.4.2023 כתב הדר חורש במוסף דה-מרקר לפסח מאמר בשם ״הדרך לדירה מתארכת״. את הכתבה מלווה גרף ענקי, שמתאר את מחירי הדירות בשנים האחרונות, וגם את השכר באותה תקופה. הגרף תומך לכאורה בתיזה של הכתבה, שהיא התייקרות הדיור מעבר לעליה בשכר. רק כדי להבהיר, אני מאמין לחורש שהמשפחה הממוצעת בישראל מתקשה יותר ויותר לקנות דירה. התלונה העיקרית שלי כאן היא לגבי הגרף. אני שם אותו כאן כדי שתוכלו לנסות למצוא את הבעיה בעצמכם:

    מה רואים? קודם כל, איורים דרמטיים של אנשים מטפסים ונופלים, מה שקרוי בשפה מקצועית chartjunk. אבל לא בזה נתעסק היום. מעבר לזה, יש פה שני צירי Y שונים – אחד לשכר והשני לנדל״ן. וזה תמיד חשוד, ובהמשך נראה שהחשדות מוצדקים. אבל לפני כן, מה מתואר בצירים:

    1. ציר השכר – מתאר את השכר הממוצע
    2. ציר הנדלן – מתאר את שיעור השינוי במדד

    אז כבר כאן יש בעיה. ״שיעור השינוי״, כלומר, נגזרת, הבדל משנה לשנה. וזאת לעומת השכר, שמבוטא כמספר טהור. מה ההבדל? נניח שמדד מסוים (שכר, מחיר הדלק, מספר החזירים ברחוב, לא משנה מה) מתחיל בשנה מסוימת במספר 100. עכשיו נניח שהוא עולה ב-10% בכל שנה. מה יהיה ערכו כעבור שנתיים? התשובה: 121, וזאת כי התוספת של 10% בשנה השניה מתיחסת כבר לערך המוגדל של 110 שבסוף השנה הראשונה. ולכן, למרות שגרף הנגזרת יראה כקו אופקי (10% ללא שינוי משנה לשנה), גרף המדד יראה עליה יפה.

    אבל זו לא הבעיה העיקרית. הבעיה היא קנה המידה השונה של הצירים. שימו לב לטווח של שני המספרים (הערך הקטן ביותר והגדול ביותר האפשריים בגרף):

    1. עבור השכר – 9 עד 15 (באלפי שקלים)
    2. עבור מדד הדיור – מינוס 5 עד 20 (באחוזים). זה לא נראה בצילום בגלל קיפול של הדף שלא הצלחתי ליישר. תאמינו לי.

    וזה כשלעצמו משנה את היחס בין שני הקוים בגרף (הכחול והכתום). מי שבחר לאפשר בציר השכר מספרים עד 15, השאיר המון מרווח בין הקו לבין קצה הגרף העליון. ואז נראה שהקו שטוח יותר. הנה, לדוגמה, איך גרף כזה יראה בתוכנה דמוית אקסל, בלי שום מניפולציה. התוכנה בוחרת את הטווח 10 עד 13, כי אלו מספרים עגולים שכוללים את כל הערכים:

    מדובר באותם מספרים בדיוק כמו שיש בגרף המקורי של דה-מרקר. רק קנה המידה השתנה, והנה ההבדל נעשה הרבה פחות דרמטי. להמחשה, שיניתי ידנית את הטווח לערכים 9 עד 15 כמו בעיתון, וזה נראה כך:

    עכשיו יש הבדל, והקו הכחול תופס פער מהקו הכתום (או התיבות הכתומות). אבל זו אשליה אופטית ותו לא. אפשר לשחק עם זה עוד קצת: בואו נבחר טווח של מינוס 4 עד 16, בדיוק כמו הטווח של המדד. איך זה יראה עכשיו?

    בהצגה כזאת, נראה אמנם שהכחול עולה והכתום יציב, אבל רוב האנשים יאמרו שהכחול מדביק פער למול הכתום. ושוב, מדובר בדיוק באותם מספרים שמוצגים בכל הגרפים שפה. ההבדל ביניהם הוא קנה המידה, ולב הבעיה הוא שיש קני מידה שונים לציר ה Y הימני ולציר ה Y השמאלי.

    ומה הלקח? בכל פעם שרואים גרף שבו יש שני צירי Y, צריך להגדיל את מידת החשדנות לפני שאנחנו ניגשים לפרש את הנתונים, וזה תופס גם בלי תוספות של איורים דרמטיים. חג שמח.

  • מספרי רישוי מגניבים

    אתה עומד ברמזור ולפתע רואה משהו מוזר בלוחית הרישוי של הרכב שלפניך: קל לזכור אותו! אולי יש בו חזרה על ספרות, אולי יש רצף עולה, אולי אפשר לקרוא אותו גם מימין לשמאל בלי שישתנה. מספר מגניב! אפשר לצלם (בהתאם לחוקי התנועה) וגם להעלות לקבוצת הפייסבוק הייעודית ״מספרים מגניבים של מכוניות״. אבל מה בעצם מאפיין מכוניות עם מספרים מגניבים? צללתי אל הנתונים כדי לבדוק.

    איך מגדירים מספר מגניב? יש כמה תבניות: צמד של ספרות זהות (33), חזרה על צמד או שלשה (12300123), שימוש במספר נמוך של ספרות שונות בכל המספר, רצפים עולים או יורדים (765), ועוד. נתתי לכל תבנית ציון (די שרירותי), ובהנתן מספר רישוי, ציון המגניבות שלו הוא הסכום של הציונים של התבניות שיש בו.

    את רשימת לוחיות הרישוי של כלי הרכב בישראל אפשר להוריד מאתר משרד התחבורה. הנתונים מכילים גם את דגם הרכב, היצרן, שנת הייצור ועוד נתונים. ניקדתי את מספרי הרישוי, והנה התוצאות:

    הרכבים המגניבים ביותר בישראל: את הציון המקסימלי גורפת יונדאי i20 בצבע לבן הנושאת בגאווה את לוחית הרישוי 1111111. יש בזה גם מספר ספרות נמוך, גם רצפים של זוגות, שלשות, וגם יותר, וגם פלינדרום. אמנם מדובר בדגם 2013, אבל אין פלא שלא מוותרים עליה בקלות. יש בראש הרשימה גם רכבים עם מספרים שמורכבים רק מהספרה 5, רק מהספרה 3, ורק מהספרה 6. ותיקי התחום מציינים שבעבר הסתובבה בכבישי הארץ גם סיטרואן משנת 88 שמספרה 8888888 (בתמונה למעלה), אבל היא לא נמצאת בקובץ העדכני וסביר שירדה מהכביש. לרכבים בראש הרשימה, הציון שחישבתי מסתובב מעל 30 ויכול להגיע גם ל-50. זאת לעומת ממוצע כללי של 1.02 לרכב מסחרי וממוצע של 1.11 לרכב פרטי.

    היצרנים המגניבים ביותר: אם ממצעים את הציונים על פי יצרן, אז היצרנית שהמכוניות שלה הן עם המספרים המגניבים ביותר על כבישי ישראל היא בנטלי. אמנם לא מותג פופולרי (רק 97 יחידות ברחבי הארץ), אבל בהחלט מפנק, עם ציון ממוצע של 3.8. אם מחפשים יצרנים קצת יותר פופולריים (לפחות 200 יחידות), אז לראש הטבלה מגיעות מרצדס, פורשה, ופיג׳ו אוסטריה (יצרנית דגם הקופה RCZ).

    הדגמים המגניבים ביותר, מבחינת מספרי הרישוי, הם לקסוס LS460, ניסאן אינפיניטי, יונדאי GV80, ומספר דגמים של מרצדס: C300E, GLC350E, S500, ו-GLE350D. גם פורשה מיוצגת יפה, עם דגמי 718 ופנמרה. מה הסיפור עם דגמי היוקרה? קשה לדעת, אבל בחיפוש ברשת עולות כמה תיאוריות מעניינות. מיד נחזור לבדוק את זה מבחינה מספרית.

    לגבי סוג הבעלות: לרכב בבעלות פרטית יש את הסיכוי הגדול ביותר למספר מגניב, קצת פחות מזה לרכב בבעלות חברה, עוד פחות בבעלות ליסינג, והרחק בתחתית – בעלות של חברת השכרה.

    מה לגבי הדגמים הפחות מגניבים? מספר משעמם במיוחד, באופן ממוצע כמובן, צפוי לקונים של פיאט 500, סובארו פורסטר, סיטרואן ספייסטורר, רנו קנגו, או יונדאי סונטה. אפשר אולי לשער שמדובר ברכבים מאוד פרקטיים, ולכן הקונים שלהם פחות מתעניינים בדברים שלא קשורים ישירות בשינוע של אנשים וחפצים. יש אומרים גם שמספר מעניין עלול למשוך תשומת לב מיותרת של שוטרים, אז פחות צרות גם מההיבט הזה.

    ולסיום: מחיר הרכב. משרד התחבורה מרכז את מחירי המחירון של היבואנים השונים, כך שמתאפשר לנו לבדוק, לכל דגם, את ציון המגניבות של לוחיות הרישוי שלו מול המחיר הנקוב. בגרף פיזור זה נראה כך:

    יש פה נטיה לכיוון האלכסון שעולה ימינה ולמעלה, וחישוב הקורלציה יוצא 0.37. ובמילים: כן, יש קשר חיובי. מובהקות סטטיסטית גם היא נבדקה, במבחן proportions שמוגדר על העשירונים העליונים בשני המימדים. מסקנה: רכב יקר יותר בדר״כ יגיע עם מספר מגניב יותר. למה ומדוע? את זה כבר לא מצאתי בנתונים, ואני פתוח להצעות.

  • מה קו התחב״צ הכי איטי?

    כמה איטית יכולה להיות נסיעה בתחבורה ציבורית? ברור שנסיעה באוטובוס לאילת תקח הרבה זמן, אבל זה נכון גם לנסיעה במכונית. וברור שנסיעה בשעות העומס תהיה זוועה בשתי האפשרויות (בהנחה שאין נת״צ). אבל אפשר לנסות לנטרל את זה. ספציפית, לבחור יעד ואז לבדוק:

    • מה זמן הנסיעה ברכב פרטי
    • מה זמן הנסיעה בתחבורה ציבורית

    ולמצוא את היעדים שבהם ההבדל הוא הגדול ביותר. זה מה שעשיתי, בעזרת הממשק של מפות גוגל. בחרתי את חיפה כנקודת מוצא (תחנת חוף הכרמל), ומדדתי זמני נסיעה ליישובים שונים. בחרתי יישובים שבהם עד 1000 תושבים (נתוני למ״ס 2021), בהנחה שאל היישובים הגדולים יותר יש יותר קוים. הבדיקה נעשתה לפי זמן יציאה של יום א ב-7 בבוקר.

    והזוכה? ראס עלי, כפר של כ-700 תושבים בעמק זבולון. להגיע לשם יקח 25 דקות ברכב, ולחילופין שעה ו-55 דקות באוטובוס עם החלפה במרכזית המפרץ. ולמי שמעוניין ברכיבת אופניים, מדובר ברכיבה של שעה ו-42 דקות בלבד.

    מצורפת טבלה של היעדים האיטיים ביותר לנסיעה של יותר מחצי שעה ברכב. הם כולם מצפון-מזרח או מצפון לחיפה. העמודה ratio היא המנה בין שני זמני הנסיעה, כלומר פקטור של יותר מפי 3 בזמן הנסיעה לכל היעדים שבטבלה.

    יש עוד בדיקה שאפשר לעשות, והיא בין רכב פרטי לבין מסוק (תיאורטי). כלומר אם נשווה את המרחק על הכביש למרחק בקו מעוף הציפור, מהו המקום שבו הפער בין המקומות הוא הגדול ביותר?

    המנצח פה הוא גבעת ניל״י, מושב שנמצא ממש מדרום לרכס הכרמל שבקצהו הצפוני נמצאת חיפה. באופן כללי, כביש 6 חוצה את התוואי הזה באופן מהיר, אבל גבעת ניל״י ממוקמת ממש באמצע בין שתי יציאות שלו – בעסה. מרחק הנסיעה מחיפה לשם הוא 55 ק״מ, או כמעט כפליים מ-28 הקילומטרים שיעבור המסוק ההיפותטי. שאר היישובים בראש הרשימה נמצאים בגליל העליון.

    הערות? רעיונות לעוד אנליזות? מוזמנים להגיב

  • ניסוי: מלכודת דבש ל״אל תתקשרו אלי״

    עבור מי שמעוניין להמנע משיחות טלפון שיווקיות, הושק לאחרונה שירות חדש בשם ״אל תתקשר אלי״. הרעיון הוא שבעל הקו רושם את המספר שלו במאגר ממשלתי. ואז שירותי שיווק, במידה והם שומרי-חוק, מבררים אם המספר נמצא במאגר לפני שהם פונים אליו. על פניו, רעיון יפה. אבל השטן, כמו שאומרים, נמצא בפרטים הקטנים. ואושיות טכנולוגיה שונות כבר בחנו את הפרטים ומצאו שבצורה בה המאגר בנוי, זה יהיה קל, אפילו קל מדי, ליצור רשימה של מספרים שבמאגר, שאחר-כך אפשר להשתמש בה לכל מיני מטרות נכלוליות. ואחת מהן עלולה להיות גם שליחה של הודעות שיווקיות.

    ראיתי גם דיווח אחד לפחות של תרחיש כזה (אבל את הלינק איבדתי) – כלומר מישהו שרשם את המספר שלו במאגר, וחיש מהר קיבל הודעות ספאם לאותו מספר. זה מעלה חשד שההתקפה על המאגר אכן מבוצעת בשטח. ועם זאת, יש כמה הסברים אפשריים לתצפית כזאת. למשל, אולי ההודעות נשלחו ממאגר ספאם אחר? כדי לדעת בוודאות נדרשת בדיקה יותר מדעית.

    וזה מה שיצאתי לעשות. הרעיון הוא לייצר מספר ״בתול״, שלא רשום בשום מאגר, ולרשום אותו במאגר של הרשות להגנת הצרכן. ואם אכן יש פעילות של שאיבת המספרים מהמאגר, אז נקבל לאותו מספר הודעות שיווקיות. עכשיו השאלה הופכת להיות: איך מקבלים מספר טלפון שלא רשום עדיין בשום מקום.

    למזלנו יש דרך פשוטה לייצר מספר טרי, והיא דרך מה שנקרא ״סים פריפייד״. זה כרטיס סים לטלפון שלא מוצמד לחשבון הוראת קבע, אלא מחויב כנגד יתרה שהוטענה מראש (pre-paid).
    זה שימושי לתיירים, זה שימושי לאנשים עם הגבלות אשראי, וזה שימושי לעוד כל מיני תרחישים. בפרט, זה שימושי למה שאנחנו צריכים. את הסים אפשר לקנות בכל חנות סלולר (״חנות תאית״ בעברית? או שזה שם שמתאים יותר למוצרי נייר?). וזה מה שעשיתי בתאריך 19 בדצמבר. את הסים הכנסתי למכשיר סלולרי שמצאתי בבית מעלה אבק, וגם בדקתי שהוא מקבל ושולח הודעות סמס בצורה תקינה.

    כמובן שיש אפשרות שהמספר של הסים הוא ממוחזר, הווה אומר שהוא היה שייך בעבר לחוזה שהסתיים, ואז אנחנו עלולים לקבל שיחות והודעות מהגורמים שהיו בעבר בקשר עם בעל המספר. כדי לנטרל את האפשרות הזאת, התחלתי את הניסוי בתקופת בקרה של כשבוע. בתקופה הזאת לא התקבלו שום הודעות או שיחות, כלומר הכל בסדר.

    בתאריך 27 בדצמבר, בתום תקופת הבקרה, רשמתי את המספר במאגר, וחיכיתי להודעות.

    עד ל-9 בינואר – לא הגיע כלום. לא שיחות ולא הודעות. ב-9 בינואר קיבלתי הודעה ולשונה ״בעקבות הפרסומים בתקשורת הנכם מוזמנים לבדיקה כמה כסף יש לכם בחברות הביטוח שניתן למשוך לחשבון הבנק שלכם. לבדיקה בחינם וללא התחייבות״. היה גם מספר לשלוח אליו ״להסרה״ והוא 0723941786. בתאריך 1 בפברואר קיבלתי עוד הודעה, על ״שקיות רפואי במחירים מצחיקים״. בשני המקרים נראה לי שאין קשר למאגר DNC.

    אז המסקנה, נכון לעכשיו, היא שאין פעילות מסיבית של ״חליבה״ שמשמשת למסרים שיווקיים. עדיין יכול להיות שגורמים נכלוליים מנצלים את החולשות ב API כדי לשאוב מספרים פעילים. אבל ככל שהצלחתי לבדוק, קשה לומר בוודאות שיש שליחה של הודעות לטלפונים שבמאגר.

    דרך אגב, השיטה של מספר (או כתובת) שקיימים במאגר רק כדי לתפוס את מי שמפר את תנאי השימוש היא לא חדשה, וגם יש לה שם: מלכודת דבש. אני בטוח שהרשות להגנת הפרטיות שותלת ברשימה כמה כאלה מיוזמתה. מה, לא?

    ומה הלאה? יש לי מספר חדש ונוצץ, ואת המחיר של הסים (כ-50 שקלים) לא אקבל בחזרה. אפשר להשתמש בו לניסוי דומה, במאגר אחר שאנשים חושדים בו שהוא פתיון לספאמרים. אני פתוח להצעות – תשלחו לי רעיונות ואני מבטיח לעשות ניסוי נוסף ולדווח לכם.

  • תוספת נפח

    ביום 30.11.2022 כתב סטנלי ריד בדה-מרקר על גז מונזל. בכתבה מופיע הגרף הבא, שמתאר את השינויים במחיר שלו:

    הגרף הזה גרוע. יש מספר סיבות:

    1. אם רוצים שנבין את שינוי הנתון לאורך הזמן, אז צריך גרף קוי ולא גרף עמודות.
    2. ציר הזמן לא אחיד: יש שתי נקודות זמן ב-2022, אחת נוספת עבור כל 2020, ואת 2021 מסתירים כליל.
    3. יש מעט מדי נתונים. גם ויזואלית, מה שרואים זה בעיקר רקע לבן. זה מעין היפוך של תופעה בשם chartjunk – תוספת קישוטים ויזואליים שלא מכילים מידע. מה שקורה פה זה מחסור גדול באלמנטים שנותנים מידע.

    מיעוט הנתונים והמספרים העגולים מרמזים שאולי עדיף לחסוך את המקום ולתאר את הנתונים במשפט. ואתם יודעים מה? זה בדיוק מה שתמצאו במאמר. בפסקה הרביעית כתוב:

    ״מחיר משלוח LNG לפני שנתיים היה כ–20 מיליון דולר. מאז נסק ל–200 מיליון דולר ביוני, ועכשיו התמתן לכחצי מזה, כשהחורף כבר בפתח.״

    למה צריך את זה גם כגרף? וגם אם נניח שצריך, למה בצורת גרף לא מתאימה? לעורך פתרונים.