-
Hello world!
Welcome to WordPress. This is your first post. Edit or delete it, then start writing!
-
תאורה לממ״ד
גם אני נפלתי בשגעון הבית החכם. איזה בעיות זה יכול לפתור? ובכן, הבעיה הנוכחית היא שכשמחכים בממ״ד לתום עשר הדקות, הילדים כל הזמן שואלים כמה זמן עבר (חלקם מספיקים להביא טלפונים וחלקם לא).
אז קניתי מנורת אוירה, שמפיצה אור בגוונים שאפשר לתכנת. חיברתי את התראות פיקוד העורף לתוכנת הניהול (שנקראת home assistant) בעזרת תוסף מדהים של עמית פינקלשטיין. וכתבתי סקריפט שמשנה את הגוון בהדרגה, מאדום ועד ירוק, במשך 10 דקות. כשהצבע ירוק, אפשר לצאת.
עכשיו נשאר רק להחזיר את החטופים.
-
טעויות נפוצות ב-OCR בעברית, ואיך להתמודד איתן
פוסט אורח מאת שרון לוי
בסדנת הקיץ של "מדע הנתונים לטובת הכלל״ אנחנו עובדים עם עמותת ״דף חדש״ לניתוח פסקי דין שקשורים להסדרי חוב. חלק מהמסמכים קיימים בצורת doc או pdf שאפשר למשוך מהם את הטקסט ישירות כמחרוזת. אבל חלקם הם תמונה סרוקה של מילים מודפסות, ויש צורך בהמרה של התמונה למילים.
טכנולוגיה להמרת קבצים סרוקים נקראת OCR – Optical Character Recognition והיא קיימת כבר זמן רב (ותיקי התחום זוכרים את MNIST ולפניו את NIST, שנולדו סביב 1994). תוכנות שכאלו לרוב מתמודדות בהצלחה עם המרה של מסמכים סרוקים, אך לעיתים צצות בעיות וטעויות שונות, בפרט במסמכים בעברית, ועוד יותר במסמכים משפטיים, כפי שנראה מיד.
השלב הראשוני כדי להתמודד עם טעויות שכאלו הוא להבין היכן הטעויות מלכתחילה. במקרה שלנו, רצינו תחילה למפות את אותן הטעויות הנפוצות מסך המילים הסרוקות במסמכים שלנו. לשם כך, תחילה בחרנו אקראית מדגם גדול יחסית של 50 קבצי טקסט מומרים. 50 הקבצים האלו הכילו 48,397 מילים בסך-הכל (ובהן 7853 מילים ייחודיות). בהמשך, בדקנו האם כל אחת מהמילים הללו נמצאת במילון עברי מקיף אשר כולל, בין היתר, הטיות שונות, מילים הן בכתיב מלא והן חסר, נטיות שונות לפעלים וכן הלאה.
בדיקה ראשונית זו העלתה כי 4,104 מילים, או כ-8.3% מסך המילים במסמכים שלנו, לא נמצאות במילון. את הקבוצה הזאת ניסינו לאפיין כדי להקטין את מספר השגיאות. הנה התובנות שהגענו אליהן:
מילים בז׳רגון
למרות שחלק מהמילים לא נמצאו במילון, הן דווקא כן מילים תקינות בעברית. השתמשנו במילון מקיף, אבל בפסקי הדין שנפוצים בפרויקט שלנו יש ז'רגון משפטי, שימוש נפוץ בשמות של פסקי-דין, תאריכים עבריים וראשי-תיבות. לכן, החלטנו להרחיב את המילון עם שמות של פסקי-דין (כמו: אלקצאצי), מונחים משפטיים (אבעיה, דא עקא וכן הלאה), ראשי-תיבות נפוצים (פס"ד, למשל), תאריכים עבריים ושמות ישראלים וערבים פופולאריים. בסוף השלב הזה, נותרנו עם 2069 מילים או 4.23% מילים שגויות מסך המילים בקבצים שלנו.
תקלות OCR
בשלב השני, לאחר שנותרנו עם מילים שגם לא במילון וגם באמת לא מילים תקינות בשפה – יכולנו לבחון את השגיאות הנפוצות שנובעות מתהליך ה-OCR עצמו. גילינו מיד שהטעויות הנפוצות שחוזרות עליהן נובעות, באופן אינטואיטיבי, מתווים דומים ויזואלית:
- יי (פעמיים האות י׳) במקום " (גרשיים)
- ם (מם סופית) במקום ס'
- ז' במקום ו'
- אותיות סופיות שמוחלפות בגירסה הלא-סופית של אותה אות: מ׳ במקום מם סופית, ובדומה עבור נ׳ וגם פ׳.
- וכן הלאה.
מחיקת רווחים
שגיאה נפוצה נוספת היא איחוד של שתי מילים תקניות למילה אחת שגויה: לדוגמה, ביטוי כמו "יוביל לביטול" הפך לאחר ה-OCR ל-"יוביללביטול".
לתיקון של מקרים כאלה פיתחנו את היורסיטיקה הבאה:
- סינון של מילים עם 7 אותיות או יותר
- מעבר על הרצף והפרדה שלו בכל נקודות האמצע (לפי הדוגמה, ננסה את: ״יוב יללביטול״, ״יובי ללביטול״, ״יוביל לביטול״ וכן הלאה)
- לכל אפשרות, שיערוך כמה היא נפוצה
- בחירת האפשרות הנפוצה ביותר
בפועל, כמו שקורה לא פעם, הבנו שבקורפוס שלנו יש מעט מקרים כאלה ופשוט יותר לתרגם אותם בעזרת מילון קשיח (בלי לקודד אלגוריתם).
מתוך 4104 רצפים שגויים שנותרו בתחילת שלב זה, היוריסטיקה הצליחה להוריד את מספר הרצפים השגויים מ 4104 (שלא נפתרו על-ידי השלבים הקודמים) ל-1096 מילים שלא במילון, או 2.6% מכלל המילים בטקסט.
זה כבר מספיק טוב לצרכינו, ולא המשכנו לטייב עוד. אפשרות לשיפור נוסף יכולה להיות בדיקה של אינטראקציה בין טעויות, למשל: איחודי מילים שגם מכילים יי (יוד כפולה) במקום " (גרשיים); מילים עם שתי החלפות שונות – למשל, "דמיון" שנהפך ל-"זמיונ", (זאת אומרת גם ה-ד' נהפכה ל-ז' וגם ה-ן ל-נ'), וכן הלאה.
לסיום, הנה ההתפלגות של השגיאות שונות בטקסטים שלנו:
-
הסרת מטא-דאטא מתמונות באייפון
רן בר-זיק כתב לאחרונה על הסכנות שבמידע המצורף לתמונות שאנחנו מצלמים, כמו למשל המיקום. כשאנחנו משתפים את התמונה, המידע הזה מטייל יחד איתה, ולמרות שלא רואים אותו על המסך, ממש קל לחלץ אותו ולחשוף פרטים שאולי היינו מעדיפים שיוסתרו.
כמו שרן מסביר, כדי להוריד מטא-דאטה מתמונה שנמצאת על המחשב, יש כלים כמו exiftool ו jpegtran. אבל רובנו מצלמים את התמונות בטלפון, וגם משתפים אותן משם. אז איך מסלקים מטא-דאטא מהתמונה בלי להעביר אותה קודם מהטלפון למחשב?
הנה הסבר איך עושים את זה באייפון:
משתמשים בכלי הקיצורים (shortcuts). זה כלי שמאפשר לנו לתכנת סדרת פעולות על הטלפון ול״נגן״ אותה שוב בלחיצה אחת. כך נתכנת אותו:
- הכלי מגיע מותקן באייפון סטנדרטי. פותחים אותו בעזרת לחיצה על האייקון
- לוחצים על סימן ה״פלוס״ למעלה כדי להוסיף סדרה חדשה של פעולות:
- בוחרים בפעולה "select photos" (ואם שפת הטלפון היא עברית אז זה נקרא ״בחר תמונות״). זה אומר שאנחנו נראה את מסך הבחירה המוכר בגלריה של האייפון, ושם נבחר את התמונות שאנחנו רוצים לנקות. יש הרבה פעולות לבחור מהן, אז אפשר להשתמש בחיפוש כדי למצוא את הפעולה.
- הפעולה הבאה נקראת convert image (״המר את״). נבחר להמיר אותם לפורמט JPEG (הנפוץ ביותר).
- ועכשיו לחלק החשוב – נפתח את התפריט בחץ שליד המילה JPEG. ושם באופציה ״preserve metadata" (ובעברית ״שמור מטא-נתונים״) נסמן ״לא״. כלומר התמונה לאחר ההמרה לא תכיל מטא-דאטא.
- הפעולה האחרונה היא share (״שיתוף״). זה יפתח את מסך השיתוף המוכר של הטלפון, ובו בוחרים מדיה חברתית לשלוח אליה את התמונה (ולמי שמעדיף, אפשר גם לשמור לגלריה, לשלוח במייל, וכולי וכולי).
- כך הסדרה המתוכנתת אמורה להיראות:
זהו. מעכשיו, כשרוצים לשתף תמונה נקיה תמונה, נכנסים ל״קיצורים״, לוחצים על הסמליל שמסומן convert image (או שם אחר שבחרתם). ואז הטלפון יציג את הגלריה שלכם עם אפשרות לסמן תמונות. ולאחר שתבחרו את התמונה, יופיע מסך השיתוף המוכר.
מקווה שעזרתי, ותשמרו על עצמכם שם ברשת!
-
למה הפרות בסעודיה אוכלות אספסת שגדלה בכלל באריזונה?
למה הפרות בסעודיה אוכלות אספסת שגדלה בכלל באריזונה? סיפור על הפאדיחה של נחלת הכלל שמתפרשת על שתי יבשות.
כן, יש בסעודיה גידול בקר. הם קיבלו את הידע מהאמריקאים בשנות ה-40, יחד עם הידע לאיתור ושאיבת נפט. ויש להם חוות לא קטנות. כי, אתם יודעים, אי אפשר לשתות נפט. וגם כי המלך אוהב סטייקים. אבל עם השנים, מאגר מי התהום ששימש לחקלאות הדלדל, ואפילו הסעודים לא רוצים להשתמש בהתפלה בשביל לגדל יבולים.
אז הם הולכים וחוכרים שדות לגידול מספוא באריזונה. באריזונה האספסת גדלה מהר ואז קוצרים ומעמיסים אותה על אוניות ששטות לסעודיה. ומאיפה המים באריזונה? או. שם הכלל הוא שאם האדמה שלך, אז גם מה שתחתיה שלך, ומותר לך לחפור באר ולשאוב מי תהום ללא הגבלה. אז החקלאים האמריקאים, שבמקור בכלל דחפו לעידוד המדיניות של ״שאוב ככל יכולתך״, עכשיו מגלים שבארות המים שלהם יבשו, כי מפלס מי התהום ירד (לך תתחרה בסעודי מי יכול לקדוח יותר עמוק באדמה).
איך אומרים? ״ויקום המלפפון ויכה את הגנן״. אז נהיה עניין גדול והוא היה במוקד של מערכת הבחירות למושל אריזונה, והמושלת החדשה פועלת לתקן את העיוות והסעודים יאלצו למצוא דרך אחרת להאכיל את הפרות שלהם.
יש בסיפור הזה הרבה היבטים – חקלאות, תחבורה, קיימות, שיתוף ידע. אני אוהב את ההיבט של העקרון הכלכלי שנקרא ״הטרגדיה של המשאב המשותף״. אם מחלקים משהו בחינם (או במחיר נמוך מדי), אז האינטרס של כל משתמש הוא לצרוך כמה שיותר, ובסופו של דבר המשאב מתכלה וכולם מפסידים. מה שמיוחד בדוגמה הזאת היא שהמשאב (מים וקרקע חקלאית) מתפרש על שתי יבשות – אמריקה ואסיה. ואפשר גם לומר שהמשאב המשותף הוא נפט, שכרגע הוא זול מדי ומאפשר לשנע מספוא בין שני מקומות שאין שום הגיון לשנע ביניהם מספוא.
ודבר אחרון – השם של התופעה באנגלית הוא ״tragedy of the commons״. וה״קומונס״ המדובר הם שטחי מרעה כפריים באנגליה, שם הרועים יכלו לשחרר את הכבשים, אבל גילו שאם כל אחד מגדיל את העדר שלו כדי להרוויח יותר, בסופו של דבר העשב נגמר ולא מתחדש. יענו השלמנו מעגל מלא.
מקור:
פרק בפריקונומיקס בשם ״מים, מים בכל מקום״ -
קנסות ומחיר הרכב
ביום 3.8.2023 אודי עציון כתב בוואלה על הקשר בין קנסות על נסיעה בנתיב תחבורה ציבורית ובין מחיר הרכב. ההשערה היא שעבור בעלי רכבים יקרים יותר, הקנס הכספי על נסיעה לא-חוקית הוא פחות משמעותי ולכן הם נוטים יותר לזלזל בתקנות. בכתבה יש נתוני קנסות, שהופקו על-ידי המשטרה לבקשת גלעד ליפשיץ מהקליניקה לחופש המידע. הם מושווים לנתח השוק של היצרנים, בהתאמה.
אם אנחנו רוצים לשאול ״בהנתן כלי רכב שאנחנו רואים על הכביש, כמה שכיח יהיה קנס תנועה לרכב של אותו היצרן״, אז נתח השוק הוא קירוב טוב. אבל אפשר לדייק יותר. יש מכוניות שנוסעות הרבה ויש כאלו שנוסעות מעט. בעבר כבר בדקנו וראינו שיש שונות גדולה בין היצרנים. לכן קירוב טוב יותר לשאלה ״מה ההסתברות שנראה רכב של יצרן נתון״ יתקבל אם נתחשב בקילומטרג׳ של רכבים מאותו הסוג. את הקילומטרג׳ אפשר למצוא בנתוני משרד התחבורה, והוא נרשם בזמן מבחן הרישוי (״טסט״). השתמשתי בנתונים של רכבים משנתון 2019, מכיוון שרכבים פרטיים פטורים ממבחן למשך שלוש שנים ואין נתונים לגביהם. לכל מכונית חושב קילומטרג׳ ממוצע ליום נהיגה (לפי מספר הימים שעברו ממועד העלייה לכביש ועד לטסט), ולכל יצרן סוכמו כל הקילומטרים.
אני עוצר פה להדגשה: סכום, ולא ממוצע. כלומר שיש הטייה ליצרנים שמוכרים יותר מכוניות בישראל. וזה מייצג במדויק את ההגדרה של ״ההסתברות לראות רכב מיצרן נתון על הכביש״. בראש הרשימה יש את יונדאי וטויוטה הפופולריים, ובתחתיתה את וולבו ואת סוזוקי. מרצדס ובמוו, למקרה שאתם מתעניינים, במקום טוב באמצע.
לגבי מחירי המכוניות, גם כאן יש לנו נתונים של משרד התחבורה, והם מחיר המחירון של הדגם כפי שנמסרו על-ידי היבואן. השתמשתי במחירים של דגמי 2022, וגם כאן הם משוקללים לפי השכיחות על הכביש. לדוגמא: אם ליצרן מסוים יש שני דגמים. דגם עממי במחיר 100 אלף שקל, וממנו נמכרו 1000 יחידות, ועוד דגם יוקרתי במחיר מיליון שקל, ממנו נמכרו 10 יחידות, אז המחיר הממוצע יהיה קצת פחות מ-110 אלף שקל, כלומר בהטיה לכיוון הדגם שנמכר יותר.בשיטה הזאת, בראש הרשימה מופיעות מרצדס (505 אלף ש״ח בממוצע), במוו (415 אלף), אאודי (343 אלף) ולקסוס (315 אלף). בתחתית יש את פיאט (147 אלף) וקיה (134 אלף).
עכשיו סוף סוף אפשר לשאול את השאלה: כשמנרמלים את מספר הקנסות לק״מ נסיעה על הכביש, מה ההבדל בין היצרנים היקרים ובין הזולים? תשובה ראשונה נקבל בצורה ויזואלית, בגרף פיזור:
אז העין בהחלט תופסת את היצרנים היקרים בצד ימין, שלהם מספר קנסות גבוה. אבל אולי זו רק אשליה אופטית, ועיקר המשקל הוא בעצם בפינה השמאלית? מה אומרת הסטטיסטיקה?
אז לטובת הסטטיסטיקה, בדקתי את המתאם (ספירמן) בין המדדים. הוא יוצא 0.3, שזה כן אומר שיש שם קשר (מכונית יקרה יותר תצבור יותר קנסות). ומצד שני, אין תקפות סטטיסטית חזקה (p=0.18). כלומר המסקנה רחוקה מרמת הבטחון שתאפשר לפרסם אותה, נאמר, במאמר מדעי.
[הערה: עבור וולבו והונדה, שיש להן מעט מכוניות על הכביש באופן יחסי, מספר הקנסות היחסי יצא גדול מאוד והן הושמטו מהגרף לטובת הקריאות.] -
טסטים ודחיינות
מתי עושים מבחן רישוי לרכב, מה שנקרא ״טסט״? בנתוני משרד התחבורה רשום התאריך שבו בוצע הטסט בפועל לכל רכב. בדקתי אם יש יום בשבוע שבו עושים יותר טסטים מאחרים – אולי יש סיכוי למצוא יום פחות עמוס. והתשובה: זה תלוי. ההתפלגות די אחידה בימות השבוע. ביום שישי יש בערך חצי מהכמות, וזה לא מפתיע כי זה יום עבודה קצר. וביום שבת יש מספר יחסית קטן של טסטים – בערך שישית מיום חול (כן, יש מכוני רישוי שפתוחים בשבת).
מבחינת החודש בשנה, אז ינואר-פברואר-מרץ הם יותר עמוסים מחודשים אחרים. זה פחות בשליטה של בעל הרכב, כי זה תלוי בעיקר בתאריך עליית הרכב לכביש.
מה לגבי היום בחודש? הנה ההתפלגות.
ציפיתי שהתפלגות תהיה אחידה הרבה יותר, מכיוון שמדובר במספרים מאוד גדולים. היום הכי נפוץ הוא ה-13 בחודש, ואפשר לראות עליה מסוימת בתאריכים 1-2-3 בתחילת החודש. יכול להיות שגם ה-31 יגיע למספרים גבוהים אם ננרמל אותו במספר החודשים שיש בהם 31 ימים. משהו קורה פה וזה מצדיק בדיקה יותר מעמיקה.
אולי התאריכים הנפוצים הם התאריכים שבהם נגמר תוקף הרשיון? בנתוני משרד התחבורה יש גם את תאריך התפוגה, כלומר מתי צריך יהיה לעשות את הטסט. מדובר בתאריך עתידי (שנה או יותר קדימה), אבל מנסיוני האישי, התאריך לא משתנה משנה לשנה. כלומר אם תאריך התפוגה הוא, לדוגמה, 12 ביוני, כך הוא ישאר לאורך כל חיי הרכב. אז איך נראית התפלגות תאריכי התפוגה? כך:
זה ממש לא דומה להתפלגות שראינו קודם. כאן יש עליה מובהקת בימים 27-29 בחודש. ננסה לבדוק יותר לעומק. לכל רכב יש שני תאריכים (יום בחודש):
- יום התפוגה, כלומר מתי צריך לעשות טסט
- היום שבו נעשה הטסט בפועל
יש לכל אחד 31 אפשרויות. ולצמד המספרים ביחד יש 31×31, או 961 אפשרויות. כל רכב על הכביש נמצא באחת האפשרויות האלו. נספור כמה פעמים רואים כל אפשרות. את התוצאה נמחיש במפת חום. וזה נראה כך:
הצבעים החמים מייצגים ערכים גבוהים. וההתנהגות הנפוצה היא לאורך האלכסון, אבל כשמסתכלים מקרוב רואים שזה לא בדיוק האלכסון, אלא משבצת אחת מתחתיו. כלומר אם יום התפוגה הוא ה-12 בחודש, אז רוב האנשים יגשו לטסט ב-13 בחודש. דחיינות עד הסוף.
בפינה השמאלית העליונה גם אפשר לראות את הראשון בחודש, שמקבל את דחייני ה-31, כמו גם מה-30 ומה-28.
למה אנשים מתנהגים ככה? אני אישית לא מבין – את הטסט אפשר לעשות ברגע שמשלמים את האגרה, כלומר 3-4 שבועות לפני המועד, אם רוצים. אני בדרך-כלל מבצע גם טיפול לרכב באותו יום, והתזמון הוא לפי היום שמתאים לי ולמוסך, וזה יוצא כשבוע לפני המועד. יש איזה יתרון בביצוע הטסט לאחר המועד שאני מפספס פה?
-
לחשוב מחוץ לתיבה
ביום 30.5.2023 כתב מיכאל רוכוורגר בדה-מרקר על מרווחי האשראי של הבנקים. לכתבה מצורף הגרף הבא:
הוא מראה את מרווחי האשראי לאורך תקופה, בחמש קטגוריות שונות. את ציר הזמן מקודד הצבע, ואת הנתון (מרווח האשראי) מתארות תיבות (או עמודות). אני לא חושב שזו המחשה טובה. למה?- כדי למצוא את השנה של כל תיבה, העין צריכה לנדוד אל המקרא ולהתאים את הצבע.
- הצבעים מושכים את העין, אבל הם לא מקודדים קטגוריות, כמקובל, אלא מספר (השנה). ולמרות שלמשתנה השנה יש כאן רק ארבעה ערכים שונים (2019-2022), המשמעות שלו היא רציפה (זמן) הרבה יותר מאשר קטגורית.
- יש פה חזרתיות גדולה מאוד: כל שנה מופיעה בכל אחד ממקבצי העמודות.
- השימוש בעמודות פחות מתאים לתאר נתון שמשתנה בתלות במשתנה אחר. במקרים כאלה, מה שמתאים יותר למשימה זה תרשים קו.
איך נוכל לשפר אותו? נתחיל בתיבות ונהפוך אותן לקוים. זה יראה משהו כמו זה:
הקוים טובים יותר לתאר את המגמה, וזה טוב מכיוון שמגמת הירידה היא נושא חשוב בכתבה. אבל עדיין נשארנו עם צבעים. וזה לא רק מסיח את הדעת, אלא גם יכול להיות בעייתי לעוורי צבעים (ואפילו להכניס אותנו לבעיות מבחינת תקינה של נגישות האתר). הנה הצעה להורדת כל הצבעים:יותר משעמם, אולי, אבל יותר אינפורמטיבי. וגם יש פחות צורך בתנועה של העין אל המקרא ובחזרה. ומה לגבי החזרתיות? עדיין יש לנו חזרה על השנים.
את זה ניתן לתקן אם מציירים את כל הקוים על אותה מערכת צירים. באופן כללי, יש פה סיכון – אם הקוים חוצים זה את זה יכול להווצר ספגטי (של קוים ישרים – כלומר ספגטי לא מבושל). אבל במקרה של הנתונים האלה, זה מסתדר ממש טוב:לציור הזה החזרתי את הצבעים. אפשר לוותר עליהם, אם בוחרים צורות שונות לנקודות המודגשות (למשל, איקסים/ריבועים/משולשים). אבל פה נראה לי שצבע הוא הרע במיעוטו.
-
עבודות שקופות וללא מקרא
בתאריך 24.5.2023 כתבה יעל דראל בדה-מרקר על ״עבודות שקופות״ – עבודות במשק הבית ובטיפול בילדים שלא משולם עליהן שכר כספי. התיזה של הכתבה היא שעיקר הנטל של העבודות השקופות הוא על הנשים.
אחד הגרפים בכתב מציג את הערך הכספי של שעות העבודה השקופות, הנה הוא:
לכאורה הגרף די ברור – נשים לעומת גברים, שעות עבודה מימין, ושווי כספי של אותן שעות משמאל. אבל מה אומרות התיבות המקווקוות בצד שמאל? לא ברור. דבר כזה חייב להיות מצוין במקרא של הגרף (היכן שכתוב ״נשים/גברים״).
חיפשתי בכל הכתבה את הפירוש של הקוים המסתוריים, ואם זה כתוב שם אז פספסתי. את התשובה מצאתי במאמר אחר של דה-מרקר, מאוגוסט 2022. שם גם מופיעה גירסה זהה של אותו הגרף. מסתבר שההבדל הוא בין גבול תחתון לשכר לשעת עבודה (ע״פ שכר מינימום של 29 ש״ח לשעה) ובין הגבול העליון של 50 ש״ח לשעה. אז עכשיו אנחנו יודעים. חבל שהמידע הזה לא עבר לכתבה החדשה, ובפרט הושמט מהמקרא של הגרף.
נ.ב: הנתון של הרף התחתון הוא 5233 ש״ח לפי 29 ש״ח לשעה. כלומר כ-180 שעות חודשיות. אם בכל יום מושקעות 5.5 שעות, הרי שחודש ממוצע הוא בן 32.8 ימים. שגיאת עיגול?
-
בעלויות רכב
איזה רכב מחליף ״ידיים״ הכי מהר? ואיזה דגם הוא שיאן הקילומטרז׳? צלילה נוספת לנתונים של משרד התחבורה.
הנתונים מכילים את הקילומטרז׳ של כל מכונית בטסט האחרון, וגם את התאריך שלו. אפשר לחשב את מספר הימים שהרכב בילה על הכביש- מתאריך העליה על הכביש ועד תאריך הטסט. משם אנחנו גוזרים את הקילומטרז׳ הממוצע ליום, לכל כלי רכב. את התוצאות קיבצנו לפי דגמים, והשיאנים הם:
- רנו פלואנס עם 83 ק״מ ליום ממוצע (כולל שבתות וחגים)
- רנו מגאן גראנד קופה, 77 ק״מ ליום
- רנו קנגו, 74 ק״מ ליום
- סקודה ראפיד, אוקטביה, וטויטה אוריס ופריוס, כולן עם מעל 66 ק״מ ליום ממוצע
יש פה כמה דגמי מוניות, באופן לא מפתיע. וגם כמה כלים היברידיים, חסכוניים בדלק. רק הגיוני שמי שנוהג הרבה ישתדל לקנות דגם חסכוני.
כידוע, רכב חדש שעולה על הכביש פטור מטסט למספר שנים,. לכן הם לא לא מיוצגים בנתונים למעלה. לדוגמה, הכלים החשמליים שנעשו פופולריים החל מ-2021 בכלל לא נכנסו לשקלול. כדי לנטרל את ההשפעה הזאת, מעתה והלאה נגביל את הנתונים לשנתון רכב 2019, שכבר עבר טסט אחד לפחות.
בבדיקה לפי סוג הדלק, רכבי הדיזל מכלים יותר קילומטרים ליום ממוצע על הכביש, כמו שרואים בגרף הכינור למטה. הנקודות הלבנות הן הממוצעים. עיקר ההתפלגות של רכבי בנזין היא סביב 40 ק״מ ליום, ואילו רכבי הדיזל מתפרסים בצורה אחידה יותר בטווח של 60-80 ק״מ ליום. לגבי הרכבים החשמליים, בשנת 2019 עדיין היו מעט מאוד כאלה אז יהיה פזיז לגזור מסקנות. להרחבה, אני ממליץ על הכתבה של דניאל שמיל (שהניתוח הזה מופיע בה גם כן).
מכיוון שהעברות בעלות גם הן מתועדות, אפשר לראות כמה בעלים שונים היו לכל לוחית רישוי. ואת נתון הקילומטרז׳ נחלק במספר ה״ידיים״, כדי לקבל את ממוצע הק״מ לכל יד. אל ראש הרשימה מגיעות דאצי׳ה, רנו, וסקודה, עם מעל 43 אלף ק״מ ל״יד״ ממוצעת. היצרנים של המכוניות שנוסעות הכי מעט לפני שהן מחליפות בעלות הם:
- ב.מ.וו, כ-18.4 אלף ק״מ לכל יד
- מרצדס, 19.3 אלף ק״מ
- קאדילק, 20.6 אלף ק״מ
אם נחשב את אותו נתון (קילומטרז׳ ל״יד״ ממוצעת) לפי דגמים (לא לפי יצרנים), אז השיאנים הם רנו קנגו, דאצ׳יה דאסטר, קיה סיד וטויוטה קורולה היברידית.
הדגמים עם הכי מעט קילומטר לכל יד הם מזדה 2, יונדאי טוסון, מיצובישי ספייס סטאר, שברולט ספארק, ויונדאי i10. למעט הטוסון, אלו רכבי עיר קטנים ומתאימים לשמש כרכב שני למשפחה.
ונעבור לנתוני סחירות: מספר הידיים הממוצעות לרכב, לפי יצרן. התחלופה הגבוהה ביותר נרשמת ברכבי מרצדס וב.מ.וו (2.8 ידיים), ואופל (2.3 ידיים). להזכיר, מדובר ברכבים משנתון 2019. הקונים הנאמנים ביותר הם של רכבי דאצ׳יה (1.6 ידיים) ופולקסווגן (1.5 ידיים).
אפשר לבדוק גם את הקשר בין צבע הרכב לשימוש בו ולסחירות. מבחינת העברות הבעלות לפי צבע הרכב, הקונים של רכב בצבע שחור ממהרים ביותר למכור אותו (2.1 ידיים בממוצע, לרכב משנתון 2019). הנאמנים ביותר הם בעלי רכב בצבע ירוק – 1.6 ידיים בממוצע. את הקילומטרז׳ הגבוה ביותר רושמים כלים בצבע חום – 76 אלף ק״מ מ-2019 ועד היום. ואת הנסועה הנמוכה משיגות שוב המכוניות הירוקות, עם כ-45 אלף ק״מ באותה תקופה.