שנה חדשה

סיום שנה זה תמיד זמן טוב לסכם נתונים.

ומה יותר מתאים לבלוג על נתונים מאשר נתונים על נתונים?

אז הנה דרוג מדינות העולם לפי ה-Global Open Data Index, מדד שמתיימר למדוד עד כמה כל מדינה מספקת נתונים חופשיים למי שמתעניין.  המדד מורכב מבדיקה של נגישות לנתונים על מגוון נושאים (תקציב המדינה, סטטיסטיקה לאומית, תוצאות בחירות, תחזיות מזג אויר, רישום חברות, ועוד כל מיני דברים).  לגבי כל נושא בודקים אם הנתונים חפשיים, מעודכנים, בפורמט נוח לעיבוד ממוחשב, וחינם.  את כל זה מסכמים למספר אחד שמיצג את האחוז מהניקוד המקסימלי האפשרי.  ישראל מקבלת ציון של 41%, שבצרוף מקרים נאה גם מביא אותה למקום ה-41 בדרוג.  מבין המדינות המערביות המפותחות רק שתיים מדורגות נמוך יותר (פורטוגל ושוויצריה).  מדינות כמו הודו, אוקראינה, ורוסיה מעלינו.  בגרף החצי העליון של המדינות המדורגות מוצג במלואו, ומהשאר רק כמה דוגמאות (הדרוג של כל מדינה ניתן בסוגריים).  מדינות ה-OECD בירוק.

open-data

וכמה הערות על זה:

  1. אני חושב שחלק מהציונים שלהם לא מדויקים. למשל באתר מצוין שעבור תוצאות בחירות או חוקי המדינה אי אפשר להוריד את מה שרוצים בבת אחת ומיד.  מנסיוני זה אפשרי.
  2. מצד שני אנחנו באמת בפיגור רציני בכל מה שנוגע לנגישות מידע.  באתר data.gov.il יש 482 מאגרי מידע, חלקם חופפים דברים שאפשר למצוא במקומות אחרים, ורבים מהם לא באמת מאגרים נפרדים אלא סדרות נתונים (למשל תקציב או שערי חליפין) עבור תקופות שונות.  חלק מהמידע הוא בכלל תוצאות של סקרים על איזה מאגרי מידע יש, לפי החלטת ממשלה שב-2017 סוף סוף ימפו את זה בצורה מסודרת.  בינתיים באתר המקביל של ממשלת ארה"ב יש 228 אלף, בבריטניה 40 אלף, ובצרפת 33 אלף.
  3. דוגמה לנתונים שאי אפשר למצוא כאן (לפחות אני עוד לא מצאתי אותם, אם אתם מכירים אשמח לשמוע) הם נתונים בסיסיים על אי שוויון, ובפרט למשל איזה אחוז מההכנסה מגיע למאיון העליון לעומת החצי התחתון באוכלוסייה.  זה סוג הנתונים שנמצא בבסיס הספר של פיקטי על קפיטאל במאה ה-21, עם סדרות נתונים מכל העולם.  אבל גם לו אין נתונים מישראל.
  4. בתור אספן נתונים אני יכול גם להעיד על שני מאפיינים מעצבנים של הנתונים שכן אפשר למצוא בארץ.  ראשית, בהרבה מקרים אין מספיק רקע היסטורי אלא רק נתונים מתקופה קצרה יחסית.  זה נובע מכך שרק עכשיו מתחילים לאסוף ולהנגיש נתונים בכל מיני נושאים, ונתונים מהעבר גם אם נאספו לא נשמרו או לא הועלו לרשת (דוגמה – נתוני גיוס, שבטוח שנאספו כל שנה).  שנית, בחלק מהמקרים הנתונים חלקיים ולא מעודכנים באופן מזעזע.  הדוגמה הבולטת ביותר היא נתוני הביצוע של תקציב המדינה.  אפשר למצוא כל מיני אקסלים חלקיים באתר של החשב הכללי, כרגיל באיחור אופנתי.  אבל למה כל התקציב לא מגיע בצורה מסודרת ואמינה למפתח התקציב??
מודעות פרסומת

3 תגובות

  1. פרסם את 01/01/2018 ב-23:34 | Permalink | להגיב

    למה? מן כי משרד האוצר לא רואה את עצמו כשלוחם של האזרחים, אשר מחויב לתת להם דין-וחשבון ציבורי ראוי.

  2. פרסם את 02/01/2018 ב-12:33 | Permalink | להגיב

    הגהה:
    "אם אתם מכירים אשמח שמוע"

    תודה על הפוסטים המרתקים!

להשאיר תגובה

הזינו את פרטיכם בטופס, או לחצו על אחד מהאייקונים כדי להשתמש בחשבון קיים:

הלוגו של WordPress.com

אתה מגיב באמצעות חשבון WordPress.com שלך. לצאת מהמערכת /  לשנות )

תמונת גוגל

אתה מגיב באמצעות חשבון Google שלך. לצאת מהמערכת /  לשנות )

תמונת Twitter

אתה מגיב באמצעות חשבון Twitter שלך. לצאת מהמערכת /  לשנות )

תמונת Facebook

אתה מגיב באמצעות חשבון Facebook שלך. לצאת מהמערכת /  לשנות )

מתחבר ל-%s

%d בלוגרים אהבו את זה: