על עניים ועשירים

אי שיוויון — ובעיקר אי שיוויון כלכלי בין עניים ועשירים — הוא נושא חם בשנים האחרונות, שמרבים לדון בו ולציין אותו בתור גורם חשוב בכלכלה ובפוליטיקה העולמית.  אבל עדיין קשה למצוא נתונים עליו.  בישראל עד לא מזמן לא היו בכלל נתונים רשמיים על עושר, אלא רק על הכנסות.  ואי השיוויון בהכנסות הוא לא אותו הדבר כמו אי השיוויון בעושר, כי הכנסות יכולות להשתנות בכל רגע אבל עושר מצטבר לאורך זמן וגם יכול לעבור בירושה.

לכן מעניין במיוחד מסמך עם הכותרת "אי שיוויון בישראל: כיצד מתחלק העושר?" שנכתב על ידי מאור מילגרום וגלעד בר-לבב מהמכון לרפורמות מבניות לפני שנה.  החלק המדליק הוא המתודולוגיה שלהם, שפרוט טכני שלה מופיע בנספח למסמך.  הבסיס הוא סקר נכסים של הלמ"ס שנערך לראשונה ב-2013, שבו שאלו מדגם מייצג של האוכלוסיה על הנכסים שלהם.  אבל יש עם זה שתי בעיות: מדגם כזה כרגיל מפספס את העשירים ביותר, ולכן הוא לא באמת מייצג, ובנוסף לרוב אי אפשר לקבל נתונים מהימנים על כל הנכסים.

למה מפספסים את העשירים ביותר?  הלמ"ס ערכו מדגם ענק של 4621 משקי בית.  אבל בישראל יש כ-2.5 מיליון משקי בית.  כך שכל אחד שעולה במדגם מייצג כ-540 משקי בית.  אז קל להבין שנראה לכל היותר אחד מה-500 העשירים ביותר, ואפילו אם נראה אחד מהם, אין שום סיכוי שנראה מדגם טוב שלהם.

ולמה זה חשוב לא לפספס את העשירים ביותר?  הסיבה היא שידוע (מאז העבודה החלוצית של פארטו בסוף המאה ה-19) שלהתפלגות העושר יש "זנב כבד".  זו תכונה סטטיסטית שאומרת שחלק ניכר מההתפלגות נמצא בזנב, כלומר בערכים הגדולים ביותר.  והתפלגות העושר היא צורה טובה להדגים את זה באופן אינטואיטיבי: העובדה שהתפלגות העושר היא התפלגות עם זנב כבד אומרת שרוב האנשים אינם עשירים (הם ב"גוף" ההתפלגות ולא ב"זנב" ההתפלגות, כלומר לא בקצה שלה, ויש להם רמת עושר "ממוצעת"), אבל רוב הכסף דווקא כן נמצא בזנב — כלומר כל הכסף של העניים ומעמד הביניים ביחד, למרות שמדובר בהמון אנשים, אינו משתווה לכסף של הבודדים העשירים ביותר.  במילים אחרות, אם תבחר אדם אקראי מכל אוכלוסית ישראל, תגלה שהוא לא עשיר.  אבל אם תבחר שקל אקראי מכל הכסף שיש בישראל, תגלה קרוב לוודאי שהוא שייך לשרי אריסון או אחד מחבריה.

אז אם רוצים לאפיין את התפלגות העושר, צריך מידע מפורט על העשירים ביותר וגם על העשירים למדי, ואת זה לא מקבלים ממדגם אקראי.

אז איך בכל זאת נקבל מידע אמין על התפלגות העושר?  הטריק שמילגרום ובר-לבב השתמשו בו מכיל שלושה רכיבים.  את הראשון כבר פגשנו: זה מדגם כללי של האוכלוסיה, שמספק מידע סביר על גוף ההתפלגות.  הרכיב השני הוא רשימות כמו "500 העשירים ביותר" שמתפרסמות מדי שנה במגזינים כלכליים, ובמקרה שלנו רשימה כזו שפורסמה על ידי דה מרקר (הם השתמשו ברשימה של 2013 — אותה שנה כמו הסקר).  זה נותן מידע פרטני ומלא למדי על הקצה הרחוק ביותר של הזנב של ההתפלגות.  הרכיב השלישי משלים את התמונה על ידי מילוי טווח הביניים בין גוף ההתפלגות לבין קצה הזנב.  את זה עושים בצורה שתתאים לצורה הכללית של ההתפלגות הצפויה, שנקראת התפלגות פארטו (על שם אותו פארטו שמצא אותה).

כדי שזה יעבוד צריך שהנתונים במדגם והנתונים על העשירים ביותר יהיו אמינים.  לגבי העשירים, אין לנו ברירה אלא להסתמך על דה מרקר.  לגבי המדגם, יש שלל סיבוכים שצריך להתייחס אליהם.  מילגרום ובר-לבב מפרטים את זה במסמך שלהם, החל מההגדרה שעושר כולל נכסים ריאליים (בעיקר דירות) ונכסים פיננסיים (השקעות הון ופנסיה צפויה), וכלה בהשוואות בין התוצאות של המדגם לבין נתונים כלכליים כלליים של הלמ"ס כדי לראות אם זה מתאים.  המסקנה היא שיש להניח שהתוצאות לא ממש מדויקות, אבל עדיין הן הרבה יותר טובות מחוסר ידע מוחלט.

כיוון שכל התהליך הזה סבוך ומורכב לא רציתי לחזור עליו, וביקשתי את הנתונים הסופיים (כלומר ההערכה של התפלגות העושר) ממאור מילגרום.  הגרפים הבאים מציגים את מה שקיבלתי ממנו.

הגרף הראשון מדגים את תהליך בנית ההתפלגות על שלושת חלקיה. ההסבר קצת טכני אז מי שלא מתעניין מוזמן לקפוץ לפסקה על מדד ג'יני.

llcd

כיוון שהתפלגויות עם זנב כבד מתאפיינות בערכים מאוד מאוד גדולים שיש להם הסתברות מאוד מאוד קטנה, הצורות הרגילות לצייר התפלגות לא עובדות.  אז מה שצריך לעשות הוא "להסתכל על ההתפלגות המשלימה בצירים לוגריתמיים".  בואו נסביר את זה.  ההתפלגות המשלימה מוגדרת להיות ההסתברות לראות ערך יותר גדול, כלומר לכל ערך x נתאים את ההסתברות שדגימה מקרית X תהיה גדולה יותר: S(x) = Pr(X > x).  ההסתברות הזו תלויה באיזו התפלגות מדובר.  במקרה של התפלגות פארטו הביטוי המתמטי של זה הוא S(x) = x -a.  אם מוציאים מזה לוג מקבלים:

log(S(x)) = -a log(x)

ולכן אם מציירים את זה כפונקציה של log(x) אמור להתקבל קו ישר שיורד בשיפוע של a-: מתחיל בצד שמאל למעלה, שמייצג את המדגם שמייצג את גוף ההתפלגות, ויורד לימין למטה, כשהקצה מייצג את העשיר ביותר (28 מיליארד שקלים בהסתברות של 1 חלקי 2.5 מיליון, כי יש רק אחד כזה מתוך 2.5 מיליון משקי בית).  החלק באמצע שמתוייג בגרף בתור "זנב מתוקן" הוא החלק שמילגרום ובר-לבב שיפצרו כדי שיקשר בין המדגם לנתונים של דה מרקר עם קו ישר.  מה שהגרף מראה זה שהכל ביחד לא יוצא ממש קו ישר, אבל בשביל נתונים כאלה זה לא רע.  השיפוע של הקו נותן את הפרמטר a של ההתפלגות, וציירתי קו עם שיפוע דומה ליד לשם השוואה.

הגרף הבא מדגים את חישוב מדד ג'יני של העושר.  על מדד ג'יני כבר הסברתי בעבר, אז כאן אני פשוט מראה את הגרף.  כפי שניתן לראות עקומת לורנץ די רחוקה מקו השיוויון, ומדד ג'יני לעושר (השטח הצבוע) יוצא 0.66, הרבה יותר ממדד ג'יני להכנסות.

gini

צורה אחרת להסביר אי שיוויון הוא על ידי ביטויים כמו "האלפיון העליון מחזיק ב-11.5% מכלל העושר במדינה", שזה יותר מפי 100 ממה שהיה להם אם חלוקת העושר הייתה שיוויונית לגמרי.  באופן כללי יותר ניתן להציג את כלל היחסים האלה על ידי הגרף הבא, שמראה שתי התפלגויות ביחד: הקו העליון הוא התפלגות העושר, כלומר כמה עושר יש למשקי הבית השונים, ואילו הקו התחתון הוא התפלגות הכסף, כלומר למי הכסף שייך.

למי שלא מכיר, גרף כזה נקרא cumulative distribution function (CDF).  זה הגרף המקורי שקודם השתמשנו במשלים שלו: הוא מתאר את ההתפלגות על ידי כך שהוא נותן את ההסתברות לראות ערך קטן יותר: לכל x נתאים את ההסתברות שדגימה מקרית X תהיה קטנה מ-x, ובסימנים: F(x) = Pr(X < x).  למשל אפשר לראות שהעושר של ה-25% העניים ביותר באוכלוסיה הוא עד בערך 200,000 שקלים, ושהעושר החציוני הוא בערך מיליון (אם מסתכלים על הנתונים המדוייקים, החציון הוא 1.18 מיליון).  האזור בגרף שבו השיפוע תלול ביותר הוא האזור שבו רוב המסה מרוכזת.  בהתפלגות העושר (הקו העליון) רואים שרוב האוכלוסיה נמצאת בין כ-200,000 שקלים לבין כ-5 מיליון שקלים.  בהתפלגות הכסף (הקו התחתון) רואים שרוב הכסף שייך לאלה שהעושר שלהם בין 2 מיליון ל-20 מיליון.

mass.gif

אבל מה שעוד יותר מעניין הוא להשוות את שתי ההתפלגויות, כפי שמודגם על ידי החיצים.  נתחיל עם ארבעת החיצים המקווקווים, משמאל לימין:

  • החץ השמאלי ביותר מראה שה-30% העניים ביותר ביחד מחזיקים רק 1% מהעושר במדינה.
  • החץ השני משמאל מראה שחצי האוכלוסיה העני מחזיק ביחד רק 8.5% מהעושר.
  • החץ השני מימין מראה שחצי מהכסף מתרכז בידי כ-10% העשירים של האוכלוסיה.
  • החץ הימני ביותר מראה שכ-22% מהכסף מרוכז בידי האחוז (המאיון) העליון.

וכמובן אפשר היה לשרטט עוד חיצים ולאפיין אותם, אבל הגרף נותן את כל התמונה ביחד.

החץ הכפול באמצע מתאר את מה שאני מכנה "היחס המשותף".  זו הנקודה היחודית שבה הסכום של שני הקווים הוא בדיוק 1, ולטעמי הנקודה הזו מייצגת יותר טוב מכל דבר אחר את "האמצע" של התפלגות העושר.  במקרה שלנו זה 2.17 מיליון שקל.  התכונה המיוחדת של הערך הזה היא מעין סימטריה הפוכה: ל-73% מהאוכלוסיה יש פחות עושר, וביחד הם מחזיקים 27% מהעושר במדינה, ובו בזמן ל27% מהאוכלוסיה יש יותר מהערך הזה, וביחד הם מחזיקים ב-73% מהעושר הכולל.

עוד מה שבולט הוא שבעצם התפלגות העושר והתפלגות הכסף לא כל כך רחוקות זו מזו.  בעולם המחשבים שבו אני עוסק כשאני לא כותב בלוגים יש התפלגויות עם זנבות הרבה יותר כבדים, ועם פערים ענקיים בין שני הקוים (למשל יחס משותף של 90 ל-10, וחצי מהמסה שייך לפחות מ-1% מהפרטים).  לטעמי האישי יש שני דברים שהם הצורמים ביותר בהתפלגות העושר.  הראשון הוא בצד שמאל, איפה שהקו העליון מתחיל מערך גבוה יחסית במקום מהקצה התחתון.  המשמעות היא של-20% מהאוכלוסיה ויותר בעצם אין כלום (ואם מדקדקים בנתונים, יש כמה אחוזים שיש להם עושר שלילי, כלומר יותר חובות מנכסים).  השני הוא השפיץ הארוך שהולך רחוק ימינה בקצה העליון.  זה אומר שהבודדים העשירים ביותר אמנם לא מחזיקים אחוז מאוד גדול מכלל העושר, אבל מצד שני העושר שלהם הוא באיזה שלושה סדרי גודל יותר משל אלה שהם סתם נורא עשירים.

מודעות פרסומת

2 תגובות

  1. נמרוד חפץ
    פרסם את 16/12/2016 ב-6:32 | Permalink | הגב

    מחכים וחשוב להבנה בין הכנסה לעושר – שבת שלום

  2. פרסם את 16/12/2016 ב-17:58 | Permalink | הגב

    מרתק. תודה.
    החץ הימני ביותר מראה שכ-22% (ולא 12% כפי שכתוב) מהכסף מרוכז בידי האחוז (המאיון) העליון. נכון, או שלא הבנתי?
    תוכל לצרף את קבצי הנתונים (בין השאר כי בצורת הצגת הגרפים הנוכחית, על סקאלה לוגריתמית בציר אחד / כשהעניין הוא בקצוות כמו המאיון העליון – קשה לזהות את הערך המתאים בגרף)?

טרקבאק אחד

  1. מאת ממוצע וחציון « נתונים ביום 16/04/2017 בשעה 19:18

    […] היא שהתפלגות ההכנסות (ועוד יותר מכך התפלגות העושר) היא התפלגות מוטה. זה אומר שההתפלגות היא לא סימטרית. […]

להשאיר תגובה

הזינו את פרטיכם בטופס, או לחצו על אחד מהאייקונים כדי להשתמש בחשבון קיים:

הלוגו של WordPress.com

אתה מגיב באמצעות חשבון WordPress.com שלך. לצאת מהמערכת / לשנות )

תמונת Twitter

אתה מגיב באמצעות חשבון Twitter שלך. לצאת מהמערכת / לשנות )

תמונת Facebook

אתה מגיב באמצעות חשבון Facebook שלך. לצאת מהמערכת / לשנות )

תמונת גוגל פלוס

אתה מגיב באמצעות חשבון Google+ שלך. לצאת מהמערכת / לשנות )

מתחבר ל-%s

%d בלוגרים אהבו את זה: