גרף פיזור

גרף פיזור הוא כלי סופר-שימושי להראות קשר בין משתנים.  והוא גם פשוט וברור.  אז חבל לא להשתמש בו כשצריך.

זה מתחיל עם גרף מדה-מרקר שהוא כל כך בעייתי שלא יכולתי להתאפק.  הסיפור שהם רוצים לספר הוא בנושא בעלי דירות להשקעה ושוק השכירות.  ספציפית הטענה היא שיש קשר הפוך בין תשלום מס על הכנסות משכירות לבין מכירת דירות להשקעה כתוצאה מחוק המס על דירה שלישית: בערים שבהן מרבים לשלם מס כדרוש היתה רק הקטנה צנועה בביקוש לדירות של בעלי 3 דירות או יותר, בעוד בערים שבהן מרבים להעלים הכנסות הייתה הקטנה ניכרת בביקוש.  כשהם ניסו להראות את הנתונים יצא להם הגרף הבא:

themarker-bad

כדי להראות את הקשר הם ציירו שתי פונקציות, ואנחנו אמורים לראות שהן מתנהגות בצורה דומה, עם מגמת ירידה משמאל למעלה כלפי ימין למטה.  אבל

  • הנתונים הם דיסקרטים ולא רציפים.  הסידור של הערים נקבע לפי הקו האדום, אבל פחות מתאים לקו הכחול, ואין באמת רצף מחדרה לרחובות לחיפה לירושלים.
  • הסקלות שונות, וגם גדלות בכיוונים הפוכים (משלמים יותר -> הקטנה רבה יותר), מה שחייב שימוש בשני צירים.  אז הצופה צריך להשוות נקודות עם שניהם כדי לנסות להעריך מה קורה כאן.

אז איך אפשר להציג את הנתונים יותר טוב?

יש לנו אוסף נקודות, ולכל אחת יש שני ערכים.  אנחנו רוצים לראות את המגמה: כשמשנים ערך אחד, האם השני גדל או קטן באופן דומה.  אז הפתרון הפשוט והישיר להצגת נתונים כאלה הוא גרף פיזור.  במקרה שלנו הכותרת מספרת שמשקיעים ברחו כפונקציה של העלמת מס, אז אני מציע לשים את אחוז משלמי המס בציר האופקי, ואת אחוז ההקטנה בביקוש בציר האנכי.  התוצאה היא כדלהלן (הנתונים נמדדו מהגרף המקורי בערך באמצע האזור המוקדש לעיר, נקווה שזה בערך נכון…):

themarker-bad-scat

אז באמת רואים בבירור שהסיפור שלהם סביר: בערים שבהן משלמים יותר מס, הייתה הקטנה צנועה יותר של הביקוש.  וגם רואים שטבריה היא חריג שקצת מקלקל.

גרסה עוד יותר טובה מתקבלת אם הופכים את הצירים (והכיתוב שלהם) ומציגים את אותם הנתונים כך:

themarker-bad-scat-rev

לא שגרתי, אבל זה מדגים בצורה הכי ישירה את הכותרת "ככל שיותר משקיעים העלימו מס, כך הם מיהרו לברוח מהשקעותיהם".  בנוסף השימוש בערכים שליליים עם הכיתוב "שינוי" (כמו שנעשה גם בגרף המקורי) מבטל בלבול אפשרי בהבנה של "אחוז הקטנה", כשאחוז הקטנה גדול יותר משמעו ירידה גדולה יותר.

עדכון: קיבלתי הערה שאולי הקשר הוא לא לינארי אלא מתכנס לכ-50% של שינוי בדרישה, ודווקא רחובות היא החריג.  נכון.  מה שמצביע על עוד בעיה בנתונים של דה מרקר: איפה עוד ערים גדולות יחסית כמו פתח תקוה, ראשון לציון, אשדוד, אשקלון, חולון, ורמת גן?  צריך גם אותן כדי לראות אם יש באמת מגמה ומה היא.

מודעות פרסומת

הערה אחת

  1. אליהו ירט
    פרסם את 22/02/2017 ב-14:59 | Permalink | הגב

    אז מה חידשת?
    אם המגמה נשארה אותה מגמה,
    האדם הפשוט ברחוב Layman,
    לא מבין בגרפים ויותר נוח לו לקרוא גרפים רציפים,

    אני בעד הגישה שלך של הצגה יותר מדוייקת
    אבל לא הבנתי על מה התרגזת אם בסוף יצא לך אותו דבר?

    אליהו ירט

להשאיר תגובה

הזינו את פרטיכם בטופס, או לחצו על אחד מהאייקונים כדי להשתמש בחשבון קיים:

הלוגו של WordPress.com

אתה מגיב באמצעות חשבון WordPress.com שלך. לצאת מהמערכת / לשנות )

תמונת Twitter

אתה מגיב באמצעות חשבון Twitter שלך. לצאת מהמערכת / לשנות )

תמונת Facebook

אתה מגיב באמצעות חשבון Facebook שלך. לצאת מהמערכת / לשנות )

תמונת גוגל פלוס

אתה מגיב באמצעות חשבון Google+ שלך. לצאת מהמערכת / לשנות )

מתחבר ל-%s

%d בלוגרים אהבו את זה: