האמת היא שמארק טווין חשב שהוא מצטט את ראש ממשלת בריטניה, בנג'מין ד'יזראלי, אבל אין שום הוכחה שהוא אכן אמר זאת. הנה לכם דוגמא מצויינת לכך שכאשר לא בודקים את מקור המידע – יש סיכוי לא רע שיתווכחו אתכם על התוצאה…
בואו נחזור לשניה להתחלה ונוודא שאנחנו מדברים על אותו דבר. סטטיסטיקה היא תחום ידע שעוסק באיסוף, עיבוד, ניתוח והצגת מסקנות מנתונים כמותיים. שני הענפים המרכזיים של התחום הם:
- סטטיסטיקה תיאורית – יצירה והשוואה של מדדים לטובת תיאור ברור של מציאות או תופעה
- הסקה סטטיסטית – הסקת מסקנות על תכונות של התפלגות על סמך בדיקה אמפירית, למשל לטובת יצירת אומדנים לגבי כלל האוכלוסיה
הרבה מילים שאמורות להרגיע אותנו לגבי הדיוק של הנתונים, התהליך והתוצאה, לא?
כן, אבל סטטיסטיקה נוצרת על ידי אנשים ולטובת אנשים, ולכן אפשר למצוא בה הרבה אי דיוקים – כאלו שנוצרו בטעות, כמו שימוש בנתונים שגויים או במדגם לא מייצג, וכאלו שנוצרו במכוון, כמו בחירה מודעת של נתונים שתומכים בעמדה מסוימת או הצגה מניפולטיבית של הנתונים.
נתונים סטטיסטיים משמשים בסיס להרבה מאד ענפים אחרים, כמו כלכלה (הערכת שווי של חברה או מוצר), מסחר (שיווק ופירסום), פוליטיקה (סקרים) ועוד. לכן, יש סיכוי טוב שאתם נתקלים מדי יום בשימוש שגוי או מניפולטיבי בסטטיסטיקה, וכדאי לפקוח עין.
המתמטיקאי האמריקאי צ'רלס סייף כתב בדיוק על זה את הספר Proofiness – The Dark Arts of Mathematical Deception. הוא מציג בספר שיטות רבות מאד להונאה מכוונת ולא-מכוונת באמצעות נתונים ומספרים, ומסביר שהסיבה לכך שהן נפוצות היא שרוב הציבור אינו בקי במספרים.
למעשה, אנשים נוטים להאמין לנתונים ולנוסחאות שמוצגים בפניהם ולראות בהם מידע משכנע, עד כדי כך שחוקרים ומפרסמים עושים בהם שימוש ציני, כמו במחקר שהציג נוסחה מתמטית שמתארת את… הדרך הנכונה לצמצום היקף הישבן.