מטא-ביקורת בונה על אקונומטריקה

שתי ביקורות נפוצות בקרב סטודנטים על אקונומטריקה כפי שהיא נלמדת בקורסי תואר ראשון הן חוסר המציאותיות של ההנחות המאפשרות אמידה ובפרט של לינאריות משוואת האמידה. על אף שהביקורות הללו אינן שגויות כשלעצמן, חלקן אינן מוצדקות מכוון שבקיצור, אמידת מודל אינו ניסיון להסביר את המציאות באופן גורף אלא קשר מסוים בין שני משתנים, או שתי תופעות, ותו לא.

אקונומטריקאים בדרך כלל עובדים עם מדגם של תצפיות שלכל אחת מהן הצורה \left\{ \mathbf{x}_{i},y_{i}\right\}, עם \mathbf{x}_{i}=\left(x_{1i}\ x_{2i}\ ...\ x_{ki}\right)  וקטור של משתנים (למשל גיל, השכלה, מצב משפחתי וכדומה). הבחירה במילה "מדגם" אינה מקרית: הצעד הראשון לכיוון הסבר הקשרים הפועלים ביסוד הנתונים הנצפים הוא ההנחה שקיים מרחב הסתברות, שנגדיר כעת, כך שהמדגם הוא למעשה אוסף של ריאליזציות אקראיות של משתנים מקריים \left(\mathbf{X}_{i},Y_{i}\right)  בעלי התפלגות משותפת מסוימת. מרחב הסתברות הוא שלשה \left(\Omega,\mathcal{F},\mathbb{P}\right) \Omega  קרוי מרחב מדגם: קבוצה המונה את כל התוצאות האפשריות של ניסוי. למשל, אם נתייחס להטלה יחידה של קובייה רגילה, מרחב המדגם יהיה \Omega=\left\{ \left\{ 1\ is\ obtained\right\} ,\left\{ 2\ is\ obtained\right\} ,...,\left\{ 6\ is\ obtained\right\} \right\}  . חוקר יכול להגדיר \Omega  כרצונו במסגרת מערך ניסוי יחיד: במקום המספר שהקוביה מציגה אחרי זריקה, אפשר לבחור את מספר הסיבובים השלמים שהיא עושה סביב עצמה עד שנעצרת (במקרה זה, \Omega=\mathbb{Z}_{+} ). \mathcal{F}  הוא סיגמא-אלגברה: קבוצה הכוללת כל רצף של תוצאות אפשריות של אפס, אחד, או יותר איטרציות של הניסוי (שתוצאות כל אחת מהן שייכות כולן ל- \Omega ). נכנה את איברים של \mathcal{F}  מאורעות ונגדיר למשל \mathcal{F}=2^{\Omega}: כל תתי הקבוצות של \Omega , קבוצה ריקה ו-\Omega  עצמו. נמדוד את ההסתברות שמאורע התרחש באמצעות מידת הסתברות \mathbb{P} , פונקציה שמחזירה מספר בין 0 ל-1 לכל מאורע ב-\mathcal{F} . נשים לב ש-\Omega  ולכן גם \mathcal{F} אינן כוללת מספרים אלא תיאורים של תוצאות: תפקידו של משתנה מקרי הוא לשייך ערך מספרי לכל מאורע. בדוגמא שלנו, נרשום \mathbf{X}:\Omega\rightarrow\left\{ 1,2,...,6\right\}  , כלומר \mathbf{X}  לוקח איבר ב-\Omega  ומשייך לו מספר בין 1 ל-6. אם היינו מגדירים את \Omega  באופן אחר, למשל כך שבנוסף למספר שהתקבל היה נקלט מספר הסיבובים השלמים שהקוביה עשתה סביב עצמה ואת מספר השעות שעברו מאז חצות בזמן ביצוע הניסוי, היינו מקבלים  \mathbf{X}:\Omega\rightarrow\left\{ 1,...,6\right\} \times\mathbb{Z}_{+}\times\left\{ 0,...,23\right\}  . נדגיש שתי נקודות חשובות: \Omega  הוא אמירה פוזיטיבית על העולם, שתלויה בפרשנות המציאות של החוקר ובחוויתו. בניגוד לו, \mathbb{P}  הוא עצמו אמירה אובייקטיבית בהנתן \Omega . המדגם עצמו מושפע משיטת הדגימה שנבחרה.

עד כאן, תאוריה סטטיסטית טהורה; נעבור לתוכן כלכלי (יותר). גישה בסיסית באקונומטריקה היא הנחת הקיום של משוואה מהצורה הבאה:

 y=\mathbf{x}\cdot\beta+\varepsilon  

עם \beta\in\mathbb{R}^{k}  וקטור של פרמטרים שתפקידם לבצע סילום של \mathbf{x}\in\mathbb{R}^{k}  כך שהמכפלה תניב את y\in\mathbb{R} , כאשר \varepsilon\in\mathbb{R}  הוא הפרעה אקראית להתאמה מושלמת (שנהוג לפרש כמשתנים בלתי נצפים שגם משפיעים על y  אך אינם נשלטים במודל); במלים אחרות, \varepsilon  אנכי למרחב שפורש \mathbf{x} . ההנחה החזקה ביותר כאן אינה הלינאריות כשלעצמה, אלא קיומו של \beta  כזה, הרי הוא גורר קיום קשר קבוע בין \mathbf{x}  לבין y  וסטייה מקרית לחלוטין בינהם. כמו כן, אם \mathbf{x}  אכן רלוונטי ומספיק להסביר את y , קשה לטעון שהיכולת לסכום את סך הסילומים של האיברים של \mathbf{x}  מופרכת. הבעיה אם כן פשוטה: \beta  אינו יודע, אך ניתן לאמידה בתנאי שתהליך איסוף הנתונים נעשה כהלכה, כלומר באופן רנדומלי. נראה כיצד במשך.

באופן כללי יותר, אפשר לנסח:

y=m\left(\mathbf{x};\beta\right)+\varepsilon

עם m:\mathbb{R}^{2k}\rightarrow\mathbb{R}  פונקציית ההתאמה, שאינה בהכרח לינארית. עלינו להבין מהו הקשר על מנת לפתח תהליך אמידה: יש להבחין בין הערך המספרי של \beta , לבין הסיבה לכך שהוא קיבל את ערך כזה, שאינה נובעת רק מ-m . סיבה אפשרית יכולה להיות שבהנתן m , הפרמטר \beta ממזער את הסטיות בערך מוחלט בין \mathbf{x}  לבין y , או את הסטיות הריבועית, או משהו אחר. את פונקציה הזו נסמן \ell , עבור loss. אזי אפשר להעריך את m  עצמו על ידי \hat{m}  כך:

(1)\qquad\hat{m} = \arg\min_{m:\mathbb{R}^{2k}\rightarrow\mathbb{R}}\sum_{i=1}^{n}\ell\left(y_{i}-m\left(\mathbf{x}_{i};\beta\right)\right)

עבור מדגם מגודל n. הבחירה של \ell  היא בעייה בפני עצמה ולא ניכנס אליה כאן. הבעיה היא שאין אנו יודעים מהו ערכו של \beta  ולעומת זאת עדיין מעוניינים להניח את קיומו (הרי ביטול ההנחה היה מאפשר לאמוד את m ), כי איבר מסוים בו הוא התוכן הכלכלי בגללו מבצעים מחקר: השפעה של משתנה מסוים x_{j}\in\mathbb{R}  על y . המוטיבציה היא כוח פרשנות, לא כוח הסבר: הצדקה מעט גסה לנוכחות שאר האיברים של \mathbf{x}  במשוואה הוא שהם צפויים להשפיע על y  אף הם ובד בבד להיות מתואמים עם x_{j}  ולכן, כאשר מפקחים עליהם, "מנקים" מ- \beta_{j}  את השפעתם, כדי להשאיר בו את הקשר הסיבתי בין x_{j}  ל-y בלבד. כמובן שקיום קשר כזה הוא גם הנחה, אבל לא הנחה נוספת: הוא למעשה תוצאה מקיום הצורה הפונקציונלית m\left(\mathbf{x};\beta\right) . מה עושים? בפשטות, מניחים מהי m  א-פריורי. נוכל אם כן לאמוד את \beta  על ידי \hat{\beta}

\hat{\beta}=\arg\min_{\beta}\sum_{i=1}^{n}\ell\left(y_{i}-m\left(\mathbf{x}_{i};\beta\right)\right)

בחזרה ל-\ell . מסתבר שיש לצורה \ell\left(\cdot\right)=\cdot^{2}  תכונות מאוד רצויות מבחינה אקונומטרית. לא נעמיק לגבי המוטיבציה העומדת מאחורי בחירה זו (אפשר למצוא הצדקה מפרושת בטקסטבוק החינמי והמעולה של ברוס האנסן¹), אבל נאמר בקצרה שתחת תנאים מסוימים, הדימיון בין \hat{\beta}  ל-\beta  יגדל יחד עם מספר התצפיות. בעיית האופטימיזציה היא:

 (2)\qquad\hat{\beta}=\arg\min_{\beta}\sum_{i=1}^{n}\left(y_{i}-m\left(\mathbf{x}_{i};\beta\right)\right)^{2}

אחד התנאים הנ"ל הוא שהתצפיות יהיו .i.i.d: הן בלתי תלויות זו בזו ונובעות מאותה ההתפלגות. במלים, התוצאה של ניסוי בודד אינה מושפעת מתוצאות הניסויים האחרים. זו הנחה שאינה סבירה במיוחד ושניתנת לביטול, אולם היא בדרך כלל נעשית על מנת להקל על האמידה, בהתחשב בכך שאפשר לפצות את חוסר המציאותיות באמצעות שיטת אמידה מתאימה ובעיקר מודעות לו. נשים לב שלא היינו צריכים את ההנחה i.i.d. על מנת לאמוד את (1) או (2). במקרה הראשון, מספיק היה לוותר על הנחת קיומו של \beta  על מנת להסביר את הקשר בין \mathbf{x}  לבין y באמצעות פונקציה ללא פרמטרים. ההסבר היה אמין כל עוד, כאמור, התצפיות היו נאספות באופן רנדומלי, אבל יהיה קשה לזהות את ההשפעה של איבר בודד של \mathbf{x}  על y . מנגד, ההנחה נדרשת על מנת להבטיח תוצאות אמינות ב-(2), שיהיו מפורטות יותר. קיימות שיטות מתקדמות יותר המאפשרות להחליש את ההנחה .i.i.d, אבל הן מחליפות אותה במגבלות אחרות.

לסיכום, נפנה למאמר Policy analysis with incredible certitude של צ'רלס מנסקי², בו הוא מציע את הפשרה הבאה:

“An analyst can resolve the tension between the credibility and power of assumptions by posing alternative assumptions of varying credibility and determining the conclusions that follow in each case.”


¹  http://www.ssc.wisc.edu/~bhansen/econometrics/

²  http://economics.wustl.edu/files/economics/imce/policy_certitude_tlk.pdf

מודעות פרסומת

2 מחשבות על “מטא-ביקורת בונה על אקונומטריקה

להשאיר תגובה

הזינו את פרטיכם בטופס, או לחצו על אחד מהאייקונים כדי להשתמש בחשבון קיים:

הלוגו של WordPress.com

אתה מגיב באמצעות חשבון WordPress.com שלך. לצאת מהמערכת / לשנות )

תמונת Twitter

אתה מגיב באמצעות חשבון Twitter שלך. לצאת מהמערכת / לשנות )

תמונת Facebook

אתה מגיב באמצעות חשבון Facebook שלך. לצאת מהמערכת / לשנות )

תמונת גוגל פלוס

אתה מגיב באמצעות חשבון Google+ שלך. לצאת מהמערכת / לשנות )

מתחבר ל-%s