|
||
主頁→專題:經濟經濟學與學術誠信文:曾國平
南韓科學家黃禹鍚偽造實驗結果一事,成了世界新聞。南韓國立大學師生中,為此事而感蒙羞的居多,但繼續支持這位明星教授的亦不乏人。筆者問及身邊畢業自南韓國立大學的同學,他們均為此事鬱鬱不樂,謂南韓的國譽因此受損不輕。 偽造結果(有意或無意的)在各門科學中屢見不鮮,今回複製狗事件鬧得大,只因有關研究影響深遠,絕非象牙塔內的爭辯。經濟學中的例子,自電腦科技發達、統計軟件普及和實證數據供應增加以來,可謂俯拾皆是。經濟學中這類偽造結果,沒有傳媒報導,只因其對人類影響甚微。 修研究院二年級的課,如勞工經濟、實證宏觀和計量經濟,常有所謂「複製練習」(replication exercise),意即在期刊中找文章,搜集數據(有時候是原作者提供的),重寫電腦程式,把文中的實證結果複製出來。這類練習很有益,一則可運用課堂上學到的理論,二則可嘗嘗做研究的滋味。但據筆者和筆者同學的經驗,若只有數據在手,另寫電腦程式,能成功複製文中結果的機會近乎零。 何解如此?計有四個可能: 一、原作者用的電腦軟件跟複製者的不同。從事實證研究的,都知道各種統計軟件對各類統計數字的定義大有分別。比如說,普通回歸分析的標準誤差(standard error),只要軟件對自由度(degree of freedom)的定義不同,計算結果可大有分別。 二、原作者用的雖是同一軟件,但型號不同。同一軟件,型號較新的,功能較多速度較快,但對各類統計數字的定義,隨時大改特改。 三、原作者用的數據,經過特別處理。若原作者在文中語焉不詳,對數據含糊交代,複製者用的數據,可能就跟原作者的差之千里。比如說,每月匯率(monthly exchange rate)的數據,便有月尾(end-of-the-month)和每日平均(daily-average)之分,亦有買入價(bid price)、賣出價(ask price)和兩者平均(bid-ask average)之分。儘管數據一樣,原作者亦可將數據作「特別處理」,如把週期性部分過濾(filter)掉等。若原作者交代不清,能成功複製結果的機會便低得很了。 四、原作者偽造結果,或在運算中犯錯。 何不要求原作者把數據和電腦程式公開?若各大期刊有此要求,實證結果是真是假,從此便一目了然。實情卻非如此。主要的經濟學期刊中,要求作者把數據和程式公開,或供讀者索取(available upon request)的,可謂少之又少。把數據和程式放到網上供讀者下載的,亦只有Journal of Applied Econometrics等幾份期刊。經濟學者的個人網頁,無論是明星級還是新晉教授,慷慨提供數據和程式的,據筆者估計,不夠一成。 去年筆者聽一位印度同學訴苦:在著名期刊Review of Economics and Statistics中找到名作一篇,作複製練習。同學寄電郵給兩位大有名氣的作者索取數據,數星期後都沒有回音。同學心有不甘,嘗試重新搜集數據,雖跟原作者的未必完全一樣,但大致齊全。把文中的unit root test重做一次後,同學發現結果跟文中的可謂南轅北轍,其結論全站不住腳。又有一南韓同學從著名期刊Journal of Finance找來名作一篇作練習,用的數據是原作者提供的,但複製結果大有分別,其中有些分別更是文章的主要論點。筆者也曾從Journal of Political Economy和American Economic Review就某題目各找到名作一篇,幾番複製,結果也和原文頗有出入。 也許以上只是個別例子,或是複製者道行未夠,犯錯而不自知。但筆者發現,未能複製結果的情況,在經濟學中乃是常態。Dewald、Thursby和Anderson於一九八六年American Economic Review中撰文,以另一期刊Journal of Money, Credit and Banking的文章作例,找出錯誤連篇。作者找來五十四篇已刊登、即將刊登或評審中的文章,從原作者手上拿到數據,再複製結果。五十四篇文章中,沒有問題的只有八篇。其餘文章的問題,計有數據定義不清、數據定義跟原文不符、數據處理沒有交代和數據不全等等。McCullough、McGeary和Harrison最近於一篇討論文章中再以同一期刊作例,發現一百五十多篇文章中,少於十五篇能被成功複製。總而言之,實證研究猶如黑箱作業,是真是假天曉得。 McCullough、McGeary和Harrison提到近期的一個例子,主角是大家熟悉的Steven Levitt。此君在一九九七年在American Economic Review的文章,談及警察數量與罪案的關係。另一經濟學家McCrary從Levitt手中拿到數據和程式,複製結果嚇人一跳。複製的普通回歸結果為0.00、-0.28和0.17,原文中的竟是-0.06、-0.31和0.11。此君更在程式中找到錯誤,一經改正,原文的結論立時無效。文中另一部份運用上某特別的instrumental variable,但Levitt在文中沒交代變數的來源。McCrary嘗試獨自建立這個變數,但結果跟Levitt的不同,於是問Levitt索取該變數的資料。Levitt的回應,是當初用的變數找不到了,今天找到的,跟原文用的和McCrary找到的都不同。更諷刺的,這個特別的變數,是Levitt文章中的創新貢獻。 從自私角度想,經濟學家不公開數據和程式,誘因有二。若結果是偽造得來的,經濟學家自然不會把罪證公諸同好。而無論是真是假,把數據和程式公開,隨時給其他經濟學家後來居上,把原作者的材料更改,做出更重要的結果。近十多年來的科技發展,導致局限改變,此問題只會惡化:在互聯網上找文章易如反掌,若把數據和程式公諸同好,必定招來同行競爭。若題材吸引,要把原作者的數據和程式稍加改進,只要懂用搜尋器,世界各地的同行隨時加入戰團。經濟學家守口如瓶,實在是人之常情。但筆者不禁問:為何類似事件在其他自然科學甚少發生? 故事教訓:管你是一流學報,或是明星教授,學子的正確態度,該是事事懷疑、小心求證,別給名氣嚇唬。 讀者如有興趣,可參考以下讀物: Richard G. Anderson, William H. Greene, B. D. McCullough and H. D. Vinod (2005): “The Role of Data and Program Code Archives in the Future of Economic Research” (Federal Reserve Bank of St. Louis Working Paper Series) William G. Dewald, Jerry G. Thursby and Richard G. Anderson (1986): “Replication in Empirical Economics: The Journal of Money, Credit and Banking Project” (American Economic Review, Vol. 76, No. 4, pp. 587-603) Deidre McCloskey (2000): “Cheating as a Scientist” (from How to be Human* Though an Economist, University of Michigan Press, pp. 52-57) B. D. McCullough, Kerry Anne McGeary and Teresa D. Harrison (2006): “Lessons from the JMCB Archive” (forthcoming in the Journal of Money, Credit and Banking) B. D. McCullough and H. D. Vinod (1999): “The Numerical Reliability of Econometric Software” (Journal of Economic Literature, Vol. 37, No. 2, pp. 633-665) |
:: 主 頁 |
|