13051 IQ Test的歷史

諸位會員及友好:

  自從掌門天地開山來,向本會通訊投稿者幾希已。今日得本會新銳才俊湯君瑪士慨然投書,還是附有參考書目的「高級學術通訊」,實在教朝日喜出望外。

  湯瑪士君從社會學和歷史學的角度為各位闡釋「IQ Test」的源流,甚有後現代解構主義的味道。事實上到了今時今日,舉辦不同「品牌IQ Test」的各大機構,已經非常小心地做足「風險披露」,在測試前已預先告知受測者(的家長),「IQ Test」雖然能「很有效地」測試出若干方面的「智能」,但絕對不是一個全面能力的評估。

  很明顯,現在「IQ Test」的功能已由「科學工具」蛻變成「社會工具」。就此而論,朝日認為「IQ Test」作為一個「有相當局限性的測試」,要比一個「相對全面的能力評估」更能達到其社會功能。說得簡單一點,就是方便家長可以「輸打贏要」。現在的小童如此「矜貴」,家長都不介意花錢為他們作不同的「能力測試」,以便選出其中結果較好的,呈交到心儀的幼稚園或小學。「IQ Test」作為一個歷史悠久、聲譽昭著的老牌「能力測試」,就算收費貴一點也很合理吧!若果「IQ Test」是一個「絕對的能力指標」,拿不到好成績的受測者(的家長)不就沒有退路了嗎,這樣他們可會很失望啊!

  收了人家的錢,卻讓客人不高興──今時今日咁既服務態度點得架?──「其實這個測驗也有很多局限,分數高固然表示令公子/千金是天才,分數低則可能令公子/千金的天分在其他方面,我們XX中心還有很多不同的「能力測試」,讓我為你介紹一下吧……

野人通訊(不)負責人
朝日謹啟

***********************

IQ Test的歷史
決定天才或低能的合法劊子手

1. 引言

「智力測驗」(IQ Test)是一個用單一及等量單位去測量人們有多聰明的工具。任何的工具都是思想的產物,而思想則是時代精神和意識形態的彰顯。「智力測驗」作為工具也不例外,它對智力的定義和使用目的也含有時代的意識形態,其測量出所謂的「客觀數據」也是建基於主觀的預設。但這些背後的思想及預設是沒法從理論的內部了解,它們是歷史性的。因此,本文使用歷史學的縱深去了解「智力測驗」的產生, 用廣闊的視野,跳出理論框架去批評我們習以為常的「常識」。從而了解到智力測驗如何誤導了人們對智力的理解,及限制了人們的潛能。

2. 時代精神

最早的智力測驗開始於維多利亞時代,那是一個受工業革命和演化論影響的年代。歷史學家Edward J. Larson描述:「那時代的人包括達爾文在內,他們的觀念來自於一個受效用主義、個人定義、帝國主義與自由資本主義影響的世界觀…把個人競爭描繪為經濟進步的動力。」社會達爾文主義者史賓塞更提出「適者生存」(survival of the fittest)的說法,整個西方世界正在努力掙扎著擺脫農業社會的貧窮,鑑別何人為「適者」變成了那時代的當務之急。

3. 量度狂爵士Galton

最早嘗試去量度智力的人是Sir Francis Galton,他是達以文的堂弟。因此他也一直深信自己的家族遺傳了高智力的血統,在《物種始原》出版後十年,他寫了一本名《遺傳天才》(Hereditary Genius)的書。《物種始原》一直再版至今,但他的《遺傳天才》卻已默默無聞。他是一個量度狂,「只要可能,便用數字」是他常掛在口邊的説話。他創造了「心理計量學」(psychometrics)一詞及其學科。而且他也是優生學的始祖,他測量智力的目標就是要將人按智力分等級。(但其實在進行任何測量之前,他已經對人的等級有了劃分,央格魯撒克遜人名列最前,其他有色人種排其後,黑人排最後,測量只是再證明一次他的想法而已。情況就好像很多人買了股票才去找證據支持自己一樣,後果自然很危險)。

Galton為他有關人類未來繁殖的學說創造了一個新字「優生學」Eugenics(借希臘文字根Well和Born)。他認為「智力」是天生的,而社會上只有很少數人擁有這些高品質的遺傳,如他自己和表兄達爾文,因此他深信教育和慈善事業是一種浪費。他更推論那些殘病和貧窮的人也是智力低所至,他們的繁衍將會「沖淡」人類中優質的遺傳,以至危害整個人類物種。為了挽救這場「危機」,他建議英國政府鼓勵優良男女結婚生育,制約智力低於標準者生育。而不願放棄生育的人,應被視作「國家的敵人」。為了定立進行「公眾測驗的執行和原則」,他制作了「人體測量實驗室」去量度人們身體的各部分,還測量拳擊速度、呼吸力量、聽力和視覺等,因為他認為高智力的人感觀是比一般人敏銳。他也發明了相關性系數Correlation coefficient,以作為找出各種數據與智力的相互關係統計方法。可是諷刺地,他所發明的統計工具卻證明了他所採集的數據,彼此亳不相干,不能衡量人的智力。其後雖然他的得意門生James Cattell也做了很多心理測試,但最終也被他的研究生Clark Wissler證明心理測驗與學業上表現完全沒有關係。

4. 第一個智力測驗Binet-Simon Test

雖然英國人在智力測驗方面失敗了,但海峽的另一邊,法國人Alfred Binet卻造出了第一個智力測驗,但他的出發點與高爾敦等人徹然不同。最初,他對智力測驗的興趣是源於自己兩個女兒很不同的學習模式。他也曾採用過很多Galton及Cattell的人體感觀測驗模式。但他發現兒童比成人的感觀還要敏銳,這違反了成人智力高於兒童的想法,因此他放棄了Galton的學說。
與英國人不同,在平等、博愛、自由的法國大革命理想感召下,法國政府於1890年宣佈所有兒童均需要上學。為了照顧當中有特殊需要的智障兒童,法國政府組成了一個研究兒童智力的委員會,Binet成為了該會的主席。用了十五年時間研發,1905年他與研究員Theodore Simon共同製作了現代第一篇智力測驗試題,稱為Binet-Simon Test。研發中期,他們發現在兩組分別為「正常」和所謂「不正常」的孩子表現當中,似有重疊現象,有時候甚至是「不正常」的孩子表現還要好。因此他們轉移了焦點,他們要在測驗中發現孩子在什麼年齡能答覆什麼樣的問題。測試的問題包括有眼睛的專注力、分辨物件、命名身體部位、重複敘述別人話語及描述事物的差異性等。他們認為人有一個生理年齡(Chronicle Age)及一個心智年齡(Mental Age),正常情況低下兩者是配合的。一些命名各種程度智力問題的名詞也同時產生,如idiots、imbeciles、morons等字。但Binet認為這個量化(Quantitative)測驗相對於人類多樣性的智力有很大的限制,他反對用這測驗去代表一個人的智力,他認為還需要質性(Qualitative)研究去了解一個人的智力。

以下直接引用Alfred Binet對他所製作的智力測驗的想法:
“[The scale] does not permit the measure of the intelligence, because intellectual qualities are not superposable, and therefore cannot be measured as linear surfaces are measured.”

“Some recent thinkers have affirmed that an individual’s intelligence is a fixed quantity, a quantity that cannot be increased. We must protest and react against this brutal pessimism; we must try to demonstrate that it is founded on nothing.”

5. 一般智力理論g-factor

而有關智力理論,則由同時間的英國人Charles Spearman提出了他的「一般智力理論」(General Intelligence Theory)。他師從現代心理學之父馮特(Wilhelm Wundt),同時也受到Galton的啟發,採用了很多統計學的方法去研究智力。他發明了Factor Analysis作為研究不同能力相關性的工具,而這些統計學的方法也一直應用在心理計量學上至今。(筆者也曾為這科目讀到嘔泡)。在一間鄉村小學的樣本中,他發現學生在不同學科的表現當中有相關性。在測驗中需要較多思維的項目如古典文學等,更能預測學生運用思想的能力,因此古典文學成績影響法文、英文。由此推論,他相信人的心靈中有一種叫g-factor的東西主宰人的智力,而其下則有「特殊智力」(Specific intelligence)影響人的特定能力。雖然他發展的智力理論並沒有具體測量方法,但是他的理論一直影響著其後的智力測驗建構直至今天。,

Spearman也是一位信奉優生學的人,他說過:「我們可以…設想從這些最低(g-factor)指數所構成的了解中,篩取國會議員,決定誰可以有權孕育後代。」藉著他的理論,優生論者便可以聲稱透過量度g-factor這主宰智力的因子,而去實行優生計劃了。但事實上g-factor只是一個假說(hypothesis),並無物理上的證據可以觀察和證明它的存在。

6. 智力測驗在美國

雖然智力測驗在法國萌生了,但真正將它發揚光大的卻是大西洋彼岸的美國。將Binet-Simon Test帶回美國的,是心理學家Henry Herbert Goddard。他最初是一位寂寂無名的心理學家,在美國新澤西州彎藍(Vineland)一所弱智兒童的訓練所任教。他曾經嘗試自己發展一套智力測驗,可是由於學校的一切太簡陋而沒有成功。於是他遠渡法國尋求其他心理學家的意見,並讀到Binet的智力測驗,他高興地把它譯成英語並帶回美國在校內測試。經過一年的研究,他向美國醫生單位提出報告,也在American Association for Feeble-minded的會議中發表。最後,醫學組織承認了他的報告,心理學成功把心智測量的工作從醫生手上接來,他的測驗也成了學界的共通語言和測量標準。但Goddard也是一位優生學者,他在1912年出版了一本名為《卡里卡家庭:弱智遺傳研究》的書,宣揚「弱智威脅論」。他搜尋卡里卡家族六代人資料,發現家族產生了141名弱智患者,只有46人正常,其餘291也並非良民,因此他斷然認為弱智是會遺傳並成為社會的威脅。其後,他成功說服學校採用他的智力測驗去找出弱智的學童。1911年新澤西政府更立法要求學校開設特別班給與智力落後的學童。因此,智力測驗開始行全國,1914年104個都市中有80個採用了這種測驗。

7. 智力測驗的高峯

1916年史丹福大學心理學家Lewis Terman跟據Binet的測驗改良,出版了Standford-Binet Intelligence Scale。它最大的不同之處就是在於引用了德國心理學家William Stern的「智商」概念,將心智年齡除以生理年齡再乘以一百就是他的「智力商數」(Intelligence Quotient)。「IQ」一詞作為一個更容易被人理解的方式,開始被全面推廣起來。這個做法為智力測驗帶來空前的市場成功,而且IQ一詞更是一個很受市場青睞的名稱。不竟人們是喜歡接受簡單容易的東西,即使它是以徧概全。Standford-Binet Intelligence Scale一直不斷被改良,至今已經是第五版了。它的應用度十分廣泛,第一次世界期間,它已經被用來進行軍方選取軍人用的測驗。當時的新兵面試是一對一,效率很低,集體智力測驗的好處就在於可以一次過大量篩選。

智力測驗也被應用到教育方面,Terman更揚言:「一個孩子的『可教度』(the limits of a child’s educability)可以從他入學第一年的智力測驗中見到端倪。」有很多學校把智力測驗作為篩選分班的標準。

有了測量智力的「客觀標準」,優生學者更以為可以知道人們的遺傳智力,於是智力測驗把執行優生學的執行推至高峰。1924年一件名為Buck v. Bell的案件,令美國有多個州運用此案例而通過了優生絕育法,有紀錄的就已經有六萬多人因為被界定為弱智而被進行強制絕育手術。這段歷史也成為了天真的美國人想去迴避的污點。

8. 智力測驗再改良

雖然Terman所造的智力測驗在市場上很成功,但還是有行家認為它有很多技術上的問題。1939年,David Wechsler跟據Standford-Binet Intelligence Test在統計方法上作了改良,他不再用心智年齡的概念。而是先設定100分為平均值,然後在每一點平均值以上或以下的標準差(standard deviation)加減15分。標準差位於平均值兩點以為之資優,以下為智障。他開發的智力測驗中文版稱為韋氏智力測驗,英文是WAIS(Wechsler Adult Intelligence Scale),兒童版足WISC(Wechsler Intelligence Scale for Children)。現在最新是第四版,香港心理學會也是採用這個測驗的。

韋氏智力測驗另一個不同的地方是,他把智商分作兩種類型:語言智商(Verbal IQ)及操作智商(Performance IQ)。他對智商持一個比較開放的態度,他認為智商只代表一些思維能力,而並非優生學者所認為的「唯一重要或至高無上的因素」。他主張還有其他non-intellective的因素影響一個人的能力,他也嘗試測量這些其他因素,只是沒有成功而已。現時WAIS IV已經更精細,它分為10個副測驗(subtest),分別歸類為4個指數:Verbal Comprehension Index (VCI)、Perceptual Reasoning Index (PRI)、Working Memory Index (WMI)、Processing Speed Index (PSI);4個指數又整合為一個Full scale IQ;此外還有另外5個副測驗,專門用以識別一些學習障礙的問題。

9. 對智力測驗的批評

A) 智力的定義問題

智力測驗也一直受到很多批評,其中一個重要批評是心理學家們沒有一個很清晰和共通的智力概念。面對這些批評,Terman卻反駁道:「咬定在測量智力之前必須交代什麼是智力,完全沒有必要。…我們能測量電流,遠早於我們了解什麼是電流。」他雖然沒有說錯,但他們基於智力理論的「假說」上所執行及推廣的社會政策早已危害到基本人權,如生育權、教育權和社會福利等。而且他們已經把智力測驗置於一個「至高無上」的地位,把它作為分辨善惡的標準。他們早已忘記智力測驗只是建基在一個主觀性的假說上而已,它的應用已超過科學的範疇。美國心理學會主席Robert J. Sternberg在《智力簡史》一書中用了「瞎子摸象」的譬喻指出:「人們探索智力的本質,但不能看到智力的具體,所以他們只好運用隱喻去幫助自己去把智力行為概念化。」因此心理學家所謂的「測量」與很多一般的測量是有很大區別的,而人們卻誤以為前者與後者的客觀性是一致的,這是極大的危險。

B) 學習因素

另外一個批評是,智力測驗是不能夠準確地找出它所聲稱能測量到的天生遺傳的智力。在一件美國《Atkins v. Virginia》的案件中,辯方律師以被告有智力障礙為由,而提出引用法案中保護智力低於70者可以免去死刑的權利。當時心理學家用了韋氏三版來測驗被告的智力,測驗結果為59分,本來被告可免死刑。但案件不停地多次上訴,其間也再做智力測驗,第二次是64分,最後一次為76分,高於智力障礙的標準。對於這17分的增長有很多不同的解釋,有人認為是因多年審訊令被告獲得「學習」並提升了語言及理解能力,也有人認為是因重複測驗令被告熟識了題目。不論什麼原因,這事件也反映出,若天生遺傳的智力是不變的話,智力測驗並無法排除學習因素,而找出所謂「天生的智力」。

C) “Flynn Effect”-為何孫兒分數比爺高

最致命一擊的批評是所謂的〝Flynn Effect〞,它是由紐西蘭政治科學家James Flynn提出。他作了一個不同世代的智力分數研究, 採用了Raven’s Progressive Matrics。這測驗當中的六十條問題是不用文字作答的,因此它被相信為能夠測量最純粹的智力g-factor。 但是研究發現,人們的智商每年都在上升,其中一個例子是三十年來荷蘭士兵的智商平均上升了二十點。此外,Stanford-Binet Intelligence Scale在全球表現中也有每一世代上升九至十八分的現象。由於遺傳差異不可能全球地、一致地、短期地出現如此大的變化,我們可以相信智力測驗的分數並不能代人們天生遺傳的智力。

Flynn指出:「 心理學家們不應再說IQ測量人的智力。他們應改口說,IQ測量的是『抽象解決問題的能力』(abstract problem-solving ability)。這個術語指出的正好是我們的無知:在IQ測驗中我們要人解決問題;但我們知道這些都是與生活脫節的問題,或者過分抽象以致不再屬於現實的世界,因此解決這種問題的能力也常常脫離了真正解決問題的能力,我們通常稱之為『智慧』(intelligence)的。除此之外,我們所知不多。」

10. 總結:客觀與數字

生物學家古爾德(Stephen Jay Gould)一直反對使用這些智力測驗作為標準,面對當時一本鼓吹優生學的書The Bell Curve,他寫了一本名為The Mismeasure of Man的著作作為最有力的反駁。他認為科學家很多時候會使用數字以表客觀,但對數字所作的詮釋卻是主觀的。人們很容易誤以為使用數字就必然代表客觀事實,有些科學家往往忘記了理論所夾雜的主觀假設可能是徧見,智力測驗的失敗正好說明了這點。原文精闢,以下直接引用他的原文作為對智力測驗的歷史總結:

“Science is rooted in creative interpretation. Numbers suggest, constrain, and refute; they do not, by themselves, specify the content of scientific theories. Theories are built upon the interpretation of numbers, and interpreters are often trapped by their own rhetoric. They believe in their own objectivity, and fail to discern the prejudice that leads them to one interpretation among many consistent with their numbers.”

參考書目:

智力測驗的歷史 – 史蒂芬•穆達克
IQ A smart history of a failed idea – Stephen Murdoch

了不起的演化論 – 愛德華•拉森
Evolution: The remarkable history of a scientific theory – Edward J.Larson

Intelligence a brief history – Anna T.Cianciolo and Robert J.Sternberg

The Mismeasure of Man – Stephen Jay Gould