性格測評如何運作?

張貼日期:2021/9/15

How Do Personality Tests Work?

原文出處:https://www.hoganassessments.com/blog/how-do-personality-tests-work/

翻譯:陳淑婷 睿信管理顧問有限公司 資深引導顧問

性格是一個人的個性,或是本質的線路,會驅動我們的思想、感覺與行為,也都是非常容易預測的。就好比駕駛踩油門之前,先用地圖來看自己要走的路,僱主在決定選才之前,也應該透過性格測評來預測求職者工作績效的可能軌道。但是性格測評是如何運作的?

決定選心理測評工具之前,僱主應先看看其內容,確保自己對於性格測評運作的方式有一點基本的了解。測評產業未受規範,坊間充斥著標榜不實的測評。掌握詳細資訊,讓您可以避開地雷測評。本文將說明僱主想要理解性格測評不同面向時,需要考慮的要點。

性格測評類型

首先,想要理解性格測評如何運作的僱主,必須知道主觀與客觀性格測評的不同之處。

主觀的性格測評適用於臨床與法庭中,需要受測者提出主觀的回應,再由心理學家進行分析。羅夏墨跡測驗(Rorschach Inkblot)測評就是一個知名的範例。

客觀的性格測評有更廣泛的應用,也特別適合用於職場。這類型的測評需要由參與者完成標準化的測評,針對自己回答不同的選擇題。他們的回應再用來與客觀的分類系統進行比對。

概念架構

想知道「性格測評如何運作」時,僱主必須知道的第二個要點就是,這項測評的概念架構是什麼?簡單的說,就是這項測評所運用的理論。穩健的概念架構讓心理學家可以發展出可行的工具。就好比科學家,如果想要發展可以調節氣候變遷的工具,就必須對大氣層有所理解,才能在這個框架裡進行研發。如果第一個步驟不夠踏實,後續就可能走偏崩潰。

大部分的性格測評都沿用以下三種概念架構之一。第一個,也可能是最普遍的,就是心理動力學理論。源自臨床心理學的這個架構,試圖說明精神病理學的根源,假設每一個人在某種程度都是神經質的,並努力尋找參與者神經質的根源。由於精神官能症的人是平均分佈於所有的人口,而非普及,這個概念現在已經不太適用。

另一個概念架構就是特質理論,是目前性格科學中最廣泛運用的架構。這個架構將性格分成重複發生的行為傾向,並根據五大性格特質模式來測量這些特質。參與者聆聽或閱讀一個問題,將這個問題和自己的相法做比較,然後根據這個比較來作答。雖然五大性格特質模式非常有用,一些較新、較簡易的變數已經顯示可以更精確地預測結果。另一個問題就是,這個模式預設自我作答是一個可靠的評估方式,能夠評估受測者真正的感覺、想法或行為。這個假設是有疑點的,因為自我作答很可能有偏差,偏向受測者的利益,特別是當他們了解這些作答會影響選才的決策,更容易有誤差。除此之外,這種做法也預設一個人所採取的行動,無論是那一種人都會一樣。

最後要討論的概念架構是社會分析理論,這就是Hogan 測評系統的框架基石。 這個理論提出,所有的人都在團體中工作與生活,而這些團體是以身份地位的階級為架構,也因此生活中有三個主要的動機:與其他人相處、擁有地位、找到意義。人們在職場中解決這些問題,性格中的差異驅動他們在職場的成功或失敗。這個理論架構是以務實為本,檢視受測者數據的角度,並非當作自我作答,而是自我的表現。這個架構並非試圖找出為什麼受測者要說或做這些,而是簡單聚焦在這些回應如何預測他們的行為與表現。

計分方式

思考「性格測評如何運作」時,僱主要注意的第三個要點就是性格測評計分的方式。每一個性格測評因為概念結構不同,過程都會有些差異,我們將焦點放在Hogan的計分方式。根據社會分析學的理論,我們將受測者的身份(identity)與評價(reputation) 區隔出來。身份是受測者對自己的看法,無法透過科學的方式來測量,評價則是其他人對此人的看法,這是可以測量的。因此,我們從觀察者觀點的數據來評估此人的評價。

如此的計分方式,表示當我們幫「我每年看一百本書」這個問題計分時,我們注意的並不是受測者是不是閱讀的人,而是受測者在觀察者的眼中,是不是表現出是一個閱讀的人。受測者如何回應這個問題,就會轉換成評價的數據,評估觀察者對受測者的看法,而這些會影響一個人的職涯。我們之所以可以預測受測者的評價數據,是因為我們的資料庫中,已經收集了上百萬份受測者在當地、全球的相關數據,他們針對這個問題都有類似的回應。這就是常模,顯示出受測者跟當地與全球人口相較之下的狀況。

簡單來說,我們的評分系統聚焦於評估一個人的評價,探詢他們對自己的想法,再從團體與觀察者的形容來找出數據上的關係。整理出評價上的形容之後,這些分數預測出傾向,提供在職場上可能出現的評價。需要注意的是這些傾向代表的是可能性,不是絕對,所以我們需要審視接下來的這一個重點。

效度與信度

第四項,或許也是最重要的一環,就是在僱主探詢「性格測評如何運作」時需要瞭解的問題,就是知道測評工具如何驗證是否能夠正確、一致性的評估出他們宣稱評估的結果。性格測評可以標榜各種訴求,但是只有可以提供已發表信效度數據的測評,才能證實其效果。信效度非常重要,才能用來預測績效,也讓組織可以做出適切的選才決策。信效度經過完整確認的性格測評,不會因年齡、性別、種族、性傾向、宗教、民族上有所歧視,反而是信效度未經完整確認的測評才有潛在的負面效應,所以僱主在選擇性格測評時,必須檢視其信度與效度。

效度則有不同的形態來展現,但是對於性格測評來說,最具結果性的,就是預測性的效度,確保這項測評所測試的,是它原本設計要測試的。預測性的效度通常是以介於-1和1之間的係數來測量,稱之為 皮爾森積動差相關係數(Pearson correlation coefficient)。係數越接近1,測評的預測效果就越高。 Hogan在預測職場績效的效度係數是 .54。這表示Hogan的測評在預測受測者未來的工作績效上,可以預測29% 的方差(variance)。相較之下,止痛藥ibuprofen在治療頭痛的效度係數只有 .14。這表示,使用ibuprofen跟安慰劑之間,舒緩疼痛徵兆的差異只有 2%。

要判斷性格測評的預測性效度有很多方式。在Hogan,我們用多面向的作法,將我們的測評與外部工作績效與同仁評分的數據做比對。比對的結果清楚顯示我們的工具能夠正確地預測受測者的績效成果。雖然這是個費用較高、耗時的方式,我們仍然持續將我們的性格測評與外部工作績效做比較。相對的, Myers-Briggs Type Inventory (MBTI) 與 Enneagram 這些測評,在預測職場績效上,效度偏低、或是未知。

信度也同樣重要,因為可以證明測評的結果不是騙人的,也可以在每一次都測量到同樣的結果。信度可以透過內在一致性以及再測信度係數來評估。有信度的性格測評用多重的問題來探尋同樣的問題,或是在結構上確認此問題能夠正確評估。這些問題如果分數都接近,就表示這項測評具有內在的一致性,評估的就是一項稱為Cronbach’s alpha係數。重複測驗信度則是用皮爾森積動差相關係數(Pearson correlation coefficient)來比較兩個不同的測驗期間,測試者的分數。性格是穩定、不變的,所以接近1的分數有較高的重複測驗信度。

除了要留意測評針對信度與效度所發表的佐證之外,僱主也必須確認該性格測評是由無偏見的第三方所評估,像是心理學委員會或協會。出現在經過同儕評閱的學術期刊上,也是該測評品質的驗證方式。因為同儕評閱小組是由客觀的專業人士所組成,用以確保科學性的準確度。

全球的運用

有的組織因結構的問題,在考慮性格測評的運作時,必須思考在全球應用的可行性。性格測評的目標,就是橫跨各種地理位置,都能客觀作出評估。這表示,性格測評必須由流利的譯者小心翻譯,且必須對於語言與當地文化和規範持敏感度。研究發現我們相似的地方,比不同的地方多,所以謹慎地翻譯、信效度高、可以與當地常模作比對的測評,預測的能力就相當高。

結構完整的性格測評確實有效

那麼性格測評究竟如何運作?客觀的心理評估工具是以扎實的理論基礎、完整的計分系統、經驗證的信效度,以及橫跨各地理地區均能一視同仁評估人類行為的能力為基底。依據這些條件,雇主就能夠找到架構完整的性格測評,改善組織的選才機制與發展流程。

參考文獻:

  1. Walker, H. K., Hall, W. D., & Hurst, J. W. (Eds.). (1990). Clinical Methods: The History, Physical, and Laboratory Examinations (3rd ed.). Butterworths.

  2. Hogan, R., & Sherman, R. A. (2020, January 1). Personality Theory and the Nature of Human Nature. Personality and Individual Differences, 152(1), 1-5.

  3. Hogan, R. (2006). Personality and the Fate of Organizations. Erlbaum.

  4. Hogan Assessments. (2021). How to Select an Assessment.

  5. Howell, A. (2017, May 30). A Quick and Dirty Guide to Validity & Reliability.