Hogan常問問題集:

性格測評分數的穩定度

人的性格會變嗎?客戶經常問我們這個問題,也常常提出測評分數會改變的時間與理由的各種推論。其實要回應這個看似很容易回答的問題,還需要討論到三個相關的問題:

  • 測評的分數改變的頻率有多高?

  • 測評的分數出現變化時,變化幅度多高?

  • 為什麼測評的分數有時候會改變?

性格測評,也就是Hogan設計的這種測評,用意在於測量行為的模式。數十年的研究都證實,性格的測評可以預測未來的行為模式,包括在職場上的表現。性格測評之所以能夠有效預測未來行為,一大部分是因為性格是穩定的,也就是說,人不會改變太多。比方說,一份研究以小學教師對學童性格的測評預測他們四十年後的行為!最能測量性格穩定度的方式,就是測試-重測之間的關聯性:你進行一項測評,然後我們看看這項測評如何預估你在未來進行同一測評時的分數。霍根性格測評短期受測-重測(14-21天)的相關性指數介於 .69-.87之間,長期 (8年)的相關性指數則是介於.30-.73。針對3,217次(7年期)統合分析,產生的受測-重測相關性則介於.30-.70。重點是:性格測評的分數穩定度相當高。因此,大多數的時間,重測的分數也是很接近。

測評的分數出現變化時,變化幅度多高?

如果你很細心解讀,你會注意到「分數很接近」並不是「完全相同」,或是說上述的測試-重測相關性並不完美。老實說,即使是短期,測試的分數也會浮動。所有的測驗都是如此,包括認知能力還有醫學檢驗 (例如血壓、血糖指數)。在霍根的測評,重測後分數的差異通常不會超過2分。這表示浮動的幅度相當低,也不會改變整體解讀的結果。

為什麼測評的分數有時候會改變?

請思考以下的情境:你的醫生幫你測膽固醇。隔了一段期間,你的醫生又幫你測了一次,發現膽固醇指數有了變動。在這情況下,有兩種可能(也很明顯)的理由讓指數變動:(a) 測驗的過程有所調整,還有/或是 (b) 你的膽固醇指數真的變了。同樣的,心理測驗也是,分數的變動有可能是測評過程,也可能是受測者/心理層面的變化所致。

測評相關的變化

有時候測評和測量的過程,會導致重測時的分數出現變化。心理學測評的分數,可能因為三種方法上的原因而有所變化: (1)測量的不精確, (2) 型式上的改變,以及 (3) 常模的變化。

測量的不精確。醫生驗你的膽固醇時,醫生其實並不是在測量你血液系統裡的所有膽固醇,而是取出少量的血液樣本,並假設這份血液樣本代表的就是整體血液系統的狀態。一份樣本中的膽固醇數據,可能和另一份血液樣本的膽固醇數據不太相同。這些數據會有所不同,理由之一,可能是檢驗的工具和過程不完美。這些不完美的部分稱為測量誤差(measurement errors)。在性格測評中,大多數的受測者針對「我有時候也會違規」這個問題,會回答「是」或是「否」,但是有一小部分的人回答時,會因爲最近發生的事情寫下不同的答案 (有可能是最近看了一部關於監獄的電影、闖紅燈)這測評過程的不完美,會影響一個人測評的分數。好消息是,這些瑕疵會不規則地出現,也就是說,這些測評並不會偏頗,所有的測評都會出現瑕疵,包括醫學檢驗。在研發測評時,我們盡量將測量誤差降到最低。短期的受測-重測相關性指數顯示,我們測評的誤差相當低。

型式的變化。霍根的科學基礎為凱澤心理測評學(Kaizen Psychometrics),也就是說,我們會持續改善我們的測評。在這過程中,我們會定期更新測評的工具,搭配更新、更好的型式。因為希望改善而調整的型式,跟過去的型式不會完全相同。因此,較早期完成測評的受測者,在之後以不同的規格完成測評,就會產生不同的分數。

常模的變化。原始分數的詮釋可能不簡單 (滿分12分時,7分的意義是什麼?),所以我們幫客戶提供常模分數(百分比)。我們的常模是從上百萬份幾乎涵蓋全世界所有領域、工作的受測者當中分層抽樣而出。但是,基於凱澤心理測評學的核心理念,我們仍持續更新常模,在整理出更精確的樣本時進行更新。也因此,根據之前的常模所完成的測評,分數可能和根據更新後常模完成的測評而有所差異。

受測者相關的變化

除了方法相關的因素之外,也有些心理層面的因素,會讓測評的分數在一段時間之後有所改變,包括 (a) 成熟度、(b) 重大生命變故,以及 (c)回饋與指導。

成熟度。雖然性格相當穩定,一個人的性格也會在生命中有所變化。人們越來越年長後,會變得更有自信、容易相處、體貼,情緒也比較穩定。這種性格發展的模式,是多數人在長大成人過程中普遍經歷的變化。因此,性格的變化通常在青少年、二十歲出頭時比較強烈,但是性格也會隨年紀增長而越漸成熟。所以說,時間間隔較短的測評,以及較年長受測者的測評,分數出現變化的機率較低。

生命歷經重大變故。生命經歷重大事件或經驗,也會讓性格有所改變。舉例來說,性格在一些重要的生命轉折之後,似乎都會有所變化(像是失業、結婚、離婚)。同樣的,也有數據顯示,從軍的經驗也會讓性格改變。不過,即使有些事件帶來極大創傷(如喪親)或是極大的喜悅(像是贏樂透),在這些歷程過後沒多久,人們的性格還是會回到原來的狀態。重大的事件對性格產生的重大變化並不會持久,而是一些小變化反而比較持久。剛剛經歷重大生命變故而進行的測評,受測結果可能和正常狀態下完成測評的結果,有很大的差異。但是從我們的經驗中,這些結果在進行測評時,仍是正確的。比方說,一個剛剛經歷重大變故的人,受測時,對壓力的耐受度的分數可能比他們正常狀態時的分數低,這的確是真實、可以解讀的結果。換句話說,即使這樣的改變是暫時性的,並不能表示是「不正確」而捨棄此結果。

測評回饋與指導。最後,數據顯示,刻意的練習,還有/或是專業的回饋與指導下,性格是可以改變的。同樣的,在職場中進行有效的教練指導,也會影響個人和組織的效能。不過,這些狀況下,性格測評分數的差異通常很小。因此,教練指導可能有效,我們認為變化會出現在 360° 或是績效考核的回饋,而不是性格測評的分數。分數有變化時,我們沒辦法分辨這是因為個人的成長,還是因為受測者對於受測分數的覺察(例如:覺察到容易高傲的傾向,或是潛意識操弄測評答案)。這些變化通常會有兩個方向: (1)分數變得比較誇張 (2) 因為覺察而降低強度。

總結

一個人的性格整體上是相當穩定的。性格測評重測時,分數很少出現差異,差異也通常很小,通常是因為方法上的因素所導致,而不是有意義的心理層面所導致。因此,如果測評的結果跟原始的分數差異很大,最好要確認這些差異是不是跟進行的方法有關 (型式或是常模的改變)。而雖然機率較低,這些變化也有可能是因為個人因素(例如成熟度、生命事故、或是刻意行為)。無論如何,通常變化不大,意義也不大,也比較不容易解讀。