沒有測評工具的世界：就像對候選人擲骰子

Welcome to Infelligent

沒有測評工具的世界：就像對候選人擲骰子

A World Without Assessments: Rolling the Dice on Candidates

作者： Chase Winterberg, JD, PhD, director of the Hogan Research Institute, and Brandon Ferrell, PhD.

美國最近的社會和政治趨勢對測評工具不利。例如，要求標準化考試成績入學的大學數量持續下降。另一個例子是，測評工具可能會成為兩黨重新審查職業證照中的附帶損害。越來越多的跡象也試圖誹謗在工作場所使用測評工具，導致迄今為止禁止在工作場所進行性格測試的嘗試未獲成功。

儘管存在這種誤導性的審查，但現在利用測評工具為組織決策提供資訊比以往任何時候都更加重要。在今年的工業與組織心理學會（SIOP）年會上許多測評工具專家進行了有意義的討論，我們想與您分享這些見解。

是什麼引起了這些審查？

儘管這種懷疑並不新鮮，3但隨著大眾對在工作場所使用人工智慧的認知提高，這些懷疑似乎有所增加。儘管如此，仍有幾個因素在發揮作用。

不切實際的期望

人們有時認為基於測評工具的結果應該是完美且沒有錯誤的。不幸的是，這是一個不切實際的期望。事實上，所有測評工具都是基於統計數據和機率，具有固有的不確定性。同樣，測評工具衡量人類的傾向和現象，這是無法直接看到的。這並不像拿著尺測量物體的長度那麼簡單。要了解人，必須根據我們所看到的事物來推論。

換句話說，測評工具並不能完美解決世界上所有的問題。然而，它們有助於在工作場所做出更客觀、更準確的決策。因此，當測評工具沒有達到這些毫無根據的完美期望時，使用者很容易感到失望，並對所有測評工具用途和應用失去信心。如果大眾將這種邏輯應用到他們的醫療決策中，那麼沒有人會服用任何藥物，因為藥物並非始終對每個人都有效。事實上，許多常見的藥物甚至不如正確應用心理評估有效。

濫用測評工具

說到統計，設計和驗證測評工具需要複雜的分析和計算。當測評工具用於了解更複雜的人時，正確理解測評結果需要熟悉心理學和相關的行為科學。害怕我們不理解的東西是人類的天性，許多人不理解測評工具或測評工具如何使用。在霍根，我們不害怕測評工具。相反地，由於我們對於人員解決方案的社會責任感促使我們熱愛測評工具。我們在設計、評估、維護和實施高品質測評工具方面擁有數十年的專業知識。然而不幸的是，許多市場上其他宣稱是性格測評的工具缺乏霍根測評的科學基礎和社會責任保障。

缺乏理解可能會導致組織中測評工具應用不當。例如，許多人熟悉邁爾斯-布里格斯類型指標（MBTI），企業組織經常使用這種測評工具進行員工招募。然而，MBTI 並不是為員工招募而設計的。

工作場所測評工具的另一個不當使用源自於人工智慧和大型語言模型的最新進展。也就是說，一些測評工具提供者已經使用這些新技術來減少解釋測評結果和提供回饋時需要提供的人際互動。問題在於，這違反了心理學家的道德準則，該準則要求只有合格的人才能使用心理測評技術。

當性格或其他心理測評工具被錯誤解讀時，受測者可能會感到壓力和被誤導。當測評工具使用不當出現問題時，很容易根據這些孤立的「壞蘋果」將所有測評工具視為錯誤的。

有什麼影響？

某些形式的測評工具，無論是性格測評或結構化面試，都是在就業環境中做出更準確決策、減少偏見的主要方式。對測評工具和相關決策工具的審查促使人們傾向於更有缺陷和偏見的決策策略，例如人類的判斷和直覺。由於組織必須專注於其品牌形象和公眾聲譽以支持客戶關係和有效的招募工作，因此他們可能會在某些時候和某種程度上追隨公眾輿論（無論訊息有多麼錯誤）。結果，人才專業人士不得不在沒有測評工具幫助的情況下做出決定。

如果沒有測評工具，世界會是什麼樣子？

基於測評工具的決策唯一其他替代方案是純粹的人類判斷或隨機方法。儘管很容易看出人類判斷的表面好處，但人類判斷存在嚴重缺陷。事實上，人類的判斷在很多方面都是有問題的，任何人就可以這個主題寫一整本書，許多學者已經這樣做了（例如，Kahneman，2011）。人類的決策是由期望、偏見、經驗和啟發法決定的，這些因素扭曲了準確性和公平性，甚至在決策者不知情的情況下。這正是專家開始尋找更好的方法來做出有影響力的決策的原因：工作場所測評工具。

在大多數測評工具中，決策者只會看到相關訊息，例如性格分數。換句話說，他們看到的只是一個數字，告訴他們這個人可能會如何行為。決策者看不到該人的種族、性別、年齡、殘疾、民族或任何其他可能引發有問題的偏見的不相關特徵。相反地，當決策者僅使用人類判斷時，我們無法確切地確定他們在做出決策時評估了哪些因素。與人類判斷不同，基於測評工具的決策可以不斷改進工具、保護個人權利以及評估決策實踐。

除了人類判斷之外，基於測評工具的決策的另一種選擇是純粹的隨機選擇，類似於擲骰子。雖然這確保了每個人都有平等的被選擇的機會，但它給雇主帶來了不合理的負擔，無論他們的工作能力如何，都需要雇用人選。你願意和許多無能的同事一起工作嗎？

我們如何提高測評工具的聲譽？

由於組織最終必須滿足大眾的需求，因此採取措施提高測評工具在工作場所使用的聲譽至關重要。

例如，測評工具專家可以以一般受眾易於理解和相關的方式進行研究並提供有關測評工具應用的教育。關於正確評估使用以及與替代方案（例如人類判斷）進行比較的準確並且運用引人入勝的故事似乎是與非專業觀眾建立聯繫的有效策略。專家也可以與測評工具批評者合作，幫助修復社會科學家與一般大眾之間溝通的障礙。

人們還可以了解正確和不正確使用測評工具之間的差異，並提高對自己偏見的自我意識，所有這些都有助於形成更現實的期望，並幫助他們保護自己。

如果沒有測評工具來支持工作場所決策，員工和組織將在沒有科學和基於證據的洞察力的情況下，在人類偏見和錯誤的危險世界中航行。

參考資料：

Nietzel, M. T. (2023, June 13). The Test-Optional College Admissions Movement Continues to Grow. Forbes.
Cottle, M. (2017, August 13). The Onerous, Arbitrary, Unaccountable World of Occupational Licensing. The Atlantic.
Highhouse, S. (2008). Stubborn Reliance on Intuition and Subjectivity in Employee Selection. Industrial and Organizational Psychology, 1, 333–342.
Kahneman, D. (2011). Thinking Fast and Slow. Farrar, Straus and Giroux.

Hogan 專欄

More infelligent insight

Page updated

Report abuse