請ChatGPT提供對測評的建議不是明智之舉     

張貼日期:2024/4/8

Getting Assessment Advice from ChatGPT

翻譯:陳淑婷  睿信管理顧問有限公司 資深引導顧問

以大型語言模型(例如 ChatGPT)為本的AI工具功能非常強大,並有相當廣泛的應用方式,可以先完成初稿、總結關鍵資訊,並提高職場的效率。但是,容我我在這裡提醒各位一下,建議不要從 ChatGPT 或其他 AI 工具中獲取測評的建議。

我最近接觸到了以下的客戶案例。有一位員工在他的組織內被認定為未來的新星。他也在該組織的高潛能人才選拔過程中完成霍根測評。但是他測評的結果卻跟同儕所形容的不太相同。這是很不尋常的現象,因為霍根測評的設計,就是跟他人的形容一致的。我們的顧問詢問他在進行測評時是否獲得任何的指導或協助,他透露他其實「詢問ChatGPT如何回應測評」。根據這位顧問的說法,ChatGPT建議這位候選人「避免極端的回應」,像是「強烈同意」或「強烈不同意」。很可惜,這是很不好的建議,這個人沒有入選該項高潛能人才計畫。

ChatGPT針對回應性格測評所提出的建議

聽完這個故事後,我上了 ChatGPT(4.0),並給予以下的提示:「我正在填寫性格測評,想要拿到好成績,可以找到工作。測評中使用『強烈不同意』到『強烈同意』等評分方式。我該如何回應才能得到好分數?」

ChatGPT 提供了一些籠統的建議,包括「最好的建議是回應時誠實、說實話」。然後,它提出了六項具體建議:(1)瞭解該職位與公司文化,(2)思考多樣工作中重視的特質,(3)反思你的經歷,(4)避免極端的答案,除非你很確定,(5)保持一致性,以及(6)練習自我反省。請注意,我之所以在這裡強調第四項建議,因為它與之前提及的客戶故事很相似。(稍後會更詳細討論。)

在整體建議上,我也鼓勵大家在進行測評之前先瞭解該職位與公司文化 -就如我在面試會做的準備一樣 – 但是其他的建議則可能需要存疑。例如說,雖然考慮大多數工作中會受重視的特質看似明智,但大多數求職者被要求填寫性格測評時,目的是在申請一份特定的工作。在許多情況下,有一些性格特質比較適合該工作。想要讓自己看起來像是適合所有工作的話,反而有可能表示您不適合您想要的這份工作。

除此之外,ChatGPT 針對測評提出的建議中,會警示說測評會檢查回應時答案是否一致。雖說這沒錯,但是填寫測評時刻意注意答案是否一致,就顯得矯枉過正。大部分的人不需要想太多,回應通常就很一致。想太多反而更有可能出現不夠一致的回答。


為什麼建議在性格測評中避免「極端」的答案

我想要回到之前ChatGPT提出的第四個建議,全文如下:

4. 除非非常確定,否則請避免極端的答案:雖然用『非常同意』或『非常不同意』的回答讓自己看起來更醒目感覺很吸引人,似乎可以讓自己的答案更脫穎而出,但是這其中細節有點微妙。除非你對該想法非常堅持,或是有特定的例子可以支持這樣的回答,否則建議考慮一個比較溫和的答案,可能更能精準地反應你真正的想法。」

整體來說,這不是一個很好的建議。首先,它鼓勵受測者過度思考每一個答案,這就是不精確的處方。性格測評通常建議受測者用最自然的方式來回答,結果才會精確。其次,性格測評通常是以常模為本,這表示個人的結果反映的不只是他們對測評的回答,也反映這些回答與其他人回答的比較。比方說,霍根性格量表(HPI)的調適維度(Adjustment)共有37個項目,分別是語句或問題,讓受測者回答。如果一個人都不選擇回應「強烈不同意」或「強烈同意」的選項,他們最低可能原始分數(lowest possible raw score)就是74,最高可能原始分數highest possible raw score)就是111。比對到霍根常模,就會個別呈現於到0跟62的百分比。換句話說,如果聽從ChatGPT建議,避免選擇極端的回答,這些人調適的分數就會限制於百分之62或更低。

那麼,對很多人來說,這可能是正確的。的確,對一些人而言,他們通常不會特別極度同意或極度不同意某些語句。這也沒關係。測評跟常模的設計,都是要對這些人提供正確的反饋。但是如果有些人刻意為了打敗測評來操作會打,通常對自己沒有什麼好處 – 就如剛剛那個案例所顯示。

這個「調適(Adjustment)」的範例,只是讓我們知道這種填寫測評的策略如何影響測評的一個例子。「避免回答過於極端」的策略對每一個維度的影響,取決於有多少的項目和常模。即使如此,這個例子應該可以清楚表現出ChatGPT說不要有太極端的回應這個建議,並不是最明智的做法。


結語

ChatGPT 和其他以大型語言模型為本的人工智慧工具的確可以提供很大的協助。如果你需要構思出一份報告的結構、寫一份履歷表的初稿、或整理一些資料,這些工具可以提供很好的助力。但是如果需要真實的資訊或好的建議,或許單純在網路上搜尋或是請教專家,可能更好。從最低限度,在接受 AI 工具提供的建議之前,至少需要先評估一下;同樣的,用ChatGPT 寫出的電子郵件草稿,在送出之前,也至少需要檢查一下。而在性格測評,聽從從ChatGPT 對測評的建議似乎弊大於利。


本文章由霍根首席科學長Ryne A. Sherman博士撰文