ChatGPT是OpenAI開發的一種語言模型,在過去一年中變得非常流行,因為(wei) 它能夠在各種情況下生成類似人類的響應。ChatGPT已經變得如此強大,以至於(yu) 學生們(men) 現在正在使用它來幫助他們(men) 完成家庭作業(ye) ,這促使美國的幾個(ge) 學區阻止設備在其網絡上訪問該模型。
那麽(me) ,ChatGPT有多聰明呢?
在2023年3月27日發布的一份技術報告中,OpenAI全麵介紹了其最新模型GPT-4。此報告中包含一組考試結果,如下圖所示:
圖片來源於(yu) 網絡
為(wei) 了對ChatGPT的功能進行基準測試,OpenAI模擬了各種專(zhuan) 業(ye) 和學術考試的測試運行。其中了包括SAT、GRE、各種大學先修課程 (AP) 期末考試等。績效以百分位數衡量,百分位數基於(yu) 每種考試類型的應試者的最新分數分布。
百分位評分是一種相對於(yu) 其他人的表現,對一個(ge) 人的表現進行排名的方法。例如,如果在你測試中排名第60個(ge) 百分位,則意味著你的得分高於(yu) 60%的應試者。
我們(men) 來重點看看學生們(men) 比較關(guan) 心的考試:
ChatGPT與(yu) SAT考試
GPT-4在SAT閱讀和寫(xie) 作部分以710分(滿分 800 分)的成績名列前茅,這使其在考生中排名第93個(ge) 百分位。另一方麵,GPT-3.5在800分中獲得670分,排名第87個(ge) 百分位。
在數學部分,GPT-4獲得了800分中的700分,在考生中排名第89個(ge) 百分位。同時OpenAI指出,雖然GPT-3.5得分在第70個(ge) 百分位。總的來說,GPT-4 在1600分中獲得了1410分。根據大學理事會(hui) 的一份報告,2021年SAT的平均分數為(wei) 1060。
ChatGPT與(yu) GRE考試
根據OpenAI的報告, 雖然GPT-4在語文的得分為(wei) 第99個(ge) 百分位,在數學的得分為(wei) 第80個(ge) 百分位,但GPT-4在寫(xie) 作測試中的得分僅(jin) 為(wei) 第54個(ge) 百分位。GPT-3.5在寫(xie) 作測試中同樣取得了第54個(ge) 百分位的分數,並且在數學和語文上分別獲得了第25個(ge) 百分位和第63個(ge) 百分位的分數。
ChatGPT與(yu) AP考試
根據大學理事會(hui) 的標準 ,分數範圍從(cong) 1到5,3分及以上通常被視為(wei) 及格。根據OpenAI的報告,GPT-4在AP藝術史、AP生物學、AP環境科學、AP宏觀經濟學、AP微觀經濟學、AP心理學、AP統計學、AP美國政府和AP美國曆史方麵獲得5分。在大多數這些考試中,GPT-4(2023年3月發布)比 GPT-3.5(2022年3月發布)的能力強得多。
然而,它仍然無法提高AP英語和競爭(zheng) 性編程。 關(guan) 於(yu) AP英語(以及其他需要書(shu) 麵回答的考試),ChatGPT的回答由1-2 名具有相關(guan) 工作經驗的第三方對這些論文進行評分。
事實證明,雖然ChatGPT確實能夠寫(xie) 出足夠的論文,但它可能難以理解考試的提示。
ChatGPT如此聰明,文書(shu) 寫(xie) 作上的表現如何呢?
福布斯雜誌 (Forbes) 在去年底就讓ChatGPT幫助其寫(xie) 了2篇美國大學本科申請文書(shu) 。ChatGPT在10分鍾之內(nei) 就完成了寫(xie) 作,並且文書(shu) 在語言表達和邏輯上都較為(wei) 正確。隨後,福布斯拿著完成的2篇文書(shu) 采訪了幾位在不同大學負責招生的專(zhuan) 業(ye) 人士,他們(men) 普遍的觀點是:文書(shu) 的內(nei) 容很好,甚至可以說很完美。但是,缺乏個(ge) 性,沒有感情,可能無法讓申請人脫穎而出。
對於(yu) GPT-4.0來說,如果你期望的是你描述一下申請學校的要求,然後就能為(wei) 你生成一份盡善盡美的文書(shu) 的話,這恐怕有點困難。就算不考慮重複和抄襲的因素,就能力本身而言,它目前也還做不到。就像ChatGPT自己說的,它是一個(ge) 語言模型,它的生成邏輯基本上還是遵循材料組合這種方式,隻不過它能試圖去處理並組合的材料量非常大。
並且AI會(hui) 根據大數據來調整你的文書(shu) ,結果一定是最符合大眾(zhong) 標準的,換句話說,就是最傳(chuan) 統且沒有特色的!就像上麵說的,文書(shu) 的內(nei) 容很好,但可能無法讓申請人脫穎而出。
如何利用ChatGPT輔助寫(xie) 文書(shu) ?
頭腦風暴主題思想:使用ChatGPT來幫助激發你的文章的主題想法。通過嚐試各種提示或者命令來廣泛撒網,看看它會(hui) 給你帶來什麽(me) 。大多數情況下,它不會(hui) 為(wei) 你提出一個(ge) 驚人的想法,但它可以幫助你激發記憶,幫助你建立通向其他想法的聯係。
生成大綱:你可以拿一份文章的草稿,讓它生成一個(ge) 大綱,看看它是如何組織你寫(xie) 的東(dong) 西的,然後按照你想要的方式移動這些板塊。
獲得寫(xie) 作建議:如果你有作業(ye) 或論文,但不確定寫(xie) 作質量,可以將其粘貼到ChatGPT並尋求寫(xie) 作建議。
擴展或濃縮文章:ChatGPT可以作為(wei) 你的個(ge) 人編輯器,擴展你在一個(ge) 想法或主題上的寫(xie) 作,或者濃縮總結你已經寫(xie) 過的東(dong) 西。同樣,它也不完美,因為(wei) 它不是你,不能決(jue) 定什麽(me) 是重要的,該保留或刪除。
修改校對:ChatGPT是一個(ge) 不錯的校對器。拿出你的文章草稿,讓它校對你的文章或其他東(dong) 西。
評論已經被關(guan) 閉。