site logo: www.iloveguava.com

誰更了解加拿大?DeepSeek比拼ChatGPT等

2025年1月27日,DeepSeek應用程序顯示在iPhone螢幕上。 (Justin Sullivan/Getty Images)
人氣: 697
【字號】    
   標籤: tags: , ,

【大紀元2025年01月29日訊】(大紀元記者季薇多倫多報導)一款名為「深度求索」(DeepSeek)的中國人工智能(AI)應用程式近日引發關注,因其宣稱性能與美國OpenAI等工具相媲美且成本低廉。為檢驗其能力,《環球郵報》舉行了一場AI聊天機器人對決,將DeepSeek、ChatGPT和Meta AI進行比較,測試它們對加拿大相關問題的回答表現。

測試規則如下:每個聊天機器人需回答相同問題,正確或最佳回答者得一分。測試使用免費版和付費版(如GPT-4),不手動啟用進階工具如網頁搜尋。雖然測試並不完全科學,但揭示了這些系統的能力,也帶來了一些樂趣。

以下是幾輪測試的內容和結果:

1. 用俳句描述加拿大

三個聊天機器人創作了包含「廣袤」(vast lands)和「楓葉」(maple leaves)等典型意象的俳句,準確反映了加拿大特徵。由於表現均佳,各得一分。這顯示其訓練數據可能偏向這類描述。

2. 計算加拿大的人均GDP

此輪測試重點在於機器人的計算能力。三者給出的答案相近,約為5.5萬美元,但方式有所不同:

  • • ChatGPT:不僅計算出結果,還提供了數據來源,因此得分。
  • • DeepSeek和Meta AI:雖展示了計算公式,但未附上來源,未得分。

3. 誰是NHL職業生涯中進球數與出場次數最多的球員?

該輪測試聚焦於加拿大冰球歷史上場均進球數最高的球員:

  • • ChatGPT和DeepSeek:均回答正確,指出紐約島人隊的邁克‧波西(Mike Bossy)場均進球數為0.76(總進球數573,出場752場)。
  • • Meta AI:答錯,誤將韋恩‧格雷茨基(Wayne Gretzky)列為記錄保持者。雖計算出格雷茨基的場均進球數為0.6,但未提及波西。

此輪ChatGPT和DeepSeek各得一分。

4. 「Canada」中有多少個字母「a」?

此測試針對簡單的字母計數問題,三者均正確回答「a」出現3次,皆得一分。值得一提的是,ChatGPT曾在早期版本中對類似問題出錯,如未準確計算「strawberry」中「r」的次數,但該問題已修復。

5. 人口與土地面積

問題是:如果將加拿大的人口均勻分布於全國,每人能分到多少面積?

  • • ChatGPT和DeepSeek:計算出每人約0.25平方公里(25公頃),各得一分。ChatGPT更進一步,將25公頃形象化為約35個足球場,並引用國際足聯建議的足球場地尺寸進行比較。
  • • Meta AI:引用的數據高於實際土地面積(1008萬5000平方公里),計算結果與其它兩者不同,且數據來源部分不符實際,因此未得分。

總評

  • • ChatGPT:以5分排名第一。
  • • DeepSeek:以4分緊隨其後,若在人均GDP計算中引用了來源,可與ChatGPT平分秋色。
  • • Meta AI:以3分排名第三。

值得注意的是,DeepSeek於1月27日宣布,由於網路攻擊,將暫時限制註冊。

AI聊天機器人表現愈發成熟,但可能提供錯誤信息或捏造答案,儘管它們表現得極其自信。使用時需謹慎核實,特別是對涉及重要數據或決策的信息。

責任編輯:岳怡#

評論