site logo: www.iloveguava.com

谁更了解加拿大?DeepSeek比拼ChatGPT等

2025年1月27日,DeepSeek应用程序显示在iPhone萤幕上。 (Justin Sullivan/Getty Images)
人气: 697
【字号】    
   标签: tags: , ,

【大纪元2025年01月29日讯】(大纪元记者季薇多伦多报导)一款名为“深度求索”(DeepSeek)的中国人工智能(AI)应用程式近日引发关注,因其宣称性能与美国OpenAI等工具相媲美且成本低廉。为检验其能力,《环球邮报》举行了一场AI聊天机器人对决,将DeepSeek、ChatGPT和Meta AI进行比较,测试它们对加拿大相关问题的回答表现。

测试规则如下:每个聊天机器人需回答相同问题,正确或最佳回答者得一分。测试使用免费版和付费版(如GPT-4),不手动启用进阶工具如网页搜寻。虽然测试并不完全科学,但揭示了这些系统的能力,也带来了一些乐趣。

以下是几轮测试的内容和结果:

1. 用俳句描述加拿大

三个聊天机器人创作了包含“广袤”(vast lands)和“枫叶”(maple leaves)等典型意象的俳句,准确反映了加拿大特征。由于表现均佳,各得一分。这显示其训练数据可能偏向这类描述。

2. 计算加拿大的人均GDP

此轮测试重点在于机器人的计算能力。三者给出的答案相近,约为5.5万美元,但方式有所不同:

  • • ChatGPT:不仅计算出结果,还提供了数据来源,因此得分。
  • • DeepSeek和Meta AI:虽展示了计算公式,但未附上来源,未得分。

3. 谁是NHL职业生涯中进球数与出场次数最多的球员?

该轮测试聚焦于加拿大冰球历史上场均进球数最高的球员:

  • • ChatGPT和DeepSeek:均回答正确,指出纽约岛人队的迈克‧波西(Mike Bossy)场均进球数为0.76(总进球数573,出场752场)。
  • • Meta AI:答错,误将韦恩‧格雷茨基(Wayne Gretzky)列为记录保持者。虽计算出格雷茨基的场均进球数为0.6,但未提及波西。

此轮ChatGPT和DeepSeek各得一分。

4. “Canada”中有多少个字母“a”?

此测试针对简单的字母计数问题,三者均正确回答“a”出现3次,皆得一分。值得一提的是,ChatGPT曾在早期版本中对类似问题出错,如未准确计算“strawberry”中“r”的次数,但该问题已修复。

5. 人口与土地面积

问题是:如果将加拿大的人口均匀分布于全国,每人能分到多少面积?

  • • ChatGPT和DeepSeek:计算出每人约0.25平方公里(25公顷),各得一分。ChatGPT更进一步,将25公顷形象化为约35个足球场,并引用国际足联建议的足球场地尺寸进行比较。
  • • Meta AI:引用的数据高于实际土地面积(1008万5000平方公里),计算结果与其它两者不同,且数据来源部分不符实际,因此未得分。

总评

  • • ChatGPT:以5分排名第一。
  • • DeepSeek:以4分紧随其后,若在人均GDP计算中引用了来源,可与ChatGPT平分秋色。
  • • Meta AI:以3分排名第三。

值得注意的是,DeepSeek于1月27日宣布,由于网路攻击,将暂时限制注册。

AI聊天机器人表现愈发成熟,但可能提供错误信息或捏造答案,尽管它们表现得极其自信。使用时需谨慎核实,特别是对涉及重要数据或决策的信息。

责任编辑:岳怡#

评论