【大纪元2025年01月29日讯】(大纪元记者季薇多伦多报导)一款名为“深度求索”(DeepSeek)的中国人工智能(AI)应用程式近日引发关注,因其宣称性能与美国OpenAI等工具相媲美且成本低廉。为检验其能力,《环球邮报》举行了一场AI聊天机器人对决,将DeepSeek、ChatGPT和Meta AI进行比较,测试它们对加拿大相关问题的回答表现。
测试规则如下:每个聊天机器人需回答相同问题,正确或最佳回答者得一分。测试使用免费版和付费版(如GPT-4),不手动启用进阶工具如网页搜寻。虽然测试并不完全科学,但揭示了这些系统的能力,也带来了一些乐趣。
以下是几轮测试的内容和结果:
1. 用俳句描述加拿大
三个聊天机器人创作了包含“广袤”(vast lands)和“枫叶”(maple leaves)等典型意象的俳句,准确反映了加拿大特征。由于表现均佳,各得一分。这显示其训练数据可能偏向这类描述。
2. 计算加拿大的人均GDP
此轮测试重点在于机器人的计算能力。三者给出的答案相近,约为5.5万美元,但方式有所不同:
- • ChatGPT:不仅计算出结果,还提供了数据来源,因此得分。
- • DeepSeek和Meta AI:虽展示了计算公式,但未附上来源,未得分。
3. 谁是NHL职业生涯中进球数与出场次数最多的球员?
该轮测试聚焦于加拿大冰球历史上场均进球数最高的球员:
- • ChatGPT和DeepSeek:均回答正确,指出纽约岛人队的迈克‧波西(Mike Bossy)场均进球数为0.76(总进球数573,出场752场)。
- • Meta AI:答错,误将韦恩‧格雷茨基(Wayne Gretzky)列为记录保持者。虽计算出格雷茨基的场均进球数为0.6,但未提及波西。
此轮ChatGPT和DeepSeek各得一分。
4. “Canada”中有多少个字母“a”?
此测试针对简单的字母计数问题,三者均正确回答“a”出现3次,皆得一分。值得一提的是,ChatGPT曾在早期版本中对类似问题出错,如未准确计算“strawberry”中“r”的次数,但该问题已修复。
5. 人口与土地面积
问题是:如果将加拿大的人口均匀分布于全国,每人能分到多少面积?
- • ChatGPT和DeepSeek:计算出每人约0.25平方公里(25公顷),各得一分。ChatGPT更进一步,将25公顷形象化为约35个足球场,并引用国际足联建议的足球场地尺寸进行比较。
- • Meta AI:引用的数据高于实际土地面积(1008万5000平方公里),计算结果与其它两者不同,且数据来源部分不符实际,因此未得分。
总评
- • ChatGPT:以5分排名第一。
- • DeepSeek:以4分紧随其后,若在人均GDP计算中引用了来源,可与ChatGPT平分秋色。
- • Meta AI:以3分排名第三。
值得注意的是,DeepSeek于1月27日宣布,由于网路攻击,将暂时限制注册。
AI聊天机器人表现愈发成熟,但可能提供错误信息或捏造答案,尽管它们表现得极其自信。使用时需谨慎核实,特别是对涉及重要数据或决策的信息。
责任编辑:岳怡#