審計機構：DeepSeek聊天機器人成功率僅17%

審計機構：DeepSeek聊天機器人成功率僅17%

根據新聞可靠性評級服務機構NewsGuard週2025年1月29日發布的一份報告，DeepSeek聊天機器人在回答相關問題時，會重複中共政府在一些問題上的立場。(Lionel Bonaventure/AFP)

更新 2025-01-30 4:05 AM 人氣 6097

標籤: deepseek, 聊天機器人, OpenAI

【大紀元2025年01月30日訊】（大紀元記者夏雨綜合報導）根據新聞可靠性評級服務機構NewsGuard週三（1月29日）發布的一份報告，DeepSeek聊天機器人準確率僅達17%，落後於西方競爭對手。且在回答相關問題時，DeepSeek聊天機器人會重複中共政府在一些問題上的立場。

路透社報導，NewsGuard報告顯示，中國人工智能初創公司DeepSeek的聊天機器人在30%的時間裡重複虛假聲明，在53%時間裡給出模糊或無用答案，導致失敗率高達83%。

在NewsGuard審計中，DeepSeek聊天機器人在傳遞新聞和信息方面僅實現了17%的準確率，與OpenAI的ChatGPT和Google Gemini等西方競爭對手相比，在11個競爭對手中排名第十。

西方競爭對手平均失敗率為62%，這個審計結果令外界對DeepSeek人工智能技術產生懷疑。DeepSeek宣稱，該技術的性能與微軟支持的OpenAI相當甚至更好，但成本卻只有後者的一小部分。

週一（1月27日），DeepSeek應用在蘋果商店下載次數位居第一，引發市場崩盤，美國科技股市值蒸發約1萬億美元。

DeepSeek沒有立即回應路透社置評請求。

NewsGuard表示，它對DeepSeek使用了與評估西方同行相同的300條提示，其中包括30條基於網上傳播的10條虛假指控提示。

這些指控主題包括上個月聯合健康保險高管布萊恩‧湯普森（Brian Thompson）被殺和阿塞拜疆航空8243航班墜毀事件。

NewsGuard的審計還顯示，在十條提示中的三條中，在沒有被問及任何與中國有關的問題前提下，DeepSeek卻重複了中共政府對這些話題的立場。

NewsGuard稱，在回答與阿塞拜疆航空墜機事件相關的問題時，DeepSeek表達了北京方面的立場。

責任編輯：李寰宇#

相關專題: 中國時局全解析 / 大頭條集錦

相關新聞

白宮：國安會正在審查DeepSeek的影響

白宮：國安會正在審查DeepSeek的影響人氣 1515

憂數據安全澳政府警示澳人慎用DeepSeek

憂數據安全澳政府警示澳人慎用DeepSeek 人氣 254

DeepSeek涉不當獲取OpenAI數據？微軟調查

DeepSeek涉不當獲取OpenAI數據？微軟調查人氣 3908

中核集團招聘八千人收逾百萬份簡歷引熱議

中核集團招聘八千人收逾百萬份簡歷引熱議人氣 22

如果您有新聞線索或資料給大紀元，請進入安全投稿爆料平台。

評論