審計機構:DeepSeek聊天機器人成功率僅17%

人氣 6097

【大紀元2025年01月30日訊】(大紀元記者夏雨綜合報導)根據新聞可靠性評級服務機構NewsGuard週三(1月29日)發布的一份報告,DeepSeek聊天機器人準確率僅達17%,落後於西方競爭對手。且在回答相關問題時,DeepSeek聊天機器人會重複中共政府在一些問題上的立場。

路透社報導,NewsGuard報告顯示,中國人工智能初創公司DeepSeek的聊天機器人在30%的時間裡重複虛假聲明,在53%時間裡給出模糊或無用答案,導致失敗率高達83%。

在NewsGuard審計中,DeepSeek聊天機器人在傳遞新聞和信息方面僅實現了17%的準確率,與OpenAI的ChatGPT和Google Gemini等西方競爭對手相比,在11個競爭對手中排名第十。

西方競爭對手平均失敗率為62%,這個審計結果令外界對DeepSeek人工智能技術產生懷疑。DeepSeek宣稱,該技術的性能與微軟支持的OpenAI相當甚至更好,但成本卻只有後者的一小部分。

週一(1月27日),DeepSeek應用在蘋果商店下載次數位居第一,引發市場崩盤,美國科技股市值蒸發約1萬億美元。

DeepSeek沒有立即回應路透社置評請求。

NewsGuard表示,它對DeepSeek使用了與評估西方同行相同的300條提示,其中包括30條基於網上傳播的10條虛假指控提示。

這些指控主題包括上個月聯合健康保險高管布萊恩‧湯普森(Brian Thompson)被殺和阿塞拜疆航空8243航班墜毀事件。

NewsGuard的審計還顯示,在十條提示中的三條中,在沒有被問及任何與中國有關的問題前提下,DeepSeek卻重複了中共政府對這些話題的立場。

NewsGuard稱,在回答與阿塞拜疆航空墜機事件相關的問題時,DeepSeek表達了北京方面的立場。

責任編輯:李寰宇#

相關新聞
白宮:國安會正在審查DeepSeek的影響
憂數據安全 澳政府警示澳人慎用DeepSeek
DeepSeek涉不當獲取OpenAI數據?微軟調查
中核集團招聘八千人收逾百萬份簡歷 引熱議
如果您有新聞線索或資料給大紀元,請進入安全投稿爆料平台
評論