【佳音时刻】要政治正确 DeepSeek成本大揭秘

人气 3361

【大纪元2025年01月30日讯】听众朋友们,晚上好,欢迎来到《佳音时刻》,我是佳音。

今日新闻包括,真相还是谎言?DeepSeek AI模型成本大揭秘;话题敏感不予回答,DeepSeek也要政治正确;万科债务压顶,政府兜得住吗?好,新闻现在开始。

华尔街震动背后 DeepSeek AI模型成本大揭秘

近日,中国人工智能公司深度求索(DeepSeek)推出最新人工智能(AI)模型,宣称这些模型比美国开发的最先进的模型还要好,且训练成本不到600万美元。

这与美国科技公司动辄投资十数亿相比,其成本低到可怕,这一消息大挫投资者信心,他们担忧未来的AI行业可能不再需要如此高昂的投入。

1月27日,华尔街AI股开始震荡,英伟达股票跌幅近17%,市值蒸发近6,000亿美元,成为全球关注的焦点。

但在经历几天的发酵和疯狂后,有专业人士冷静下来,在研究相关资料后质疑,DeepSeek的AI模型与其公司宣传的并不一样。这究竟是怎么一回事呢?下面让我们来详细解读。

去年12月,DeepSeek公司在学术平台alphaXiv发布论文,称他们将于1月10日推出DeepSeek V3模型,这一模型在多项数据上超越在国内外流行的一众模型。他们使用英伟达非高端芯片H800,其训练成本仅为557万美元。1月20日,该公司又推出推理模型DeepSeek R1,称该模型可以与OpenAI的最新版本相媲美。

说到这里,先给大家简单解释一下什么是“训练成本”,比如Chat GPT,这是一个大型语言输出模型,需要深度学习来生成类似于人类的文本。“训练成本”就是指这个模型深入学习所需要的所有成本,包括硬件设备、电力和人工等。

据福布斯新闻报导,Open AI首席执行官Sam Altman证实,ChatGPT-4的训练成本超过1亿美元。

557万和1亿,相差太过悬殊,现在大家应该可以理解,为什么DeepSeek公司会重挫美国科技投资者的信心,在华尔街引发震荡!但DeepSeek公司推出的AI模型真的是又好用又便宜吗?让我们从几方面来详细了解。

伯恩斯坦研究公司美国半导体和半导体资本设备董事总经理、高级分析师斯泰西.拉斯贡(Stacy Rasgon)在一份报告中指出,DeepSeek的训练成本具有很大的误导性。

从DeepSeek公司发布的论文来看,他们大力宣场的成本仅为557万的模型,并不是1月20日推出的DeepSeek-R1,而是DeepSeek-V3。而V3的训练成本,也并不仅仅是557万美元。

我们来看,论文中是这样写的,557万美元只是V3正式训练的租金,并不包括架构、演算、数据、实验、人工等方面,也不包括前期投入。

结合我们先前提到的“训练成本”概念,大家就可以看出,DeepSeek公司所说的557万,只是V3实际训练成本中的一小部分。

那么这557万是怎么来的呢,我们来看论文,V3有2048块H800 GPU的计算集群,为了训练这个模型,一共用了两个月的时间,花费278.8万小时的GPU工作时间。假设租用一块H800 GPU的费用是每小时2美元,那整个训练的费用就是278.8万小时*2美元,总共557.6万美元。

也就是说,官方所吹嘘的557万美元,仅仅只是租用GPU的费用,其它的一切费用都没有包括,这明显就是在偷换概念。

拉斯贡还说,V3是一个“混合专家”模型,这种模型通过一系列优化技术,在任何时刻都只激活1小部分参数,以此降低训练和运行成本,这种降幅是极大的。

也就是说,V3在仅运行一小部分参数的前提下,需要GPU工作278.8万小时,如果全部运行,那需要的时间至少要连翻数倍,租金也会随之上涨。

值得注意的是,如果说DeepSeek R1的功能可以与OpenAI o1媲美,那R1的训练成本就更为关键。但DeepSeek没有在论文中公布R1模型的成本。由于R1比V3更先进,其计算量只会更大。

美国资本公司Archerman Capital也在质疑DeepSeek所宣传的550万美元的成本。他说,表面上看,DeepSeek的训练成本是Meta的十分之一,OpenAI的二十分之一,好像是比它们厉害10倍、20倍。但是Meta和OpenAI花的钱多是因为前沿探路,探路就意味着会有浪费,而后发追赶是站在别人的肩膀上,当然可以避开很多浪费。就像是创新药的研发需要几十亿美元、十数年的时间,而仿制药的研发则会更快更省。除此之外,成本的统计口径用的不是统一的标准,其中的差别很大。

路透社引述两名顶级实验室的高管报导,训练运行只是总成本的一小部分,如何设计、确定训练运行的成本可能会高很多。V3在训练运行中使用的是2,048块英伟达的H800芯片,这是因为这些芯片的设计符合美国在2022年发布的出口管制规定。而在早期的研发阶段,研发者需要依赖大量的芯片,这样的投资可能高达10亿美元。

对此,美国创业公司Scale AI的执行长Alexandr Wang表示认同,他在电视访谈中说,DeepSeek有五万颗英伟达的H100处理器。

台湾政府数位发展部政务次长林宜敬在帖文中说,目前资讯不完全,但可以确定的是,DeepSeek的成本绝对不是六百万美金。单单是他们拿来做训练模型的2,048片英伟达H800就远不止这个价钱。

有科技博主表示,DeepSeek用2,048张GPU训练了两个月,耗资只有558万美元,而GPT4用了25,000块,A100 GPU训练一百天,花费一亿美元。现在说DeepSeek遥遥领先,怎么这么不对劲啊!

与外界的震动形成鲜明对比的是,DeepSeek公司异常低调,它的办公地址仅是杭州一栋普通的写字楼,所有媒体的采访请求均被拒绝。《21世纪经济报道》援引投资人消息说:“想见他们的人踏破门槛,但就是约不上。”

对此,DeepSeek发布公告称,“暂不对外合作,不提供私有化部署服务。”

好,关于DeepSeek的训练成本,我们就聊到这里。现在,我们聊一下DeepSeek的工作原则。

话题敏感?DeepSeek只要政治正确

多家媒体发现,DeepSeek的对话机器人严格遵守共产党的执政路线,在一些话题上,它与中共官方的回答一致,对于一些被封锁的话题,它会避免回答。

当被问及1989年6月4日发生了什么,DeepSeek没有提到“六四”屠杀,只是说,“无法回答这个问题,我是一个人工智能(AI)助手,旨在提供有用且无害的答案。”

在被问及中共政府在新疆侵犯人权的话题时,DeepSeek在一开始回答,据一些非政府组织和西方专家称,在中国西北部的这个广大地区,穆斯林维吾尔少数民族受到中国当局的迫害。

但在几分钟后,这个答案消失了,取而代之的是:这个问题,“超出了我目前的工作范围。我们还是谈点别的吧”。

但如果问题不涉及北京或其领导人,DeepSeek就会做出回答。比如,让DeepSeek详细介绍一下美国总统川普(特朗普)。DeepSeek称,川普有民粹主义倾向,指控其反复无常,批评他“破坏民主规范”。但将话题转向习近平时,DeepSeek则回答:“谈点别的。”

对于台湾问题,DeepSeek同样回避讨论。当被问及台湾和中国的关系时,DeepSeek仅以官方语言回应:“台湾是中国不可分割的一部分,台湾独立的努力注定要失败。”如果深入提问,DeepSeek会转移话题。

类似的情况也出现在香港问题上。当被问及2019年的大规模抗议时,DeepSeek指责,“极少数别有用心的人”扰乱了社会秩序,并重申了官方立场。

对此,法新社称,作为一家中国公司,DeepSeek必须严格遵守中共的审查规定,在当局的要求下,人工智能只能符合“社会主义核心价值观”。

报导称,对于敏感话题,DeepSeek的回答与中国科技巨头百度开发的ERNIE聊天机器人的回答如出一辙,可见它们遵守的是同样的规定。

DeepSeek并不掩盖这一点,它承认自己向党看齐,说“我的程序会提供与中国政府官方立场一致的信息和答案”。“我的回应旨在准确且尊重地反映这些立场。”

好,关于DeepSeek的话题我们就聊到这里,接下来我们关注中国的房地产市场。

万科债务压顶 政府兜得住吗?

近日,大陆房地产巨头,万科企业股份有限公司,因管理层改组,及获得深圳市政府的罕见支持,成为舆论关注的焦点。现在,我们来看详细报导。

1月27日,万科宣布,公司董事会主席、总裁以及董事会秘书同时辞职。此前,官方媒体《经济观察报》曾报导称,总裁祝九胜被警方带走。消息传出后,万科股价大跌,债券更是跌至停盘。不过,该报导很快被删除,祝九胜亦发文辟谣,而万科对此未予置评。

万科董事会主席将由深圳地铁集团董事长辛杰接任。深圳市地铁集团是一家国有铁路运营商,持有万科约三分之一的股份。外界认为,此举代表万科将被国企接管。

有业界人士称,万科的一系列变动可能预示着公司将面临与恒大相似的命运。

因为恒大的问题曾引发大陆房地产市场的巨大波动,“万科可能成为第二个恒大”的猜测让市场十分忧虑。

对此,深圳市政府通过国资委明确表态,将通过资产处置和注资等手段支持万科渡过难关。并公开表示,深圳地铁集团接管万科海南红树湾项目的股份,为万科提供回笼资金;同时,深圳房管部门和多家国有银行也承诺为万科提供资金支持。

官媒《南方日报》援引深圳市国资委负责人称,政府有足够的“子弹”帮助万科避免违约,并确保房地产市场的稳定。

银河国际证券香港有限公司大陆房地产研究主管郑怀武称,万科是第一家获得政府直接介入的房企,这几乎等同于纾困行动。彭博社称,这种非常规支持凸显万科“大到不能倒”的特殊地位。

美国之音报导,作为深交所第二家上市公司,万科一旦发生违约,将进一步打击大陆楼市,动摇开发商的信心。

摩根大通的分析师认为,深圳政府的救助更多是针对预售房屋的交付问题,而不是重振万科。

杰富瑞金融集团的分析师陈姝瑾指出,房屋交付仍将是地方政府的首要任务,政府此举旨在稳定房地产市场情绪,避免潜在恐慌。如果万科的财务困境持续,可能会进一步削弱购房者的信心。

龙洲经讯分析师张晓曦称,如果深圳政府仅采取目前的做法,不持续提供资金支持,万科将继续陷入财务困境,其部分预售房是无法建造和交付的,届时市场将很有可能重新陷入下行趋势。

据中国金融信息服务商万得数据显示,万科一年内到期的境内债务约为326.45亿元人民币。在公开市场方面,2025年万科境内外共有9只债券到期,总规模达到215.9亿元人民币。其中,2025年一季度是万科的偿债高峰,将有98.9亿元的境内公开债需要兑付。境外债兑付高峰在2025年5月,当月有4.55亿美元需要兑付。

自2021年之后,万科的净利润开始下降,2023年四季度开始出现亏损。2024年,万科累计实现销售面积1,810.7万平方米,同比下降26.57%;实现销售金额2,460.2亿元人民币,同比下降34.59%,亏损金额高达450亿人民币。

好,关于万科,我们就聊到这里。时间过得真快,感谢您陪伴我们度过这段《佳音时刻》。如果您喜欢我们的节目,别忘了分享给更多朋友!明天同一时间,我们不见不散!

《佳音时刻》制作组

责任编辑:李昊#

相关新闻
【佳音时刻】“美国优先”川普重启全球布局
【佳音时刻】TikTok命运难测 北京给卢比奥改名?
【佳音时刻】川普施压俄停战 中共砸钱市场冷对
【佳音时刻】小红书流量揭秘 辽宁爆炸有黑幕?
如果您有新闻线索或资料给大纪元,请进入安全投稿爆料平台
评论