中国AI一夜掀翻美股,硅谷大佬坐不住了,特朗普发话!
据 @CCTV 国际时讯 消息,当地时间 1 月 27 日晚,美国总统特朗普在佛罗里达州迈阿密发表讲话时,对中国人工智能初创公司 DeepSeek 搅动纳斯达克一事表示,DeepSeek 的出现 " 给美国相关产业敲响了警钟 ",美国 " 需要集中精力赢得竞争 "。
据央视新闻消息,当地时间 1 月 27 日,美国股市开盘即大幅下跌,科技板块尤为惨重。市场分析认为,核心原因是中国人工智能初创公司 DeepSeek 的最新突破,动摇了美国科技行业的 " 无敌 " 地位。
因受到 DeepSeek 人工智能模型冲击,美国芯片巨头英伟达(NVIDIA)当日股价暴跌约 17%,博通公司股价下跌 17%,超威半导体公司(AMD)股价下跌 6%,微软股价下跌 2%。此外,人工智能领域的衍生品,如电力供应商也受到重创。美国联合能源公司股价下跌 21%,Vistra 的股价下跌 29%。
1 月 24 日,在国外大模型排名 Arena 上,DeepSeek-R1 基准测试已经升至全类别大模型第三,其中在风格控制类模型(StyleCtrl)分类中与 OpenAI o1 并列第一,其竞技场得分达到 1357 分,略超 OpenAI o1 的 1352 分。一夜间,DeepSeek 在全世界科技界刷屏。1 月 27 日,Deepseek 应用登顶苹果中国地区和美国地区应用商店免费 APP 下载排行榜,在美区下载榜上超越了 ChatGPT,成为美国苹果应用商店下载量最大的免费应用程序。
CNN、《纽约时报》、《华盛顿邮报》等美国主流媒体纷纷用《中国名为 DeepSeek 的人工智能技术正在导致美国股市暴跌》、《由于投资者担心中国的 AI 进展,股市下跌》、《中国的 DeepSeek AI 应用程序导致美国科技股下跌》等标题对 DeepSeek" 现象级 " 的崛起进行报道。
01
低成本实现高性能 给美国 " 苦涩教训 "
据报道,DeepSeek 推出的 DeepSeek-R1 模型以极低的成本实现了与 OpenAI o1 相当的性能,但成本连后者的零头都不到。有分析人士认为,DeepSeek 在有限的硬件资源下实现顶尖的模型性能,减少了对高端 GPU 的依赖,低廉的训练成本预示着 AI 大模型对算力投入的需求将大幅下降。正因为此,美股芯片股首当其冲。
DeepSeek 备受关注的原因主要是性价比、开源及推理能力的提升等方面。在性价比上,DeepSeek-R1 成本很低,预训练费用只有 557.6 万美元,不到 OpenAI GPT-4o 模型训练成本的十分之一。DeepSeek 还公布了 API ( 应用程序编程接口 ) 的定价,收费大约是 OpenAI o1 运行成本的三十分之一。
同时,DeepSeek 与外国大模型巨头闭源的路径不同,采用开源模式。DeepSeek 公布了相关论文,整个过程可复现。网络上已经出现了一波复现热潮,加州大学伯克利分校、香港科技大学、知名人工智能公司 HuggingFace 等纷纷成功复现,复现成本甚至低至几十美元。
美国红迪网(社交新闻类站点)25 日称,中国 DeepSeek 的模型是开源的,是令人兴奋的真正原因,他们将制造这些东西的知识免费提供给全世界,确保没有人能够真正垄断它。AI 数据服务公司 Scale AI 创始人 Alexander Wang 就发帖称,(去年发布的)DeepSeek-V3 是中国科技界带给美国的苦涩教训。" 当美国休息时,中国(科技界)在工作,以更低的成本、更快的速度和更强的实力赶上。"
1 月 26 日,游戏科学创始人、CEO,《黑神话:悟空》制作人冯骥评价 DeepSeek:" 可能是个国运级别的科技成果 "。冯骥表示:" 希望 DeepSeek-R1 会让你对当前最先进的 AI 祛魅,让 AI 逐渐变成你生活中的水和电。太幸运了!太开心了!这样震撼的突破,来自一个纯粹的中国公司。知识与信息平权,至此又往前迈出了坚实的一步。"
02
硅谷大佬们坐不住了
DeepSeek 不仅冲击了英伟达的商业模式,也让硅谷的一众科技巨头感到不安。
以 Meta 为例,这家公司近年来在 AI 领域投入了数百亿美元,试图通过构建超大规模的语言模型来与 OpenAI 竞争。但是,DeepSeek 仅用不到 1000 万美元的研发成本并且大获成功,让人们开始质疑,这种砸钱式研发是否真的是唯一的路径。
据知情人士透露,DeepSeek 登顶 App Store 排行榜的第二天,Meta 内部的一个高层会议就连夜召开。这种危机感,不独 Meta 一家有,整个硅谷都弥漫着一种恐慌,很多大厂开始重新评估自己的研发策略。
微软 CEO 萨蒂亚・纳德拉在瑞士达沃斯世界经济论坛上表示:" 看到 DeepSeek 的新模型,真的令人印象非常深刻。他们切实有效地开发出了一款开源模型,在推理计算方面表现出色,且超级计算效率极高。我们必须非常、非常认真地对待中国的这些进展。"
03
开发团队 140 人 多为职场 " 萌新 "
DeepSeek,全称杭州深度求索人工智能基础技术研究有限公司,成立于 2023 年 7 月 17 日,是一家创新型科技公司,专注于开发先进的大语言模型(LLM)和相关技术。
据悉,DeepSeek 的团队不到 140 人。工程师和研发人员几乎都来自清华大学、北京大学、中山大学、北京邮电大学等国内顶尖高校,工作时间都不长。创始人梁文锋今年 40 岁,广东湛江人,17 岁考入浙江大学,后又在浙大攻读信息与通信工程专业硕士。师从项志宇,主要做机器视觉研究。
梁文峰是如何带领团队创造出这款撼动全球 AI 业界应用的?他又如何成为总理的 " 座上宾 "?共同回顾直新闻早前的报道《"85 后 " 广东小伙,缘何成为李强总理 " 座上宾 "?》(点击链接查看全文)。
来源丨综合
排版丨季靳玮
编辑丨郭永佶
审校丨曾子瑾
监制丨王云霞