同时,DeepSeek的开源策略和技术突破有助于吸引更多开发者参与优化和部署,进一步降低算力成本,提高模型的应用效果。
另外◆★★■★,意大利等国家也跟风禁用DeepSeek★◆。意大利数据保护局(Garante)以数据隐私风险为由◆■■,要求DeepSeek提供关于个人数据收集和存储的详细信息★★◆★◆,包括数据来源、用途、法律依据及是否存储在中国境内。由于DeepSeek的回应被认定为◆◆“完全不充分■◆■◆”,Garante随即下令屏蔽其服务,并展开正式调查。意大利要求政府设备移除DeepSeek相关产品,但个人设备暂未受限。
DeepSeek的模型在较低成本的算力环境下运行高效,降低了对英伟达高端GPU芯片的依赖◆★★■◆。这可能导致市场对英伟达高端芯片的需求增长放缓。
2月1日华为云宣布,硅基流动与华为云团队联合首发并上线基于华为云昇腾云服务的DeepSeek-R1/V3推理服务■★。
意大利的举措引发了欧洲多国跟进。例如,法国、爱尔兰等国的监管机构也启动了对DeepSeek的质询,而澳大利亚◆■◆★■、美国部分州及韩国则进一步扩大至政府系统的全面禁用■★◆◆■★。
整体来看,DeepSeek的崛起促使全球科技圈重新审视AI产业的投资逻辑和技术路径★◆★◆★,加速了AI技术的创新和发展。
2月5日,壁仞科技宣布壁仞AI算力平台正式上线 DeepSeek R1 蒸馏模型推理服务,全球开发者可云端体验 1■★◆◆■◆.5B、7B■◆■、8B、14B◆■■、32B■★◆★◆■、70B 全系列模型服务。该服务具备以下两大核心优势:一是零部署成本★★◆◆:免去硬件采购与环境搭建◆★◆,实现“开箱即用★■★■■”的云端推理体验。二是多场景覆盖:针对LLM等不同任务预置优化配置方案★■◆★■。
早在法案提出之前★★,美国总统就已开始屏蔽DeepSeek■★★,包括国防部★◆◆◆■★、国会和NASA等部门◆■■★◆。
不过,目前使用DeepSeek服务非常不稳定■★★★★■。有用户反馈★★◆◆■★,一上午问了10个问题◆★★◆,7个被回复“服务器繁忙,请稍后再试。”
然而,DeepSeek的崛起之路并非一帆风顺。美国政府挑头围堵DeepSeek。
DeepSeek模型在前端的优秀表现,其背后依赖于DeepSeek的技术突破。
2月5日下午■◆◆■■,青云科技旗下 AI 算力云服务——基石智算CoresHub 正式上线 DeepSeek-R1 系列模型,限时免费★◆■★◆!既可以通过大模型服务直接调用 DeepSeek 系列模型,按token计费■◆◆★★■,前5天免费使用,不限token数量◆◆★;也可以通过 AI 算力云服务提供的 GPU 在云端部署推理服务,按需使用算力,可随用随开,新用户注册认证立即赠送 50 元算力券,可免费体验。
2月4日★◆★◆,DeepSeek-R1■■■★、DeepSeek-V3、DeepSeek-V2、Janus-Pro正式上线昇腾社区★◆■◆,支持一键获取DeepSeek系列模型★★◆◆★■,支持昇腾硬件平台上开箱即用,推理快速部署,带来更快、更高效、更便捷的AI开发和应用体验,欢迎广大开发者体验使用。
根据DeepSeek 发表的论文,R1模型放弃了RLHF中的HF(人类反馈)部分,只采用RL(强化学习):为模型设置两个奖励函数,一个用于奖励◆■“结果正确★■★★★■”的答案,另一个奖励■◆■★“思考过程正确■★★★”的答案◆◆;鼓励模型一次尝试几个不同的答案,然后根据两个奖励函数对它们进行评分。DeepSeek称■◆,经过数千个RL步骤,DeepSeek-R1-Zero在推理基准测试中的性能就与OpenAI-o1-0912的性能相当了。
2月2日,腾讯云宣布腾讯云高性能应用服务 HAI 支持 DeepSeek-R1 一键部署,2月4日又宣布腾讯云 TI 上架 DeepSeek 系列模型;
在C端用户使用来看◆★★★,DeepSeek与ChatGPT等其他聊天机器人的不同之处在于,DeepSeek的同名聊天机器人在回应用户提问时,会将思维链(Chain of Thought,CoT)完全展示出来◆■。将自己的思考过程完全展示给用户看★★,这激发了大量用户的热情■★★★。
开源模型成本的下降对产业链上的云服务厂商无疑是利好。目前,全球主要云厂商纷纷将DeepSeek系列模型部署在其云服务上,以丰富其AI产品线■■★,提升服务竞争力。
在R1之前★■■,业界大模型普遍依赖于RLHF(基于人类反馈的强化学习)■★★★■■。这一强化学习模式使用了大量由人类撰写的高质量问答以了解★■“什么才是好的答案”
2月4日,火山引擎宣布◆■◆★★■,将支持 V3、R1 等不同尺寸的 DeepSeek 开源模型,可以通过在火山引擎机器学习平台 veMLP 中部署和在火山方舟中调用模型两种方式使用模型◆■。
DeepSeek的火爆,不仅体现在用户数量的激增上,更在于它赢得了芯片巨头的青睐。AMD、英伟达◆■■★、英特尔等大佬纷纷宣布适配DeepSeek,国产GPU企业更是欢呼雀跃,仿佛过年一般。壁仞科技、摩尔线程★◆、华为昇腾等纷纷宣布上线DeepSeek推理服务,为全球开发者提供了云端体验的全系列模型服务,从1.5B到70B,应有尽有,简直是开发者的福音。
早在1月25日,AMD宣布将DeepSeek-V3模型集成到其Instinct MI300X GPU上■★■◆■;1月31日★■,英伟达官宣其NVIDIA NIM微服务预览版支持DeepSeek-R1模型;2月1日,美国芯片巨头英特尔宣布DeepSeek能够在英特尔产品上运行,包括搭载英特尔处理器的AI PC上实现离线使用。
DeepSeek的技术突破使投资者重新审视AI产业的投资逻辑★◆★■,对英伟达等依赖高端算力芯片的企业前景产生担忧,导致英伟达等科技股集体下挫。DeepSeek的技术突破引发市场对AI算力需求的怀疑,导致博通■★■◆、台积电等依赖AI获得巨额市值增长的芯片制造商股价下跌◆★■◆。
DeepSeek V3模型和R1系列模型都是基于更基础版本V3-Base开发的★◆◆■◆■。V3模型的突破主要在于训练成本和计算效率■◆◆■◆,R1开辟了训练推理模型的新路径。
近期,就有消息称■◆■,DeepSeek发布之后◆★◆■,英伟达GPU预期需求已经出现下降,有人发现Alibaba网站上有大量全新的英伟达H800◆■、A100■■、甚至H100上线■■■,正在疯狂被抛售◆★★◆■■。
2月4日,摩尔线月宣布成功部署DeepSeek蒸馏模型推理服务,验证了其自研全功能GPU在复杂AI任务中的支持能力★★■■◆。摩尔线程还计划开放自主设计的夸娥(KUAE)GPU智算集群■■◆★★,支持DeepSeek V3◆◆★★■■、R1模型及新一代蒸馏模型的分布式部署。
自2025年1月31日起,DeepSeek在意大利的苹果和谷歌应用商店已无法下载。
2月3日晚★■■★,百度智能云宣布,百度智能云千帆平台已正式上架 DeepSeek-R1 和 DeepSeek-V3 模型。
对企业等B端用户而言,DeepSeek R1 API 的价格,比o1便宜近27倍。效果差不多的情况下,便宜这么多,谁不选便宜又好用的呢★◆?
据媒体报道◆■,近日■◆,美国参议员Josh Hawley提出了一项激进的法案《2025年美国人工智能能力与中国脱钩法案》。根据新的法案,任何下载或使用DeepSeek的行为将被定性为犯罪,最高可判处20年监禁。如果与中国的高校★★■■★、大学或实验室合作,可能涉及违法行为★◆,并对违反规定的行为设定了民事罚款,具体为个人罚款100万美元◆★★◆★,公司罚款1亿美元,此外赔偿金额为3倍◆◆。
DeepSeek-R1 在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下■◆◆■★★,极大提升了模型推理能力。在数学◆★■、代码、自然语言推理等任务上,性能比肩 OpenAI o1 正式版。
更令人咋舌的是,截止1月31日DeepSeek霸榜苹果应用商店157个国家/地区的第一名。
DeepSeek的颠覆性影响已经显现◆◆◆★■。它不仅改变了大模型经济的格局,更让全球科技圈重新审视AI产业的未来★★■■■■。