DeepSeek突然测试新模型,春节大招要来了?

深度求索灰度测试1M上下文窗口,知识库更新至2025年5月,语言风格优化,出海开发者可关注其长文本处理能力。

摘要

国产大模型头部玩家深度求索近日开启关键更新,将上下文窗口从128K提升至1M级别,可直接处理《三体》三部曲等长文本,对标GPT-5及Gemini 3 Pro等海外旗舰产品。知识库截止时间更新至2025年5月,非联网状态下可准确输出近期新闻。DeepSeek保持纯文本与语音交互路径,未加入多模态功能,但长上下文能力为出海开发者处理多语言内容、复杂用户交互提供新选择。

继被曝出全新V4系列架构规划后,国产大模型头部玩家深度求索今日傍晚逐步推送了一个关键更新。

2月11日,多位用户反馈DeepSeek已在网页及App端开启灰度测试,核心上下文窗口由原有的128K直接提升至1M(百万Token)级别。经凤凰网科技实测,其自身反馈的上下文长度已更新。

此外,当前版本模型在非联网状态下已能准确输出2025年4月的新闻事件,其知识库截止时间正式更新至2025年5月。

1M上下文窗口的到来,使该模型可在单次处理中完整吞吐《三体》三部曲体量的长文本,直接对标GPT-5及Gemini 3 Pro等海外旗舰产品的长上下文能力。


除参数层级的硬核跃升外,本次灰度测试还释放出显著的体验层信号。多名开发者及早期体验者反馈,新模型的语言风格明显趋向“热情而细腻”,前端响应质感被评价为“可媲美Claude 3.5 Sonnet”。这或是DeepSeek在保持极致推理性能的同时,对C端交互体验发起的一次精准补课。

值得注意的是,此番升级并未包含多模态视觉理解能力,模型仍聚焦于纯文本与语音交互路径。

凤凰网科技此前曾发现,DeepSeek在近期曾大量招人。放出了多个技术核心岗位招聘,包括深度学习研究员(负责LLM各个方向的前沿探索,如预训练、alignment、codemath、backbone、multimodal等)、深度学习研发工程师(LLM预训练数据/搜索策略相关)、大模型全栈工程师(算法与工程并重,归属于各个前沿探索方向,除了实现还会参与一些环境的部署和搭建)、全栈开发工程师、核心系统研发工程署。且据招聘者表述,校招、社招、实习均开放,另有产品、设计、数据百晓生等岗位开放。

截至目前,深度求索官方尚未就此轮灰度发布命名具体版本号。业内普遍猜测,若该版本对应此前网传的“DeepSeek V4”或强化版V3.2系列。

本文源自「私域神器」,发布者:siyushenqi.com,转载请注明出处:https://www.siyushenqi.com/72026.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
Epic Games抨击英国监管机构对苹果与谷歌的约束措施
上一篇 9小时前
下一篇 9小时前

相关推荐

发表回复

登录后才能评论
联系我们

联系我们

+86 132-7601-9273

邮件:siyushenqi@gmail.com

工作时间:周一至周日 9:30-20:30

添加微信
添加微信
email Email Telegram
分享本页
返回顶部

私域神器:一站式全网全渠道营销获客软件
备用域名:https://www.nodgame.com