News

Guangdong BAIDU Special Cement Building Materials Co.,Ltd
— 新闻中心 —

DeepSeek v3.1 Ultimate Edition拆卸：“最后的测试人”

用-SOHU技术的设定制成| Zheng Songyi DeepSeek的新“ Ultimate Edition”！几个小时前，DeepSeek正式宣布发布最新升级的DepSek-V3.1-endinus模型（Terminus的终点是拉丁语中的终点），然后该模型宣布为开放资源。当前，官方应用程序，网页，迷你程序和DeepSeek API模型已在DeepSeek-V3.1-endinus上进行更新。根据官方报告，此更新基于原始模型的功能，该功能的重点是改善语言一致性问题，并进一步优化代码代理的性能和搜索代理。 “最后的人类试验”的表现增加了36.5％，在世界上排名第三。值得一提的是，在最后一次DeepSeek-V3.1模型更新之后一个月，DeepSeek-V3.1-enderinus的新模型的性能在许多专业的基准测试中都得到了改善。在非代理模式（思维）中，DeepSeek-V3.1末端的作用胜于较老的MMLU-PRO（广泛的学科知识），GPQ-Diamond（领先的专业科学问题）中的版本。其中，在人类最终考验中的表现增加了36.5％，并超过了双子座2.5 Pro模型，达到了全球排名的第三名。该测试主要评估模型在各种困难任务中的整体性能。正如代理商评估的那样，DeepSeek-V3.1-Terminus Web的浏览，编程和问答程序的程序得到了略有改进。实际测试：受批评的两个主要错误终于不再“困惑”了。今年8月，在DeepSeek-V3.1发布后，Maraming用户报告说，新模型有两个严重的错误值得关注。首先，该模型将具有语言的不一致，并且输出答案通常与中文，英语，法语和其他语言混合在一起，从而使用户令人惊讶。另一方面，当使用API调用模型时，单词“激烈”一个D“ Extreme”将是不可控制的随机输出，从而影响正常的代码操作。一些开发人员向社区的开放资源抱怨：“屏幕上充满了奉献精神，好像在玩文字游戏。”为了回答第一个问题，当一些网民要求DeepSeek-V3.1帮助分析红色大厦梦想的文学价值时，输出答案突然相互作用“此寓言使用非常漂亮”，笑声和笑着和cr笑。 SOHU技术在新的Deptseek-V3.1末端测试模型中发现了语言混乱的问题，语义表达比以前更好。另一个网民指出，在翻译小语言时，DeepSeek-V3.1中多语言混乱的问题更为严重。 Sohu Technology还尝试了它，并将一长长的西班牙语喂入了DeepSeek-V3.1-末端，并且必须翻译成7种语言，没有发现语言混乱。我们还尝试了以前的错误“你真漂亮“在互联网上已经听到的是：以前，诸如“ time.se”之类的特殊字符出现在输出代码中，尤其是在GO和Python语言中写入时，出现的可能性很高，但是，在新模型中的许多测试中，没有类似的例外，没有类似的例外，它已经重新出现了。 agent's period" and continued to deepen its layout in the field of AI agent. The emphasis on optimizing DeepSeek-V3.1-terminus in agent's capabilities further confirms this strategic focus. According to reports from many sources, Deepseek is currently striving to produce a new model with a stronger AI agent's capabilities, and is set to launch in the four quarter of 2025. At this time, the name "Terminus" has previously brought about the concept of网友。是V3系列的最后更新，其名称显示了它。预计启动下一个版本将是一个新的体系结构，而代理商会给代理商带来许多惊喜。 “另一个开发人员也表达了类似的观点，”这可能代表v3.1的技术体系结构。它在这里抛光。 DeepSeek-v3.1-terminus是本系列的最后任务，这也是下一代模型的起点。 “国内外的社交平台通常会鼓励网民更新：DeepSeek-V4/DeepSeek-R2，回到Sohu，看到更多

News

DeepSeek v3.1 Ultimate Edition拆卸：“最后的测试人”

Tel

Mail

Map

Share

Contact