DeepSeek v3.1 Ultimate Edition拆卸:“最后的测试人”
![]()
用-SOHU技术的设定制成| Zheng Songyi DeepSeek的新“ Ultimate Edition”!几个小时前,DeepSeek正式宣布发布最新升级的DepSek-V3.1-endinus模型(Terminus的终点是拉丁语中的终点),然后该模型宣布为开放资源。当前,官方应用程序,网页,迷你程序和DeepSeek API模型已在DeepSeek-V3.1-endinus上进行更新。根据官方报告,此更新基于原始模型的功能,该功能的重点是改善语言一致性问题,并进一步优化代码代理的性能和搜索代理。 “最后的人类试验”的表现增加了36.5%,在世界上排名第三。值得一提的是,在最后一次DeepSeek-V3.1模型更新之后一个月,DeepSeek-V3.1-enderinus的新模型的性能在许多专业的基准测试中都得到了改善。在非代理模式(思维)中,DeepSeek-V3.1末端的作用胜于较老的MMLU-PRO(广泛的学科知识),GPQ-Diamond(领先的专业科学问题)中的版本。其中,在人类最终考验中的表现增加了36.5%,并超过了双子座2.5 Pro模型,达到了全球排名的第三名。该测试主要评估模型在各种困难任务中的整体性能。正如代理商评估的那样,DeepSeek-V3.1-Terminus Web的浏览,编程和问答程序的程序得到了略有改进。实际测试:受批评的两个主要错误终于不再“困惑”了。今年8月,在DeepSeek-V3.1发布后,Maraming用户报告说,新模型有两个严重的错误值得关注。首先,该模型将具有语言的不一致,并且输出答案通常与中文,英语,法语和其他语言混合在一起,从而使用户令人惊讶。另一方面,当使用API调用模型时,单词“激烈”一个D“ Extreme”将是不可控制的随机输出,从而影响正常的代码操作。一些开发人员向社区的开放资源抱怨:“屏幕上充满了奉献精神,好像在玩文字游戏。”为了回答第一个问题,当一些网民要求DeepSeek-V3.1帮助分析红色大厦梦想的文学价值时,输出答案突然相互作用“此寓言使用非常漂亮”,笑声和笑着和cr笑。 SOHU技术在新的Deptseek-V3.1末端测试模型中发现了语言混乱的问题,语义表达比以前更好。另一个网民指出,在翻译小语言时,DeepSeek-V3.1中多语言混乱的问题更为严重。 Sohu Technology还尝试了它,并将一长长的西班牙语喂入了DeepSeek-V3.1-末端,并且必须翻译成7种语言,没有发现语言混乱。我们还尝试了以前的错误“你真漂亮“在互联网上已经听到的是:以前,诸如“ time.se”之类的特殊字符出现在输出代码中,尤其是在GO和Python语言中写入时,出现的可能性很高,但是,在新模型中的许多测试中,没有类似的例外,没有类似的例外,它已经重新出现了。 agent's period" and continued to deepen its layout in the field of AI agent. The emphasis on optimizing DeepSeek-V3.1-terminus in agent's capabilities further confirms this strategic focus. According to reports from many sources, Deepseek is currently striving to produce a new model with a stronger AI agent's capabilities, and is set to launch in the four quarter of 2025. At this time, the name "Terminus" has previously brought about the concept of网友。是V3系列的最后更新,其名称显示了它。预计启动下一个版本将是一个新的体系结构,而代理商会给代理商带来许多惊喜。 “另一个开发人员也表达了类似的观点,”这可能代表v3.1的技术体系结构。它在这里抛光。 DeepSeek-v3.1-terminus是本系列的最后任务,这也是下一代模型的起点。 “国内外的社交平台通常会鼓励网民更新:DeepSeek-V4/DeepSeek-R2,回到Sohu,看到更多