投资提醒: 本文内容仅供参考,不构成投资建议。外汇和差价合约交易涉及高风险,可能不适合所有投资者。
根据XM外汇官网APP的模型消息,9月29日,正式深度求索推出了DeepSeek-V3.2-Exp模型,发布方大幅下这是并开一个实验版本。该模型采用了稀疏注意力架构,源官专注于优化长文本的价格训练和推理效率。DeepSeek-V3.2-Exp已在官方App、模型网页端和小程序上同步更新,正式并且API价格大幅降低,发布方大幅下使开发者调用其API的并开成本显著减少。
DeepSeek表示,源官V3.2-Exp作为新一代架构的价格中间步骤,在V3.1-Terminus的模型基础上引入了DeepSeek Sparse Attention (DSA)机制。此机制在几乎不影响模型输出效果的正式情况下,显著提升了长文本训练和推理的发布方大幅下效率。
该模型已在华为云大模型服务平台MaaS上架,华为云继续采用大EP并行方案进行部署。该方案基于稀疏注意力结构,增强了对长序列的上下文并行处理,同时兼顾了模型延迟和吞吐量性能。
为了准确评估稀疏注意力的影响,DeepSeek团队严格对齐了DeepSeek-V3.2-Exp和V3.1-Terminus的训练设置。在多个领域的公开评测集上,DeepSeek-V3.2-Exp的表现与V3.1-Terminus基本相当。
受到新模型服务成本大幅降低的影响,官方API价格已显著下调,新的价格政策立即生效,使开发者调用DeepSeek API的成本降低超过50%。