
4月26日日照铁皮保温,DeepSeek官发布API价钱转机公告,全系API输入缓存掷中价钱降至发价的十分之。旗舰模子DeepSeek-V4-Pro重迭限时2.5折惠。
重迭两项惠后,DeepSeek-V4-Pro价钱大幅下调:输入(缓存掷中)低至0.025元/百万Tokens,输入(缓存未掷中)为3元/百万Tokens,输出价钱为6元/百万Tokens。同时调价的还有DeepSeek-V4-Flash,其输入(缓存掷中)从0.2元/百万Tokens降至0.02元/百万Tokens,突出扣头,其余价钱保握不变。
关于RAG学问库、智能客服等缓存掷中率的利用,商用资本降幅过90,AI领域化落地的资本门槛跨越镌汰。
那么,DeepSeek的价钱到底有多低?
据Open Router数据潜入日照铁皮保温,GPT-5.5 Pro加权平均输入价钱为30好意思元/百万Tokens,输出为180好意思元/百万Tokens。单看输入(缓存掷中)价钱,DeepSeek-V4-Pro比其低廉700倍。
Anthropic Claude Opus、谷歌Gemini 3.1 Pro等国外顶模子的输出订价也均在12至25好意思元之间,与调价后的DeepSeek-V4-Pro差距悬殊。
如斯廉价的背后,是V4-Pro在期间上的升。
参与惠的DeepSeek-V4-Pro,是DeepSeek于4月24日厚爱上线并开源的旗舰模子,分为Pro和Flash两个版块。
该系列全系原生维持1M token长高下文,选定全新着重力机制结DSA稀薄着重力,完结长高下文处治率的冲破——1M token场景下,V4-Pro单token理FLOPs仅为V3.2的27,KV Cache大小仅为V3.2的10,大幅镌汰贪图和显存需求。
其架构升还包含CSA+HCA混着重力机制、mHC流形经管邻接和Muon化器三项中枢鼎新,既强化残差邻接证实,也提高了不停速率。
DeepSeek-V4-Pro领有1.6T总参数、49B激活参数,在33万亿tokens上完成预测验,铁皮保温各项智力对标顶闭源模子。
联系人:何经理Agent智力是其凸起升向,在Agentic Coding评测中达到现时开源模子佳水平,使用体验于Sonnet 4.5,委派质地接近Opus 4.6非想考格局。宇宙学问测评中,它大幅先其他开源模子,仅稍逊于Gemini-Pro-3.1;理能上,在数学、STEM、竞赛型代码测评中,是越通盘已公开评测的开源模子,并列宇宙顶闭源模子。
另版块DeepSeek-V4-Flash为284B总参数、13B激活参数,在32万亿tokens上完成预测验,面向对资本和速率明锐的场景。比较V4-Pro,它的宇宙学问储备稍逊,但明智力接近;苟简Agent任务上两者旗饱读相配,难度任务仍有差距。
现在,DeepSeek API已同步上线V4-Pro和V4-Flash,维持OpenAI ChatCompletions接口与Anthropic接口,修改model参数即可调用。
需要着重的是,旧有模子名deepseek-chat与deepseek-reasoner将于7月24日住手使用,现时这两个模子名分辨对应V4-Flash的非想考格局与想考格局。
尽管价钱大幅下调,DeepSeek-V4-Pro仍受端算力完结,Pro版块做事费解十分有限。后续价钱能否跨越下调,仍需恭候下半年昇腾950节点批量上市。
开端:银河交易不雅察
相关词条:不锈钢保温施工 塑料管材生产线 钢绞线厂家 玻璃棉板 泡沫板橡塑板专用胶1.本网站以及本平台支持关于《新广告法》实施的“极限词“用语属“违词”的规定,并在网站的各个栏目、产品主图、详情页等描述中规避“违禁词”。
2.本店欢迎所有用户指出有“违禁词”“广告法”出现的地方,并积极配合修改。
3.凡用户访问本网页,均表示默认详情页的描述,不支持任何以极限化“违禁词”“广告法”为借口理由投诉违反《新广告法》,以此来变相勒索商家索要赔偿的违法恶意行为。


