DeepSeek
DeepSeek
32B逆袭671BDeepSeek R1!阿里推理模型炸翻了:小到笔记本就能run,成本仅1/10!又是强化学习带来惊喜!
昨天看外媒的报道说,R1带火了消费级显卡,新款游戏芯片RTX 5090被黄牛炒到150%。这是因为DeepSeek的模型不再需要高端AI芯片,普通消费级产品就能满足运行需求。那么QwQ-32B这波震撼之余,可能带货的就是M4 Max的苹果电脑了。
从DeepSeek看IT行业的未来:如何通过智能搜索技术提升企业竞争力
2025年,中国AI企业DeepSeek凭借其开源大模型DeepSeek-R1的横空出世,在全球AI
大模型系列:DeepSeek大模型与应用场景介绍
DeepSeek 的模型家族以其卓越的性能和广泛的应用场景,展现出了强大的实力和潜力。从强大的推理能力到多模态的融合,从日常对话的贴心陪伴到专业领域的高效助力,DeepSeek 的模型正逐渐改变着我们的生活和工作方式。
视觉强化微调!DeepSeek R1技术成功迁移到多模态领域,全面开源
今天给大家重磅推荐一个突破性的视觉强化微调开源项目 —— Visual-RFT (Visual Reinforcement Fine-Tuning)。
大模型是一场新的搜索战争,OpenAI不会赢家通吃,一家最好被收购!硅谷知名投资人曝料特朗普希望马斯克更积极裁撤美政府预算
最近DeepSeek开源周带来了很多惊喜与热议。但小编发现大家对于马斯克的Grok3的讨论却远远不够
32    2025-03-03
云厂商接入DeepSeek,会放弃自研吗?
云厂商纷纷宣布接入DeepSeek系列模型。目前,阿里云、腾讯云、百度智能云、华为云、京东云等主流云
27    2025-03-03
被DeepSeek带火的知识蒸馏详解!
知识蒸馏是一种模型压缩技术,通过训练一个小而高效的学生模型来模仿一个预训练的大且复杂的教师模型(或一
24    2025-02-27
DeepSeek 总崩溃?如何快速使用满血版DeepSeek!!
DeepSeek 太火了,我们在使用的过程中,是不是经常遇到服务器繁忙的情况。
33    2025-02-27
“源神”DeepSeek!突破H800性能上限,FlashMLA重磅开源,算力成本还能降
MLA,正是DeepSeek提出的创新注意力架构。从V2开始,MLA使得DeepSeek在系列模型中
24    2025-02-24
DeepSeek 入门指导手册——从入门到精通
DeepSeek 是由杭州深度求索人工智能基础技术研究有限公司精心打造的一款大型语言模型(LLM)。该模型集自然语言处理(NLP)、计算机视觉(CV)、强化学习(RL)以及多模态融合技术等核心功能于一体。