LLM
LLM
DeepSeek 入门指导手册——从入门到精通
DeepSeek 是由杭州深度求索人工智能基础技术研究有限公司精心打造的一款大型语言模型(LLM)。该模型集自然语言处理(NLP)、计算机视觉(CV)、强化学习(RL)以及多模态融合技术等核心功能于一体。
DeepSeek 系列模型详解之 DeepSeek LLM
DeepSeek LLM使用的是高效且轻量级的训练框架HAI-LLM。该框架集成了数据并行、张量并行
16    2025-02-13
关于战略人工智能的深度综述
在本文中,我们将定义战略性人工智能,探讨它是什么,以及自1997年IBM的深蓝击败卡斯帕罗夫以来,它
十个最关键的LLM漏洞
全球开放应用安全项目组发布了大语言模型应用中的十大关键安全漏洞,揭示了提示注入、训练数据投毒、模型盗
26    2024-10-16
提升LLM结果:何时使用知识图谱RAG
简而言之,知识图谱与向量存储相结合,可以提供一种方法来直接连接在向量空间中可能不接近或不相似,因此在
34    2024-10-07
最新文献综述:LLM可控文本生成
本文将给出一份详尽的指南,介绍如何管理和指导大型语言模型(LLM)进行文本生成的各类技术和方法,着重于理论支撑与实践操作。
揭开神秘面纱:深入了解语音识别算法
本文将探索使语音识别成为可能的机制,了解日益普及的用于应用人工智能的语音用户界面(VUI)可能带来的优势。
Meta SAM 2:令人印象深刻的对象分割模型
Meta公司已经发布了模型权重、代码和用于训练它的数据集,这将对研究和开发社区非常有用。以下是SAM
如何为软件工程优化ChatGPT和其他大模型
本文解读了一份最新研究成果,提供了一些有关软件工程师如何在软件工程中使用ChatGPT的任务类型、以
通过多样本学习加速LLM应用开发
本文通过将持续样本ICL与RAG比较,讨论了具有长上下文LLM的ICL,如何帮助产品团队创建原型和完