2026/7/5 8:32:34
网站建设
项目流程
一、基础概念层 名词 解析 GPT OpenAI 开发的生成式预训练 Transformer 系列大语言模型,是 LLM 领域的标杆产品。 RAG Retrieval-Augmented Generation,检索增强生成。通过外挂知识库检索来增强 LLM 回答的准确性和时效性,解决模型"幻觉"问题。 Agent(智能体) 能够自主感知环境、做出决策并执行动作的 AI 系统,可调用工具、规划任务、完成复杂目标。 多模态 能够同时处理和理解多种数据类型(文本、图像、音频、视频)的 AI 模型。 Sora OpenAI 发布的文本生成视频大模型,可生成长达 60 秒的高质量视频。 Prompt(提示工程) 通过精心设计的输入指令来引导大模型输出高质量结果的技术。 Function Calling 大模型识别用户意图后,自动调用外部 API/函数来完成特定任务的能力。 MCP 协议 Model Context Protocol,Anthropic 推出的开放标准协议,用于统一 AI 模型与外部数据源、工具的连接方式。
二、模型部署与推理层 名词 解析 vLLM 高性能 LLM 推理和服务框架,采用 PagedAttention 技术大幅提升 GPU 利用率。 SGLang 结构化生成语言框架,用于高效控制和引导大语言模型的输出结构。 PagedAttention vLLM 的核心技术,借鉴操作系统虚拟内存的页式管理,解决 KV Cache 显存碎片化问题。 华为昇腾 华为自研的 AI 处理器(Ascend)及配套软件栈,国产替代 NVIDIA GPU 的算力方案。 DeepSeek V4 DeepSeek 系列大模型的最新版本,以高性价比和强推理能力著称。 GPU 调度 对 GPU 计算资源进行分配和管理的技术,涉及显存管理、任务排队、负载均衡等。 显存管理 对 GPU 显存进行分配、回收和优化的技术,直接影响大模型推理的并发能力和成本。
三、训练与微调层 名词 解析 LoRA Low-Rank Adaptation,低秩适应。一种高效的模型微调方法,只训练少量低秩矩阵参数,大幅降低显存和计算开销。 QLoRA Quantized LoRA,在 LoRA 基础上引入 4-bit 量化,进一步降低微调所需的显存(可在消费级 GPU 上微调 65B 模型)。 蒸馏 Knowledge Distillation,知识蒸馏。将大模型(教师)的知识迁移到小模型(学生),实现模型压缩和加速。 YOLO You Only Look Once,经典实时目标检测算法,以速度快著称,广泛应用于工业质检、自动驾驶等场景。 Qwen-VL 阿里巴巴通义千问系列的多模态视觉-语言模型,能理解图像内容并进行图文对话。
四、开发框架与工具层 名词 解析 LangChain 最流行的 LLM 应用开发框架,提供链式调用、工具集成、记忆管理等模块化组件。 LlamaIndex 专注于数据索引和检索的 LLM 框架,擅长构建 RAG 系统和知识库问答。 AutoGen 微软开源的多 Agent 协作框架,支持多个 AI Agent 之间对话协作完成任务。 HuggingFace 全球最大的开源 AI 社区和平台,提供模型仓库、数据集、Transformers 库等基础设施。 Coze 字节跳动推出的 AI Bot 开发平台,支持低代码方式快速搭建智能体应用。 Dify 开源的 LLM 应用开发平台,支持可视化编排、RAG、Agent、工作流等功能。 Claude Code Anthropic 推出的 AI 编程助手,基于 Claude 模型,可理解代码库并协助开发。 RocketMQ 阿里巴巴开源的分布式消息队列,用于系统解耦、异步通信和流量削峰。
五、项目实战相关名词 名词 解析 OpenManus 开源的通用 AI Agent 框架,支持自主规划、工具调用和多步骤任务执行。 HermesAgent 课程自研的多 Agent 协作系统,强调长期记忆、自进化和主从调度能力。 LLMWiki 基于 LLM 的自进化知识库系统,融合结构化数据、双向链接和版本控制。 向量数据库 专门存储和检索高维向量(文本/图像的嵌入表示)的数据库,是 RAG 的核心基础设施。 混合检索 结合向量检索(语义匹配)和关键词检索(精确匹配)的复合搜索策略,提升 RAG 效果。 Spec Coding Specification-driven Coding,基于规格说明的编码范式,AI 根据详细需求文档生成代码。 心跳唤醒 分布式系统中定时发送心跳信号检测存活状态的机制,此处用于 Agent 的自主调度和状态管理。 4层颗粒度记忆 课程设计的分层记忆架构,可能包括:对话级、会话级、用户级、全局知识级等不同时间跨度的记忆。
六、其他 名词 解析 Git 版本控制 分布式版本控制系统,用于代码和文档的变更追踪、协作开发和回滚管理。 双向链接 笔记/知识管理中的链接方式,不仅 A→B,B 也能自动感知被 A 引用,形成知识网络。