学AI，先AI大模型专业术语开始打好基础-酒店常州论坛 - Powered by Discuz!

学AI，先AI大模型专业术语开始打好基础

2026/6/19 11:34:12 网站建设项目流程

对普通人来说，AI人工智能，仿佛太遥远了，又感觉就在眼前，现在咱们生活、工作中，到处都能听到某某某用AI提高工作效率，或者用AI做了一些作品，用AI做图做视频等等。

下面从AI基础概念，用大白话，讲讲诸如像深度学习、大模型、推理、训练、算力等多个方面的术语出发，让咱们一起来认识AI，了解AI。

一、AI基础

术语	大白话解释	生活/工作场景举例
AI（人工智能）	让机器学着像人一样看东西、听声音、想事情、做决定。	手机语音助手、人脸识别解锁、AI帮你写文章。
ML（机器学习）	让机器自己去海量数据里找规律，不用咱们一行行写代码教它。	刷短视频越刷越懂你、淘宝猜你喜欢、自动拦截垃圾邮件。
DL（深度学习）	现在AI画画、聊天、认脸的主流技术，底层靠它支撑。	GPT聊天、Stable Diffusion画画、手机刷脸支付。
AGI（通用人工智能）	啥都会、跟真人一样聪明的AI（目前还没实现）。	网上吹的“全能AI”，其实都是把几个单项功能拼凑起来的。
AIGC（生成式人工智能）	AI自己原创内容。	让AI写请假条、画头像、配音、剪短视频。
窄AI（弱AI）	现在咱们用的AI全都是这种，只会干一件事。	Siri只会听指令，Midjourney只会画画，电商客服只会回话。
模型（Model）	训练好、能直接干活的AI程序。	聊天的GPT-4、通义千问，画画的Midjourney。
参数（Params）	AI脑子里的“脑细胞”数量。参数越多，懂的就越多，越聪明。	7B就是70亿参数，GPT-4万亿参数，脑子特别大。
权重（Weight）	AI在学东西时自己总结出来的经验，用来分清重点。	分清一句话里的重点，或者认出照片里的人脸。
数据集（Dataset）	喂给AI吃的“教材”。	拿几百万篇维基百科教它认字，拿一堆照片教它认猫认狗。
预训练（PT）	AI的“九年义务教育”，学完成了什么都懂一点的“基座模型”。	拿全网海量资料教它常识、语法。
微调（FT）	“岗前培训”，用专门资料教它，让它变成懂行的专家。	拿医生、律师或者客服的资料教通用模型。
训练（Train）	让AI不停地看数据、找规律，做错了就纠正，直到学会为止。	用海量文本数据教大模型。
推理（Inference）	咱们平时用AI的过程，问它问题它给答案。	你问它问题，它给你答案；你给个词，它给你画张图。

二、神经网络与深度学习

术语	大白话解释	生活/工作场景举例
神经网络	模仿人脑搭出来的计算网。	手机相册自动把风景照分一类、人脸照分一类。
神经元	网里最小的计算零件，负责接收和处理信息。	海量神经元组合运算，让AI识别图片轮廓。
层（Layer）	神经网络一层一层的，层数越多叫“深度”学习。	一步步深入，能学的东西就越复杂。
CNN（卷积神经网络）	“看图专家”。	手机相册分类、小区摄像头抓人、医院看X光片找病灶。
RNN/LSTM	早期的“文字和语音处理专家”，现在基本被淘汰了。	早期机器翻译、语音识别。
Transformer	现在所有厉害的聊天AI、多模态AI的底层架构。	GPT系列、Qwen、Claude，能看懂长文上下文。
Encoder 编码器	专门负责“阅读理解”。	百度用它来做文章相似度匹配、情感分析。
Decoder 解码器	专门负责“写作文”。	GPT系列，主打陪你聊天、帮你写文案。
编解码架构	既能看懂又能写。	同声翻译软件、图文问答模型。

三、大语言模型LLM

术语	大白话解释	生活/工作场景举例
LLM（大语言模型）	读了海量文章、脑子特别大的AI。	GPT-4、文心一言、通义千问，能聊天、写东西、做算术。
LMM（多模态大模型）	“多面手”，文字、图片、视频都能看懂和处理。	GPT-4V、Sora视频模型。
Base Model 基座模型	刚上完“九年义务教育”的AI，没经过专门培训。	直接跟它聊天，它可能会胡言乱语。
Token 词元	AI看文字的最小单位，用来算钱和算字数。	一个汉字大概算1到2个Token。
上下文窗口	AI的“短期记忆力”。	8K窗口只能记住这么多字；128K能记住好几本书。
Embedding 嵌入向量	把文字变成电脑能懂的一串数字，方便搜资料。	企业私有知识库文本匹配。
Prompt 提示词	你给AI下的指令，你怎么问，它就怎么答。	输入问题让文心一言作答。
Zero-Shot 零样本	啥例子都不给，直接让它干活。	直接说“帮我写篇春天的作文”。
Few-Shot 少样本	先给它打个样，它写得就准。	给两首古诗，让它照着风格再写一首。
CoT（思维链）	让AI“把解题步骤写出来”，不容易算错。	做数学题时，让它一步步算。
RAG（检索增强生成）	给AI配个“实时搜索引擎”，防瞎编。	企业知识库问答、最新时政问答。
Agent 智能体	“高级打工人”，能自己拆解任务、找工具、检查错误。	GPTs、AutoGPT、企业自动化办公AI。
模型幻觉	AI在“一本正经地胡说八道”。	编造根本不存在的论文或者假数据。
Alignment 对齐	教AI做个“好人”，说话符合规矩。	不爆粗口、不教人干坏事。

四、模型微调与轻量化技术

术语	大白话解释	生活/工作场景举例
LoRA（低秩适配）	给大模型做“微创手术”，只动一小部分参数。	普通电脑也能调教出专属写作风格的AI。
QLoRA	LoRA升级版，配合压缩技术。	用家里的普通游戏显卡就能调教大模型。
量化（Quantization）	把大模型“压缩打包”，普通电脑也能跑得动。	原来占100G的模型，压缩完只要20多G。
浮点精度/整型量化	AI的“画质”。FP32是原画；INT4是标清，省空间。	本地部署运行模型，适配端侧与家用显卡。
模型蒸馏	“大模型带小徒弟”。	让GPT-4教一个小模型，还能装进手机里。

五、推理优化与分布式训练

术语	大白话解释	生活/工作场景举例
KV Cache	给AI加了个“草稿本”，回复特别快。	连续多轮对话时，不用把前面的话重新算一遍。
PagedAttention	显存管理技术，人多也不卡顿。	企业AI服务高峰期同时承载上千用户对话。
DP/MP/TP/PP	把大模型拆开来，分给一堆显卡一起算。	加快训练速度，解决单卡显存不足问题。

六、模型训练细节与数据集

术语	大白话解释	生活/工作场景举例
训练集/验证集/测试集	AI的“课本、模拟考卷和高考卷”。	课本用来学，模拟卷调状态，高考卷测真实水平。
Epoch 轮次	AI把课本从头到尾看了一遍。	完整跑完一整份全部训练数据。
Batch 批次	AI一次往脑子里塞多少题。	单次送入模型进行计算的一组数据。
过拟合	AI“死记硬背”了，换题就抓瞎。	做原题全对，全新题型正确率极低。
欠拟合	AI“没学进去”，啥都不会。	课本上的题不会，新题更不会。
数据污染	喂给AI的教材里有错别字或坏内容。	导致模型输出异常、能力缺陷。

七、算力、硬件与评测指标

术语	大白话解释	生活/工作场景举例
GPU 图形处理器	AI的“大脑”，最火的算力硬件。	RTX 3090/4090、A100、H100。
VRAM 显存	大脑的“工作记忆空间”。	显存越大，能跑的模型就越大。
TPU / NPU	专用AI芯片。	谷歌云端AI训练；手机本地AI美颜、智能字幕。
TFLOPS	衡量显卡算得快不快的单位。	每秒万亿次浮点运算。
PPL（困惑度）	测AI说话通不通顺的指标。	分数越低，说话越像正常人。
MMLU	AI界的“高考综合测试卷”。	考它常识、逻辑、推理到底行不行。

标签：网站建设企业官网项目流程 UI设计前端开发

需要专业的网站建设服务？

联系我们获取免费的网站建设咨询和方案报价，让我们帮助您实现业务目标