学AI,先AI大模型专业术语开始打好基础
2026/6/19 11:34:12 网站建设 项目流程

对普通人来说,AI人工智能,仿佛太遥远了,又感觉就在眼前,现在咱们生活、工作中,到处都能听到某某某用AI提高工作效率,或者用AI做了一些作品,用AI做图做视频等等。

下面从AI基础概念,用大白话,讲讲诸如像深度学习、大模型、推理、训练、算力等多个方面的术语出发,让咱们一起来认识AI,了解AI。

一、AI基础

术语大白话解释生活/工作场景举例
AI(人工智能)让机器学着像人一样看东西、听声音、想事情、做决定。手机语音助手、人脸识别解锁、AI帮你写文章。
ML(机器学习)让机器自己去海量数据里找规律,不用咱们一行行写代码教它。刷短视频越刷越懂你、淘宝猜你喜欢、自动拦截垃圾邮件。
DL(深度学习)现在AI画画、聊天、认脸的主流技术,底层靠它支撑。GPT聊天、Stable Diffusion画画、手机刷脸支付。
AGI(通用人工智能)啥都会、跟真人一样聪明的AI(目前还没实现)。网上吹的“全能AI”,其实都是把几个单项功能拼凑起来的。
AIGC(生成式人工智能)AI自己原创内容。让AI写请假条、画头像、配音、剪短视频。
窄AI(弱AI)现在咱们用的AI全都是这种,只会干一件事。Siri只会听指令,Midjourney只会画画,电商客服只会回话。
模型(Model)训练好、能直接干活的AI程序。聊天的GPT-4、通义千问,画画的Midjourney。
参数(Params)AI脑子里的“脑细胞”数量。参数越多,懂的就越多,越聪明。7B就是70亿参数,GPT-4万亿参数,脑子特别大。
权重(Weight)AI在学东西时自己总结出来的经验,用来分清重点。分清一句话里的重点,或者认出照片里的人脸。
数据集(Dataset)喂给AI吃的“教材”。拿几百万篇维基百科教它认字,拿一堆照片教它认猫认狗。
预训练(PT)AI的“九年义务教育”,学完成了什么都懂一点的“基座模型”。拿全网海量资料教它常识、语法。
微调(FT)“岗前培训”,用专门资料教它,让它变成懂行的专家。拿医生、律师或者客服的资料教通用模型。
训练(Train)让AI不停地看数据、找规律,做错了就纠正,直到学会为止。用海量文本数据教大模型。
推理(Inference)咱们平时用AI的过程,问它问题它给答案。你问它问题,它给你答案;你给个词,它给你画张图。

二、神经网络与深度学习

术语大白话解释生活/工作场景举例
神经网络模仿人脑搭出来的计算网。手机相册自动把风景照分一类、人脸照分一类。
神经元网里最小的计算零件,负责接收和处理信息。海量神经元组合运算,让AI识别图片轮廓。
层(Layer)神经网络一层一层的,层数越多叫“深度”学习。一步步深入,能学的东西就越复杂。
CNN(卷积神经网络)“看图专家”。手机相册分类、小区摄像头抓人、医院看X光片找病灶。
RNN/LSTM早期的“文字和语音处理专家”,现在基本被淘汰了。早期机器翻译、语音识别。
Transformer现在所有厉害的聊天AI、多模态AI的底层架构。GPT系列、Qwen、Claude,能看懂长文上下文。
Encoder 编码器专门负责“阅读理解”。百度用它来做文章相似度匹配、情感分析。
Decoder 解码器专门负责“写作文”。GPT系列,主打陪你聊天、帮你写文案。
编解码架构既能看懂又能写。同声翻译软件、图文问答模型。


三、大语言模型LLM

术语大白话解释生活/工作场景举例
LLM(大语言模型)读了海量文章、脑子特别大的AI。GPT-4、文心一言、通义千问,能聊天、写东西、做算术。
LMM(多模态大模型)“多面手”,文字、图片、视频都能看懂和处理。GPT-4V、Sora视频模型。
Base Model 基座模型刚上完“九年义务教育”的AI,没经过专门培训。直接跟它聊天,它可能会胡言乱语。
Token 词元AI看文字的最小单位,用来算钱和算字数。一个汉字大概算1到2个Token。
上下文窗口AI的“短期记忆力”。8K窗口只能记住这么多字;128K能记住好几本书。
Embedding 嵌入向量把文字变成电脑能懂的一串数字,方便搜资料。企业私有知识库文本匹配。
Prompt 提示词你给AI下的指令,你怎么问,它就怎么答。输入问题让文心一言作答。
Zero-Shot 零样本啥例子都不给,直接让它干活。直接说“帮我写篇春天的作文”。
Few-Shot 少样本先给它打个样,它写得就准。给两首古诗,让它照着风格再写一首。
CoT(思维链)让AI“把解题步骤写出来”,不容易算错。做数学题时,让它一步步算。
RAG(检索增强生成)给AI配个“实时搜索引擎”,防瞎编。企业知识库问答、最新时政问答。
Agent 智能体“高级打工人”,能自己拆解任务、找工具、检查错误。GPTs、AutoGPT、企业自动化办公AI。
模型幻觉AI在“一本正经地胡说八道”。编造根本不存在的论文或者假数据。
Alignment 对齐教AI做个“好人”,说话符合规矩。不爆粗口、不教人干坏事。

四、模型微调与轻量化技术

术语大白话解释生活/工作场景举例
LoRA(低秩适配)给大模型做“微创手术”,只动一小部分参数。普通电脑也能调教出专属写作风格的AI。
QLoRALoRA升级版,配合压缩技术。用家里的普通游戏显卡就能调教大模型。
量化(Quantization)把大模型“压缩打包”,普通电脑也能跑得动。原来占100G的模型,压缩完只要20多G。
浮点精度/整型量化AI的“画质”。FP32是原画;INT4是标清,省空间。本地部署运行模型,适配端侧与家用显卡。
模型蒸馏“大模型带小徒弟”。让GPT-4教一个小模型,还能装进手机里。

五、推理优化与分布式训练

术语大白话解释生活/工作场景举例
KV Cache给AI加了个“草稿本”,回复特别快。连续多轮对话时,不用把前面的话重新算一遍。
PagedAttention显存管理技术,人多也不卡顿。企业AI服务高峰期同时承载上千用户对话。
DP/MP/TP/PP把大模型拆开来,分给一堆显卡一起算。加快训练速度,解决单卡显存不足问题。

六、模型训练细节与数据集

术语大白话解释生活/工作场景举例
训练集/验证集/测试集AI的“课本、模拟考卷和高考卷”。课本用来学,模拟卷调状态,高考卷测真实水平。
Epoch 轮次AI把课本从头到尾看了一遍。完整跑完一整份全部训练数据。
Batch 批次AI一次往脑子里塞多少题。单次送入模型进行计算的一组数据。
过拟合AI“死记硬背”了,换题就抓瞎。做原题全对,全新题型正确率极低。
欠拟合AI“没学进去”,啥都不会。课本上的题不会,新题更不会。
数据污染喂给AI的教材里有错别字或坏内容。导致模型输出异常、能力缺陷。

七、算力、硬件与评测指标

术语大白话解释生活/工作场景举例
GPU 图形处理器AI的“大脑”,最火的算力硬件。RTX 3090/4090、A100、H100。
VRAM 显存大脑的“工作记忆空间”。显存越大,能跑的模型就越大。
TPU / NPU专用AI芯片。谷歌云端AI训练;手机本地AI美颜、智能字幕。
TFLOPS衡量显卡算得快不快的单位。每秒万亿次浮点运算。
PPL(困惑度)测AI说话通不通顺的指标。分数越低,说话越像正常人。
MMLUAI界的“高考综合测试卷”。考它常识、逻辑、推理到底行不行。

需要专业的网站建设服务?

联系我们获取免费的网站建设咨询和方案报价,让我们帮助您实现业务目标

立即咨询