毕业三年,自学大模型到就业,我用了9个月。
先给大家分享一下我转行的经历:
17年毕业,垃圾专科,通信专业。
当初选择这个专业是因为有一个校企合作,承诺学生毕业之后给学生安排就业,在学校里面混了三年之后,学校也是履行了当初安排就业的承诺,给我“发配”到了上海,在上海工作两年,每天的工作基本就是坐着地铁跑整个上海的机房,给发生故障的服务器换硬盘,完全没有技术性可言,在上海混了两年几乎什么都没有学到,用我朋友的话说这样的工作“栓条狗都可以”。
当时想的是如果一直这样下去这辈子就废掉了, 在网上了解之后,都说互联网行业有发展前景,加上自己对计算机这方面也是比较感兴趣的,于是决定转行学习编程做程序员。
选择了市场需求最高大模型开始学习。
最开始的时候是在淘宝上面花了几块钱买了一套培训的教程,利用工作之余每天下班回家看,前面学习语法的时候感觉还挺简单的,可是学着学着就会遇到很多问题,自己根本就没办法解决,去百度查的答案自己还看不懂,
加上感觉学习没有方向,学的这些内容能做什么都不清楚,一度让我产生了放弃的想法。
后面的时候我就把我遇到的这些问题去知乎上面提问,想知道大家在学习大模型的时候是不是也都这样,还是说我不太适合学习编程。结果发现大部分的人都遇到了和我一样的问题。
他们说应该多去加一些交流群,在群里跟大家一起交流学习,探讨一些问题,然后我就加了很多的大模型交流群。
不过加了很多都是一些培训机构的推广群,那些客服就整天无脑的推销让我买课,但是有个群是非常活跃的,里面都是一些探讨学习的问题和交流找工作的经验的。
这个群每天都在讨论大模型问题,好多已经工作的大佬,每天不忙的时候在群里解答问题。也有很多正在学习的人每天交流学习心得。气氛是非常好的,大家可以在群里一起监督学习。
我能坚持学完,成功转行都离不开这个群。自己摸索真的太难了,遇到问题有大佬指点,自己琢磨可能要琢磨几个小时,大佬几分钟就给我讲清楚了,也是让我少走了很多弯路。
在我的老家吉林,工资不高,只有5.5k,我是比较满意的。
因为东北这边互联网行业发展不好,薪资本来就不高,实习工作拿到这些也还是可以的。
而且作为一个刚自学完,对于找工作一脸懵逼的状态,能省去网上海投简历,直接进去公司面试我觉得已经非常好了。
这份工作大概做了两个月之后之后感觉还是应该趁着年轻去大城市发展一下,多学一些前沿的技术,挑战一些高薪,打算去北京发展一下,离家也不算很远。
来到北京之后发现北京做互联网的薪资和老家那边真是天翻地覆,北京这边的工作基本都是10k起步的。
在北京找到的第一份工作也是现在正在做的工作是做 AI 大模型应用开发的,小公司,开始的时候是 13k *13。
经过一年的技术沉淀,也积累的一定的工作经验,外加在工作期间看了很多技术提升的书籍,打算换一家大点公司。都说 AI 从业者的高薪是跳出来的,我也要跳出去看看。
现在经常会在网上看到说 AI 大模型行业专科找不到工作,不是科班、不是算法专业找不到工作之类的话。作为已经成功转行大模型的我,现在明白了一个道理:
那些顺利转行成功的,不会去网上说自己转行有多么容易;
但是那些转行不成功的,就会到网上宣传行业饱和了,专科找不到工作。
现在学的人确实越来越多了,但是学的好,达到公司招聘标准的却没有几个。
这是一个技术行业,最终能不能找到工作,找到什么样的工作主要还是看技术学的怎么样,学历,专业对口只是一个人的加分项,如果不是进大公司,只是选择一些中小公司的话,公司主要看重的还是这个人的实际业务能力。
然后分享一下 AI 大模型学习方法:
①切记不要开始就只看书,这样比较容易放弃。
AI 相关书籍理论性极强、内容抽象晦涩,对于零基础的小白非常不友好,纯看书学习很容易越学越迷茫,甚至直接放弃。
②找一套完整系统的教程
学习的内容不能过于陈旧,有人学习还在看多年前的视频,死磕老旧机器学习框架、过时深度学习版本、淘汰的传统 AI 算法,这些早已不符合企业实际用人需求,无法满足大模型相关岗位的招聘标准,面试时很难跟上面试官的考察方向,最终难以找到对口工作。要找一套最新且系统的大模型学习教程去学习。
③学习的过程中不要 “钻牛角尖”
遇到复杂理论、代码 bug 不要死磕,浪费时间不说,还会产生强烈的学习挫败感。遇到这种情况可以适当休息,或者跳过当前知识点先学后续内容再回头回顾,或者找人请教,问题很快就能解决。
④沟通,交流,拒绝 “闭门造车”
多看 AI 技术社区、行业博主的学习经历与经验,多加一些大模型交流群互相分享学习心得,最终找到最适合自己的学习方式。遇到问题可以去问搜索引擎,或者在技术交流群提问,不要怕没人回答,自己梳理问题的过程中往往就能找到答案。
⑤学以致用,多练多敲
学 AI 大模型就像是学编程一样,不是看懂理论、跑通示例代码就算学会了。一个模型知识点、算法原理有多种应用场景,要把不同场景的实践都做通,这个知识点才算是真正掌握,不然就会陷入 AI 学习最常见的问题:能看懂模型原理,自己动手做项目就无从下手。
⑥保持高效的学习状态
短时间内看不到学习效果,很容易产生自我怀疑,进而失去学习动力。无论是看视频还是看书,要学会调节自己,累了就休息,千万不要采用高强度透支式的学习方式。
⑦看书巩固学习
学过一段时间后,回头精读 AI 大模型、深度学习经典书籍,系统梳理知识点,巩固效果会非常好。
⑧记笔记 + 常复习
“温故而知新”,记笔记不是单纯抄录重点,对于每个 AI 知识点一定要有自己的思考与理解,再用自己的话把理解和总结整理出来,才能真正内化知识。
⑨积累项目经验
可以去 AI 开源平台找实战项目,比如Hugging Face、魔搭 ModelScope、GitHub这类平台。边做项目边查资料,千万别照着源码照搬,一定要独立思考实现,锻炼自己的模型应用能力、代码逻辑思维和工程落地能力。
⑩有人带,高效学习,少走弯路
如果只靠自己摸索,学习效率极低,没有明确的学习方向,不知道所学知识能落地到什么业务场景。遇到模型训练、部署问题也得不到及时解答,网上搜索的答案杂乱不精准,白白浪费时间。
而且靠自学视频成功入职 AI 大模型岗位的难度极大,不是每个人都能无师自通。真正的 AI 工程化经验,是和行业大佬交流学到的实战技巧,而非看视频学死板的理论知识点。我们学习大模型技术不是为了应付考试,而是用 AI 技术落地实际产品、解决业务问题。
最后总结我的学习转行经历送给大家几句话:
1、趁着年轻一定要多学习,千万不要混日子,不然等你上了年纪想转行进入 AI 行业、改变自己的时候,就没有足够的精力去钻研新技术了。
2、转行学习 AI 大模型最好有人指导,自己闭门造车根本行不通。现在入行 AI 的人越来越多,半吊子水平的从业者比比皆是,企业的招人标准水涨船高,经济允许的情况下,花钱找专业老师指导非常有必要。
3、对于专科学历的同学,虽然学历也能找到 AI 相关基础岗位,但后续职业晋升、大厂面试会有明显限制,就算顺利入职,也建议尽早提升学历。
4、进入 AI 互联网行业后更需要持续学习,AI 技术迭代速度远超传统 IT 行业,不能 35 岁还在做 25 岁的基础 AI 执行工作,这样的话公司不淘汰你淘汰谁呢?
AI 大模型学习路线:
(一)AI 大模型前置核心基础(Python + 数学 + 计算机基础)
编程基础
Python 开发环境安装配置:Anaconda、PyTorch/TensorFlow 环境搭建,基础 Python 脚本编写Python
核心语法:变量、数据类型、条件 / 循环逻辑、函数、模块与包、文件 IOPython
数据处理库:NumPy 数值计算、Pandas 数据清洗、Matplotlib/Seaborn 数据可视化
数学基础
线性代数:矩阵运算、向量、特征值 / 特征向量、张量基础
概率论与数理统计:概率分布、期望方差、极大似然估计、贝叶斯定理
高等数学基础:导数、梯度、偏微分、极值优化(适配模型训练)
计算机基础
Linux 基础命令:服务器操作、文件管理、环境部署
计算机网络基础:HTTP/HTTPS、API 接口、网络通信原理
数据结构与算法:列表、哈希表、树结构、基础排序算法
(二)机器学习核心基础
传统机器学习算法
监督学习:线性回归、逻辑回归、决策树、随机森林、SVM、K 近邻
无监督学习:K-Means 聚类、PCA 降维、关联规则
半监督 / 强化学习基础概念
机器学习工程实践
数据集处理:数据采集、清洗、归一化、特征工程
模型评估:准确率、精确率、召回率、F1 值、ROC 曲线
交叉验证、过拟合与欠拟合解决、正则化应用
(三)深度学习核心原理
深度学习基础框架
PyTorch 实战(主流首选):张量操作、自动求导、模型搭建、训练流程
TensorFlow/Keras 基础:计算图、模型封装、训练推理
深度学习基础组件:全连接层、激活函数、损失函数、优化器(SGD、Adam)
经典深度学习网络
卷积神经网络 CNN:图像分类、目标检测基础、经典网络(ResNet、VGG)
循环神经网络 RNN/LSTM/GRU:序列数据处理、NLP 基础
注意力机制基础:Transformer 前身核心原理
(四)大模型底层原理与基础架构
Transformer 核心架构
Encoder-Decoder 结构、自注意力机制、多头注意力、位置编码
GPT 系列(Decoder-only)、BERT 系列(Encoder-only)架构差异
大模型基础术语:参数量、上下文窗口、预训练、微调、Prompt
大模型预训练基础
预训练数据构建、文本预处理(分词器 Tokenizer)
无监督预训练任务:因果语言模型、掩码语言模型
大模型训练基础流程:分布式训练、混合精度训练
(五)大模型微调、部署与推理优化
大模型微调技术
全量微调、参数高效微调 PEFT:LoRA、QLoRA、Prefix Tuning
指令微调 SFT、偏好对齐 RLHF/DPO
微调数据集构建、微调框架实战(Transformers、PEFT 库)
大模型推理与部署
本地部署:CPU/GPU 部署、量化推理(INT4/INT8)
服务化部署:FastAPI 封装 API、Docker 容器化、云端部署
推理优化:模型剪枝、蒸馏、批量推理、加速框架(vLLM、TensorRT)
开源大模型实战
主流开源大模型应用:Llama 2、Qwen、ChatGLM、Baichuan
模型调用、对话系统搭建、多轮对话逻辑实现
(六)大模型应用开发与工程实践
RAG 检索增强生成
向量数据库:Chroma、Milvus、FAISS
文档切分、向量化、检索召回、RAG 全流程搭建
企业知识库问答系统实战
AI 应用开发
大模型 + 工具调用:Function Calling、智能体 Agent 基础
多模态大模型:图文理解、文生图 / 文生视频基础应用
低代码 / 无代码 AI 应用搭建、行业场景适配(客服、文案、数据分析)
(七)大模型进阶技术与行业落地
多模态大模型
图文多模态原理、多模态微调、多模态对话系统
文生图模型(Stable Diffusion、Midjourney 原理)、AIGC 应用
行业垂直大模型
垂类数据微调、领域知识库构建、垂直场景落地(教育、金融、电商、医疗)
大模型安全对齐、幻觉解决、内容合规优化
(八)AI 工程化工具与项目管理
版本与环境管理
Conda/Pip 环境管理、Poetry 依赖管理
Git/GitHub:代码版本控制、分支管理、开源项目协作
AI 工程化工具
DVC 数据版本管理、MLflow 模型实验跟踪
大模型训练日志监控、模型评估与迭代优化
学AI大模型的正确顺序,千万不要搞错了
🤔2026年AI风口已来!各行各业的AI渗透肉眼可见,超多公司要么转型做AI相关产品,要么高薪挖AI技术人才,机遇直接摆在眼前!
有往AI方向发展,或者本身有后端编程基础的朋友,直接冲AI大模型应用开发转岗超合适!
就算暂时不打算转岗,了解大模型、RAG、Prompt、Agent这些热门概念,能上手做简单项目,也绝对是求职加分王🔋
📝给大家整理了超全最新的AI大模型应用开发学习清单和资料,手把手帮你快速入门!👇👇
学习路线:
✅大模型基础认知—大模型核心原理、发展历程、主流模型(GPT、文心一言等)特点解析
✅核心技术模块—RAG检索增强生成、Prompt工程实战、Agent智能体开发逻辑
✅开发基础能力—Python进阶、API接口调用、大模型开发框架(LangChain等)实操
✅应用场景开发—智能问答系统、企业知识库、AIGC内容生成工具、行业定制化大模型应用
✅项目落地流程—需求拆解、技术选型、模型调优、测试上线、运维迭代
✅面试求职冲刺—岗位JD解析、简历AI项目包装、高频面试题汇总、模拟面经
以上6大模块,看似清晰好上手,实则每个部分都有扎实的核心内容需要吃透!
我把大模型的学习全流程已经整理📚好了!抓住AI时代风口,轻松解锁职业新可能,希望大家都能把握机遇,实现薪资/职业跃迁~