【HCIA- AI(正课)】7.1 业界大模型及应用
2026/7/2 12:59:21 网站建设 项目流程












  • 课程内容安排与 langchain 介绍

    • 课程时间限制:langchain 内容丰富,可讲多节课,但 IA 课程 PPT 仅一页带过,虽实用性强,但时间有限。
    • 后续内容规划:介绍业内模型及应用,最后部分约十来页 PPT,旨在让学员大致了解,并非要求做相关应用或变现。
  • 开源大模型介绍

    • 模型分类与路线
      • 大模型分类:大语言模型是早期最火的,还有世界模型、多模态模型。
      • 发展路线:开源大模型早期有仅 Encoder、Encoder 和 Decoder、Decoder 三种发展路线,代表模型有仅 Decoder 的 GPT 系列、Llama 等。
  • 具体模型介绍

    • Llama 模型:从早期 7B 发展到现在 65B,版本众多。

    • ChatGLM 模型:国内外皆有,如 ChatGLM 6B,压缩后显存仅需 3.2B,但考试答题仍按 PPT 写 6GB。

    • Matro 模型:核心早期为 7B,有 8 组前馈参数,即 8 组网络中有两组专家模型(MOE),可针对特定行业快速激活参数,增加参数量同时控制成本和延时。

    • 相关社区与模型应用

      • Hugging Face 社区:可找到 Hugging Chat 模型直接部署。
      • 其他模型应用:Stable Diffusion 文生图模型应用广泛,IE 考试涉及的 Open Sora 模型用于视频生成,目前时长较短、速度较慢,考试时因华为本地服务器速度稍快。
  • 闭源大模型介绍

    • 知名闭源模型
      • GPT 系列:OpenAI 开发,已到 GPT 5,GPT 3 做了有监督微调、强化模型训练。
      • Sora 模型:可生成 60 秒短视频,闭源收费,具有多样性、扩展性强等优势,支持图生视频、文生视频。
      • Gemini 模型:谷歌大模型,在国外应用较多,1.5 版本采用 MOE 技术,早期在上下文长度竞争中表现突出。
    • 国内厂商模型:阿里、科大讯飞等厂商都有大模型,如豆包、星火讯飞等,其中星火讯飞输出格式较好,受学生欢迎。
    • 华为盘古大模型
  • 模型特点与应用范围:只针对 B 端,如政务、气象等领域,个人无法使用。

  • 模型层级:分为通用模型(如科学、自然语言、多模态大模型)、行业模型(如矿山、政务、气象大模型)和场景,即 5 + N + P 模式。

  • 应用案例:包括政务知识检索、游戏开发、智慧城市、行业助手等,还有盘古药物分子大模型、气象大模型,气象大模型速度比传统数值快 1 万倍以上。

    • 工业应用:在智能制造领域应用较早,可进行实时技术监控、控煤自动监测等,相关应用有对应网址,可查看授课课件获取。
    • 相关课程:华为推出鸿蒙 + 小艺 + agent 课程,可直接接入微信等,效果更好。
  • 课程总结与考题解答

    • 考题解答
      • MOE 技术优势:采用 MOE 技术可在规模增大时,只激活部分参数,使推理速度快且准确度高。
      • 微调重要性:大模型需预训练、有监督微调、奖励模型和强化学习,若不微调,输出信息可能错误或不符合人类需求,所以微调很重要。

需要专业的网站建设服务?

联系我们获取免费的网站建设咨询和方案报价,让我们帮助您实现业务目标

立即咨询