主办单位: | 泰迪杯数据挖掘挑战赛组织委员会 |
协办单位: | 广东省工业与应用数学学会 |
人民邮电出版社有限公司 | |
北京泰迪云智信息技术研究院 | |
华南师范大学人工智能机器人教育产业学院(广东省示范性产业学院) | |
承办单位: | 广东泰迪智能科技股份有限公司 |
随着数字经济的快速发展,社会对数字人才的需求与日俱增。为贯彻落实党中央、国务院关于发展数字经济的决策部署,发展数字人才支撑数字经济的基础性作用,加快推动形成新质生产力,为高质量发展赋能蓄力,数字人才培育成为当务之急。根据《加快数字人才培育支撑数字经济发展行动方案(2024-2026年)》通知,“泰迪杯”数据挖掘挑战赛组织委员会将举办全国数字人才技能提升师资研修班,旨在提升高校教师在大数据、人工智能、大模型等领域的专业知识和技能,以更好地支持数字经济的发展。定于2024年7月18日至8月3日开展2024年第二期全国数字人才技能提升师资研修班,活动将覆盖六个线上专题,涵盖了数字技术核心领域的最新进展和应用实践,具体安排如下,期待您的参与。
一、 培训组织
主办单位:泰迪杯数据挖掘挑战赛组织委员会
协办单位:广东省工业与应用数学学会
人民邮电出版社有限公司
北京泰迪云智信息技术研究院
华南师范大学人工智能机器人教育产业学院(广东省示范性产业学院)
承办单位:广东泰迪智能科技股份有限公司
二、课程安排
本次培训分为线下和线上两种班型,详细课程内容见文件末附件课程大纲。
1 线下班(广州&青岛&北京)
混合模式,技能学习课程放置在线上云课堂以便学员系统学习,核心案例实战采用线下形式由讲师亲授同步操作演练。
线下广州班 AIGC技术与大模型应用开发实战
基本信息 | 技能学习(线上云课堂) | 现场案例实战,7.19 - 7.23 |
时间:7月18日 - 23日 线下报到时间:7月18日 地点:广州 学时:共计56学时 证书:CBDA大模型应用工程师 费用:3980元/人 学习环境要求:Windows10或以上操作系统(64位),8G+内存 专题特色:从大模型工具使用到应用开发、从全新的提示工程到大模型对各行业的应用赋能、从RAG到AI Agent开发,带你掌握大模型时代全面的实战技能。 |
|
|
线下青岛班 人工智能技术与应用实战
基本信息 | 技能学习(线上云课堂),7.19 - 7.22 | 现场案例实战,7.24 - 7.28 |
时间:7月19日 - 28日 线下报到时间:7月23日 地点:青岛 学时:共计80学时 证书:高级人工智能应用工程师职业技术证书 费用:3980元/人 学习环境要求:Windows10或以上操作系统(64位),8G+内存 专题特色:贯穿机器学习与深度学习的核心内容,深度探索计算机视觉和自然语言处理任务,全面剖析深度学习原理,并结合实际项目进行教学实践。 |
(1) ChatGPT教学应用 (2) 金牌助手ChatGPT,让应用开发更高效 (3) 大模型(ChatGLM)产业应用漫步与畅想 |
|
线下北京班 大模型微调与私有化部署实战
基本信息 | 技能学习(线上云课堂),7.26 - 7.28 | 现场案例实战,7.30 - 8.3 |
时间:7月26日 - 8月3日 线下报到时间:7月29日 地点:北京 学时:共计72学时 证书:CBDA大模型应用工程师 费用:3980元/人 学习环境要求:Windows10或以上操作系统(64位),8G+内存 专题特色:从基础神经网络到Transformer、从传统机器学习到预训练和微调,彻底讲清楚大模型的工作原理与机制;手把手带你在本地部署属于自己的大模型。 |
|
|
2 线上班
本次培训教学视频六个月有效期可反复观看学习,同步提供配套资源,线上学习无需脱产,可灵活安排时间。
专题一 AIGC技术与应用实战
基本信息 | 技能学习 | 案例实战 | ||
时间:7月20日 - 30日 学时:共计88学时 证书:CBDA大模型应用工程师 费用:1980元/人 【专题特色:紧贴大模型前沿应用、切实提升工作效率、全程无代码、真正零门槛学习最新技术】 | 1、大模型与AIGC概述 2、提示工程 3、AIGC的教学应用 4、大模型其他教育应用 5、AIGC生产力提升 6、大模型辅助金融数据分析 7、基于大模型的图像生成艺术 | 1、大模型赋能科研 2、RAG应用:构建一个答疑小助手 3、Agent应用:构建一个私人助理 4、基于大模型的小红书文案写作(拓展) |
专题二 大模型应用开发实战(LangChain)
基本信息 | 技能学习 | 案例实战 |
时间:2024年7月20日 - 7月29日 学时:共计80学时 证书:CBDA大模型应用工程师 费用:1980元/人 学习环境要求:Windows10或以上操作系统(64位),8G+内存 【专题特色:从大模型工具的基本使用开始,逐步深入到LangChain应用,以实战案例演练来了解大模型应用方向RAG(检索增强生成)技术与Agent(代理)技术】 | 3、大模型与AIGC概述 4、提示工程 5、AIGC的教学应用 6、LangChain实战-基础使用 7、LangChain实战-RAG应用 8、LangChain实战-Agent应用 |
|
专题三 大模型微调应用实战 | ||
基本信息 | 技能学习 | 案例实战 |
时间:2024年7月20日 - 7月30日 学时:共计88学时 证书:CBDA大模型应用工程师 费用:2480元/人 学习环境要求:Windows10或以上操作系统(64位),8G+内存 【专题特色:从基础神经网络到Transformer、从传统机器学习到预训练和微调,彻底讲清楚大模型的工作原理与机制;手把手带你搭建属于自己的大模型】 |
|
|
专题四 大模型私有化部署和应用开发实战 | ||
基本信息 | 技能学习 | 案例实战 |
时间:2024年7月20日 - 7月29日 学时:共计80学时 证书:CBDA大模型应用工程师 费用:2480元/人 学习环境要求:Windows10或以上操作系统(64位),8G+内存 【专题特色:本专题重点介绍了多种部署框架如LangChain、Ollama及多样应用案例,教导学员本地部署属于自己的大模型。学习过程融入实战和前端开发,提升互动性和实用性,促进深入理解。】 |
|
|
专题五 数据分析与挖掘实战(泰迪杯竟赛方向) | ||
基本信息 | 技能学习 | 案例实战 |
时间:2024年7月20日 - 7月30日 学时:共计88学时 证书:高级机器学习工程师职业技术证书 费用:1980元/人 学习环境要求:Windows10或以上操作系统(64位),8G+内存 【专题特色:课程融合泰迪杯经典竞赛,涵盖机器学习、爬虫和深度学习基础。分析历年竞赛魅力,掌握实战技巧。】 | 2、Python数据分析基础 4、Python机器学习实战 5、Python网络爬虫实战 6、PyTorch框架基础实战 7、PyTorch深度学习原理与实现(拓展) 8、特别内容: (1) ChatGPT教学应用 (2) 金牌助手ChatGPT,让应用开发更高效 (3) 大模型(ChatGLM2)产业应用漫步与畅想 | 1 学生校园卡消费行为分析(2019年技能赛B题相关) 2 泰迪内推平台招聘信息采集与分析(2023年挑战赛C题相关) 3 基于YOLOv8的岩石样本图像分割(2021年挑战赛B题相关) |
专题六 大数据技术应用实战(Hadoop+Spark) | ||
基本信息 | 技能学习 | 案例实战 |
时间:2024年7月20日 - 7月29日 学时:共计80学时 证书:高级大数据技术应用职业技术证书 费用:2980元/人 学习环境要求:Windows10或以上操作系统(64位),8G+内存 【专题特色:本专题课程涵盖了Hadoop生态圈的多种组件,如Hadoop、Hive、Spark、HBase 、ZooKeeper等,这种全面的知识体系有助于学员从整体上把握Hadoop生态圈的架构和工作原理。课程注重理论与实践的结合,让学员了解最新的大数据处理技术,并在实践中掌握相关的操作技能。】 |
(1) ChatGPT教学应用 (2) 金牌助手ChatGPT,让应用开发更高效 (3) 大模型(ChatGLM2)产业应用漫步与畅想 |
|
专题七 数据采集与处理实践(Python&八爪鱼) | ||
基本信息 | 技能学习 | 案例实战 |
时间:2024年7月20日 - 7月30日 学时:共计88学时 证书:高级Python技术应用工程师职业技术证书 费用:1980元/人 学习环境要求:Windows10或以上操作系统(64位),8G+内存 【专题特色:课程以Python编程实现与八爪鱼工具应用双轨并行。从零开始讲解数据采集流程Python代码实现,以及使用无编程门槛的八爪鱼工具高效实现数据采集工作,实现工具与编程技能的双重掌握与优化应用。】 | 2 Python数据分析基础 4 Python网络爬虫实战 5 特别内容: (1) ChatGPT教学应用 (2) 金牌助手ChatGPT,让应用开发更高效 (3) 大模型(ChatGLM2)产业应用漫步与畅想 | 1 泰迪内推平台招聘信息采集与分析(Python) 2 新浪财经数据采集(八爪鱼工具) 3 汽车质量投诉平台数据采集(八爪鱼工具) 4 微博疫情评论数据采集(Python) 5 网站图像素材采集实战(拓展) |
专题八 商务数据分析实战(Python) | ||
基本信息 | 技能学习 | 案例实战 |
时间:2024年7月20日 - 7月30日 学时:共计88学时 证书:高级大数据分析师职业技术证书 费用:1980元/人 学习环境要求:Windows10或以上操作系统(64位),8G+内存 【专题特色:课程以六大商务数据分析场景为切入点,以数据分析为导向,逐步深入分析案例。学员们将能够更容易地理解商务数据分析的核心概念与实践应用。】 | 2 Python数据分析基础 4 Python数据分析实训 5 商务数据分析概述 6 特别内容: (1) ChatGPT教学应用 (2) 金牌助手ChatGPT,让应用开发更高效 (3) 大模型(ChatGLM2)产业应用漫步与畅想 | 1 牛刀小试-T公司运营数据分析与业务决策 2 回归分析-某市财政收入预测 3 聚类分析-对某航空公司客户分群 4 分类分析-运营商用户流失判别 5 关联规则-购物篮商品推荐 6 协同过滤-新闻网站用户个性化推荐应用 |
专题九 PyTorch深度学习实战 | ||
基本信息 | 技能学习 | 案例实战 |
时间:2024年7月20日 - 7月30日 学时:共计88学时 证书:高级人工智能应用工程师职业技术证书 费用:1980元/人 学习环境要求:Windows10或以上操作系统(64位),8G+内存 【专题特色:重点专注于计算机视觉和文本领域。理论与实践相结合,深入解析深度学习原理,实战项目教学】 | 3 Python机器学习实战 4 PyTorch框架基础实战 5 PyTorch深度学习原理与实现 6 特别内容: (1) ChatGPT教学应用 (2) 金牌助手ChatGPT,让应用开发更高效 (3) 大模型(ChatGLM2)产业应用漫步与畅想 | 1 脑PET图像分析和疾病预测 2 基于textCNN的公众健康问句分类 3 新冠疫情期间网民情绪识别 4 基于FaceNet的人脸智能识别 |
三、课程特色
1、数字人才赋能产业+落地实操授课
课程全程强调动手实操,以实际编码为核心,通过解析企业案例,培养学员在产业技术和数字技术方面的综合能力,助力产业数字化转型和高质量发展。
2、全方位答疑辅导学习
课程设有答疑交流讨论群,培训期间助教全程辅导教学。线上学习部分每天提供10小时的实时在线答疑辅导。
3、 内容从浅及深更易入门
本课程配套有基础知识内容,即使零基础学员也能找到合适自己的学习内容和节奏,快速掌握课程知识和技能,助力学员入门数字经济领域。
4、大模型应用:畅想数据智能新未来
紧贴产业前沿,特邀三位专家畅谈大模型应用,分享“ChatGPT教学应用”,“金牌助手ChatGPT,让应用开发更高效”,“大模型(ChatGPT)产业应用漫步与畅想”等专题,一起畅想数据智能新未来。
5、提供课程资源和回看功能
所有课程相关源代码、数据、PPT、案例素材全部提供下载,即学即用,教学更轻松!
6、满足教学和科研需求
通过技能学习和案例实战,学员将在具体应用场景中全面掌握相关技能,提升实训教学工作的实际动手能力并为后续科研打下坚实基础。
四、证书颁发
1、CBDA大模型应用工程师证书
线下广州班、线下北京班、线上专题一、线上专题二、线上专题三和线上专题四的学员完成培训并经考核合格后,可以获得由泰迪智能研究院国际培训中心颁发的“大模型应用工程师”证书。
2、职业技术证书
其他专题学员经培训并考试合格后,可以获得由工业和信息化部教育与考试中心颁发的相应职业技术证书,证书可登录工业和信息化部教育与考试中心官网查询。
五、报名与联系方式
1、报名材料:报名申请表、身份证复印件、两寸近期正面免冠彩色半身证件照电子版(要求:白色背景底,14-20K大小的.JPG格式)。
2、本期研修班由广东泰迪智能科技股份有限公司收取费用并开具发票。
3、报名联系方式
联系人:曾老师 电 话:13246821827
微 信:antonia602501 邮 箱:zengaizhi@tipdm.com
全国数字人才技能提升师资研修班报名申请表
单位名称 | |||||||||
部门/院系 | |||||||||
通讯地址 | |||||||||
发票抬头 | 发票内容: | ||||||||
纳税号 | 电子发票 接收邮箱: | ||||||||
联系人 | 电话: | 邮箱: | |||||||
以下表格中要求提供的信息为申报职业技术证书使用,请真实完整填写 | |||||||||
姓 名 | 性别 | 职务 | 主要任课专业 | 毕业院校 | 最高学历 | 手机号 | 电子邮箱 | 专题选择 (线上/线下) | 是否住宿 (单间/标间) |
费用 支付方式 | 1、电汇到指定账户 2、扫码支付(报名后联系工作人员索要支付码) 3、付款时请注明”大数据研修班+单位名称或姓名“字样,方便查账备案 | ||||||||
账户信息 | 账户名:广东泰迪智能科技股份有限公司 开户行:中国工商银行广州花城支行 账户号:3602 0285 0920 1663 221 | ||||||||
备 注 | 请将报名表发送至邮箱:zengaizhi@tipdm.com 联系人:曾老师 电话:13246821827 微信:antonia602501 | ||||||||
附件一 线下班课程大纲
<线下广州班>AIGC技术与大模型应用开发实战课程大纲
技能学习课程安排 | |||
时间:报名成功后即可开始学习 1 认识Python 2 编写Python程序 3 认识Python数据结构 4 条件判断及分支语句 5 使用def定义函数 6 认识面向对象 7 读取文件数据 8 模块和第三方库 拓展课程 大模型赋能科研 1 抛出目标-目标路径-实际场景 2 确定发明专利的关键点 3 完成发明专利的基本内容 4 完成发明专利的详细阐述 5 赋能科研-科研小助手 6 赋能科研-kimi AIGC与图像生成 1.1 AI绘画简介 1.2 绘图提示词原则与框架 1.3 绘图工具介绍 2.1 绘图流程 2.2 文生图与图生图 2.3 图像连续创作 | 大模型在教育中的应用 1 学术版ChatGPT应用指南 1.1 ChatGPT学术版简介 1.2 ChatGPT学术版的安装 1.3 ChatGPT学术版的基础使用 1.4 ChatGPT学术版的高级功能 1.5 ChatGPT学术版在学术研究中的应用 2 大模型课堂教学应用 2.1 利用大语言模型对老师的课堂内容总结 2.2 利用大语言模型对老师的课堂内容问答 2.3 利用大语言模型随机出题与批改作业 3 人工智能行业法规 | 大模型辅助金融数据分析 1 大模型+金融数据分析介绍 2 智谱清言大模型介绍 3 应用大模型进行金融数据分析 3.1 金融数据清洗和数据处理 3.1.1 数据排重 3.1.2 缺失数据处理 3.1.3 数据格式检查 3.1.4 异常值处理 3.2 股票数据分析 3.2.1 股票的收益率计算 3.2.2 绘制K线图和成交示意图 3.2.3 绘制投资组合K线图和成交量示意图 3.3 量化投资 3.3.1 绘制股票价格走势图 3.3.2 双均线投资策略的制定 3.3.3 收益情况分析 4 小结 | 基于大模型的图像生成艺术 1 大模型与计算机视觉简介 1.1 计算机视觉的定义与应用 1.2 大模型在计算机视觉中的应用 2 利用大模型对图像进行描述 2.1 图像标注与描述计算概览 2.2 图像描述的实际操作 2.3 图像描述的应用案例 3 利用大模型生成图像 3.1 文本到图像的转换 3.2 大语言模型在图像生成的应用 3.3 面临的挑战与未来发展 4 利用大模型绘制数据图 4.1 利用大模型绘制柱状、折线图 4.2 利用大模型绘制饼图、雷达图 4.3 利用大模型绘制散点图、漏斗图、思维导图 5 开源图像小模型 5.1 魔搭与PaddleHUB 5.2 图像小模型 5.3 图像文字识别 5.4 图像去水印 5.5 图像清晰化 5.6 色彩增强 5.7 风格迁移 6 使用开源模型进行艺术绘画 6.1 Stable Diffusion-webUI 6.2 其它开源绘画模型 7 利用大模型生成视频 7.1 基于文心一言一键流影 7.2 stabel-video-diffusion-webui 7.3 魔搭平台的视频生成模型 |
现场案例实战课程安排 | |||
时间:7月19日(08:30 - 11:30) 大模型与AIGC概述 1 大模型是什么? 1.1 大模型的定义 1.2 大模型的特性与应用 2 大模型的前世今生 3 大模型爆火的原因 4 大模型原理介绍 4.1 ChatGPT工作机制与训练流程 4.2 自监督预训练解读 4.3 有监督微调介绍 4.4 奖励建模与强化学习 4.5 token是什么 5 AIGC简介 提示工程 1 提示工程(Prompt Engineering)简介 1.1 提示(Prompt)是什么 1.2 提示的发展历程 1.3 提示工程(Prompt Engineering)是什么 1.4 提示词编写原则与策略介绍 2 提示编写原则与策略 2.1 原则与策略:编写清晰的提示 2.2 原则与策略:提示参考示例 2.3 原则与策略:让模型一步步思考 2.4 原则与策略:调用外部工具 2.5 原则与策略:将复杂任务分解成子任务 2.6 原则与策略:采用系统的提示框架 2.7 原则与策略:用结构化方式进行提示 2.8 自动生成Prompt 3 总结 时间:7月19日(14:00 - 17:00) AIGC的教学应用 1 学习准备与声明 2 大模型辅导教案撰写 2.1 编写一份教案模板 2.2 撰写具体教案内容 3 题库题目生成 4 大模型辅导文献阅读 5 大模型辅导编程 6 大模型辅导数据分析 7 总结 | 时间:7月20日(08:30 - 11:30) AIGC生产力提升 1 学习准备与声明 2 大模型辅助生成PPT 2.1.1 一步到位生成自我介绍PPT 2.1.2 基于文档制作PPT 2.2.1 提炼并梳理文档中的核心内容 2.2.2 将markdown内容转为PPT 3 大模型辅助生成思维导图 3.1 利用大模型生成思维导图 3.2 将已有内容提炼成思维导图 4 大模型辅助绘制流程图 RAG应用:构建一个答疑小助手 1 目标与分析 2 RAG介绍及其工作流程 3 任务实现 3.1 RAG实现1:将文档直接上传至大模型 3.2 RAG实现2:创建一个Bot 3.2.1 设定Bot角色及回复逻辑 3.2.2 上传知识库并调试Bot 3.2.3 发布并使用Bot 4 小结 时间:7月20日(14:00 - 17:00) Agent应用:构建你的私人助理 1 Agent是什么 1.1 引言:大模型与通用人工智能的差距 1.2 Agent的概念和示例 2 第一个Agent:天气播报员 2.1 利用口子平台创建一个Bot(Agent) 2.2 为Agent配置人设并添加天气插件 2.3 发布并使用第一个Agent 3 创建工作流 3.1 工作流介绍 3.2 创建一个工作流 3.3 在Agent中关联使用工作流 4 第二个Agent:AI资讯早知道 4.1 目标与实现思路介绍 4.2 创建相应工作流 4.3 完成Agent配置及发布 5 小结 | 时间:7月21日(08:30 - 11:30) LangChain实战-基础使用 1.1 LangChain简介 1.2 LangChain环境安装 2.1 申请阿里云的API KEY 2.2 LangChain示例 2.3 链的使用 3.1 提示模板 3.2 模型调用 3.3 输出解析 3.4 基于LangChain开发情感极性分析应用 3.5 课堂练习:基于LangChain开发命名实体识别应用 时间:7月21日(14:00 ) - 7月22日(11:30) LangChain实战-RAG案例应用 4.1 RAG的概念 4.2 文档加载 4.3 文档分块 4.4 向量化存储 4.5 检索器 4.6 函数式链构造RAG 4.7 记忆机制 4.8 为RAG添加记忆功能 4.9 使用streamlit开发界面应用
实战演练-产品手册智能问答助手 1 任务提出 2 任务实现路径分析 3 本地知识库准备 4 RAG实践 5 效果检测 实战演练-搭建一个AI Agent 1 任务提出 2 任务实现路径分析 3 创建Agent 4 创建工作流 5 在Agent中关联使用工作流 | 时间:7月23日(09:00 - 17:00) 1 结课考核 2 企业参观 跳转至线下班课程安排 |
<线下青岛班>人工智能技术与应用实战课程大纲
技能学习课程安排 | |||
时间:报名成功后即可开始学习 1 认识Python 2 编写Python程序 3 认识Python数据结构 4 条件判断及分支语句 5 使用def定义函数 6 认识面向对象 7 读取文件数据 8 模块和第三方库 1 Python数据分析概述 2 NumPy数值计算基础 3 Matplotlib数据可视化基础 4 Pandas统计分析基础 5 使用Pandas进行数据预处理 时间:7月19日(09:00 - 18:00) Python机器学习实战 1 机器学习绪论 1.1 引言 1.2 基本术语 1.3 假设空间&归纳偏好 2 模型评估与选择 2.1 经验误差与过拟合 2.2 评估方法 2.3 性能度量 2.4 性能度量Python实现 3 回归分析 | 3.1 线性回归基本形式 3.2 线性回归模型的Python实现 4 人工神经网络 4.1 单个神经元介绍 4.2 经典网络结构介绍 4.3 神经网络工作流程演示 4.4 如何修正网络参数-梯度下降 4.5 网络工作原理推导 4.6 网络搭建准备 4.7 样本从输入层到隐层传输的Python实现 4.8 网络输出的Python实现 4.9 单样本网络训练实现 4.10 全样本网络训练实现 4.11 网络性能评价 4.12 实现神经网络算法 时间:7月20日(09:00 - 18:00) PyTorch框架基础实战 1 PyTorch简介 2 张量操作 2.1 创建张量 2.2 张量与数组相互转化 3 构建一个线性模型 3.1 任务描述:构建一个线性模型 3.2 读取数据 3.3 构建初始模型及损失函数 3.4 test-构建优化器 3.5 最小化方差(训练) 3.6 执行多轮训练 | 3.7 训练过程可视化 4 识别手写数字 4.1 案例目标与流程 4.2 加载数据 4.3 加工数据 4.4 模型结构介绍 4.5 构建模型 4.6 模型配置 4.7 模型训练 4.8 执行多轮训练 4.9 模型性能评估 4.10 保存模型 4.11 加载模型 4.12 模型应用 时间:7月21日(09:00 - 18:00) PyTorch深度学习原理与实现 1 深度神经网络-引言 2 卷积神经网络CNN 2.1 浅层神经网络的局限 2.2 卷积操作 2.3 卷积操作的优势 2.4 池化及全连接 2.5 高维输入及多filter卷积 2.6 实现卷积和操作 2.7 将卷积结果可视化 2.8 实现池化操作 | 时间:7月22日(09:00 - 18:00) 3 循环神经网络RNN 3.1 循环神经网络简介 3.2 循环神经网络的常见结构 4 长短时记忆网络LSTM 4.1 LSTM的三个门 4.2 LSTM三个门的计算示例 4.3 实现LSTM操作 4.4 LSTM返回值解读 5 利用RNN&LSTM实现MNIST手写数字识别 5.1 加载数据 5.2 数据加工 5.3 搭建循环神经网络 5.4 模型配置 5.5 模型训练 5.6 模型性能验证 特别内容: (1)ChatGPT教学应用 (2)金牌助手ChatGPT,让应用开发更高效 (3) 大模型(ChatGLM)产业应用漫步于畅想 |
时间:7月24日(08:30 - 17:00) 核心技能串讲与巩固 1 PyTorch简介 2 张量操作 3 构建一个线性模型 4 识别手写数字 5 深度学习引言 6 卷积神经网络CNN 7 循环神经网络RNN 8 长短时记忆网络LSTM 9 利用LSTM实现手写数字识别 | 时间:7月25日(08:30 - 17:00) 基于大模型微调的命名实体识别 1 背景与目标 2.1 命名实体识别的概念 2.2 命名实体识别的方法 3.1 数据格式 3.2 环境配置 3.3 数据格式转换 3.4 Label-Studio数据标注工具使用 3.5 Label-Studio数据格式转换 3.6 Dataset数据格式说明 3.7 __init__函数配置 3.8 __get_item__函数 3.9 分词器 3.10 NERDataset结果返回 3.11 NETDataset代码调试 3.12 构建最终的训练数据 4.1 模型介绍 4.2 模型下载使用 4.3 PyTorch Lightning框架 4.4 模型训练 4.5 指标评价 4.6 模型验证 5 小结 | 时间:7月26日(08:30 - 17:00) 基于YOLOv8的岩石样本分割 1 背景与目标 2 目标分析 3.1 YOLOv5模型情况 3.2 YOLOv8网络结构 3.3 数据增强 3.4 Backbone和Neck结构 3.5 Head结构和非极大值抑制 4.1 环境准备 4.2 模型和预训练权重下载 4.3 lableme安装 4.4 数据标注 4.5 认识不同的数据格式 4.6 数据格式转化 4.7 数据可视化 4.8 数据划分 4.9 数据配置文件修改 4.10 模型训练方式说明 4.11 模型训练 4.12 模型验证 4.13 模型预测 4.14 含油面积计算 4.15 图像分割过程总结 | 时间:7月27日(08:30 - 17:00) 实战演练-基于YOLOv8的岩石样本识别 1.1 目标分析 1.2 工程准备 1.3 数据格式整理 1.4 图像分类模型训练 1.5 图像分类模型预测 时间:7月28日(09:00 - 17:00) 1 职业技术考试 2 企业参观 跳转至线下班课程安排 |
<线下北京班>大模型微调与私有化部署实战课程大纲
技能学习课程安排 | |||
时间:报名成功后即可开始学习 1 认识Python 2 编写Python程序 3 认识Python数据结构 4 条件判断及分支语句 5 使用def定义函数 6 认识面向对象 7 读取文件数据 8 模块和第三方库 1 Python数据分析概述 2 NumPy数值计算基础 3 Matplotlib数据可视化基础 4 Pandas统计分析基础 5 使用Pandas进行数据预处理 | 时间:7月26日(09:00 - 18:00) Python机器学习实战 1 机器学习绪论 1.1 引言 1.2 基本术语 1.3 假设空间&归纳偏好 2 模型评估与选择 2.1 经验误差与过拟合 2.2 评估方法 2.3 性能度量 2.4 性能度量Python实现 3 回归分析 3.1 线性回归基本形式 3.2 线性回归模型的Python实现 4 人工神经网络 4.1 单个神经元介绍 4.2 经典网络结构介绍 4.3 神经网络工作流程演示 4.4 如何修正网络参数-梯度下降 4.5 网络工作原理推导 4.6 网络搭建准备 4.7 样本从输入层到隐层传输的Python实现 4.8 网络输出的Python实现 4.9 单样本网络训练实现 4.10 全样本网络训练实现 4.11 网络性能评价 4.12 实现神经网络算法 | 时间:7月27日(09:00 - 18:00) 大模型原理与实现 1 大模型简介 2.1 Transformer引入 2.2 Transformer训练阶段 2.3 Transformer推理阶段 2.4 Input Embedding操作 2.5 注意力机制介绍 2.6 attention层的计算过程01 2.7 attention层的计算过程02 2.8 从单头到多头注意力 2.9 Encoder整体计算流程 2.10 Encoder代码实现 2.11 Decoder整体计算过程 2.12 Masked Attention及Decoder输出 2.13 Decoder代码实现 2.14 Transformer代码实现 2.15 Transformer的并行计算能力 时间:7月28日(09:00 - 18:00) 3 生成式预训练模型GPT 4 双向编码模型BERT 5 Transformer应用 6 小结 时间:7月19日(08:30 - 11:30) | 拓展内容: PyTorch框架基础实践 1 PyTorch简介 2 张量操作 2.1 创建张量 2.2 张量与数组相互转化 3 构建一个线性模型 3.1 任务描述:构建线性模型 3.2 读取数据 3.3 构建初始模型及损失函数 3.4 test-构建优化器 3.5 构建优化器 3.6 最小化方差(训练) 3.7执行多轮训练 3.8 训练过程可视化 4 识别手写数字 4.1 案例目标与流程 4.2 加载数据 4.3 加工数据 4.4 模型结构介绍 4.5 构建模型 4.6 模型配置 4.7 模型训练 4.8 执行多轮训练 4.9模型性能评估 4.10 保存模型 4.11 加载模型 4.12 模型应用
PyTorch深度学习原理与实现 1 引言 2 循环神经网络RNN 3 长短时记忆网络LSTM |
案例实战课程安排 | |||
时间:7月30日(08:30 - 17:00) 大模型与AIGC概述 1 大模型是什么? 1.1 大模型的定义 1.2 大模型的特性与应用 2 大模型的前世今生 3 大模型爆火的原因 4 大模型原理介绍 4.1 ChatGPT工作机制与训练流程 4.2 自监督预训练解读 4.3 有监督微调介绍 4.4 奖励建模与强化学习 4.5 token是什么 5 AIGC简介 核心技能串讲与巩固 1 机器学习模型构建 2 PyTorch框架基础实践 3 PyTorch深度学习原理与实现 4 万模基座Transformer | 时间:7月31日(08:30 - 17:00) 大模型微调计数应用-基于大模型微调的新闻文本分类 1 大模型微调的概念 2.1 大模型微调方法 2.2 硬件配置要求说明 2.3 环境准备 2.4 模型准备 2.5 数据准备 3.1 全量微调FFT-原理介绍 3.2 全量微调FFT-配置训练参数 3.3 全量微调FFT-构建训练器 3.4 全量微调FFT-模型训练 3.5 全量微调FFT-模型效果验证 4.1 参数高效微调PEFT 4.2 Promp Tuning微调原理 4.3 Promp Tuning实现 4.4 Promp Tuning结果分析 4.5 Promp Tuning模型验证 4.6 P-Tuning微调原理 4.7 P-Tuning实现 4.8 LoRA微调 4.9 LoRA实现 | 时间:8月1日(08:30 - 11:30) 基于大模型微调的命名实体识别 1 背景与目标 2 目标分析 3 模型准备 3.1 环境准备 3.2 权重下载 4 数据准备 4.1 数据格式说明 4.2 数据格式转化 4.3 构建Dataset 5 模型微调训练 5.1 构建模型训练函数 5.2 构建模型测试函数 5.3 模型训练 5.4 模型测试 6 小结 | 时间:8月1日(14:00 - 17:00) 大模型部署 1 基于Gradio的页面部署 1.1 Gradio库介绍与安装指南 1.2 使用Gradio构建Web界面 1.3 整合后端模型与前端界面 1.4 广告创意生成的页面部署 时间:8月2日(08:30 - 17:00) 实战演练:基于大模型的校内问答系统 1 制作学校相关语料库 2 利用文心千帆平台开发问答系统 3 部署开源的ChatGLM模型 4 利用语料库进行模型微调 5 基于Gradio的前端开发 时间:8月3日(09:00 - 17:00) 1 结课考核 2 企业参观 跳转至线下班课程安排 |
附件二 线上班课程大纲
专题一 AIGC技术与应用实战课程大纲
技能学习(线上云课堂)课程安排 | ||||
时间:7月20日 (09:00 - 18:00) 大模型与AIGC概述 1 大模型是什么? 1.1 大模型的定义 1.2 大模型的特性与应用 2 大模型的前世今生 3 大模型爆火的原因 4 大模型原理介绍 4.1 ChatGPT工作机制与训练流程 4.2 自监督预训练解读 4.3 有监督微调介绍 4.4 奖励建模与强化学习 4.5 token是什么 5 AIGC简介 提示工程 1 提示工程(Prompt Engineering)简介 1.1 提示(Prompt)是什么 1.2 提示的发展历程 1.3 提示工程(Prompt Engineering)是什么 1.4 提示词编写原则与策略介绍 2 提示编写原则与策略 2.1 原则与策略:编写清晰的提示 2.2 原则与策略:提示参考示例 2.3 原则与策略:让模型一步步思考 2.4 原则与策略:调用外部工具 2.5 原则与策略:将复杂任务分解成子任务 2.6 原则与策略:采用系统的提示框架 2.7 原则与策略:用结构化方式进行提示 2.8 自动生成Prompt 3 总结 | 时间:7月21日 (09:00 - 18:00) AIGC的教学应用 1 学习准备与声明 2 大模型辅导教案撰写 2.1 编写一份教案模板 2.2 撰写具体教案内容 3 题库题目生成 4 大模型辅导文献阅读 5 大模型辅导编程 6 大模型辅导数据分析 7 总结 时间:7月22日(09:00 - 18:00) 大模型其他教育应用 1 学术版ChatGPT应用指南 1.1 ChatGPT学术版简介 1.2 ChatGPT学术版的安装 1.3 ChatGPT学术版的基础使用 1.4 ChatGPT学术版的高级功能 1.5 ChatGPT学术版在学术研究中的应用 2 大模型课堂教学应用 2.1 应用大语言模型对老师的课堂内容总结 2.2 利用大语言模型对老师的课堂内容问答 2.3 利用大语言模型随机出题与批改作业 3 人工智能行业法规 | 时间:7月23日 (09:00 - 18:00) AIGC生产力提升 1 学习准备与声明 2 大模型辅助生成PPT 2.1.1 一步到位生成自我介绍PPT 2.1.2 基于文档制作PPT 2.2.1 提炼并梳理文档中的核心内容 2.2.2 将markdown内容转为PPT 3 大模型辅助生成思维导图 3.1 利用大模型生成思维导图 3.2 将已有内容提炼成思维导图 4 大模型辅助绘制流程图 时间:7月24日(09:00 - 18:00) 大模型辅助金融数据分析 1 大模型+金融数据分析介绍 2 智谱清言大模型介绍 3 应用大模型进行金融数据分析 3.1 金融数据清洗和数据处理 3.1.1 数据排重 3.1.2 缺失数据处理 3.1.3 数据格式检查 3.1.4 异常值处理 3.2 股票数据分析 3.2.1 股票的收益率计算 3.2.2 绘制K线图和成交量示意图 3.2.3 绘制投资组合K线图和成交量示意图 3.3 量化投资 3.3.1 绘制股票价格走势图 3.3.2 双均线投资策略的制定 3.3.3 收益情况分析 4 小结 | 时间:7月25日 (09:00 - 18:00) 基于大模型的图像生成艺术 1 大模型与计算机视觉简介 1.1 计算机视觉的定义与应用 1.2 大模型在计算机视觉中的应用 2 利用大模型对图像进行描述 2.1 图像标注与描述技术概览 2.2 图像描述的实际操作 2.3 图像描述的应用案例 3 利用大模型生成图像 3.1 文本到图像的转换 3.2 大语言模型在图像生成中的实际应用 3.3 面临的挑战与未来发展 4 利用大模型绘制数据图 4.1 利用大模型绘制柱状图、折线图 4.2 利用大模型绘制饼图、雷达图 4.3 利用大模型绘制散点图、漏斗图、思维导图 | 时间:7月26日(009:00 - 18:00) 5 开源图像小模型 5.1 魔搭与PaddleHUB 5.2 图像小模型 5.3 图片文字识别 5.4 图像去水印 5.5 图像清晰化 5.6 色彩增强 5.7 风格迁移 6 使用开源模型进行艺术绘画 6.1 Stable Diffusion-webUI 6.2 其他开源绘画模型 7 利用大模型生成视频 7.1 基于文心一言一键流影 7.2 Stable-video-diffusion-webui 7.3 魔搭平台的视频生成模型 |
案例实战课程安排 | ||||
时间:7月27日(09:00 - 18:00) 大模型赋能科研 1 抛出目标-目标路径-实际场景 2 确定发明专利的关键点 3 完成发明专利的基本内容 4 完成发明专利的详细阐述 5 赋能科研-科研小助手 6 赋能科研-kimi | 时间:7月28日(09:00 - 18:00) RAG应用:构建一个答疑小助手 1 目标与分析 2 RAG介绍及其工作流程 3 任务实现 3.1 RAG实现1:将文档直接上传至大模型 3.2 RAG实现2:创建一个Bot 3.2.1 设定Bot角色及回复逻辑 3.2.2 上传知识库并调试Bot 3.2.3 发布并使用Bot 4 小结 | 时间:7月29日(09:00 - 18:00) Agent应用:构建你的私人助理 1 Agent是什么 1.1 引言:大模型与通用人工智能的差距 1.2 Agent的概念和示例 2 第一个Agent:天气播报员 2.1 利用口子平台创建一个Bot(Agent) 2.2 为Agent配置人设并添加天气插件 2.3 发布并使用第一个Agent 3 创建工作流 3.1 工作流介绍 3.2 创建一个工作流 3.3 在Agent中关联使用工作流 4 第二个Agent:AI资讯早知道 4.1 目标与实现思路介绍 4.2 创建相应工作流 4.3 完成Agent配置及发布 5 小结 | 时间:7月30日(09:00 - 18:00) 结课考核 跳转至课程安排 | 拓展内容 基于大模型的小红书文案写作 1 小红书文案介绍 2 基于大模型撰写小红书文案并整理文案排版 3 基于大模型设置文案标题 4 基于大模型增加文案内容 5 基于大模型润色整体文案并做出总结 6 实训 小红书文案写作 |
专题二 大模型应用开发实战(LangChain)课程大纲
技能学习课程安排 | |||
时间:报名成功后即可开始学习 1 认识Python 2 编写Python程序 3 认识Python数据结构 4 条件判断及分支语句 5 使用def定义函数 6 认识面向对象 7 读取文件数据 8 模块和第三方库 1 Python数据分析概述 2 NumPy数值计算基础 3 Matplotlib数据可视化基础 4 Pandas统计分析基础 5 使用Pandas进行数据预处理 时间:7月20日(09:00 - 18:00) 大模型与AIGC概述 1 大模型是什么 1.1 大模型的定义 1.2 大模型的特性与应用 2 大模型的前世今生 3 大模型爆火的原因 4 大模型原理介绍 4.1 ChatGPT工作机制与训练流程 4.2 自监督预训练解读 4.3 有监督微调介绍 4.4 奖励建模与强化学习 4.5 token是什么 5 AIGC简介 提示工程 1 提示工程(Prompt Engineering)简介 1.1 提示(Prompt)是什么 1.2 提示的发展历程 1.3 提示工程(Prompt Engineering)是什么 1.4 提示词编写原则与策略介绍 | 时间:7月21日(09:00 - 18:00) 2 提示编写原则与策略 2.1 原则与策略1:编写清晰的提示 2.2 原则与策略2:参考示例 2.3 原则与策略3:让模型一步步思考 2.4 原则与策略4:调用工具 2.5 原则与策略5:将复杂任务分解成子任务 2.6 原则与策略6:采用系统的提示框架 2.7 原则与策略7:用结构化方式进行提示 2.8 自动生成Prompt 3 总结 时间:7月22日(09:00 - 18:00) AIGC的教学应用 1 学习准备与声明 2 大模型辅助教案撰写 2.1 编写一份教案模板 2.2 撰写具体教案内容 3 题库题目生成 4 大模型辅助文献阅读 5 大模型辅助编程 6 大模型辅助数据分析 7 总结 | 时间:7月23日(09:00 - 18:00) LangChain实战-基础使用 1.1 LangChain简介 1.2 LangChain环境安装 2.1 申请阿里云的API KEY 2.2 LangChain示例 2.3 链的使用 3.1 提示模板 3.2 模型调用 3.3 输出解析 3.4 基于LangChain开发情感极性分析应用 3.5 课堂练习:基于LangChain开发命名实体识别应用 | 时间:7月24日(09:00 - 18:00) LangChain实战-RAG案例应用 4.1 RAG的概念 4.2 文档加载 4.3 文档分块 4.4 向量化存储 4.5 检索器 4.6 函数式链构造RAG 4.7 记忆机制 4.8 为RAG添加记忆功能 4.9 使用streamlit开发界面应用 时间:7月25日(09:00 - 18:00) LangChain实战-Agent应用 5.1 Agent的概念 5.2 load_tools工具导入 5.3 工具类函数调用 5.4 Tool工具类 5.5 Agent其他组件 5.6 initialize_agent创建Agent 5.7 Toolkits创建Agent 5.8 界面化开发Agent |
案例实战课程安排 | |||
时间:7月26日(09:00 - 18:00) 大模型赋能科研 1 抛出目标-目标路径-实际场景 2 确定发明专利的关键的 3 完成发明专利的基本内容 4 完成发明专利的详细阐述 5 赋能科研-科研小助手 6 赋能科研-kimi | 时间:7月27日(09:00 - 18:00) RAG实战-论文阅读助手 1 背景与目标 2.1 模型准备 2.2 文档读取和预处理 2.3 文档拆分 2.4 向量存储 2.5 构建阅读问答链 2.6 阅读应用 2.7 RAG增强技术 3 阅读机器人界面开发 4 小结 | 时间:7月28日(09:00 - 18:00) Agent实战-在线教育课程订单智能助手 1 背景与目标 2 目标分析 3.1 模型准备 3.2 创建表格智能体 3.3 工具准备 3.4 Agent创建和使用 4 思维拓展:RAG结合Agent 5 小结 | 拓展内容: AIGC与图像生成 1.1 AI绘画简介 1.2 绘图提示词原则与框架 1.3 绘图工具介绍 2.1 绘图流程 2.2 文生图与图生图 2.3 图像连续创作 时间:7月29日(09:00 - 18:00) 结课考核 跳转至线上班课程安排 |
专题三 大模型微调应用实战课程大纲
技能学习课程安排 | |||
时间:报名成功后即可开始学习 1 认识Python 2 编写Python程序 3 认识Python数据结构 4 条件判断及分支语句 5 使用def定义函数 6 认识面向对象 7 读取文件数据 8 模块和第三方库 1 Python数据分析概述 2 NumPy数值计算基础 3 Matplotlib数据可视化 4 Pandas统计分析基础 5 使用Pandas进行数据预处理 时间:7月20日(09:00 - 18:00) 大模型与AIGC概述 1 大模型是什么? 1.1 大模型的定义 1.2 大模型的特性与应用 2 大模型的前世今生 3 大模型爆火的原因 4 大模型原理介绍 4.1 ChatGPT工作机制与训练流程 4.2 自监督预训练解读 4.3 有监督微调介绍 4.4 奖励建模与强化学习 4.5 token是什么 5 AIGC简介 Python机器学习实战 1 机器学习绪论 1.1 引言 1.2 基本术语 1.3 假设空间&归纳偏好 2 模型评估与选择 2.1 经验误差与过拟合 2.2 评估方法 2.3 性能度量 2.4 性能度量Python实现 3 回归分析 3.1 线性回归基本形式 3.2 线性回归模型的Python实现 | 时间:7月21日(09:00 - 18:00) 4 人工神经网络 4.1 单个神经元介绍 4.2 经典网络结构介绍 4.3 神经网络工作流程演示 4.4 如何修正网络参数-梯度下降 4.5 网络工作原理推导 4.6 网络搭建准备 4.7 样本从输入层到隐层传输的Python实现 4.8 网络输出的Python实现 4.9 单样本网络训练实现 4.10 全样本网络训练实现 4.11 网络性能评价 4.12 实现神经网络算法 时间:7月22日(09:00 - 18:00) PyTorch框架基础实践 1 PyTorch简介 2 张量操作 2.1 创建张量 2.2 张量与数组相互转化 3 构建一个线性模型 3.1 任务描述:构建线性模型 3.2 读取数据 3.3 构建初始模型及损失函数 3.4 test-构建优化器 3.5 构建优化器 3.6 最小化方差(训练) 3.7 执行多轮训练 3.8 训练过程可视化 4 识别手写数字 4.1 案例目标与流程 4.2 加载数据 4.3 加工数据 4.4 模型结构介绍 4.5 构建模型 4.6 模型配置 4.7 模型训练 4.8 执行多轮训练 4.9 模型性能评估 4.10 保存模型 4.11 加载模型 4.12 模型应用 | 时间:7月23日(09:00 - 18:00) 大模型原理与实现 1 大模型简介 2.1 Transformer引入 2.2 Transformer训练阶段 2.3 Transformer推理阶段 2.4 Input Embedding操作 2.5 注意力机制介绍 2.6 attention层的计算过程01 2.7 attention层的计算过程02 2.8 从单头到多头注意力 2.9 Encoder整体计算过程 2.10 encoder代码实现 2.11 Decoder整体计算过程 2.12 Masked Attention及Decoder输出 2.13 decoder代码实现 2.14 Transformer代码实现 2.15 Transformer的并行计算能力 时间:7月24日(09:00 - 18:00) 3 生成式预训练模型GPT 4 双向编码模型BERT 5 Transformer应用 6 小结 时间:7月25日(09:00 - 18:00) 大模型微调技术应用 1 大模型微调的概念 2.1 大模型微调方法 2.2 硬件配置要求说明 2.3 环境准备 2.4 模型准备 2.5 数据准备 3.1 全量微调FFT-原理介绍 3.2 全量微调FFT-配置训练参数 3.3 全量微调FFT-构建训练器 3.4 全量微调FFT-模型训练 3.5 全量微调FFT-模型效果验证 4.1 参数高效微调PEFT 4.2 Prompt Tuning微调原理 4.3 Prompt Tuning实现 4.4 Prompt Tuning结果分析 4.5 Promp Tuning模型验证 4.6 P-Tuning微调原理 4.7 P-Tuning实现 4.8 P-Tuning v2微调原理 4.9 P-Tuning v2实现 | 时间:7月26日(09:00 - 18:00) 4.10 LoRA微调原理 4.11 LoRA实现 4.12 AdaLoRA原理 4.13 AdaLoRA实现 4.14 IA3原理与实现 4.15 BitFit原理与实现 5.1 如何降低大模型显存占用 5.2 半精度F16与BF16 5.3 半精度微调实现 5.4 INT8量化原理 5.5 INT8量化实现 5.6 QLoRA原理 5.7 QLoRA实现 6 小结 7.1 拓展1:modelscope平台启动 7.2 拓展1:modelscope微调步骤实现 8.1 拓展2:LLaMA-Factory界面微调工具 8.2 拓展2:LLaMA-Factory环境配置 8.3 拓展2:LLaMA-Factory配置和训练 8.4 拓展2:LLaMA-Factory其他功能使用 拓展内容: PyTorch深度学习原理与实现 1 引言 2 循环神经网络RNN 3 长短时记忆网络LSTM |
案例实战课程安排 | |||
时间:7月27日 (09:00 - 18:00) 基于通义千问(Qwen)的创意广告生成 1 背景与目标 2.1 千问大模型介绍 2.2 modelscope免费实例 2.3 创建虚拟环境 2.4 模块安装 2.5 模型下载和使用 2.6 模型文件路径说明 3.1 数据格式要求 3.2 数据格式转换 4.1 LoRA技术 4.2 finetune代码解读 4.3 LoRA微调和结果 4.4 模型验证 4.5 模型验证的注意事项 5 小结 6 拓展:modelscope环境的使用 | 时间:7月28日(09:00 - 18:00) 基于大模型微调的命名实体识别 1 背景与目标 2.1 命名实体识别的概念 2.2 命名实体识别的方法 3.1 数据格式 3.2 环境配置 3.3 数据格式转换 3.4 Label-Studio数据标注工具使用 3.5 Label-Studio数据格式转换 3.6 Dataset数据格式说明 3.7 __init__函数配置 3.8 __get__item__函数 3.9 分词器 3.10 NERDataset结果返回 3.11 NERDataset代码调试 3.12 构建最终的训练数据 4.1 模型介绍 4.2 模型下载使用 4.3 Pytoch Lightning框架 4.4 模型训练 4.5 指标评价 4.6 模型验证 5 小结 | 时间:7月29日(16:00 - 18:00) 基于大模型的金融问句语义相似度计算 1 案例背景及挖掘目标 2 语义文本相似度 3.1 预处理:文件加载 3.2 预处理:错别字纠正 3.3 预处理:数据类型转化与长度统计 3.4 预处理:数据准备 3.5 加载预训练模型 3.6 定义损失函数 3.7 模型训练 3.8 模型预测 3.9 模型评估 4 小结 | 拓展内容: 基于Transformer的疫情问诊系统自动翻译实现 1.1 机器翻译发展历程 1.2 任务目标及实现流程 2.1 数据预处理 3 预训练模型加载 4 模型训练 5 模型推理 时间:7月30日 (16:00 - 18:00) 职业技术考试 跳转至课程安排 |
专题四 大模型私有化部署和应用开发实战课程大纲
课程安排 | |||
时间:报名成功后即可开始学习 1 认识Python 2 编写Python程序 3 认识Python数据结构 4 条件判断及分支语句 5 使用def定义函数 6 认识面向对象 7 读取文件数据 8 模块和第三方库 1 Python数据分析概述 2 NumPy数值计算基础 3 Matplotlib数据可视化基础 4 Pandas统计分析基础 5 使用Pandas进行数据预处理 时间:7月20日(09:00 - 18:00) 大模型与AIGC概述 1 大模型是什么 1.1 大模型的定义 1.2 大模型的特性与应用 2 大模型的前世今生 3 大模型爆火的原因 4 大模型原理介绍 4.1 ChatGPT工作机制与训练流程 4.2 自监督预训练解读 4.3 有监督微调介绍 4.5 token是什么 5 AIGC简介 开源社区Huggingface和ModelScope 1 Huggingface社区介绍 1.1 开源模型下载 1.2 模型使用 1.3 数据集使用 1.4 Space空间体验 2 ModelScope社区介绍 2.1 开源模型库 2.2 模型使用 2.3 开源数据集 2.4 ModelScope算力平台 2.5 OpenCSG平台 3 大模型部署推理 3.1 开源大模型的文件类型 3.2 开源大模型部署 3.3 使用Transformer进行模型推理 | 时间:7月21日(09:00 - 18:00) 基于开源代码的Qwen大模型部署 1 Github与开源Qwen大模型项目 1.1 Github介绍 1.2 开源项目准备 1.3 模型权重下载 2 Qwen大模型开源项目部署使用 2.1 大模型推理调用 2.2 命令行调用 2.3 网页demo调用 2.4 部署自己的大模型API 2.5 通过curl方法调用大模型API 2.6 通过request方法调用大模型API 2.7 量化模型部署和使用 2.8 其他部署方式 3 其他模型部署 时间:7月22日(09:00 - 18:00) Qwen大模型部署与电商客服模型微调 1.1 目标分析 1.2 模型部署测试 1.3 电商客服数据准备 1.4 源码微调 1.5 效果检测 2 高效微调方法介绍 2.1 高效微调的概念 2.2 LoRA微调原理与实现 2.3 QLoRA微调原理与实现 3 界面化微调LLaMa-Factory 时间:7月23日(09:00 - 18:00) 基于ChatGLM的校内问答系统 1 制作学校相关语料库 1.1 语料库的重要性与构建方法 1.2 收集与整理有监督数据(对话数据) 1.3 收集无监督数据(纯文本数据) 1.4 数据清洗、标注与存储 2 部署开源ChatGLM模型 2.1 ChatGLM模型与特点分析 2.2 模型部署的环境与硬件要求 2.3 部署与常见问题解决方案 2.4 实战演练:成功部署并测试ChatGLM模型 3 利用语料库进行模型微调 3.1 模型微调的概念与意义 3.2 利用文心千帆对大模型进行微调 3.3 本地对ChatGLM模型微调 3.4 本地微调过程中的技巧与注意实现 | 时间:7月24日(09:00 - 18:00) 3.5 实战演练1:使用自己的语料库对云端ChatGLM进行微调 3.6 实战演练2:使用自己的语料库对本地ChatTLM进行微调 4 基于Gradio的前端开发 4.1 Gradio库介绍与安装指南 4.2 使用Gradio构建Web界面 4.3 整合后端模型与前端界面 4.4 实战演练:为校内问答系统开发一个用户友好的前端界面 5 总结与展望 5.1 回顾课程重点内容 5.2 分享学习心得与项目经验 5.3 探讨自然语言处理的未来发展趋势 时间:7月25日(09:00 - 18:00) 基于Langchain的本地大模型部署和应用开发 1 Langchain框架介绍与安装 1.1 Langchain框架介绍 1.2 框架安装 1.3 Langchain的快速使用 2 LangChain使用实例 2.1 基于Langchain的公有大模型API调用 2.2 基于Langchain的私有大模型API调用 2.3 开发实例:通过本地大模型进行情感分析 2.4 开发实例:调用本地大模型进行实体提取 时间:7月26日(09:00 - 18:00) 基于Langchain部署本地大模型的知识库助手应用开发 3.1 RAG概述 3.2 文档读取 3.3 文档处理和分段 3.4 向量化与向量数据库 3.5 检索器 3.6 构建提示词 3.7 构建问答链 3.8 问答机器人测试 4 基于Gradio的知识库助手界面开发 4.1 Gradio简介 4.2 构建检索问答链 4.3 调用检索问答链 4.4 Web界面开发 4.5 Web界面的外部调用 5 小结 | 时间:7月27日(09:00 - 18:00) 基于Ollama和Dify的本地大模型的部署和应用开发 1 目标分析 1.1 任务分析 1.2 实现方式 2 基于Ollama的本地大模型部署 2.1 Ollama使用简介 2.2 Ollama环境部署 2.3 使用模型文件不是Qwen大模型 2.4 Langchain对接Ollama本地Qwen大模型 2.5 基于GGUF模型文件的本地部署 2.6 基于bge-large-zh向量化大模型文件的本地部署 2.7 Langchain对接Ollama本地向量化模型 2.8 基于Ollama部署本地大模型的知识库助手应用开发 3 Dify框架理解与安装 3.1 开源应用Dify简介 3.2 Docker安装 3.3 Dify安装 3.4 大语言模型配置--本地私有大模型 3.5 大语言模型配置--公有大模型API 3.6 简单使用:创建文章生成器 时间:7月28日(09:00 - 18:00) 4 基于Dify的RAG应用开发 4.1 知识库上传和分段 4.2 文本向量化与存储 4.3 创建RAG应用 4.4 提示词 4.5 关联知识库以及其他配置 4.6 Web站点应用发布 4.7 基于APIs的应用开发 4.8 嵌入式网站机器人开发 5 其他功能介绍 5.1 工作流(Workflow) 5.2 第三方工具 5.3 构建一个简单的AI Agent 5.4 Coze功能概览 6 小结 时间:7月29日(09:00 - 18:00) 结课考核 跳转至线上班课程安排 |
专题五 数据分析与挖掘实战(泰迪杯竞赛方向)课程大纲
技能学习课程安排 | |||
时间:报名成功后即可开始学习 1 认识Python 2 编写Python程序 3 认识Python数据结构 4 条件判断及分支语句 5 使用def定义函数 6 认识面向对象 7 读取文件数据 8 模块和第三方库 Python数据分析基础 1 Python数据分析概述 2 NumPy数值计算基础 3 Matplotlib数据可视化基础 4 Pandas统计分析基础 时间:7月20日 (09:00 - 18:00) Python数据分析与应用 1 使用Pandas进行数据预处理 1.1 合并数据 1.2 清洗数据 1.3 标准化数据 1.4 转换数据 时间:7月21日 (09:00 - 18:00) Python机器学习实战 1 机器学习绪论 1.1 引言 1.2 基本术语 1.3 假设空间&归纳偏好 2 模型评估与选择 | 2.1 经验误差与过拟合 2.2 评估方法 2.3 性能度量 2.4 性能度量Python实现 3 回归分析 3.1 线性回归基本形式 3.2 线性回归模型的Python实现 3.3 波士顿房价预测的Python实现 3.4 逻辑回归介绍 3.5 研究生入学录取预测的Python实现 4 决策树 4.1 从女士相亲到决策树 4.2 明天适合打球吗 4.3 决策树拆分属性选择 4.4 决策树算法家族 4.5 泰坦尼克号生还者预测-数据预处理 4.6 泰坦尼克号生还者预测-模型构建与预测 时间:7月22日 (09:00 - 18:00) 5 人工神经网络 5.1 单个神经元介绍 5.2 经典网络结构介绍 5.3 神经网络工作流程演示 5.4 如何修正网络参数-梯度下降法 5.5 网络工作原理推导 5.6 网络搭建准备 5.7 样本从输入层到隐层传输的Python实现 5.8 网络输出的Python实现 5.9 单样本网络训练的Python实现 5.10 全样本网络训练的Python实现 5.11 网络性能评价 5.12 调用sklearn实现神经网络算法 | 时间:7月24日 (09:00 - 18:00) Python网络爬虫实战 1 Python爬虫环境与爬虫简介 1.1 认识爬虫 1.2 认识反爬虫 1.3 配置Python爬虫环境 2 网页前端基础 2.1 认识网络信息传输过程 2.2 认识HTTP 3 简单静态网页爬取 3.1 认识静态网页 3.2 实现HTTP请求 3.3 解析网页 3.4 存储数据 时间:7月25日 (09:00 - 18:00) 4 认识动态网页 4.1 认识动态网页 4.2 逆向分析爬取动态网页 4.3 使用Selenium库爬取动态网页 时间:7月27日 (09:00 - 18:00) PyTorch框架基础实战 1 PyTorch简介 2 张量操作 2.1 创建张量 2.2 张量与数组相互转化 3 构建一个线性模型 3.1 任务描述:构建一个线性模型 3.2 读取数据 3.3 构建初始模型及损失函数 3.4 test-构建优化器 3.5 最小化方差(训练) | 3.6 执行多轮训练 3.7 训练过程可视化 4 识别手写数字 4.1 案例目标与流程 4.2 加载数据 4.3 加工数据 4.4 模型结构介绍 4.5 构建模型 4.6 模型配置 4.7 模型训练 4.8 执行多轮训练 4.9 模型性能评估 4.10 保存模型 4.11 加载模型 4.12 模型应用 拓展内容: PyTorch深度学习原理与实现 1、引言 2、循环神经网络RNN 3、长短时记忆网络LSTM 特别内容: (1) ChatGPT教学应用 (2) 金牌助手ChatGPT,让应用开发更高效 (3) 大模型(ChatGLM2)产业应用漫步与畅想 |
案例实战课程安排 | |||
时间:7月23日 (09:00 - 18:00) 学生校园卡消费行为分析 (2020年技能赛A题) 1 案例背景和目标 2.1 数据预处理 2.2 学生食堂消费记录处理 2.3 三餐分布饼图 2.4 工作日和非工作日分析 3.1 各专业不同性别消费水平分析 3.2 聚类分析及小结 | 时间:7月26日 (09:00 - 18:00) 泰迪内推平台招聘信息采集与分析 (2023年挑战赛C题) 1.1 背景与分析目标 2.1 会员信息表处理 2.2 销售流水表处理 3.1 会员年龄分析 3.2 不同年龄的消费能力 3.3 不同性别的消费情况 3.4 会员和非会员消费情况 3.5 商场会员年消费趋势 3.6 不同月份的消费趋势 3.7 每年每月的消费金额趋势 3.8 不同时刻的消费情况 4.1 用户画像介绍 4.2 会员基本信息标签 4.3 会员消费特征标签 4.4 会员商品偏好标签 4.5 生成用户画像 5.1 会员细分介绍 5.2 KMeans算法实现会员聚类 5.3 结果分析 | 时间:7月28日 (09:00 - 18:00) 基于YOLOv8的岩石样本图像分割 (2021年挑战赛B题) 1 背景与目标 2 目标分析 3.1 YOLOv5模型概况 3.2 YOLOv8网络结构 3.3 数据增强 3.4 Backbone和Neck结构 3.5 Head结构和非极大值抑制 4.1 环境准备 4.2 模型和预训练权重下载 4.3 lableme安装 4.4 数据标注 4.5 认识不同的数据格式 4.6 数据格式转化 4.7 数据可视化 | 时间:7月29日 (09:00 - 18:00) 4.8 数据划分 4.9 数据配置文件修改 4.10 模型训练方式说明 4.11 模型训练 4.12 模型验证 4.13 模型预测 4.14 含油面积计算 4.15 图像分割过程总结 5.1 目标分析 5.2 工程准备 5.3 数据格式整理 5.4 图像分类模型训练 5.5 图像分类模型预测 5.6 图像分类过程总结 6 小结 时间:7月30日 (16:00 - 18:00) 职业技术考试 跳转至线上班课程安排 |
专题六 大数据技术应用实战(Hadoop+Spark)课程大纲
技能学习课程安排 | |||
时间:报名成功后即可开始学习 Linux操作系统基础
Java编程基础
Scala编程基础
时间:7月20日(09:00 - 18:00) Hadoop大数据基础 1 Hadoop简介 1.1 大数据介绍 1.2 Hadoop核心组件 1.3 Hadoop生态环境 1.4 Hadoop应用场景 2 Hadoop集群安装与部署 2.1 安装虚拟机 2.2 安装Java 2.3 Hadoop集群部署模式 2.4 配置固定IP 2.5 SSH无密码登录 2.6 配置Hadoop集群 2.7 Hadoop集群配置参数 2.8 Hadoop集群启动与监控 | 时间:7月21日(09:00 - 18:00) 3 Hadoop基础操作 3.1 Hadoop安全模式 3.2 Hadoop集群基本信息介绍 3.3 HDFS常用Shell操作 3.4 MapReduce常用Shell操作 3.5 MapReduce任务管理 3.6 Yarn资源管理与任务调度 4 MapReduce开发入门 4.1 MapReduce框架与设计构思 4.2 MapReduce开发环境搭建 4.3 MapReduce WordCount源码分析 4.4 MapReduce API分析 4.5 MapReduce统计每天访问次数 4.6 MapReduce按用户访问次数排序 拓展 5 MapReduce编程进阶 时间:7月22日(09:00 - 18:00) Hive大数据仓库
1.1 Hive简介 2 Hive安装配置 2.1.1 Hive安装配置之MySQL数据库安装 2.1.2 Hive安装配置之Hive安装 2.2 Hive实现单词计数 3 Hive应用 3.1.1 Hive表定义 3.1.2 创建内部表与外部表 3.1.3 创建静态分区表和动态分区表 3.1.4 创建带数据的表和桶表 3.2 Hive导入及导出 | 时间:7月23日(09:00 - 18:00) 3.3.1 Select查询基本用法1 3.3.2 Select查询基本用法2 3.3.3 内置函数应用 3.3.4 关联查询 拓展 4 Hive开发 5 Hive自定义函数 6 Hive查询优化 时间:7月24日(09:00 - 18:00) Spark大数据技术应用 1 Spark入门 1.1 Spark入门 2 Spark集群的安装配置 2.1 Spark安装部署 2.2 Spark安装部署实战 3 Spark架构及原理 3.1 Spark架构 3.2 Spark RDD及DAG相关概念 4 Spark编程基础 4.1 创建RDD 4.2 RDD常用算子之Transformation算子(1) 4.3 RDD常用算子之Transformation算子(2) 4.4 RDD常用算子之键值对RDD算子 4.5 RDD常用算子之action算子 4.6 文件读取与存储 4.7 统计用户停留时间最长的基站 | 时间:7月25日(09:00 - 18:00) 5 配置Spark IDEA开发环境 5.1 搭建Spark开发环境 6 Spark SQL应用 6.1 Spark SQL简介 6.2 Spark SQL配置 6.3 从结构化数据文件创建DataFrame 6.4 从外部数据库创建DataFrame 6.5 从RDD创建DataFrame 6.6 读取Hive表数据创建DataFrame 6.7 读取学生成绩创建DataFrame 6.8 常见DataFrame API操作1 6.9 常见DataFrame操作2 6.10 常见DataFrame操作3 6.11 通过DataFrame API计算学生总分和平均分 6.12 保存DataFrame数据 6.13 保存学生成绩分析结果到Hive 6.14 DataSet基础操作 6.15 统计商品销量 拓展内容: 1 Zookeeper大数据分布式消息 2 HBase非关系型数据库 3 Flume数据采集 4 Kafka消息系统 5 Flink大数据实时处理 6 商品实时推荐系统 特别内容: (1) ChatGPT教学应用 (2) 金牌助手ChatGPT,让应用开发更高效 (3) 大模型(ChatGLM2)产业应用漫步与畅想 |
案例实战课程安排 | |||
时间:7月26日(09:00 - 18:00) 航空客户价值分析
| 时间:7月27日(09:00 - 18:00) 广电大数据用户画像 1. 项目背景与目标分析 1.1 背景介绍 1.2 目标分析 1.3 系统架构介绍 2 数据存储 2.1 数据介绍 2.2 数据存储 2.3 开发环境搭建 3 数据探索与清洗 | 时间:7月28日(09:00 - 18:00) 4. 用户画像标签计算 4.1 用户画像简介 4.2 消费内容 4.3 消费等级 4.4 产品名称 4.5 入网程度&业务名称 4.6 地区&语言偏好 5 SVM预测用户是否挽留 5.1 SVM介绍 5.2 特征构建 | 5.3 标签构建 5.4 模型构建与评估 时间:7月29日(09:00 - 18:00) 职业技术考试 跳转至线上班课程安排 |
专题七 数据采集与处理实战(Python&八爪鱼)课程大纲
技能学习课程安排 | |||
时间:报名成功后即可开始学习 1 认识Python 2 编写Python程序 3 认识Python数据结构 4 条件判断及分支语句 5 使用def定义函数 6 认识面向对象 7 读取文件数据 8 模块和第三方库 1 Python数据分析概述 2 NumPy数值计算基础 时间:7月20日 (09:00 - 18:00) 1 Matplotlib数据可视化基础 1.1 掌握绘图基础语法与常用 1.2 分析特征间关系 1.3 分析特征内部数据分布与分散情况 | 时间:7月21日 (09:00 - 18:00) 2 Pandas统计分析基础 2.1 Pandas简介 2.2 读写不同数据源的数据 2.3 数据框与数据框元素 2.4 转换与处理时间序列数据 2.5 使用分组聚合进行组内计算 2.6 创建透视表与交叉表 时间:7月22日 (09:00 - 18:00) 3 使用Pandas进行数据与预处理 3.1 合并数据 3.2 清洗数据 3.3 标准化数据 3.4 转换数据 时间:7月23日 (09:00 - 18:00) Python网络爬虫实战 1 Python爬虫环境与爬虫简介 1.1 认识爬虫 1.2 认识反爬虫 1.3 配置Python爬虫环境 | 2 网页前端基础 2.1 认识网络信息传输过程 2.2 认识HTTP 3 简单静态网页爬取 3.1 认识静态网页 3.2 实现HTTP请求 3.3 解析网页 3.4 存储数据 时间:7月24日 (09:00 - 18:00) 4 认识动态网页 4.1 认识动态网页 4.2 逆向分析爬取动态网页 4.3 使用Selenium库爬取动态网页 时间:7月25日 (09:00 - 18:00) 5 模拟登录 5.1 使用表单登录方法实现模拟登录 5.2 使用Cookie登录方法实现模拟登录 5.3 使用Selenium模拟登录 | 拓展 6 Scrapy爬虫 6.1 认识Scrapy 6.2 通过Scrapy爬取基本页面信息 6.3 通过Scrapy抓取跳转页面数据 7 拓展:终端协议及爬取工具介绍 拓展内容: 网站图像素材采集实战 1 思路介绍 2 单个图片文件爬取 3 获取一个页面所有图片网址 4 保存所有图片 5 翻页爬取更多数据 6 PDF文件规律及问题 7 PDF翻页刷新的网址规律 8 获取当前页所有图片网址 9 翻页刷新爬取所有图片 10 图片拼接成PDF文件 特别内容: (1) ChatGPT教学应用 (2) 金牌助手ChatGPT,让应用开发更高效 (3) 大模型(ChatGLM2)产业应用漫步与畅想 |
案例实战课程安排 | |||
时间:7月26日 (09:00 - 18:00) 泰迪内推平台招聘信息采集与分析(Python) 1 背景与目标 2 数据采集 2.1 网页结构探索 2.2 定位一级页面数据地址 2.3 爬取及解析一级页面数据 2.4 提取一级页面字段 2.5 定位二级页面数据地址 2.6 爬取及解析二级页面数据 2.7 翻页爬取及数据保存 3 数据处理 3.1 读取已爬取完成的数据 3.2 数据预处理操作 4 分析与可视化 4.1 招聘岗位对学历要求分析 4.2 各行业的大数据招聘需求数量分析 4.3 不同类型公司的薪资待遇分析 4.4 小结 | 时间:7月27日 (09:00 - 18:00) 新浪财经数据采集(八爪鱼工具) 1 背景与分析目标 2 目标分析 3.1 八爪鱼采集器介绍与安装 3.2 菜单栏和模块任务 4.1 自定义任务主界面介绍 4.2 新建自定义任务 4.3 自动识别爬虫字段 4.4 手动配置爬虫字段 4.5 翻页设置 4.6 二级页面爬取 4.7 进入二级页面的注意事项 4.8 数据预览操作 4.9 流程图操作 4.10 自定义任务保存 5.1 数据采集与导出 5.2 任务设置和保存 6小结 | 时间:7月28日 (09:00 - 18:00) 汽车质量投诉平台数据采集(八爪鱼工具) 1 背景与分析目标 2 数据采集 2.1 投诉网页分析和爬虫思路 2.2 分析翻页网址构造 2.3 自定义翻页网址列表 2.4 配置二级页面跳转位置 2.5 循环点击进入二级页面 2.6 配置二级页面的爬虫字段 2.7 修改字段名称 2.8 任务保存和开始采集 2.9 回顾:整体流程分析 3 数据和任务导出 3.1 查看爬虫任务明细 3.2 数据导出保存 4 总结 | 时间:7月29日 (09:00 - 18:00) 微博疫情评论数据采集(Python) 1 背景与目标 2.1 评论结构分析 2.2 数据接口分析 3.1 微博页面接口分析 3.2 评论数据接口分析 3.3 评论回复数据爬取 3.4 单页微博及评论数据爬取 3.5 多线程爬虫 4 小结 时间:7月30日 (16:00 - 18:00) 职业技术考试 跳转至线上班课程安排 |
专题八 商务数据分析实战(Python)课程大纲
技能学习课程安排 | |||
时间:报名成功后即可开始学习 1 认识Python 2 编写Python程序 3 认识Python数据结构 4 条件判断及分支语句 5 使用def定义函数 6 认识面向对象 7 读取文件数据 8 模块和第三方库 Python数据分析基础 1 Python数据分析概述 2 NumPy数值计算基础
专题讲座 计算机视觉技术及其应用 1 Matplotlib数据可视化基础 1.1 掌握绘图基础语法与常用 1.2 分析特征间关系 1.3 分析特征内部数据分布与分散情况 | 时间:7月21日 (09:00 - 18:00) 2 Pandas统计分析基础 2.1 Pandas简介 2.2 读写不同数据源的数据 2.3 数据框与数据框元素 2.4 转换与处理时间序列数据 2.5 使用分组聚合进行组内计算 2.6 创建透视表与交叉表 时间:7月22日 (09:00 - 18:00) 3 使用Pandas进行数据预处理 3.1 合并数据 3.2 清洗数据 3.3 标准化数据 3.4 转换数据 | 时间:7月23日 (09:00 - 18:00) Python数据分析实训 1 iris数据处理实训 1.1 拓展学习资料&Python环境介绍 1.2 读取数据&修改列名称 1.3 以PythonConsole方式执行代码 1.4 缺失值处理 1.5 重置索引 2 探索chipotle数据 2.1 数据读取及介绍 2.2 分组聚合 2.3 数据类型转化 2.4 求客单价 3 探索Apple公司股价数据 3.1 数据读取及介绍 3.2 找到最后一个交易日 3.3 日期探索及可视化 | 特别内容 (1) ChatGPT教学应用 (2) 金牌助手ChatGPT,让应用开发更高效 (3) 大模型(ChatGLM2)产业应用漫步与畅想 |
案例实战课程安排 | |||
时间:7月24日 (09:00 - 18:00) 商务数据分析概述 1 商务数据分析基本概念 2 商务数据分析应用场景 3 商务数据分析主要工作及流程 4 商务数据分析方法与工具 5 商务数据分析产业需求 牛刀小试-T公司运营数据分析与业务决策 1 背景与目标 2 目标分析 3 数据探索与处理 3.1 数据探索与处理思路 3.2 读取项目数据&处理业务标签 3.3 日报表读取及上下半年数据拆分 3.4 读取人员成本数据并与日报表拼接 3.5 三表合并及异常值处理 4 数据分析 4.1 计算各类业务的核心指标 4.2 各类业务指标分析及可视化 4.3 各项目核心指标统计及分析 4.4 各部门的核心指标计算分析 5 分析结果与建议 | 时间:7月25日 (09:00 - 18:00) 回归分析-某市财政收入预测 1 背景与目标 1.1 案例背景 1.2 数据介绍 2 目标分析 3 线性回归分析 3.1 线性回归分析介绍 3.2 构建线性回归模型 3.3 利用构建好的模型进行预测 3.4 数据读取与拆分 3.5 模型训练与预测 4 分析结果与评估 4.1 模型性能评估 4.2 将预测结果可视化 4.3 G市未来两年财政收入预测 时间:7月26日 (09:00 - 18:00) 聚类分析-对某航空公司客户分群 1 背景与目标 2 数据预处理 2.1 数据读取 2.2 剔除票价为空的记录 2.3 剔除异常记录 3 特征构造 3.1 RFM模型介绍 3.2 LRFMC模型 3.3 构造入会时长特征 3.4 剩余特征构造 4 K-Means客户分群 4.1 使用K-Means算法进行客户分群 4.2 获取K-Means聚类结果 4.3 聚类结果可视化 5 小结 | 时间:7月27日 (09:00 - 18:00) 分类分析-运营商用户流失判别 1.1 背景与目标 1.2 案例思路分析 2.1 数据探索 2.2 数据去重及删除无关属性 2.3 用户分组及标签构建 2.4 提取用户基本信息和在网时长 2.5 处理合约是否有效 2.6 处理合约计划到期时间 2.7 其余变量处理 2.8 特征拼接及缺失值处理 2.9 数据保存 3.1 特征选择介绍 3.2 皮尔逊特征选择 3.3 处理样本类别不均衡问题 4.1 模型性能评估介绍 4.2 模型构建及性能评估 时间:7月28日 (09:00 - 18:00) 关联规则-购物篮商品推荐 1 背景与目标 2 目标分析 3 数据探索与处理 3.1 数据读取及筛选 3.2 将数据处理成购物篮形式并保存 4 关联规则分析 4.1 关联规则介绍 4.2 Apriori算法流程 4.3 提升度的概念 5 关联规则模型构建 5.1 数据加载及拆分 5.2 挖掘强关联规则(Apriori算法实现) 6 模型性能评估 | 时间:7月29日(09:00 - 18:00) 协同过滤-泰迪内推平台信息精准推荐应用 1 背景与目标 2 目标分析 2.1 推荐思路分析 2.2 基于物品的协同过滤推荐介绍 3 工程实现 3.1 EB工具登录及简介 3.2 创建空白工程 3.3 导入数据 3.4 筛选正文数据 3.5 字符替换及记录去重 3.6 划分训练集用户和测试集用户 3.7 构建训练集和测试集数据 3.8 构建模型 3.9 推荐及性能评估 4 小结 时间:7月30日 (16:00 - 18:00) 职业技术考试 跳转至线上班课程安排 |
专题九 PyTorch深度学习实战课程大纲
技能学习课程安排 | ||||
时间:报名成功后即可开始学习 1 认识Python 2 编写Python程序 3 认识Python数据结构 4 条件判断及分支语句 5 使用def定义函数 6 认识面向对象 7 读取文件数据 8 模块和第三方库 1 Python数据分析概述 2 NumPy数值计算基础 3 Matplotlib数据可视化基础 4 Pandas统计分析基础 5 使用Pandas进行数据预处理 时间:7月20日(09:00 - 18:00) Python机器学习实战 1 机器学习绪论 1.1 引言 1.2 基本术语 1.3 假设空间&归纳偏好 2 模型评估与选择 2.1 经验误差与过拟合 2.2 评估方法 2.3 性能度量 2.4 性能度量Python实现 | 3 回归分析 3.1 线性回归基本形式 3.2 线性回归模型的Python实现 4 决策树 4.1 从女士相亲到决策树 4.2 明天适合打球吗 4.3 决策树拆分属性选择 4.4 决策树算法家族 4.5 泰坦尼克号生还者预测-数据预处理 4.6 泰坦尼克号生还者预测-模型构建与预测 时间:7月21日 (09:00 - 18:00) 5 人工神经网络 5.1 单个神经元介绍 5.2 经典网络结构介绍 5.3 神经网络工作流程演示 5.4 如何修正网络参数-梯度下降法 5.5 网络工作原理推导 5.6 网络搭建准备 5.7 样本从输入层到隐层传输的Python实现 5.8 网络输出的Python实现 5.9 单样本网络训练的Python实现 5.10 全样本网络训练的Python实现 5.11 网络性能评价 5.12 调用sklearn实现神经网络算法 | 时间:7月22日 (09:00 - 18:00) PyTorch框架基础实战 1 PyTorch简介 2 张量操作 2.1 创建张量 2.2 张量与数组相互转化 3 构建一个线性模型 3.1 任务描述:构建一个线性模型 3.2 读取数据 3.3 构建初始模型及损失函数 3.4 test-构建优化器 3.5 最小化方差(训练) 3.6 执行多轮训练 3.7 训练过程可视化 时间:7月23日(09:00 - 18:00) 4 识别手写数字 4.1 案例目标与流程 4.2 加载数据 4.3 加工数据 4.4 模型结构介绍 4.5 构建模型 4.6 模型配置 4.7 模型训练 4.8 执行多轮训练 4.9 模型性能评估 4.10 保存模型 4.11 加载模型 4.12 模型应用 | 时间:7月24日 (09:00 - 18:00) PyTorch深度学习原理与实现 1 深度神经网络-引言 2 卷积神经网络CNN 2.1 浅层神经网络的局限 2.2 卷积操作 2.3 卷积操作的优势 2.4 池化及全连接 2.5 高维输入及多filter卷积 2.6 实现卷积和操作 2.7 将卷积结果可视化 2.8 实现池化操作 | 时间:7月25日 (09:00 - 18:00) 3 循环神经网络RNN 3.1 循环神经网络简介 3.2 循环神经网络的常见结构 4 长短时记忆网络LSTM 4.1 LSTM的三个门 4.2 LSTM三个门的计算示例 4.3 实现LSTM操作 4.4 LSTM返回值解读 5 利用RNN&LSTM实现MNIST手写数字识别 5.1 加载数据 5.2 数据加工 5.3 搭建循环神经网络 5.4 模型配置 5.5 模型训练 5.6 模型性能验证 特别内容: (1)ChatGPT教学应用 (2)金牌助手ChatGPT,让应用开发更高效 (3) 大模型(ChatGLM)产业应用漫步于畅想 |
案例实战课程安排 | ||||
时间:7月26日(09:00 - 18:00) 脑PET图像分析与疾病预测 1 背景与目标 2 数据处理 2.1 图像读取及尺寸调整 2.2 图像增强之翻转操作 2.3 图像增强之旋转缩放 2.4 获取所有照片路径 2.5 批量获取照片数据 2.6 将数据处理过程封装成函数 3 模型构建 3.1 定义卷积&池化层 3.2 定义全连接层 3.3 定义网络计算过程 3.4 数据集维度顺序调整及类型转化 3.5 数据集分批及打乱操作 3.6 模型构建及配置 3.7 模型训练 4 模型性能评估及应用 4.1 模型性能评估及保存 4.2 模型应用 | 时间:7月27日(09:00 - 18:00) 基于textCNN的公众健康问句分类 1 背景与目标 1.1 背景与目标 1.2 目标分析 2 数据探索与处理 2.1 数据探索 2.2 剔除无效字符及分词操作 2.3 读取停用词表 2.4 去除停用词 2.5 为词语编号 3 词嵌入(Word2Vec) 3.1 词嵌入(Word2Vec)介绍 3.2 获取目标词向量矩阵 3.3 博爱从处理好的数据 4 模型构建(textCNN) 4.1 统一各样本的词语数量 4.2 textCNN介绍 4.3 构建textCNN 4.4 建模前数据准备 4.5 执行模型训练 5 模型性能评估 5.1 模型性能评估 5.2 小结 | 时间:7月28日 (09:00 - 18:00) 基于大模型微调的命名实体识别 1 背景与目标 2 数据准备 2.1 数据基本介绍 2.2 词嵌入介绍 2.3 进行词向量训练 2.4 构建词向量矩阵 2.5 获取编码后的语料库 2.6 对各样本执行padding操作 2.7 拆分数据并将其转为模型所需格式 3 模型训练与性能验证 3.1 Embedding层介绍 3.2 定义Embedding层算子 3.3 定义LSTM层算子 3.4 定于全连接层算子 3.5 定义网络计算流程 3.6 模型构建及配置 3.7 模型训练 3.8 模型性能评估 4 小结 | 时间:7月29日(09:00 - 18:00) 基于YOLOv8的岩石样本图像分割与识别 1 背景与目标 1.1 背景与目标 1.2 目标分析 1.3 开发环境和工程结构介绍 2 人脸检测 2.1 MTCNN人脸检测介绍 2.2 执行人脸检测操作 3 人脸对齐 3.1 执行人脸对齐操作 3.2 人脸检测与对齐代码整理 4 人脸特征提取 4.1 FaceNet溯源-计算机视觉领域的部分大事件 4.2 FaceNet介绍 4.3 执行人脸特征提取操作 5 人脸识别 5.1 获取后台数据库中的人脸数据 5.2 获取后台数据库人脸数据脚本解读 5.3 完成人脸识别操作 5.4 代码整理与结构可视化 6 小结 | 时间:7月30日(16:00 - 18:00) 职业技术考试 跳转至线上班课程安排 |
附件二 师资介绍
冯国灿博士,中山大学数学学院教授,博士生导师。泰迪杯数据挖掘挑战赛组委会委员,中国工业与应用数学会常务理事,广东省工业与应用数学学会理事长,2000-2002英国格莱莫根大学数字图像实验室和布拉德福大学数字媒体实验室做博士后研究员。主要从事模式识别、计算机视觉研究,参加主持包括国家自然科学基金等科学基金20多项,发表学术论文100余篇,入选2014-2019爱思唯尔计算机科学中国高被引学者排行榜。 | |
张敏,广东泰迪智能科技股份有限公司培训总监,高级信息系统项目管理师。具有丰富的大数据挖掘、人工智能教学和开发经验,曾为南方电网、国家电网、格力电器、珠江数码等多个大型企业提供i项目研发与维护服务。参编数据挖掘与人工智能类教材10余本,作为主讲老师参与国内高校和企业关于数据挖掘、人工智能相关培训班百余场。 | |
周东平,广东泰迪智能科技股份有限公司产品总监,高级数据分析师。项目经理。从事数据行业多年,熟悉大数据、人工智能相关项目开发流程;具有丰富的大数据、人工智能产品与应用设计经验,对于大数据、人工智能教学具有深入研究。精通Python语言,策划主持编写Python方向大数据与人工智能图书10余本,包括《Python数据分析与应用》、《Python3智能数据分析快速入门》、《大数据数学基础(Python语言描述)》等。在职期间参与项目涵盖电力、税务、金融、新闻、建筑等方向,具有丰富的行业经历。 | |
陈四德,广东泰迪智能科技股份有限公司高级数据分析师,统计学专业,对数据统计分析和数据挖掘领域均有较强的理解和理论基础;有造价行业、游戏行业背景和丰富的项目经验,精通行业内的各种指标分析,擅于从多维度分析数据,逻辑性强;擅长Python、R语言、MySQL数据库等工具,能熟练对数据进行数据处理和分析,掌握常用的数据挖掘算法如分类、聚类等,以及深度学习TensorFlow的使用。负责“网站会员流失预测”项目,完成数据处理,模型构建;负责“平台BI埋点数据入库及数据分析”项目,完成数据盘点、数据指标整理和把控;负责“游戏数据分析”项目,完成产出游戏生态日报、客户价值分群结果、用户流失的预警、用户画像指标的完善和维护,项目经验丰富。负责过西安交大城市学院、福建农林大学、国培师资培训、韩山师范学院数据分析就业班、湖南科技职业技术学院、武汉科技大学、广东机电职业技术学院国培、柳州城市职业技术学院第一届大数据职业技能竞赛指导、吉林大学珠海学院等培训项目,授课经验丰富。负责过“泰迪杯”数据挖掘挑战赛出题及赛题指导。 |