课程信息
课程名称: EXIN AI人工智能认证课程
公开班、定制版
开课时间:2024-08-17
课程介绍
【课程简介】
本课程内容不仅包括深度学习、机器学习、数据挖掘等具体技术要点,也包括AI的整体发展、现状、应用、商业价值、未来方向等,涵盖内容非常丰富, 使学员理论与实践结合,迅速掌握相关的技术。
本课程亦涵盖了EXIN BCS Artificial Intelligence Foundation 认证考试内容,符合道德、可持续且可靠的 AI 的潜在优势和挑战;机器学习(ML)的基本过程——创建 ML 工具包;与 AI 项目相关的挑战和风险,以及 AI 和人类工作的未来,课程结束后后可参与EXIN组织的AI认证考试。
【课程目标】
本课程结束时,学生将深入理解以下方面的实践知识
1.整体把握机器学习、深度学习、数据挖掘的发展方向
2.了解机器学习、深度学习、计算机视觉的技术框架
3.理解机器学习和深度学习的思维方式和关键技术
4.了解深度学习和机器学习在当前工业界的落地应用
5.了解AI顶会论文和最新技术热点
【课程形式】
课程采取公开班或企业内训形式,课程时间:3天2晚
第一篇--第四篇:3天实战训练营内容
第五篇: 2晚认证考试内容
【课程要求】
l Python编程
l 或至少一门计算机语言(C++、JAVA……)
【课程大纲】
课程大纲 |
|
第一篇:数据分析与机器学习引入 |
|
第一节:python基础 |
python基本数据类型:list, dict, tuple, set等 |
Python文件操作:txt, excel等 |
|
Python 的标准库和第三方库 |
|
Python高级用法:切片、迭代、map、filter、reduce |
|
Python文件操作 |
|
关于形成Pythonic代码习惯的思考 |
|
代码和案例实践 |
大素数计算与优化及其思考 |
负二项分布与比赛胜率 |
|
本福特定律的优化方法 |
|
第二节:数据分析和预处理 |
Numpy/Scipy/Pandas/Matplotlib/Seaborn 库 |
Numpy 基础属性与数组创建 |
|
Numpy 索引 |
|
Numpy 数学运算与常用分布 |
|
Pandas 数据处理与分析 |
|
Pandas 文件读写和个性化控制 |
|
Pandas 的 concat 与 merge |
|
Matplotlib 基本图结构介绍 |
|
基于 Matplotlib 绘制散点图、柱状图、等高线图、3D 图等 |
|
多图合并与图片文件存取 |
|
典型图像处理 |
|
多种数学曲线 |
|
多项式拟合 |
|
代码和案例实践 |
快速傅里叶变换FFT与信号处理 |
soble/Prewitt/Laplacian算子与卷积网络 |
|
卷积与(指数)移动平均线 |
|
股票数据分析 |
|
缺失数据的处理和预测 |
|
环境数据异常检测和分析 |
|
快速傅里叶变换FFT |
|
图像处理与奇异值分解SVD |
|
第二篇:机器学习模型详解 |
|
第三节:机器学习核心原理与回归分析 |
线性回归 |
Logistic/Softmax回归 |
|
广义线性回归 |
|
L1/L2正则化 |
|
Ridge与LASSO |
|
Elastic Net |
|
梯度下降算法:BGD与SGD |
|
特征选择与过拟合 |
|
Softmax回归的概念源头 |
|
最大熵模型 |
|
K-L散度 |
|
代码和案例实践 |
股票数据的特征提取和应用 |
泰坦尼克号乘客缺失数据处理和存活率预测 |
|
环境检测数据异常分析和预测 |
|
模糊数据查询和数据校正方法 |
|
PCA与鸢尾花数据分类 |
|
二手车数据特征选择与算法模型比较 |
|
广告投入与销售额回归分析 |
|
鸢尾花数据集的分类 |
|
第四节:决策和随机森林 |
熵、联合熵、条件熵、KL 散度、互信息 |
最大似然估计与最大熵模型 |
|
ID3、C4.5、CART 详解 |
|
决策树的正则化 |
|
预剪枝和后剪枝 |
|
Bagging |
|
随机森林 |
|
不平衡数据集的处理 |
|
利用随机森林做特征选择 |
|
使用随机森林计算样本相似度 |
|
异常值检测 |
|
代码和案例实践 |
随机森林与特征选择 |
决策树应用于回归 |
|
多标记的决策树回归 |
|
决策树和随机森林的可视化 |
|
葡萄酒数据集的决策树/随机森林分类 |
|
泰坦尼克乘客存活率估计 |
|
第五节:聚类分析
|
各种相似度度量及其相互关系 |
Jaccard 相似度和准确率、召回率 |
|
Pearson 相关系数与余弦相似度 |
|
K-means 与 K-Medoids 及变种 |
|
层次聚类:自顶向下,自底向上 |
|
AP 算法(Sci07)/LPA 算法及其应用 |
|
密度聚类 DBSCAN/DensityPeak(Sci14) |
|
谱聚类 SC |
|
聚类评价和结果指标 |
|
代码和案例实践 |
K-Means++算法原理和实现 |
向量量化 VQ 及图像近似 |
|
并查集的实践应用 |
|
密度聚类的异常值检测 |
|
谱聚类用于图片分割 |
|
第六节:关联规则挖掘算法 |
项、事务 |
支持度、置信度、lift 值、Conviction |
|
关联规则算法详述 |
|
频繁项集及其快速发现 |
|
阈值选择问题 |
|
BFS 和 DFS 搜索策略 |
|
计数法和交集法 |
|
Apriori、Eclat |
|
FP-growth |
|
代码和案例实际 |
商品和用户相关性分析与推荐 |
用户相似性评价的不同方案与异同比较 |
|
并查集的实践应用 |
|
关联规则与 SVD、LFM 的实战区别 |
|
第七节:XGBoost 与 LightGBM 模型详解
|
定义树的复杂度 |
boosting tree 的提升思路 |
|
残差的选择 |
|
XGBoost 损失函数的提成 |
|
Loss 的精确一阶导数和二阶导数 |
|
近似加权分位法 |
|
稀疏自适应分割策略 |
|
XGBoost 的过拟合与正则化目标函数 |
|
算法成功之处和存在的问题 |
|
boosting 框架总览 |
|
重新认识样本的梯度 |
|
GOSS 思想在 LightGBM 中的应用 |
|
贪心和启发式特征搜索 |
|
EFB 候选特征的选择 |
|
Histogram 算法与 Pre-sorted 算法对数据结构的影响 |
|
样本采样与权重 |
|
再谈引入稀疏数据的原因 |
|
单边采样带来的训练样本减少 |
|
代码和案例实践 |
收入分类模型的提升应用 |
XGBoost 库与 sklearn 库的使用 |
|
提升模型在用户感知评分预测的应用 |
|
XGBoost 用于真实信号数据中的分类建模和调参 |
|
钻井工况数据在 LightGBM 中的实践 |
|
LightGBM 与 XGBoost 的性能比较 |
|
基站小区节能预测建模 |
|
哪些场景不适合 LightGBM |
|
第三篇:深度学习原理与实践 |
|
第八节:卷积神经网络 |
神经网络结构,滤波器,卷积 |
池化,激活函数,反向传播 |
|
目标分类与识别、目标检测与追踪 |
|
AlexNet、VGGNet、GoogleLeNet |
|
Inception-V3/V4 |
|
ResNet、DenseNet |
|
代码和案例实践 |
数字图片分类 |
卷积核与特征提取 |
|
以图搜图 |
|
人证合一 |
|
卷积神经网络调参经验分享 |
|
第九节:卷积神经网络高 级应用
|
Inception-V3/V4 |
ResNet、DenseNet |
|
使用迁移学习实现蒙古文识别 |
|
获取中间隐层的特征及可视化 |
|
隐层特征的意义和使用 |
|
迁移学习的 trick |
|
学习率、衰减、冻结等问题 |
|
代码和案例实践
|
数字图片分类 |
卷积核与特征提取 |
|
以图搜图 |
|
人证合一 |
|
卷积神经网络调参经验分享 |
|
猫狗大战详解 |
|
海量蒙古文识别 |
|
隐特征可视化及其应用 |
|
第十节:图像目标检测与 视频分类
|
视频关键帧处理 |
卷积的位置不变形与图像定位的关系 |
|
物体检测与定位 |
|
RCNN,Fast-RCNN,Faster-RCNN,MaskRCNN |
|
YOLOv4、SSD |
|
UNet 及其与残差网络的结合 |
|
FaceNet 与特征 |
|
EfficientNet、EfficientDet |
|
视频帧的目标定位 |
|
时空卷积网络 |
|
SlowFast |
|
代码和案例实践
|
人脸检测 |
OCR 字体定位和识别 |
|
睿客识云 |
|
气象识别 |
|
视频分类的 trick |
|
政务大厅视频监控的真实系统 |
|
第十一节:循环神经网络 RNN
|
语言模型 Bi-Gram/Tri-Gram/N-Gram |
分词算法的原理及类似应用 |
|
词性标注 |
|
语义关系抽取 |
|
词向量 |
|
文本分类:基于 CNN 和基于 LSTM 的方法比较 |
|
机器翻译:Seq2Seq 的典型应用 |
|
Transformer、BERT 等模型原理 |
|
文本摘要与信息抽取 |
|
阅读理解 |
|
问答系统 |
|
情感分析 |
|
代码和案例实践
|
知识图谱:命名实体识别的实践 |
知识图谱:实体关系的判定与分类 |
|
HMM 分词及 CRF 的异同 |
|
文本摘要的生成 |
|
智能对话系统和 SeqSeq 模型 |
|
阅读理解的实现与 Attention |
|
机器翻译 |
|
使用 LSTM 生成文本 |
|
第四篇:AIGC与大模型实践 |
|
第十二节:扩散模型
|
GAN-VAE-流模型-扩散模型的技术发展和变化 |
CLIP 和扩散模型的结合:基于 CLIP 模型的多模态引导图像生成:图文引导 |
|
GLIDE:文本引导 |
|
Diffusion-CLIP 模型 |
|
扩散和去噪(Diffusion&Denoise) |
|
训练和采样(Training&Sampling) |
|
离散步骤的马尔可夫链 |
|
分子热动力学的扩散过程 |
|
离散加噪 |
|
DDPM-最经典的扩散模型 |
|
DDIM:加速采样、可控扩散 |
|
IVLR:迭代去燥的图像编辑,低通滤波上采样 |
|
RePaint: 被掩码的区域进行扩散生成 |
|
代码和案例实践
|
低质量噪声图像修复 |
精确复原原图 |
|
图像去除遮挡、图像补全 |
|
图像生成(人物恢复青春、人物变瘦) |
|
第十三节:GPT1、 GPT2、GPT3、chatGPT原理与实战
|
监督微调(SFT)模型 |
指示学习和提示学习 |
|
简单提示、小样本提示、基于用户的提示 |
|
指令微调 |
|
RLLHF 技术详解(从人类的反馈中学习) |
|
聚合问答数据训练奖励模型(RM) |
|
强化学习微调、PPO |
|
InstructGPT 遵循用户意图使用强化学习方案 |
|
Instruct Learning vs. Prompt Learning |
|
ChatGPT 增加增加了 Chat 属性 |
|
AI 系统的新范式 |
|
GPT1-GPT2-GPT3-InstructGPT 的-chatGPT 的技术关系 |
|
代码和案例实践
|
使用 chatGPT 打造你的私人聊天助理 |
演示提示词技巧,翻译器润色器、JavaScript 控制台 、Excel Sheet |
|
网站定制 chatgpt-web |
|
第十四节: AIGC 图文引导图像生成
|
图像引导、文本引导、图像+文本引导 |
CLIP 和扩散模型的结合:基于 CLIP 模型的多模态引导图像生成:图文引 导 |
|
GLIDE:文本引导 |
|
DALL·E 2:diffusion model 和 CLIP 结合在一起 |
|
隐式分类器引导的图像生成 |
|
Blended Diffusioni 模型 |
|
Diffusion-CLIP 模型 |
|
DiffEdit 模型 |
|
代码和案例实践
|
实现图像引导、文字引导、图文引导下的图片生成 |
Diffusion LM |
|
知识图谱-图网络等“边缘技术”在 AIGC 中的应用 |
|
AIGC 的可能应用领域和行业影响 |
|
第五篇:EXIN AI 认证考试内容 |
|
符合道德伦理和可持续的人类和人工智能(AI)
|
1.1 回顾人类智能和 AI 的一般定义 |
考生能够: |
|
1.1.1 描述智能体的概念 |
|
1.1.2 利用 Robert Dilt 的模型描述关于人类思维逻辑水平的现代方法 |
|
考生能够: |
|
1.2.1 回顾道德伦理的一般定义 |
|
1.2.2 回顾以人为中心且合乎道德的宗旨不能违背基本权利、原则和价值观 |
|
1.2.3 回顾合乎道德的 AI 是通过技术可靠的值得信赖的 AI 实现的 |
|
1.2.4 回顾以人为中心、合乎道德且可信赖的 AI 会持续得到评估和监测 |
|
1.3 描述可持续发展的三个基础领域,以及联合国的 17 个可持续发展目标 |
|
1.4 描述 AI 在“通用化设计”和“第四次工业革命”中的作用 |
|
1.5 理解机器学习(ML)对 AI 的发展起到了极大的推动作用 |
|
考生能够: |
|
1.5.1 描述“在经验中学习”及其与 ML 的关系(Tom Mitchell 给出的 明确定义) |
|
AI 和机器人
|
2.1 表明已理解 AI 智能体定义,并: |
考生能够: |
|
2.1.1 列出四个理性智能体依赖项 |
|
2.1.2 描述智能体的性能度量、环境、执行器和传感器 |
|
2.1.3 描述智能体的四个类型:反射性智能体、基于模型的反射性智能体、 基于目标的智能体、基于效用的智能体 |
|
2.1.4 描述 AI 智能体与 ML 之间的关系 |
|
2.2 描述机器人的概念 |
|
考生能够: |
|
2.2.1 描述机器人范式。 |
|
2.3 描述智能机器人,以及: |
|
考生能够: |
|
2.3.1 智能机器人与智能体的关系 |
|
AI 优势的应用 - 挑战和 风险
|
3.1 描述可持续性与以人为中心且合乎道德的 AI 之间的关系,以及我们 的价值观将如何推动 AI 的使用,进而改变人类、社会和组织 |
3.2 解释 AI 的优势 |
|
考生能够: |
|
3.2.1 列举机器、人类和机器系统的优势 |
|
3.3 描述 AI 的挑战 |
|
考生能够: |
|
3.3.1 列举 AI 引起的道德挑战 |
|
3.3.2 列举与人类系统相比 AI 系统存在的限制的一般示 |
|
3.4 表明已理解 AI 项目的风险 |
|
考生能够: |
|
3.4.1 举出至少一个关于 AI 风险的一般示例 |
|
3.4.2 具体描述典型的 AI 项目团队 |
|
3.4.3 描述什么是领域专家 |
|
3.4.4 描述什么是“符合目标”(fit-of-purpose)。 |
|
3.4.5 描述瀑布项目和敏捷项目之间的区别 |
|
3.5 列举 AI 的机遇 |
|
识别典型的 AI 项目资金来源,并理解什么是美国宇航局技术就绪水平 (TRL) |
|
如何从创建ML工具箱开始 AI 项目 - 理论和实践
|
4.1 讲解如何通过数据 - 功能、软件和硬件学习 |
考生能够: |
|
4.1.1 列举常见的开源 ML 功能、软件和硬件。 |
|
4.1.2 描述 ML 的基础理论 |
|
4.1.3 描述准备数据过程中的典型任务 |
|
4.1.4 描述典型的 ML 算法类型 |
|
4.1.5 描述数据可视化的典型方法。 |
|
4.2 回顾哪个典型的狭义 AI 对 ML 有用,以及 AI 智能体的功能 |
|
人类和机器的管理、作用和责任
|
5.1 表明已理解 AI(特别是 ML)将促使人类和机器协同工作 |
5.2 列举人类与机器协同工作的未来方向 |
|
5.3 说明项目中采用的“从经验中学习”的敏捷方法 |
|
考生能够: |
|
5.3.1 说明敏捷项目所需的团队成员类型。 |
【考试说明】
认证要求:顺利通过EXIN BCS Artificial Intelligence Foundation 考试。
考试细节(EXIN 的考试规则和规定适用于本次考试)
考试类型: 单选题 题目数量: 40
通过分数: 65% (26/40 题) 是否开卷考试: 否
是否记笔记: 否 考试时间: 60 分钟
是否允许携带电子设备/辅助设备: 否
注:具体开课时间将根据实际进行调整,请关注青蓝咨询官方公众号消息或咨询课程顾问!
【联系青蓝咨询】
地址: 深圳市南山区高新南一道06号TCL大厦B座3楼309室 (公交站:大冲 地铁站:一号线高新园C出口)
邮编:518057
电话:0755-86950769
扫码关注 了解更多课程信息