课程信息

课程名称: EXIN AI人工智能认证课程

公开班、定制版

开课时间:2024-08-17

课程介绍

 

【课程简介

本课程内容不仅包括深度学习、机器学习、数据挖掘等具体技术要点,也包括AI的整体发展、现状、应用、商业价值、未来方向等,涵盖内容非常丰富, 使学员理论与实践结合,迅速掌握相关的技术。

本课程亦涵盖了EXIN BCS Artificial Intelligence Foundation 认证考试内容,符合道德、可持续且可靠的 AI 的潜在优势和挑战;机器学习(ML)的基本过程——创建 ML 工具包;与 AI 项目相关的挑战和风险,以及 AI 和人类工作的未来,课程结束后后可参与EXIN组织的AI认证考试。

 

课程目标

本课程结束时,学生将深入理解以下方面的实践知识
1.整体把握机器学习、深度学习、数据挖掘的发展方向

2.了解机器学习、深度学习、计算机视觉的技术框架

3.理解机器学习和深度学习的思维方式和关键技术

4.了解深度学习和机器学习在当前工业界的落地应用

5.了解AI顶会论文和最新技术热点

  

课程形式

课程采取公开班或企业内训形式,课程时间:3天2晚

第一篇--第四篇:3天实战训练营内容

第五篇: 2晚认证考试内容

 

课程要求

Python编程

或至少一门计算机语言(C++、JAVA……)

 

课程大纲

课程大纲

第一篇:数据分析与机器学习引入

第一节:python基础

python基本数据类型:list, dict, tuple, set等

Python文件操作:txt, excel等

Python 的标准库和第三方库

Python高级用法:切片、迭代、map、filter、reduce

Python文件操作

关于形成Pythonic代码习惯的思考

代码和案例实践

大素数计算与优化及其思考

负二项分布与比赛胜率

本福特定律的优化方法

第二节:数据分析和预处理

Numpy/Scipy/Pandas/Matplotlib/Seaborn 库

Numpy 基础属性与数组创建

Numpy 索引

Numpy 数学运算与常用分布

Pandas 数据处理与分析

Pandas 文件读写和个性化控制

Pandas 的 concat 与 merge

Matplotlib 基本图结构介绍

基于 Matplotlib 绘制散点图、柱状图、等高线图、3D 图等

多图合并与图片文件存取

典型图像处理

多种数学曲线

多项式拟合

代码和案例实践

快速傅里叶变换FFT与信号处理

soble/Prewitt/Laplacian算子与卷积网络

卷积与(指数)移动平均线

股票数据分析

缺失数据的处理和预测

环境数据异常检测和分析

快速傅里叶变换FFT

图像处理与奇异值分解SVD

第二篇:机器学习模型详解

第三节:机器学习核心原理与回归分析

线性回归

Logistic/Softmax回归

广义线性回归

L1/L2正则化

Ridge与LASSO

Elastic Net

梯度下降算法:BGD与SGD

特征选择与过拟合

Softmax回归的概念源头

最大熵模型

K-L散度

代码和案例实践

股票数据的特征提取和应用

泰坦尼克号乘客缺失数据处理和存活率预测

环境检测数据异常分析和预测

模糊数据查询和数据校正方法

PCA与鸢尾花数据分类

二手车数据特征选择与算法模型比较

广告投入与销售额回归分析

鸢尾花数据集的分类

第四节:决策和随机森林

熵、联合熵、条件熵、KL 散度、互信息

最大似然估计与最大熵模型

ID3、C4.5、CART 详解

决策树的正则化

预剪枝和后剪枝

Bagging

随机森林

不平衡数据集的处理

利用随机森林做特征选择

使用随机森林计算样本相似度

异常值检测

代码和案例实践

随机森林与特征选择

决策树应用于回归

多标记的决策树回归

决策树和随机森林的可视化

葡萄酒数据集的决策树/随机森林分类

泰坦尼克乘客存活率估计

五节:聚类分析

 

各种相似度度量及其相互关系

Jaccard 相似度和准确率、召回率

Pearson 相关系数与余弦相似度

K-means 与 K-Medoids 及变种

层次聚类:自顶向下,自底向上

AP 算法(Sci07)/LPA 算法及其应用

密度聚类 DBSCAN/DensityPeak(Sci14)

谱聚类 SC

聚类评价和结果指标

代码和案例实践

K-Means++算法原理和实现

向量量化 VQ 及图像近似

并查集的实践应用

密度聚类的异常值检测

谱聚类用于图片分割

第六节:关联规则挖掘算法

项、事务

支持度、置信度、lift 值、Conviction

关联规则算法详述

频繁项集及其快速发现

阈值选择问题 

BFS 和 DFS 搜索策略

计数法和交集法

Apriori、Eclat

FP-growth

代码和案例实际

商品和用户相关性分析与推荐

用户相似性评价的不同方案与异同比较

并查集的实践应用

关联规则与 SVD、LFM 的实战区别

第七节:XGBoost 与

LightGBM 模型详解

 

定义树的复杂度

boosting tree 的提升思路

残差的选择

XGBoost 损失函数的提成

Loss 的精确一阶导数和二阶导数

近似加权分位法

稀疏自适应分割策略

XGBoost 的过拟合与正则化目标函数

算法成功之处和存在的问题

boosting 框架总览

重新认识样本的梯度

GOSS 思想在 LightGBM 中的应用

贪心和启发式特征搜索

EFB 候选特征的选择

Histogram 算法与 Pre-sorted 算法对数据结构的影响

样本采样与权重

再谈引入稀疏数据的原因

单边采样带来的训练样本减少

代码和案例实践

收入分类模型的提升应用

XGBoost 库与 sklearn 库的使用

提升模型在用户感知评分预测的应用

XGBoost 用于真实信号数据中的分类建模和调参

钻井工况数据在 LightGBM 中的实践

      LightGBM 与 XGBoost 的性能比较

      基站小区节能预测建模

      哪些场景不适合 LightGBM

第三篇:深度学习原理与实践

第八节:卷积神经网络

神经网络结构,滤波器,卷积

池化,激活函数,反向传播

目标分类与识别、目标检测与追踪

AlexNet、VGGNet、GoogleLeNet

Inception-V3/V4

ResNet、DenseNet

代码和案例实践

数字图片分类

卷积核与特征提取

以图搜图

人证合一

卷积神经网络调参经验分享

第九节:卷积神经网络高

级应用

 

Inception-V3/V4

ResNet、DenseNet

使用迁移学习实现蒙古文识别

获取中间隐层的特征及可视化

隐层特征的意义和使用

迁移学习的 trick

学习率、衰减、冻结等问题

代码和案例实践

 

数字图片分类

卷积核与特征提取

以图搜图

人证合一

卷积神经网络调参经验分享

猫狗大战详解

海量蒙古文识别

隐特征可视化及其应用

第十节:图像目标检测与

视频分类

 

视频关键帧处理

卷积的位置不变形与图像定位的关系

物体检测与定位

RCNN,Fast-RCNN,Faster-RCNN,MaskRCNN

YOLOv4、SSD

UNet 及其与残差网络的结合

FaceNet 与特征

EfficientNet、EfficientDet

视频帧的目标定位

时空卷积网络

SlowFast

代码和案例实践

 

人脸检测

OCR 字体定位和识别

睿客识云

气象识别

视频分类的 trick

政务大厅视频监控的真实系统

第十一节:循环神经网络 RNN

 

 

语言模型 Bi-Gram/Tri-Gram/N-Gram

分词算法的原理及类似应用

词性标注

语义关系抽取

词向量

文本分类:基于 CNN 和基于 LSTM 的方法比较

机器翻译:Seq2Seq 的典型应用

Transformer、BERT 等模型原理

文本摘要与信息抽取

阅读理解

问答系统

情感分析

代码和案例实践

 

知识图谱:命名实体识别的实践

知识图谱:实体关系的判定与分类

HMM 分词及 CRF 的异同

文本摘要的生成

智能对话系统和 SeqSeq 模型

阅读理解的实现与 Attention

机器翻译

使用 LSTM 生成文本

第四篇:AIGC与大模型实践

第十二节:扩散模型

 

GAN-VAE-流模型-扩散模型的技术发展和变化

CLIP 和扩散模型的结合:基于 CLIP 模型的多模态引导图像生成:图文引导

GLIDE:文本引导

Diffusion-CLIP 模型

扩散和去噪(Diffusion&Denoise)

训练和采样(Training&Sampling)

离散步骤的马尔可夫链

分子热动力学的扩散过程

离散加噪

DDPM-最经典的扩散模型

DDIM:加速采样、可控扩散

IVLR:迭代去燥的图像编辑,低通滤波上采样

RePaint: 被掩码的区域进行扩散生成

代码和案例实践

 

低质量噪声图像修复

精确复原原图

图像去除遮挡、图像补全

图像生成(人物恢复青春、人物变瘦)

第十三节:GPT1、 GPT2、GPT3、chatGPT原理与实战

 

 

 

监督微调(SFT)模型

指示学习和提示学习

简单提示、小样本提示、基于用户的提示

指令微调

RLLHF 技术详解(从人类的反馈中学习)

聚合问答数据训练奖励模型(RM)

强化学习微调、PPO

InstructGPT 遵循用户意图使用强化学习方案

Instruct Learning vs. Prompt Learning

ChatGPT 增加增加了 Chat 属性

AI 系统的新范式

GPT1-GPT2-GPT3-InstructGPT 的-chatGPT 的技术关系

代码和案例实践

 

使用 chatGPT 打造你的私人聊天助理

演示提示词技巧,翻译器润色器、JavaScript 控制台 、Excel Sheet

网站定制 chatgpt-web

第十四节: AIGC 图文引导图像生成

 

图像引导、文本引导、图像+文本引导

CLIP 和扩散模型的结合:基于 CLIP 模型的多模态引导图像生成:图文引

GLIDE:文本引导

DALL·E 2:diffusion model 和 CLIP 结合在一起

隐式分类器引导的图像生成

Blended Diffusioni 模型

Diffusion-CLIP 模型

DiffEdit 模型

代码和案例实践

 

实现图像引导、文字引导、图文引导下的图片生成

Diffusion LM

知识图谱-图网络等“边缘技术”在 AIGC 中的应用

AIGC 的可能应用领域和行业影响

第五篇:EXIN AI 认证考试内容

符合道德伦理和可持续的人类和人工智能(AI)

 

1.1 回顾人类智能和 AI 的一般定义

考生能够:

1.1.1 描述智能体的概念

1.1.2 利用 Robert Dilt 的模型描述关于人类思维逻辑水平的现代方法

考生能够:

1.2.1 回顾道德伦理的一般定义

1.2.2 回顾以人为中心且合乎道德的宗旨不能违背基本权利、原则和价值观

1.2.3 回顾合乎道德的 AI 是通过技术可靠的值得信赖的 AI 实现的

1.2.4 回顾以人为中心、合乎道德且可信赖的 AI 会持续得到评估和监测

1.3 描述可持续发展的三个基础领域,以及联合国的 17 个可持续发展目标

1.4 描述 AI 在“通用化设计”和“第四次工业革命”中的作用

1.5 理解机器学习(ML)对 AI 的发展起到了极大的推动作用

考生能够:

1.5.1 描述“在经验中学习”及其与 ML 的关系(Tom Mitchell 给出的

明确定义)

AI 和机器人

 

2.1 表明已理解 AI 智能体定义,并:

考生能够:

2.1.1 列出四个理性智能体依赖项

2.1.2 描述智能体的性能度量、环境、执行器和传感器

2.1.3 描述智能体的四个类型:反射性智能体、基于模型的反射性智能体、

基于目标的智能体、基于效用的智能体

2.1.4 描述 AI 智能体与 ML 之间的关系

2.2 描述机器人的概念

考生能够:

2.2.1 描述机器人范式。

2.3 描述智能机器人,以及:

考生能够:

2.3.1 智能机器人与智能体的关系

AI 优势的应用 - 挑战和 风险

 

3.1 描述可持续性与以人为中心且合乎道德的 AI 之间的关系,以及我们

的价值观将如何推动 AI 的使用,进而改变人类、社会和组织

3.2 解释 AI 的优势

考生能够:

3.2.1 列举机器、人类和机器系统的优势

3.3 描述 AI 的挑战

考生能够:

3.3.1 列举 AI 引起的道德挑战

3.3.2 列举与人类系统相比 AI 系统存在的限制的一般示

3.4 表明已理解 AI 项目的风险

考生能够:

3.4.1 举出至少一个关于 AI 风险的一般示例

3.4.2 具体描述典型的 AI 项目团队

3.4.3 描述什么是领域专家

3.4.4 描述什么是“符合目标”(fit-of-purpose)。

3.4.5 描述瀑布项目和敏捷项目之间的区别

3.5 列举 AI 的机遇

识别典型的 AI 项目资金来源,并理解什么是美国宇航局技术就绪水平

TRL)

如何从创建ML工具箱开始 AI 项目 - 理论和实践

 

4.1 讲解如何通过数据 - 功能、软件和硬件学习

考生能够:

4.1.1 列举常见的开源 ML 功能、软件和硬件。

4.1.2 描述 ML 的基础理论

4.1.3 描述准备数据过程中的典型任务

4.1.4 描述典型的 ML 算法类型

4.1.5 描述数据可视化的典型方法。

4.2 回顾哪个典型的狭义 AI 对 ML 有用,以及 AI 智能体的功能

人类和机器的管理、作用和责任

 

5.1 表明已理解 AI(特别是 ML)将促使人类和机器协同工作

5.2 列举人类与机器协同工作的未来方向

5.3 说明项目中采用的“从经验中学习”的敏捷方法

考生能够:

5.3.1 说明敏捷项目所需的团队成员类型。

 

 

考试说明

认证要求:顺利通过EXIN BCS Artificial Intelligence Foundation 考试。
考试细节(EXIN 的考试规则和规定适用于本次考试)

考试类型: 单选题                           题目数量: 40

通过分数: 65% (26/40 题)                   是否开卷考试:

是否记笔记:                            考试时间: 60 分钟

是否允许携带电子设备/辅助设备:


注:具体开课时间将根据实际进行调整,请关注青蓝咨询官方公众号消息或咨询课程顾问!

 




 

【联系青蓝咨询】

地址: 深圳市南山区高新南一道06号TCL大厦B座3楼309室 (公交站:大冲   地铁站:一号线高新园C出口) 

    邮编:518057 

    电话:0755-86950769

    邮箱:peixun@shzhchina.com 

    网址:http://www.shzhchina.com

 

扫码关注 了解更多课程信息