当前位置:首页>资源汇总>学习课程>高性能神经网络与 AI 芯片应用研修课程

高性能神经网络与 AI 芯片应用研修课程

人工智能技术近 10 年得到了飞速的发展,这不仅仅是依靠大数据的支撑,更是计算机芯片算力不断提升的结果,而实现超级算力的核心就是 AI 芯片。AI 芯片也被称为人工智能加速器,即专门用于处理人工智能应用中的大量计算任务的模块。如何借助 AI 芯片来实现特定的任务,是所有AI芯片产业人员必备的技能。

为此,贪心学院重磅推出高性能神经网络与 AI 芯片应用研修课程,为想进入 AI 芯片行业的同学们提供一个可以大幅提升自身就业竞争力的选择。

本课程会讲解 AI 芯片相关知识、高性能网络设计、通用芯片及专用芯片计算加速方法等专业技能,并结合优秀编译器的架构和实现细节的讲解,为学生构建高性能 AI 算法的软硬件视角,能够解决应用落地时神经网络的优化和部署相关问题。

课程目录

第一周:轻量化网络结构设计

本节课将讲解网络参数量、浮点运算数等模型评价指标、工具,以及分类网络, 检测网络,分割网络的轻量化设计。

课程提纲:

轻量化网络设计背景介绍
网络的计算量和内存分析工具
主干网络的轻量化
检测网络的轻量化
分割网络的轻量化
典型网络的设计思路

第二周:知识蒸馏优化、低秩分解优化

本节课将讲解神经网络知识蒸馏优化、神经网络计算低秩分解加速计算方法。

课程提纲:

知识蒸馏方法介绍

知识蒸馏原理和步骤介绍

知识蒸馏训练方法缩减网络的实际分类网络演示

低秩分解原理

低秩分解加速计算在神经网络推理中的应用

第三周:网络剪枝

本节课将讲解网络稀疏性原理,网络剪枝原则及剪枝的常见方法。
课程提纲:
网络剪枝的原理
常用的剪枝策略
神经网络框架中的剪枝功能介绍
剪枝的实际使用

第四周:网络量化

本节课将讲解网络的低比特化,以及在AI芯片中的计算,实现网络量化的离线和在线感知的量化方法。
课程提纲:
网络量化的技术发展
不同离线量化算法的实现原理
神经网络框架中在线感知量化算法的原理及实现
实际案例

第五周:神经网络编译器简介

本节课将讲解tvm、ncnn、tnn、mnn的简要对比,tvm relay和网络转换,网络的编译优化和推理加速。

课程提纲:

tvm、ncnn、tnn、mnn的简要对比
tvm relay和网络转换
网络的编译优化和推理加速
tvm的实际案例

第六周:ncnn
本节课将讲解ncnn的系统架构图,数据结构,支持的框架,网络的表示,网络优化,量化,以及各平台的优化策略。

课程提纲:

ncnn的系统架构图
ncnn的数据结构及支持框架
ncnn的网络表示
ncnn网络优化,量化,及各平台的优化策略

第七周:tnn
本节课将讲解tnn的系统架构图,数据结构,支持的框架,网络的表示,网络优化,量化,以及各平台的优化策略。
课程提纲:
tnn的系统架构图
tnn的数据结构及支持框架
tnn的网络表示
tnn网络优化,量化,及各平台的优化策略

第八周:mnn

本节课将讲解mnn的系统架构图,数据结构,支持的框架,网络的表示,网络优化,量化,以及各平台的优化策略。

课程提纲:

mnn的系统架构图
mnn的数据结构及支持框架
mnn的网络表示
mnn网络优化,量化,及各平台的优化策略

第九周:cpu中的指令集优化

本节课将讲解cpu中的指令集优化,simd、avx、sse方法,及tvm中对于cpu上神经网络加速的位置。

课程提纲:

cpu中的指令集优化:simd,avx,sse方法
tvm中对于cpu上神经网络加速的位置

第十周:arm中的神经网络加速

本节课将讲解arm中的neon优化,及ncnn,tnn和mnn的实现,并结合实际例子来看具体的加速效果。
课程提纲:
arm中的neon优化
ncnn,tnn和mnn实现的讲解
具体加速效果的实际案例

第十一周:卷积计算的优化算法
本节课将讲解卷积计算的优化算法,包括winograd等。

第十二周:神经网络加速库
本节课将讲解openblas库的优化,nnpack/qnnpack的优化,及lowpgemm。
课程提纲:
openblas库的优化

nnpack/qnnpack的优化

lowpgemm

第十三周:gpu上神经网络的运行和加速

本节课将讲解gpu与cpu计算加速的区别,英伟达gpu的原生cuda加速方法,及推理侧tensorrt的使用。

课程提纲:

gpu与cpu计算加速的区别
英伟达gpu的原生cuda加速方法
推理侧tensorrt的使用

第十四周:gpu加速通用加速库

本节课将讲解通用加速库cublas,vulkan,opencl的使用。

课程提纲:

通用加速库cublas的使用
Vulkan的使用
opencl的使用

第十五周:dsp,fpga,npu专用加速计算

本节课将讲解dsp,fpga,npu的专用加速计算。

课程提纲:

dsp计算加速
fpga计算加速
npu专用加速计算
第十六周:npu使用
本节课将以嘉楠科技的k210为例,实现一个人脸检测案例。
课程提纲:
嘉楠科技k210芯片介绍
nncase人脸检测案例

下载权限

查看
  • 免费下载
    评论并刷新后下载
    登录后下载
  • 其他用户
    办理会员后下载

查看演示

  • {{attr.name}}:
您当前等级为
登录后免费下载登录 黑名单用户禁止下载! 评论后刷新页面下载评论 支付以后下载 请先登录 您今天的下载次数(次)已用完,明日重置 支付积分以后下载立即支付 支付以后下载立即支付 您当前用户组不允许下载升级会员
您已获得下载权限 您可以每天下载资源次,今日剩余
重要声明

本站资源均来自网络分享,仅用于站内学习或测试研究使用。如有侵犯您的权益请私信留言,我们会第一时间审核。未经原版权作者许可,禁止用于任何商业途径,请在下载二十四小时内删除!


如果遇到需要升级才可获取的素材,建议升级对应的权限。 全站 90% 以上的素材“均有备份”。 本站资源均以主流网盘分享,以 7z、rar、分卷等常见的格式压缩,为防止有人压缩软件不支持 7z 格式,7z 解压,建议下载 7-zip,zip、rar 解压,建议下载 WinRAR 手机下载解压教程详见 帮助中心 。

学习课程

零基础直击 Rust 核心课程

2022-09-17 07:00

学习课程

万门大学,机器学习原理与应用入门

2022-09-18 01:00

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
今日签到
有新私信 私信列表
站内搜索