高性能神经网络与 AI 芯片应用研修课程

人工智能技术近 10 年得到了飞速的发展，这不仅仅是依靠大数据的支撑，更是计算机芯片算力不断提升的结果，而实现超级算力的核心就是 AI 芯片。AI 芯片也被称为人工智能加速器，即专门用于处理人工智能应用中的大量计算任务的模块。如何借助 AI 芯片来实现特定的任务，是所有AI芯片产业人员必备的技能。

为此，贪心学院重磅推出高性能神经网络与 AI 芯片应用研修课程，为想进入 AI 芯片行业的同学们提供一个可以大幅提升自身就业竞争力的选择。

本课程会讲解 AI 芯片相关知识、高性能网络设计、通用芯片及专用芯片计算加速方法等专业技能，并结合优秀编译器的架构和实现细节的讲解，为学生构建高性能 AI 算法的软硬件视角，能够解决应用落地时神经网络的优化和部署相关问题。

课程目录

第一周：轻量化网络结构设计

本节课将讲解网络参数量、浮点运算数等模型评价指标、工具，以及分类网络，检测网络，分割网络的轻量化设计。

课程提纲：

轻量化网络设计背景介绍
网络的计算量和内存分析工具
主干网络的轻量化
检测网络的轻量化
分割网络的轻量化
典型网络的设计思路

第二周：知识蒸馏优化、低秩分解优化

本节课将讲解神经网络知识蒸馏优化、神经网络计算低秩分解加速计算方法。

课程提纲：

知识蒸馏方法介绍

知识蒸馏原理和步骤介绍

知识蒸馏训练方法缩减网络的实际分类网络演示

低秩分解原理

低秩分解加速计算在神经网络推理中的应用

第三周：网络剪枝

本节课将讲解网络稀疏性原理，网络剪枝原则及剪枝的常见方法。
课程提纲：
网络剪枝的原理
常用的剪枝策略
神经网络框架中的剪枝功能介绍
剪枝的实际使用

第四周：网络量化

本节课将讲解网络的低比特化，以及在AI芯片中的计算，实现网络量化的离线和在线感知的量化方法。
课程提纲：
网络量化的技术发展
不同离线量化算法的实现原理
神经网络框架中在线感知量化算法的原理及实现
实际案例

第五周：神经网络编译器简介

本节课将讲解tvm、ncnn、tnn、mnn的简要对比，tvm relay和网络转换，网络的编译优化和推理加速。

课程提纲：

tvm、ncnn、tnn、mnn的简要对比
tvm relay和网络转换
网络的编译优化和推理加速
tvm的实际案例

第六周：ncnn
本节课将讲解ncnn的系统架构图，数据结构，支持的框架，网络的表示，网络优化，量化，以及各平台的优化策略。

课程提纲：

ncnn的系统架构图
ncnn的数据结构及支持框架
ncnn的网络表示
ncnn网络优化，量化，及各平台的优化策略

第七周：tnn
本节课将讲解tnn的系统架构图，数据结构，支持的框架，网络的表示，网络优化，量化，以及各平台的优化策略。
课程提纲：
tnn的系统架构图
tnn的数据结构及支持框架
tnn的网络表示
tnn网络优化，量化，及各平台的优化策略

第八周：mnn

本节课将讲解mnn的系统架构图，数据结构，支持的框架，网络的表示，网络优化，量化，以及各平台的优化策略。

课程提纲：

mnn的系统架构图
mnn的数据结构及支持框架
mnn的网络表示
mnn网络优化，量化，及各平台的优化策略

第九周：cpu中的指令集优化

本节课将讲解cpu中的指令集优化，simd、avx、sse方法，及tvm中对于cpu上神经网络加速的位置。

课程提纲：

cpu中的指令集优化：simd，avx，sse方法
tvm中对于cpu上神经网络加速的位置

第十周：arm中的神经网络加速

本节课将讲解arm中的neon优化，及ncnn，tnn和mnn的实现，并结合实际例子来看具体的加速效果。
课程提纲：
arm中的neon优化
ncnn，tnn和mnn实现的讲解
具体加速效果的实际案例

第十一周：卷积计算的优化算法
本节课将讲解卷积计算的优化算法，包括winograd等。

第十二周：神经网络加速库
本节课将讲解openblas库的优化，nnpack/qnnpack的优化，及lowpgemm。
课程提纲：
openblas库的优化

nnpack/qnnpack的优化

lowpgemm

第十三周：gpu上神经网络的运行和加速

本节课将讲解gpu与cpu计算加速的区别，英伟达gpu的原生cuda加速方法，及推理侧tensorrt的使用。

课程提纲：

gpu与cpu计算加速的区别
英伟达gpu的原生cuda加速方法
推理侧tensorrt的使用

第十四周：gpu加速通用加速库

本节课将讲解通用加速库cublas，vulkan，opencl的使用。

课程提纲：

通用加速库cublas的使用
Vulkan的使用
opencl的使用

第十五周：dsp，fpga，npu专用加速计算

本节课将讲解dsp，fpga，npu的专用加速计算。

课程提纲：

dsp计算加速
fpga计算加速
npu专用加速计算
第十六周：npu使用
本节课将以嘉楠科技的k210为例，实现一个人脸检测案例。
课程提纲：
嘉楠科技k210芯片介绍
nncase人脸检测案例

下载权限

查看

￥

免费下载

评论并刷新后下载

登录后下载
其他用户
办理会员后下载

查看演示

{{attr.name}}：

您当前等级为

登录后免费下载登录黑名单用户禁止下载！评论后刷新页面下载评论支付以后下载请先登录您今天的下载次数（次）已用完，明日重置支付积分以后下载立即支付支付以后下载立即支付您当前用户组不允许下载升级会员

您已获得下载权限您可以每天下载资源次，今日剩余次

{{userData.name}}已认证

高性能神经网络与 AI 芯片应用研修课程

课程目录

下载权限

查看演示

零基础直击 Rust 核心课程

万门大学，机器学习原理与应用入门

电脑端教程

苹果端教程

安卓端教程

《长安三万里》国产热门动画电影，天翼/阿里云盘下载

一百种生活短视频创作营

球迷汇，提供在线免费体育赛事直播 APP

绝对领域：资源大合集精华收藏 [5911P+3.4GB]

数据结构与算法基础 Java 版

最新好用的磁力搜索引擎大全推荐

左公子 666 微博相册+微密圈福利合集 [5V+495P/768M]

FANZA 2022 年通贩演员榜，美妙绝伦长江后浪推前浪

SkylineWebcams – 在线观看全球各地最美旅游景点实况摄像头

2022 年岛国最强百大女老师排行，阑夕测评必属精品

{{userData.name}}已认证

课程目录

下载权限

查看演示

零基础直击 Rust 核心课程

万门大学，机器学习原理与应用入门

后厂 - 导师制名企实训班自然语言处理方向课程

Python 3 入门机器学习课程

AI 产品经理赋能实战精英班

MSF 之 msfvenom（毒液）主动攻击课程