高性能神经网络与 AI 芯片应用研修课程

人工智能技术近 10 年得到了飞速的发展,这不仅仅是依靠大数据的支撑,更是计算机芯片算力不断提升的结果,而实现超级算力的核心就是 AI 芯片。AI 芯片也被称为人工智能加速器,即专门用于处理人工智能应用中的大量计算任务的模块。如何借助 AI 芯片来实现特定的任务,是所有AI芯片产业人员必备的技能。

为此,贪心学院重磅推出高性能神经网络与 AI 芯片应用研修课程,为想进入 AI 芯片行业的同学们提供一个可以大幅提升自身就业竞争力的选择。

本课程会讲解 AI 芯片相关知识、高性能网络设计、通用芯片及专用芯片计算加速方法等专业技能,并结合优秀编译器的架构和实现细节的讲解,为学生构建高性能 AI 算法的软硬件视角,能够解决应用落地时神经网络的优化和部署相关问题。

课程目录

第一周:轻量化网络结构设计

本节课将讲解网络参数量、浮点运算数等模型评价指标、工具,以及分类网络, 检测网络,分割网络的轻量化设计。

课程提纲:

轻量化网络设计背景介绍
网络的计算量和内存分析工具
主干网络的轻量化
检测网络的轻量化
分割网络的轻量化
典型网络的设计思路

第二周:知识蒸馏优化、低秩分解优化

本节课将讲解神经网络知识蒸馏优化、神经网络计算低秩分解加速计算方法。

课程提纲:

知识蒸馏方法介绍

知识蒸馏原理和步骤介绍

知识蒸馏训练方法缩减网络的实际分类网络演示

低秩分解原理

低秩分解加速计算在神经网络推理中的应用

第三周:网络剪枝

本节课将讲解网络稀疏性原理,网络剪枝原则及剪枝的常见方法。
课程提纲:
网络剪枝的原理
常用的剪枝策略
神经网络框架中的剪枝功能介绍
剪枝的实际使用

第四周:网络量化

本节课将讲解网络的低比特化,以及在AI芯片中的计算,实现网络量化的离线和在线感知的量化方法。
课程提纲:
网络量化的技术发展
不同离线量化算法的实现原理
神经网络框架中在线感知量化算法的原理及实现
实际案例

第五周:神经网络编译器简介

本节课将讲解tvm、ncnn、tnn、mnn的简要对比,tvm relay和网络转换,网络的编译优化和推理加速。

课程提纲:

tvm、ncnn、tnn、mnn的简要对比
tvm relay和网络转换
网络的编译优化和推理加速
tvm的实际案例

第六周:ncnn
本节课将讲解ncnn的系统架构图,数据结构,支持的框架,网络的表示,网络优化,量化,以及各平台的优化策略。

课程提纲:

ncnn的系统架构图
ncnn的数据结构及支持框架
ncnn的网络表示
ncnn网络优化,量化,及各平台的优化策略

第七周:tnn
本节课将讲解tnn的系统架构图,数据结构,支持的框架,网络的表示,网络优化,量化,以及各平台的优化策略。
课程提纲:
tnn的系统架构图
tnn的数据结构及支持框架
tnn的网络表示
tnn网络优化,量化,及各平台的优化策略

第八周:mnn

本节课将讲解mnn的系统架构图,数据结构,支持的框架,网络的表示,网络优化,量化,以及各平台的优化策略。

课程提纲:

mnn的系统架构图
mnn的数据结构及支持框架
mnn的网络表示
mnn网络优化,量化,及各平台的优化策略

第九周:cpu中的指令集优化

本节课将讲解cpu中的指令集优化,simd、avx、sse方法,及tvm中对于cpu上神经网络加速的位置。

课程提纲:

cpu中的指令集优化:simd,avx,sse方法
tvm中对于cpu上神经网络加速的位置

第十周:arm中的神经网络加速

本节课将讲解arm中的neon优化,及ncnn,tnn和mnn的实现,并结合实际例子来看具体的加速效果。
课程提纲:
arm中的neon优化
ncnn,tnn和mnn实现的讲解
具体加速效果的实际案例

第十一周:卷积计算的优化算法
本节课将讲解卷积计算的优化算法,包括winograd等。

第十二周:神经网络加速库
本节课将讲解openblas库的优化,nnpack/qnnpack的优化,及lowpgemm。
课程提纲:
openblas库的优化

nnpack/qnnpack的优化

lowpgemm

第十三周:gpu上神经网络的运行和加速

本节课将讲解gpu与cpu计算加速的区别,英伟达gpu的原生cuda加速方法,及推理侧tensorrt的使用。

课程提纲:

gpu与cpu计算加速的区别
英伟达gpu的原生cuda加速方法
推理侧tensorrt的使用

第十四周:gpu加速通用加速库

本节课将讲解通用加速库cublas,vulkan,opencl的使用。

课程提纲:

通用加速库cublas的使用
Vulkan的使用
opencl的使用

第十五周:dsp,fpga,npu专用加速计算

本节课将讲解dsp,fpga,npu的专用加速计算。

课程提纲:

dsp计算加速
fpga计算加速
npu专用加速计算
第十六周:npu使用
本节课将以嘉楠科技的k210为例,实现一个人脸检测案例。
课程提纲:
嘉楠科技k210芯片介绍
nncase人脸检测案例

下载权限

查看
  • 免费下载
    评论并刷新后下载
    登录后下载

  • {{attr.name}}:
您当前等级为
登录后免费下载登录 黑名单反思中,不准下载! 评论后刷新页面下载评论 支付以后下载 需要登录 支付积分以后下载立即支付 支付以后下载立即支付 您当前的用户组不允许下载升级权限
您有每天免费下载所有资源次特权,今日剩余 已取得下载权限
重要声明

本站资源均来自网络分享,仅用于站内学习或测试研究使用。如有侵犯您的权益请私信留言,我们会第一时间审核。未经原版权作者许可,禁止用于任何商业途径,请在下载二十四小时内删除!


如果遇到需要升级才可获取的素材,建议升级对应的权限。 全站 90% 以上的素材“均有备份”。 本站资源均以主流网盘分享,以 7z、rar、分卷等常见的格式压缩,为防止有人压缩软件不支持 7z 格式,7z 解压,建议下载 7-zip,zip、rar 解压,建议下载 WinRAR 手机下载解压教程详见 帮助中心 。

学习课程

零基础直击 Rust 核心课程

2022-09-17 07:00

学习课程

万门大学,机器学习原理与应用入门

2022-09-18 01:00

相关文章

后厂 - 导师制名企实训班自然语言处理方向课程

后厂 - 导师制名企实训班自然语言处理方向课程

AI 行业是 21 世纪的风口行业,国家政策扶持,企业资源倾投,行业人才缺口达到 500W。面对这么大的人才缺口,很多人依然无法找到 AI 相关的工作,为什么? 工作年限多的求职者很容易思维和技能陈旧,跟不上行业发展;转行的求职者技能与岗位要求匹配度较低。 后厂理工学院数十位深耕 AI 领域多年的资…

Python 3 入门机器学习课程

Python 3 入门机器学习课程

特为机器学习初学者量身打造,使用新版 python 3 语言和流行的 scikit-learn 框架,算法与编程两翼齐飞,由浅入深,一步步的进入机器学习的世界。学到的不只是一门课程,更是不断思考的能力。

AI 产品经理赋能实战精英班

AI 产品经理赋能实战精英班

AI 产品经理除了要掌握通用的产品技能,需要具有更强的专业性、广博性和条理性;AI 技术作为一种新的生产力,处理了过往技术无法处理的复杂的非结构化数据。很多人在使用机器学习时,喜欢简单粗暴的将数据丢给算法模型,期望从数据中自己得到结论;AI 绝不是将手中的数据喂给它,就能够解决我们的业务问题。 课程…

MSF 之 msfvenom(毒液)主动攻击课程

MSF 之 msfvenom(毒液)主动攻击课程

“领航者教育”与腾讯课堂机构“京峰教育”、“武汉网盾科技”及业内多位专家和图书作者,达成全面深入合作,强强联手,教育主体机构由“领航者教育”及“京峰教育”携手共创,并肩作战,同时课程携手绿盟安全技术总监、任子行安全顾问、奇安信安全首席工程师共同打造全面性及深入研修课程。
0 条回复 A文章作者 M管理员
发表垃圾评论,一经核查直接关小黑屋
    暂无讨论,说说你的看法吧
个人中心
今日签到
有新私信 私信列表
全站搜索