昇腾AI处理器架构与编程 深入理解CANN技术原理及应用 华为智能计算技术丛书

《昇腾AI处理器架构与编程 深入理解CANN技术原理及应用 华为智能计算技术丛书》

  • 出版社:清华大学出版社
  • ISBN:9787302534525
  • 版次:1
  • 商品编码:12570999
  • 品牌:清华大学出版社(TsinghuaUniversityPress)
  • 包装:平装
  • 开本:16开
  • 出版时间:2019-10-01
  • 用纸:胶版纸
  • 页数:273
  • 字数:330000
基本介绍书籍目录点评信息
  • 书籍内容

    本书系统论述了基本达芬奇架构的昇腾(Asccnd)AI处理器的原理、架构与开发技术。全书共分6章,内容涵盖了神经网络理论基础、计算芯片与开源框架、昇腾AI处理器软硬件架构、编程理论与方法,以及典型案例等。为便于读者学习,书中还给出了基本昇腾AI处理器的丰富的技术文档、开发实例等线上资源。
    本书可以作为普通高等学校人工智能、智能科学与技术、计算机科学与技术、电子信息工程、自动化等专业的本科生及研究生教材,也适合作为从事人工智能系统设计的科研和工程技术人员的参考用书。

    编辑推荐

    本书是华为公司官方出品!华为轮值董事长徐直军、中国工程院院士高文、中国科学院院士毛军发作序!揭开达芬奇架构AI处理器的神秘面纱、掌握强大算力的使用方法!昇腾Ascend AI处理器是业界领先的人工智能运算芯片,可以应用于未来的各类人工智能场景。本书由上海交大梁晓峣教授执笔,华为公司一线技术支持,并提供了大量可以运行的算例。本书可以作为广大AI工程师的参考用书,也可以作为高等学校人工智能、计算机等专业“微处理器/微控制器/人工智能芯片”等相关课程教材。

    作者简介

    梁晓峣 上海交通大学计算机科学与工程系教授、博士生导师、学科带头人。毕业于美国哈佛大学,获得博士学位。研究方向包括计算机体系结构、集成电路设计、通用图形处理器和人工智能芯片架构等。发表论文80余篇(包括国际d级学术会议(ISCA、HPCA、MICRO、ISSCC、DAC、ICCAD等)论文),其中2篇入选计算机体系结构年度z佳论文(IEEE MICRO TOP PICKS)。
  • CONTENTS
    第1章基础理论00
    1.1人工智能简史00
    1.2深度学习概论00
    1.3神经网络理论0
    1.3.1神经元模型0
    1.3.2感知机0
    1.3.3多层感知机0
    1.3.4卷积神经网络0
    1.3.5应用示例0
    第2章行业背景0
    2.1神经网络芯片现状0
    2.1.1CPU0
    2.1.2GPU0
    2.1.3TPU0
    2.1.4FPGA0
    2.1.5昇腾AI处理器0
    2.2神经网络芯片加速理论0
    2.2.1GPU加速理论0
    2.2.2TPU加速理论0
    2.3深度学习框架0
    2.3.1MindSpore0
    2.3.2Caffe0
    2.3.3TensorFlow0
    2.3.4PyTorch0
    2.4深度学习编译框架——TVM0
    第3章硬件架构0
    3.1昇腾AI处理器总览0
    3.2达芬奇架构0
    3.2.1计算单元0
    3.2.2存储系统0
    3.2.3控制单元0
    3.2.4指令集设计0
    3.3卷积加速原理0
    3.3.1卷积加速0
    3.3.2架构对比0
    第4章软件架构0
    4.1昇腾AI软件栈总览0
    4.2神经网络软件流
    4.2.1流程编排器
    4.2.2数字视觉预处理模块
    4.2.3张量加速引擎(TBE)
    4.2.4运行管理器
    4.2.5任务调度器
    4.2.6框架管理器
    4.2.7神经网络软件流应用
    4.3开发工具链
    4.3.1功能简介
    4.3.2功能框架
    4.3.3工具功能
    第5章编程方法
    5.1深度学习开发基础
    5.1.1深度学习编程理论
    5.1.2深度学习推理优化原理
    5.1.3深度学习推理引擎
    5.2昇腾AI软件栈中的技术
    5.2.1模型生成阶段
    5.2.2应用编译与部署阶段
    5.3自定义算子开发
    5.3.1开发步骤
    5.3.2AI CPU算子开发
    5.3.3AI Core算子开发
    5.4自定义应用开发
    第6章实战案例
    6.1评价标准
    6.1.1精度
    6.1.2交并比
    6.1.3均值平均精度
    6.1.4吞吐量和时延
    6.1.5能效比
    6.2图像识别
    6.2.1数据集:ImageNet
    6.2.2算法:ResNet
    6.2.3模型迁移实践
    6.3目标检测
    6.3.1数据集:COCO
    6.3.2算法:YoloV3
    6.3.3自定义算子实践
    附录A缩略词列表
    附录BAscend开发者社区及资料下载
    附录C智能开发平台ModelArts简介
微信公众号

热门文章

更多