期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
面向深度学习推理的矩阵乘法加速器设计 预览
1
作者 冉德成 吴东 钱磊 《计算机工程》 CAS CSCD 北大核心 2019年第10期40-45,共6页
为满足深度学习推理中对不同规模矩阵乘法的计算需求,提出一种基于Zynq SoC平台的整数矩阵乘法加速器。采用基于总线广播的并行结构,充分利用片上数据的重用性并最小化中间累加结果的移动范围,以降低外部DRAM的访问需求。通过动态调整... 为满足深度学习推理中对不同规模矩阵乘法的计算需求,提出一种基于Zynq SoC平台的整数矩阵乘法加速器。采用基于总线广播的并行结构,充分利用片上数据的重用性并最小化中间累加结果的移动范围,以降低外部DRAM的访问需求。通过动态调整矩阵分块的大小,使加速器在计算形状不规则的矩阵乘时保持较高效率。实验结果表明,在DeepBench测试基准下,该加速器可对双核ARM Cortex-A9 CPU的矩阵乘运算实现8.4倍的加速效果。 展开更多
关键词 整数矩阵乘法 加速器 可编程片上系统 深度学习推理 分块方案 DeepBench测试
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部 意见反馈