推进下一代 减速器的开展 高阶综合 HLS AI

当天咱们周围的一切都在变得愈加智能,人工智能,不只仅是一种数据中心运行,在咱们日常与之交互的各种嵌入式系统中也能够发现AI,咱们宿愿与这些系统启动对话和手势交流,等候它们能够识别和了解咱们,这种智能不只使这些系统的配置愈加完善、经常使用更为方便,同时愈加安保和牢靠,一切这些智能都来源于深度神经网络的提高,神经网络的关键应战之一是计算…。

当天咱们周围的一切都在变得愈加

智能



人工智能

()不只仅是一种数据

中心

运行,在咱们日常与之交互的各种

嵌入式系统

中也能够发现AI。咱们宿愿与这些系统启动对话和手势交流,等候它们能够识别和了解咱们,这种智能不只使这些系统的配置愈加完善、经常使用更为方便,同时愈加安保和牢靠。

一切这些智能都来源于深度

神经网络

的提高。神经

网络

的关键应战之一是计算复杂度。小型神经网络或许要求数百万次的乘积攒加运算(MAC)才干发生结果,而大型神经网络则或许要求数十亿次,像大言语模型等复杂网络或许要求到达万亿级的计算量。这种级别的计算需求超出了

嵌入式


处置器

的承载才干。在某些状况下,这些推理计算可以经过网络被转移到数据中心。越来越多的设施领有极速且牢靠的网络衔接,使得这种形式成为许多系统的可行之选。但是,也有很多系统具有严厉的实时要求,即使是最快最牢靠的网络也不可满足。例如,任何有智能化才干的系统(如

智能驾驶



无人机

)都要求比离线数据中心更快地做出决策。还有一些系统处置了不应该经过网络传输的敏感数据,而且传输内容会参与黑客攻打的危险。由于性能、隐衷和安保等要素,某些推理操作要求在嵌入式系统上成功。关于方便的网络来说,嵌入式就可以处置这些义务,例如,一个

树莓派

就能部署一个方便的物体识别

算法

。而关于更复杂的义务,嵌入式以及针对嵌入式系统的神经处置单元(NPU)可以提供更强的计算才干。但是,要想取得更高水平的性能和效率,要求构建一个定制化的 AI 减速器。无论是针对还是,设计新的

配件

都是一项艰难的义务,但它能使

开发者

能够取得现成组件不可到达的性能和效率水平。和有着多代

产品

设计阅历的设计师相比,普通开发团队如何才干构建一个更好的AI减速器呢?其中一个方法是经过针对正在执行的特定推理来定制实施方案,这样的成果会比通用途理方案更胜一筹。在开发者通用 AI 减速器构建 NPU 时,其指标是支持任何或许的神经网络。他们宿愿取得尽或许多的设计输入,因此必定使设计尽或许通用,不只如此,他们还宿愿在设计中内置必定水平的“future proofing”,以支持几年后或许出现的任何网络。而在技术极速开展的背景下,这并非易事。一个定制化减速器只有支持一个或几个特定的网络。这种自在度准许将在减速器实施环节中的可

编程

元素固定在配件中,使得配件比通用配件更小且更快。在图像和

滤波器

尺寸固定的状况下,一个公用卷积减速器的速度可比设计良好的通用 TPU 快上 10 倍。通用减速器理论经常使用浮点数。这是由于简直一切神经网络都是在经常使用浮点数的通用计算机上用开发的。为了正确支持这些神经网络,减速器必定支持浮点数。但是,大少数神经网络经常使用凑近 0 的数值,并且要求较高的精度,而浮点乘法器体积庞大,假设不要求它们,从设计中去除可以节俭少量面积和功耗。一些 NPU 支持整数示意法,有时还支持多种大小。但是,支持多种数值示意格式会参与电路复杂性,进而消耗电力并加大流传提前。选用一种示意格式并专门经常使用,可以成功更小、更快的成功。在构建定制化减速器时,并不局限于 8 位或 16 位,任何尺寸都可以经常使用。选用正确的数字示意,或对神经网络启动 “量化”,可以优化数据和运算器的大小。量化可以清楚增加要求存储、传输和操作的数据量。增加权重数据库的内存占用和增加乘法器的尺寸可以清楚改善设计的面积和功耗。例如,一个 10 位定点乘法器比一个 32 位的浮点乘法器小约 20 倍,功耗约为后者的 1/20。这象征着设计可以更小巧、更节能。经常使用更小的乘法器,设计人员也可以选用经常使用该区域,部署 20 个可以并行运转的乘法器,从而在经常使用相反资源的状况下发生更高的性能。

在构建定制化

机器学习

减速器时,有一个应战是创立神经网络的数据迷信家理论不了解配件设计,而配件设计师也不了解数据迷信。在传统设计流程中,他们会经过“会议”和“规范”来传递常识和分享想法,但显然,这些方法也并不会经过

信息

交流失掉有效传递。经过高阶综合(High-Level Synthesis, HLS),数据迷信家生成的实施方案不只可以作为可执行参考,还可以作为配件设计流程的机器可读输入。这就防止了在设计流程中手动从新解释算法,从而防止既缓慢又易出错的手动环节。HLS 从算法形容中分解 RTL 成功。普通来说,算法用或 SystemC 形容,但像 HLS4ML 这样的设计流程能使 HLS 工具能够间接从机器学习框架中失掉神经网络形容。HLS 能够以一种在机器学习框架中尚不遍及的形式对量化启动实践探求。为了充沛了解量化的影响,要求对算法启动微准确的成功,包含溢出、饱和和舍入等影响的特征形容。目前,这只适用于配件形容言语(HDL)或 HLS 微准确数据类型。随着机器学习的遍及,更多的嵌入式系统将要求部署推理减速器。HLS 是一种适用且行之有效的构建定制减速器的方法,减速器针对特定运前启动了优化,提供比通用 NPU 更高的性能和效率。了解更多信息:高阶综合推进下一代边缘 AI 减速器的开展

本站内容来源于网络,如不慎侵犯了您的权益,请联系我们将迅速删除。

(0)
上一篇 2024年9月14日 下午12:27
下一篇 2024年9月14日 下午12:27

相关推荐

  • 面试体现很差居然过了

    有的人考场体现良好却没过,有的人体现十分差却过了,然而这个良好和差是谁来评判的呢,不要通知我,是你自己判别的,这必需是不对的啊!要谨记一句话,自我评估不等于面试效果,你感觉自己体现的好,并不是真的好,人家考官评分是有必定的依据的,我将规范贴在这了,连忙好难看看你自己评判的规范究竟准不准,是不是一下子发现要求变多了!那就对了,老师资历证…。

    2024年9月14日
    12400
  • 江西旅游路途图 江西旅游路途 (江西旅游路途图片)

    江西,一个充溢历史文明和自然风景的省份,领有许多值得一游的旅游景点,上方,咱们就来具体了解一下这条旅游路途,包含庐山、三清山、龙虎山、景德镇古瓷窑和鄱阳湖湿地公园,庐山首站咱们到来环球文明遗产庐山,这里不只要宏伟的山峦和秀美的湖泊,还有丰盛的文明历史遗产,游客可以徒步旅游各大景点,如五老峰、三叠泉等,也可以乘坐索道,轻松欣赏美景,庐山…。

    2024年10月5日
    9700
  • 敌对精英外面的瞄准镜是怎样弄的

    敌对精英akm机瞄怎样调?昨天咱们都起码鸡苗,它的大小是无法以调整的,由于咱们都在那鸡苗,假设可以调整大小的话,就影响影响一个游戏的平衡,所以假设咱们想要调机瞄,可以更好的来玩,敌对精英左右开镜怎样调出来?敌对精英左右开镜调出来首先咱们就登陆敌对精英账号进入游戏,咱们可以在游戏大厅或许游戏中,点击设置的配置,在设置配置界面找到右侧的,…。

    2024年9月14日
    12400
  • 款宝宝食谱滋长高 (宝宝食谱大全及做法)

    款宝宝食谱滋长高很多爸爸妈妈都会想要自己家的小孩个子长的高高的,这样看起来人也精气也帅,以后不论是找上班还是找对象都有便利之处,很多的爸爸妈妈总是担忧自己的下一代的身高会不高,就会想尽所有方法让孩子长高,然而一些方法都是不肥壮的必定要留意了,那么几款宝宝食谱滋长高,上方一同来看看吧!目录孩子长高别吃什么几款宝宝食谱滋长高如何极速长高宝…。

    2024年9月18日
    8900
  • 用FlashFXP关上FTP衔接 (用flash card造句)

    问,我经常经常使用FlashFXP软件登录FTP,当经常使用IE时,间接点击网页中的FTP衔接,自动是经常使用IE间接关上,有没有方法让点击FTP衔接后经常使用FlashFXP关上呢,答,当然可以了,首先双击,我的电脑,或许进入资源治理器,按主选单,检查→文件夹选项,;单击,文件类型,标签,在左边的,已注册的文件类型,栏找到,URL,…。

    2024年10月3日
    8300
  • 紫甘蓝的做法 (凉拌紫甘蓝的做法)

    紫甘蓝,是一种肥壮的食品,然而,怎样能力施展它最大的配置呢,咱们应该留意它的正确做法,…紫甘蓝的作用紫甘蓝目录紫甘蓝怎样做好吃点击图片进入下一页&gt,&gt,紫甘蓝的做法一,紫甘蓝滑蛋原料,紫甘蓝150克、鸡蛋3个、生姜、葱、胡椒粉、鸡粉、芝麻油各少许,详细做法,1、先将紫甘蓝切成丝,再洗净沥干,生姜切成丝,葱切花,2、鸡蛋打散…。

    2024年10月10日
    9400
  • 花呗分期千万别提早还款

    时代的变迁,不只仅局限于咱们的生存出现了天翻地覆的扭转,咱们的想法也未然被一些新兴的概念所取代,先消费、后还款,曾经成为了一种盛行风,房奴、卡奴、车奴曾经成为了当代人的缩影,不过近年来又开局降生另一种,不单单是卡奴,一些平台也曾经在蹭信誉贷的热度,支付宝支付宝不只仅只是一款第三方支付平台,曾经开局越来越趋势金融行业开展,支付宝所推出…。

    2024年9月14日
    14600
  • 如何极速失掉驱动程序 (如何快速失忆方法)

    普通状况下,咱们都是经过系统属性窗口进入,设施治理器,,进入设施属性对话框的,驱动程序,选项卡,如图1,,单击,驱动程序具体消息,按钮,检查关系驱动程序言件的具体消息,遗憾的是,这里每次只能检查一个设施,且不可导出并启动前期处置,当然,咱们可以经过第三方软件成功上述要求,但比拟费事,其实,假设你曾经用上了WindowsVista,那么…。

    2024年10月3日
    7700
  • 薯莨的成效与作用 (薯莨的成效与作用图片)

    薯莨,拉丁学名,DioscoreacirrhosaLour.,别名赭魁、薯良、鸡血莲、血母、朱砂七、红药子、金花果、红孩儿、孩儿血…传统养生薯莨目录薯莨的甄别与运行薯莨块茎叶长圆形、卵圆形、球形或结节块状,长10,15cm,直径5,10cm,外表深褐色,粗裂,有瘤状突起和凹纹,有时具须根或点状须根痕,外表深褐色,粗裂,有瘤状突起和…。

    2024年10月10日
    8300
  • 长汀电力局介绍的家电培修服务指南

    H3,长汀电力局介绍的家电培修服务指南P,随着家电在家庭生存中的遍及,家电培修成为了一个无法或缺的服务,在长汀地域,长汀电力局作为外地的电力供应和治理机构,关于家电培修也有着专业的见地和倡议,以下是长汀电力局介绍的家电培修服务指南,协助您处置家电培修的关系疑问,P,**选用正轨家电培修服务**长汀电力局强调,选用正轨、有资质的家电培修…。

    2025年1月15日
    5400

发表回复

登录后才能评论