基于数据流自动加速器车牌识别片上系统的FPGA实现

(11页)

'基于数据流自动加速器车牌识别片上系统的FPGA实现'
烫业论文英文翻奪基于数据流自动加速器车牌识别片上系统的FPGA实现FPGA implementation of a license plate recognition SoCusing automatically generated streaming ccelerators基于数据流自动加速器车牌识别片上系统的FPGA实现摘要现代的FPGA平台提供了硬件和软件设备用于构建芯片(SoC),以满足应用程 序的需求。设计师可以通过从一个预先定义的外围设备和一大批固定IP功能由 硕件选择和一个基于总线系统的硕件和软件基础设施提供新的硕件,通常表示使 用的RTL。硬件加速器,提供应用特定扩展到一个系统的计算能力是一种有效的 机制,以提高性能和降低功耗。现在缺少的是一个综合的方式来确定应用程序的 计算的关键部分,并创建一个带有加速器从最小的设计投入高级别代表。在木文中,我们提出了一个自动化的方法和工具,产生的加速器。我们采用了基 于FPGA的车牌识别在执法使用(LPR)的系统方法。加速器过程流数据,并支 持一个编程模型,可以自然地表达了高效的硬件实现嵌入式导致大量应用。我们 表明,我们可以实现一个总体车牌识别应用程序的速度从1.2倍到2.6倍,从而 使场景下的现实道路实时功能。1.引言嵌入式系统要求设计承受紧张的工作时间将产甜推向市场,功耗,面积,性 能和成本的限制。不断增长的NRE与掩码设置为规模较小的晶体管儿何费用使 ASIC的标准单元设计,只适用于有明确的功能,预计不会改变在产品寿命相当 高容量的产品。使用FPGA可重构计算已经合并在过去几年里在许多情况下作为 一个潜在的替代技术。与此同时,出现了在工具进行硬件设计过程屮对算法的抽 象,以进一步减少对市场的时间深入研究和商业活动。一个建筑自动化工具应该 能够结合互动架构开发,破件软件自动分区和一个高效率的映射一个或多个内核 的可重构织物。通常情况下,如在Virtex系列FPGA的,或者在Altera FPGA合成的Nios 处理器的PPC405合理标量处理器在处理非经常执行或以指令和数据级并行度低 有条件的代码效率,更有效比映射盖茨将相同的代码[14]o不过,标量处理器非 常适用于高通量,并行代码由于并行的有限支持(指令,数据和任务),因为从 内存层次结构的有限的内存带宽,主要核心的狭窄管道效率低下。我们已经开发了一个自动化的过程,流数据流图图(sDFG)到主标量核心 加速器。一个sDFG表示计算内核的进程数据流与相对有限的生命和确定的内存 访问模式。的存取模式,可以说从sDFG独立的计算。流模型解耦的内存访问序 列从计算的描述,从而使得上述两个项目更容易,更可重复使用的毎一个定制。 以某sDFG示例图给出后,当我们讨论语文能力要求的应用。要显示的流模型在嵌入式系统的适用性,我们描述这个过程是如何在一个自 动车牌识别(LPR)的系统设计屮。这是一个独立的“智能摄像机“实施运行使 用的Virtex- II Pro的FPGA的[19]一个SoC设计方法学的实时操作系统。虽然在 手的申请是lpr, “智能摄像机“可以在一个像汽车,安全,家庭监护和控制用于 各种应用,等等,目的是要卸载从可对应的标量计算内核PPC处理器进入大门。 我们的方法生成从设计,遵循一个预定义模板空间大的硬件加速器。加快应用程序,所需的带宽和加速器所产生的大小可根据应用要求调整,区 域约束和用户参考。该研究的贡献如下:我们提出了一个可重构结构中产生的协处理器的流模式的使用情况和我们 大纲的框架为基础的方法,用于评估潜在的一整套解决方案,我们详细介绍如何 在这种方法是一个自主的车牌识别系统本文的其余部分组织如下:第2节给出了流编程范例简要背最资料,并解释 如何利用技术发展趋势有利于在通讯计算。第3节介绍我们的工具方法,以及第 4节讨论车牌识别中的应用和平台。第5节介绍了该方法的实验评估,第6节给 出了一个相对以前的工作领域总结,第7节礼物的结论。2.流规划模型我们的方法产生的过程和产生的协处理器的数据流[1]。流编程模型利用了 “算术强度“的执行单元进行聚类在一起,揭露数据移动和分期向程序员[6]的 超人规模集成电路技术。根据流模型,数据获取和储存单位脱钩计算单位,使每 个人可以单独进行优化和更有效。程序员在内存中描述的形状和位置的数据流描述符使用,并计算使用 sDFGo这种分离允许流接口单位采取可用带宽的优势,预取,然后才需要的数 据。内存访问不计算使用之前,这对于积极的预取数据是由数据路径请求允许 sDFG操作。该架构成为对少峰潜伏期敏感性,访问一个数据元素的内存子系统 的平均带宽而定。虽然传输数据流编程接口单元是利用流描述符(图1)。甲流 是由元组描述符(类型,Start_Address,步幅,跨度跳过,大。1表示,其?类型表示多少字节的每个元素都(类型为字节0,对于16位半字,等1)? Start_Address代表的内存地址第一个流元素。?步幅是元素的个数间隔间内,连续两次流元素。?跨度是元素的聚集数申请前跳过抵消。?跳过是偏移量为群体间的应用span元素后,步幅已被应用。图1.为逐行描述矩形流访问模式?尺寸是流中的元素数。另外从流描述,内核计算是表示使用流式数据流图(sDFG)语言。一个sDFG 由节点,代表基木算术和逻辑运算和有向边代表一个操作上的前一个操作的输出 依赖[3]。每个图节点描述了中流作业类型,从父节点的大小和输出结果的符号 传入的投入。输入操作数被指定为相对引用,而不是以前的节点命名寄存器。此功能可帮助消 除了不必要的争论命名寄存器以及与寄存器重命名相关的开销。该图的边表示节 点之间的流或外部流之间或源/汇和sDFG数据。3 ?基于模板的硬件代3.1 ?方法论我们已经制定了一个框架,自动生成可综合的流加速器。我们的做法是选择 而不是产生一个由高级语言通用表示,从一个给定的硬件设计精良的框架设计。 我们生成高度优化,在性价比上给定的空间的各种应用,用户的要求,以及系统 的其余部分计分的功能设计。该工具流的要点如下:?一个共同的模板一个简单的数据流体系结构,数据流处理的基础上,?迭代引擎实例对系统参数的设计,达到系统和用户的限制,开始搜索下的 空间迭代法,?一个调度程序,调度和执行sDFG硬件配置的基础上由迭代器设置参数,?一个RTL构造引擎,优化的数据路径和流接口模块的Verilog代码,?评估阶段,综合了 FPGA的设计和生产质量指标,如而积,和时钟速度。数据路径和流接口各有各的加速生成过程。本节的每一个细节,这些发动机 及其接口中的一个休息。为了简便起见,我们只纲要加速器的要点模板,但没有 详细的硬件生成算法。 Stream InterfaceTempiat?Ad<ie&s B afterSystem Bus (e.g. PLB)Streaming DatacornsConbolMult^lewr TreeData Path Template图
关 键 词:
基于 数据流 自动 加速器 车牌 识别 系统 FPGA 实现
 剑锋文库所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
关于本文
本文标题:基于数据流自动加速器车牌识别片上系统的FPGA实现
链接地址: //www.wenku365.com/p-43768420.html
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服点击这里,给剑锋文库发消息,QQ:1290478887 - 联系我们

本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有【成交的100%(原创)】。本站是网络服务平台方,若您的权利被侵害,侵权客服QQ:1290478887 欢迎举报。

1290478887@qq.com 2017-2027 //www.wenku365.com 网站版权所有

粤ICP备19057495号 

收起
展开