一、32位定/浮点乘法器设计(论文文献综述)
姚上上,沈立[1](2021)在《基于混合压缩结构的新型浮点乘法器设计》文中认为为了进一步提高浮点乘法器的性能,缩短浮点乘法器关键路径延时,提出了一种基于新型4-2压缩器和5-2压缩器的混合压缩结构.在Xillinx的xc7a35tcsg324开发板上,基于该结构实现了IEEE754标准的32位浮点乘法器.相较于现有的压缩方式,提出的新型压缩结构相较于现有的压缩方式,所使用的LUT资源减少了45,关键路径延时减少了0.004 ns.与传统浮点乘法器相比,关键路径延时由6.022 ns缩短至4.673 ns,提升了浮点乘法器的运算性能.
易清明,符清杆,石敏,骆爱文,陈嘉文[2](2021)在《基于Karatsuba和Vedic算法的快速单精度浮点乘法器》文中指出针对现有的单精度浮点乘法器存在运算速度慢的问题,该文设计了一种融合Karatsuba算法和Vedic算法两者优点的快速单精度浮点乘法器。该文利用Karatsuba算法减少单精度浮点乘法器的乘法运算次数,将24 bit尾数的乘法运算分解为少位数乘法运算,获得基于3 bit和4 bit的尾数乘法架构;进一步地,利用Vedic算法对单精度浮点乘法器的尾数乘法架构进行优化,利用复杂度低、速度快的加法器实现了Karatsuba算法分解后的3 bit和4 bit的两个基本乘法运算,提高了运算速度。仿真及FPGA验证结果表明,该文设计的单精度浮点乘法器相对于基于传统的Karatsuba算法的单精度浮点乘法器、基于Vedic算法的单精度浮点乘法器,其最大运行时钟频率分别提高了约5倍和2倍。
王宇,李涛,邢立冬,冯臻夫[3](2021)在《OpenVX高效能并行可重构运算通路的设计与实现》文中研究表明针对专用硬件在处理图形图像时无法同时兼顾灵活性、可扩展性和时效性的问题,设计一种支持OpenVX 1.3标准的专用处理器。通过对OpenVX 1.3标准中的核函数进行数据通路映射,分析实现函数高效处理所需的运算单元数目,确定适用于该标准的数据通路运算器的结构。通过编写指令对数据通路进行重构,适应OpenVX标准的演进和扩展。应用65 nm CMOS工艺库对整体电路进行综合验证,实现的OpenVX可重构数据通路运算器面积为21 076.21μm2、功耗为778.63 mW、系统主频为500 MHz、吞吐量为1.86 GB/s。实验结果表明,该数据通路运算器具有较强的可编程性和可扩展性,能够有效满足实时和高速的通用图像处理要求。
蒋林,田璞,邓军勇[4](2020)在《一种模式可配置的单精度浮点乘法器设计》文中研究说明提出了一种模式可配置的单精度浮点乘法器设计方案。利用90 nm互补金属氧化物半导体(complementary metal oxide semiconductor,CMOS)工艺设计了基于原码一位乘法、基4-Booth算法和Wallace树型算法等3种常用定点数乘法的浮点乘法器,测试了3种乘法器的性能。在乘法器的尾数乘法部分添加模式选择模块,根据应用场景对频率、功耗和面积3个性能的不同需求选择和切换相应的算法,以满足不同应用对对处理器性能的要求。实验结果表明,与ifpmul32方法相比,所提设计的延时降低了57%,最低功耗降低了76.6%。与粗粒度可重构处理器实现的浮点乘法器相比,计算一次浮点乘法所需时钟周期数平均减少了87.3%。
刘容,赵洪深,李晓今[5](2013)在《基于改进型选择进位加法器的32位浮点乘法器设计》文中提出在修正型Booth算法和Wallace树结构以及选择进位加法器的基础上,提出了一种新型32位单精度浮点乘法器结构。该新型结构通过截断选择进位加法器进位链,缩短了关键路径延时。传统选择进位加法器每一级加法器的进位选择来自上级的进位输出。提出的结构可以提前计算出尾数第16位的结果,它与Wallace树输出的相关位比较就可得出来自前一位的进位情况进而快速得到进位选择。在Altera的EP2C70F896C6器件上,基于该结构实现了一个支持IEEE754浮点标准的4级流水线浮点乘法器,时序仿真表明,该方法将传统浮点乘法器结构关键路径延时由6.4 ns减小到5.9 ns。
彭元喜,杨洪杰,谢刚[6](2010)在《X-DSP浮点乘法器的设计与实现》文中研究表明为了满足高性能X-DSP浮点乘法器的性能、功耗、面积要求,研究分析了X型DSP总体结构和浮点乘法器指令特点,采用Booth2编码算法和4∶2压缩树形结构,使用4级流水线结构设计实现了一款高性能低功耗浮点乘法器。使用逻辑综合工具Design Compiler,采用第三方公司0.13μmCMOS工艺库,对所设计的乘法器进行了综合,其结果为工作频率500MHz,面积67529.36μm2,功耗22.3424mW。
苏博[7](2010)在《低功耗数据触发微处理器功能单元的设计与实现》文中进行了进一步梳理随着半导体工艺技术的发展,功耗问题已经成为微处理器设计者无法回避的挑战之一。尤其是在嵌入式领域中,一方面,处理器的性能随着应用需求的升高而增强,带动耗电量的增大;另一方面,由于采用电池供电,系统储电量非常有限。两方面因素共同作用,使嵌入式领域中的低功耗研究处于十分重要的地位。首先,本文针对嵌入式多媒体应用,研究了低功耗数据触发体系结构。然后,使用动态操作数检测技术设计实现了定点乘法器,使用异步电路技术设计实现了浮点乘法器和浮点加法器。最后,设计实现了低功耗数据触发微处理器腾越-II,在其功能单元实现中使用了上述低功耗技术。本文主要内容如下。1.研究了低功耗数据触发微处理器体系结构。数据触发体系结构具有结构简单、模块化强、设计灵活、并行度高等优点。首先,分析嵌入式多媒体应用程序的指令特点,确定了数据触发微处理器内核功能单元的比例及数量。然后,根据多媒体应用程序整数操作数的特点,选择动态操作数检测技术实现定点功能单元。最后,根据内核及各功能单元的流水线结构特点,选择异步电路设计技术来实现计算内核与各功能单元。2.设计实现了基于动态操作数检测技术的定点乘法器。将操作数分为多个位段,通过操作数检测模块识别每一个位段的数据有效性,并在原有设计中加入锁存器、选择器等逻辑,使部分积生成模块、部分积压缩模块、加法器模块在无需计算时保持原有的电路状态。实验表明,优化后的设计减小了定点乘法器电路中信号的开关活动性,降低了功耗。3.设计实现了异步浮点乘法器、异步浮点加法器。将浮点乘法器、浮点加法器设计为多级流水结构。通过基于宏单元的异步电路设计流程对流水化功能单元进行异步化设计。实验表明,异步浮点乘法器、异步浮点加法器较同步设计降低了时钟功耗。4.设计实现了低功耗数据触发微处理器腾越-II。腾越-II微处理器包含同步数据触发内核及异步数据触发内核,包含应用上述低功耗技术实现的功能单元。腾越-II微处理器在UMC-0.18μm工艺下实现。本文通过腾越-II测试平台对芯片进行了测试。实验表明,同步内核与异步内核都达到了200MHz的性能指标,异步内核功耗为同步内核功耗的43%65%。
杨洪杰[8](2010)在《YHFT-DX浮点乘法器的设计与实现》文中研究表明乘法器是高性能数字信号处理器芯片的关键部件,也是进行实时、高速数字信号处理的核心。随着DSP芯片的广泛应用,乘法器作为DSP中的关键部件,其设计越来越受到人们的重视。本文讨论了YHFT-DX处理器的浮点乘法器的设计与实现。YHFT-DX是一款高性能定点/浮点DSP处理器,其中的浮点乘法运算是整个DSP的关键路径所在。为了满足高速浮点运算的要求,浮点乘法器需要在性能上达到很高的标准。YHFT-DX的浮点乘法器实现了单精度浮点乘法、双精度浮点乘法、单/双精度浮点乘法以及32位定点乘法的功能。本文首先介绍了YHFT-DX支持的IEEE-754浮点运算标准,对IEEE-754浮点运算标准的浮点表示格式、精度、范围、舍入及规格化进行了分析。对决定乘法器性能的两个因素:实现算法与实现结构,进行了深入研究。对实现算法的研究主要是分析乘法运算中产生的部分积的数目以及部分积生成电路的复杂度。通常来讲,产生部分积的数目越少的算法,其电路越复杂,因此需要综合两点考虑来选择合适的算法。对实现结构的研究主要是分析实现结构的部分积压缩速度以及结构规整性。本文设计的浮点乘法器在算法上采用了目前广泛使用的Booth 2编码算法,实现结构上采用了在求和速度和结构规整性方面都较好的4:2压缩树结构。4:2压缩树结构采用了进位保留的思想,部分积压缩得到的结果是以伪和与局部进位形式表示的冗余结果。最终结果需要再进行一次加法运算才能够得到。本文所设计的浮点乘法器采用4级流水线结构,使用第三方公司的0.13um CMOS工艺进行综合。综合结果表明,浮点乘法器工作频率为500MHZ,面积为67529.36um2,功耗为22.3424mW,满足YHFT-DX对浮点乘法器的性能要求。
李晓静[9](2010)在《64位高性能浮点乘法器的设计优化》文中研究指明浮点乘法器结构复杂,逻辑计算延时较大,是影响高性能微处理器设计的瓶颈之一。更快更好的实现浮点乘法的逻辑计算,对提高处理器性能具有重要的意义。半定制实现方式已经满足不了越来越高的主频要求,为了达到设计目标,在考虑性能和工作量基础上,本文采用核心模块——部分积压缩和部分积累加全定制设计,总体采用半定制方法实现浮点乘法器,在不过多增加开销的情况下,能够有效提高浮点乘法器的速度。本文的研究成果主要有:1.提出了一种改进的实现4-2压缩器的结构,用于本文的压缩结构,与以前的结构相比延时减少了大约27.5%;2.全定制设计了4-2压缩器,其延时为0.11ns,与半定制实现的4-2压缩器延时0.18ns相比,延时减少了39%;3.在分析并行加法器的组加法器位数与进位树产生延时的关系的基础上,采用136位全并行的设计方法全定制实现了该加法器,其延时为0.30ns,使部分积累加模块总延时减少了21.3%。优化后的浮点乘法器在65nmCMOS工艺的典型(tt)情况下,性能由1.4GHz优化到1.8GHz,提高了大约30%。对浮点乘法器进行了后端物理设计,版图实现后为1.36GHz。
霍权[10](2009)在《高性能浮点乘法单元的设计》文中认为高性能浮点乘法单元是现代数字信号处理器中的重要部件,是完成高性能实时数字信号处理和图像处理的关键所在,它的性能优劣直接影响到CPU的浮点处理能力。浮点乘法单元具有面积大、延迟长、结构复杂的特点。如何设计出高速、简单且结构规则的浮点乘法器成为广泛关注的问题。过去的十多年中,研究者扩展了Booth编码算法的空间,提高了乘法器的性能;改进了部分积压缩技术,使乘法器结构更加规则;以传输管逻辑、多路选择器和动态技术为基础的各种电路实现方法也持续刷新高性能乘法器的实现记录;与此同时,与物理实现紧密相关的乘法器拓扑结构的研究也硕果累累。但不断提高的高性能运算需求使得高性能乘法单元的设计和实现仍然是当前的热门话题。本论文主要完成高性能浮点乘法器的设计与验证,是微电子中心高性能浮点处理单元(FPU, Float Point Uint)项目的重要组成部分,按照Top-down的现代IC设计方法,以实现64位双精度浮点数的乘法运算为主,兼容32位单精度浮点数。文章首先讨论了IEEE-754中规定的浮点数格式以及基本操作,并对浮点乘法的几种算法进行分析,深入研究了Booth算法及其各种改进算法,对比后选择改进的Booth2算法用于乘法单元的设计。接着分析了乘法器的阵列选择,讨论乘法单元的两种典型阵列结构,研究用于部分积求和的各种加法器,选取Wallace树型结构作为压缩阵列,混合加法器进行最终的部分积求和运算。为了提高性能,课题引入流水线技术,对浮点乘法单元整体采用五级流水线结构进行控制,在全流水状态下基本上等效于一个周期完成一次乘法操作,真正实现高性能的乘法器。设计完成后通过搭建验证平台,通过模拟仿真的方法,用大量激励向量对浮点乘法单元的功能进行验证,并采取特殊激励和随机激励相结合的方式,以提高验证的覆盖率。为了检测时序要求,采用中芯国际SMIC的0.18μm CMOS工艺对其进行了逻辑综合,保证浮点乘法单元的延时要求,时钟频率预期达到500MHz。
二、32位定/浮点乘法器设计(论文开题报告)
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
本文主要提出一款精简64位RISC处理器存储管理单元结构并详细分析其设计过程。在该MMU结构中,TLB采用叁个分离的TLB,TLB采用基于内容查找的相联存储器并行查找,支持粗粒度为64KB和细粒度为4KB两种页面大小,采用多级分层页表结构映射地址空间,并详细论述了四级页表转换过程,TLB结构组织等。该MMU结构将作为该处理器存储系统实现的一个重要组成部分。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
三、32位定/浮点乘法器设计(论文提纲范文)
(1)基于混合压缩结构的新型浮点乘法器设计(论文提纲范文)
1 引言 |
2 浮点乘法器 |
3 基4 Booth编码设计 |
4 4-2压缩器设计 |
5 5-2压缩器设计 |
6 Wallace Tree结构 |
7 仿真结果与分析 |
8 结束语 |
(3)OpenVX高效能并行可重构运算通路的设计与实现(论文提纲范文)
0概述 |
1 OpenVX介绍 |
2 OpenVX函数的数据通路映射及分析 |
2.1 数据通路映射方案 |
1)流水线数据通路 |
2)并行数据通路 |
3)并行结构结合流水线数据通路 |
2.2 函数映射 |
2.2.1 点处理函数映射 |
1)基本运算类映射 |
2)图像色系变换 |
3)仿射变换 |
2.2.2 局部处理函数映射 |
2.2.3 全局处理函数映射 |
2.2.4 特征提取类函数映射 |
1)梯度幅值和方向计算 |
2)非极大抑制 |
3)边缘追踪 |
2.3 所需运算单元分析 |
1)所需运算单元种类的分析 |
2)所需运算单元数目的分析 |
3数据通路运算器的设计 |
3.1 数据通路运算器的整体结构 |
3.2 子模块内部结构 |
3.2.1 定点单元设计 |
1)定点加法器 |
2)定点乘法器 |
3)定点除法器 |
3.2.2浮点单元设计 |
1)浮点加法器 |
2)浮点乘法器 |
3)浮点除法器 |
4实验结果与分析 |
4.1 实验结果 |
4.2 性能分析 |
5结束语 |
(4)一种模式可配置的单精度浮点乘法器设计(论文提纲范文)
1 单精度浮点乘法器 |
2 多模式浮点乘法器设计 |
2.1 乘法器整体框架 |
2.2 模式选择的可重构设计 |
1)面积、功耗最优模式 |
2)频率最优模式 |
3 实验结果及分析 |
4 结语 |
(5)基于改进型选择进位加法器的32位浮点乘法器设计(论文提纲范文)
1 传统浮点乘法器 |
1.1 单精度浮点格式 |
1.2 单精度浮点格式 |
2 浮点乘法器关键部件设计 |
2.1 修正Booth编码产生部分积 |
2.2 Wallace树型结构 |
2.3 选择进位加法器 |
3 改进型浮点乘法器 |
3.1 第16位尾数 (S_16) 的计算 |
3.2 缩短CSA的进位链 |
4 结语 |
(6)X-DSP浮点乘法器的设计与实现(论文提纲范文)
0 引言 |
1 X-DSP体系结构 |
2 浮点乘法器的设计 |
2.1 浮点乘发器指令 |
2.2 浮点乘法器的结构与流水线设计 |
1) 指数运算。 |
2) 尾数运算。 |
3) 符号位确定。 |
2.3 浮点乘法器的子模块设计 |
2.3.1 阵列乘法模块 |
1) Booth编码及部分积产生。 |
2) 乘法阵列。 |
2.3.2 求和累加模块 |
2.3.3 结果处理模块 |
2.3.4 结果写回模块 |
3 浮点乘法器验证与综合 |
3.1 验证方案与环境 |
3.2 模块级验证 |
3.2.1 阵列乘法模块的验证 |
3.2.2 求和累加模块的验证 |
3.2.3 浮点结果处理模块的验证 |
3.2.4 结果写回模块的验证 |
3.3 系统级验证 |
3.3.1 流水线验证 |
3.3.2 指令功能的验证 |
3.4 覆盖率分析 |
3.5 综合 |
4 结语 |
(7)低功耗数据触发微处理器功能单元的设计与实现(论文提纲范文)
摘要 |
Abstract |
第一章 绪论 |
1.1 研究背景 |
1.1.1 半导体工艺技术的发展趋势 |
1.1.2 嵌入式领域的低功耗需求 |
1.1.3 CMOS 集成电路的功耗 |
1.1.4 课题目标与来源 |
1.2 研究现状分析 |
1.2.1 低功耗设计方法 |
1.2.2 动态操作数检测技术 |
1.2.3 异步电路设计技术 |
1.3 本文主要工作 |
1.4 论文结构 |
第二章 低功耗数据触发微处理器体系结构 |
2.1 引言 |
2.2 面向多媒体应用的数据触发体系结构 |
2.2.1 传输触发体系结构 |
2.2.2 数据触发内核流水线结构 |
2.2.3 面向多媒体应用的DTA 内核组成 |
2.3 低功耗技术的选择 |
2.3.1 动态操作数检测技术及其功耗模型 |
2.3.2 异步电路设计技术及其功耗模型 |
2.4 本章小结 |
第三章 低功耗定点乘法器 |
3.1 引言 |
3.2 基于动态操作数检测技术的定点乘法器 |
3.2.1 操作数检测模块 |
3.2.2 部分积生成模块 |
3.2.3 部分积压缩模块 |
3.2.4 加法器模块 |
3.3 性能、面积及功耗 |
3.3.1 性能分析 |
3.3.2 面积比较 |
3.3.3 功耗比较 |
3.4 本章小结 |
第四章 低功耗浮点乘法器、加法器 |
4.1 引言 |
4.2 IEEE-754 标准 |
4.2.1 浮点数据表示 |
4.2.2 舍入模式 |
4.2.3 异常处理 |
4.3 异步浮点乘法器 |
4.3.1 数据通路 |
4.3.2 控制通路 |
4.4 异步浮点加法器 |
4.4.1 数据通路 |
4.4.2 控制通路 |
4.5 性能、面积及功耗 |
4.5.1 性能分析 |
4.5.2 面积比较 |
4.5.3 功耗比较 |
4.6 本章小结 |
第五章 低功耗数据触发微处理器——腾越-II |
5.1 引言 |
5.2 腾越-II 微处理器芯片 |
5.2.1 腾越-II 体系结构 |
5.2.2 存储控制器与通信接口 |
5.2.3 DTA 内核 |
5.2.4 芯片实现 |
5.3 腾越-II 测试平台 |
5.4 测试流程 |
5.5 芯片的面积、性能及功耗 |
5.6 本章小结 |
第六章 结论与展望 |
6.1 工作总结 |
6.2 工作展望 |
致谢 |
参考文献 |
作者在学期间取得的学术成果 |
(8)YHFT-DX浮点乘法器的设计与实现(论文提纲范文)
摘要 |
ABSTRACT |
第一章 绪论 |
1.1 数字信号处理器概述 |
1.1.1 数字信号处理器的特点 |
1.1.2 数字信号处理器发展状况 |
1.2 DSP中的乘法器 |
1.3 乘法器发展概述 |
1.4 课题研究的主要内容 |
1.5 课题研究所作的工作 |
1.6 本文的结构 |
第二章 YHFT-DX体系结构与乘法部件 |
2.1 YHFT-DX体系结构 |
2.1.1 YHFT-DX总体结构 |
2.1.2 YHFT-DX内核结构 |
2.2 YHFT-DX的乘法器 |
2.3 IEEE-754浮点运算标准 |
2.3.1 浮点数的格式 |
2.3.2 单精度浮点数表示 |
2.3.3 双精度浮点数表示 |
2.3.4 浮点数的舍入处理 |
2.4 本章小结 |
第三章 乘法器的算法与实现结构 |
3.1 乘法器类型 |
3.1.1 串行乘法器 |
3.1.2 线性阵列乘法器 |
3.1.3 全阵列并行乘法器 |
3.2 乘法器算法 |
3.2.1 移位加算法 |
3.2.2 Pezaris算法 |
3.2.3 Baugh-Wooley算法 |
3.2.4 Booth编码算法 |
3.2.5 算法中的符号位处理 |
3.2.6 有符号的Booth乘法 |
3.2.7 乘法器算法小结 |
3.3 高速乘法器的实现结构 |
3.3.1 阵列实现结构 |
3.3.2 树形实现结构 |
3.3.3 实现结构小结 |
3.4 本章小结 |
第四章 YHFT-DX浮点乘法器的设计 |
4.1 浮点乘法器的总体设计 |
4.1.1 浮点乘法器指令分析 |
4.1.2 结构设计 |
4.1.3 流水线设计 |
4.2 阵列乘法模块的设计 |
4.2.1 操作数的选择 |
4.2.2 操作数的类型判断 |
4.2.3 尾数的扩展及隐含位处理 |
4.2.4 Booth编码及部分积产生 |
4.2.5 乘法阵列 |
4.2.6 指数相加及符号位确定 |
4.3 求和累加模块的设计 |
4.3.1 全加器 |
4.3.2 进位保留加法器的设计 |
4.3.3 进位传播加法器的设计 |
4.3.4 移位逻辑设计 |
4.4 浮点结果处理模块设计 |
4.4.1 尾数规格化与舍入处理 |
4.4.2 指数调整与溢出处理 |
4.4.3 结果类型判断 |
4.4.4 最终结果的生成 |
4.5 结果写回模块设计 |
4.6 本章小结 |
第五章 YHFT-DX浮点乘法器的验证与综合 |
5.1 验证方法学 |
5.1.1 基于模拟的验证 |
5.1.2 基于形式方法的验证 |
5.2 模块级验证 |
5.2.1 阵列乘法模块的验证 |
5.2.2 求和累加模块的验证 |
5.2.3 浮点结果处理模块的验证 |
5.2.4 结果写回模块的验证 |
5.3 系统级验证方案及环境 |
5.4 系统级验证 |
5.5 覆盖率分析 |
5.6 浮点乘法器的综合 |
5.6.1 综合过程 |
5.6.2 设计优化 |
5.6.3 综合结果 |
5.7 本章小结 |
第六章 结束语 |
6.1 工作总结 |
6.2 未来工作展望 |
致谢 |
参考文献 |
作者在学期间所取得的学术成果 |
(9)64位高性能浮点乘法器的设计优化(论文提纲范文)
摘要 |
ABSTRACT |
第一章 绪论 |
1.1 课题背景和意义 |
1.2 浮点乘法器研究现状 |
1.3 研究内容 |
1.4 论文结构 |
第二章 浮点乘法器结构 |
2.1 浮点数的表示与运算 |
2.1.1 IEEE-754 标准浮点数的表示格式 |
2.1.2 浮点乘法的运算原理 |
2.2 Booth算法 |
2.2.1 Booth编码的基本原理 |
2.2.2 改进的Booth编码 |
2.3 乘法器部分积压缩 |
2.3.1 加法器单元结构 |
2.3.2 阵列结构部分积压缩 |
2.3.3 树型结构部分积压缩 |
2.4 超长加法器的设计 |
2.4.1 串行进位加法器 |
2.4.2 进位选择加法器 |
2.4.3 并行进位加法器 |
2.5 舍入与Sticky位计算方法 |
2.5.1 IEEE-754 标准的舍入模式 |
2.5.2 Sticky位的计算 |
2.6 本章小结 |
第三章 X处理器的浮点乘法器性能瓶颈分析 |
3.1 优化方法 |
3.2 X处理器的浮点乘法器的总体结构 |
3.3 从数据通路分析性能瓶颈 |
3.3.1 部分积压缩结构 |
3.3.2 部分积累加的加法器结构 |
3.4 从综合结果分析性能瓶颈 |
3.5 设计提速方案 |
3.6 本章小结 |
第四章 X处理器的浮点乘法器核心模块定制设计与优化 |
4.1 3-2 压缩器和 4-2 压缩器电路设计 |
4.2 部分积累加电路设计 |
4.2.1 136 位加法器的设计方案与依据 |
4.2.2 136 位加法器的电路设计 |
4.2.3 Sticky位计算的电路设计 |
4.3 核心模块电路设计的功能验证 |
4.4 65nm版图设计与模拟验证 |
4.4.1 3-2 压缩器和4-2 压缩器的版图设计 |
4.4.2 部分积累加的版图设计 |
4.5 本章小结 |
第五章 X处理器的浮点乘法器的实现 |
5.1 数据准备 |
5.1.1 LEF视图提取 |
5.1.2 时序模型的建立 |
5.2 半定制与全定制结合设计流程 |
5.2.1 浮点乘法器的综合 |
5.2.2 布局布线 |
5.3 实现结果 |
5.4 本章小结 |
第六章 结束语 |
6.1 全文工作总结 |
6.2 未来工作展望 |
致谢 |
参考文献 |
作者在学期间取得的学术成果 |
(10)高性能浮点乘法单元的设计(论文提纲范文)
摘要 |
Abstract |
第1章 绪论 |
1.1 课题来源及研究意义 |
1.2 研究背景和应用领域 |
1.3 国内外研究现状 |
1.4 研究的主要内容 |
1.5 论文结构安排 |
第2章 浮点乘法概述 |
2.1 浮点数表示 |
2.1.1 浮点格式 |
2.1.2 异常 |
2.1.3 规格化和舍入 |
2.2 算法分析 |
2.2.1 移位加算法 |
2.2.2 Booth算法 |
2.2.3 Booth2 算法 |
2.2.4 改进的Booth2 算法 |
2.2.5 更高基的Booth译码 |
2.3 乘法单元结构 |
2.3.1 Wallace树压缩 |
2.3.2 部分积求和 |
2.3.3 流水线技术 |
2.4 本章小结 |
第3章 浮点乘法单元的具体实现 |
3.1 整体概述 |
3.2 系统模块设计 |
3.2.1 预处理模块的设计 |
3.2.2 符号和指数运算模块的设计 |
3.2.3 部分积译码模块的设计 |
3.2.4 部分积压缩模块的设计 |
3.2.5 部分积求和模块的设计 |
3.2.6 异常处理模块的设计 |
3.2.7 后处理模块的设计 |
3.2.8 流水线控制模块的设计 |
3.3 本章小结 |
第4章 浮点乘法单元验证与综合 |
4.1 验证 |
4.1.1 验证目的和方法 |
4.1.2 验证激励的产生 |
4.1.3 验证流程和结果 |
4.2 逻辑综合 |
4.2.1 逻辑综合的概念及工具 |
4.2.2 综合优化及结果 |
4.3 逻辑综合后的模拟验证 |
4.4 本章小结 |
结论 |
参考文献 |
致谢 |
四、32位定/浮点乘法器设计(论文参考文献)
- [1]基于混合压缩结构的新型浮点乘法器设计[J]. 姚上上,沈立. 微电子学与计算机, 2021(09)
- [2]基于Karatsuba和Vedic算法的快速单精度浮点乘法器[J]. 易清明,符清杆,石敏,骆爱文,陈嘉文. 电子科技大学学报, 2021(03)
- [3]OpenVX高效能并行可重构运算通路的设计与实现[J]. 王宇,李涛,邢立冬,冯臻夫. 计算机工程, 2021
- [4]一种模式可配置的单精度浮点乘法器设计[J]. 蒋林,田璞,邓军勇. 西安邮电大学学报, 2020(06)
- [5]基于改进型选择进位加法器的32位浮点乘法器设计[J]. 刘容,赵洪深,李晓今. 现代电子技术, 2013(16)
- [6]X-DSP浮点乘法器的设计与实现[J]. 彭元喜,杨洪杰,谢刚. 计算机应用, 2010(11)
- [7]低功耗数据触发微处理器功能单元的设计与实现[D]. 苏博. 国防科学技术大学, 2010(02)
- [8]YHFT-DX浮点乘法器的设计与实现[D]. 杨洪杰. 国防科学技术大学, 2010(06)
- [9]64位高性能浮点乘法器的设计优化[D]. 李晓静. 国防科学技术大学, 2010(07)
- [10]高性能浮点乘法单元的设计[D]. 霍权. 哈尔滨工业大学, 2009(S2)