一、基础知识求解
1.什么叫做FPGA?
FPGA是一种可以重构电路的芯片,是一种硬件可重构的体系结构。它的英文全称是Field Programmable Gate Array,中文名是现场可编程门阵列。
通过编程,用户可以随时改变它的应用场景,它可以模拟CPU、GPU等硬件的各种并行运算。通过与目标硬件的高速接口互联,FPGA可以完成目标硬件运行效率比较低的部分,从而在系统层面实现加速。
2.什么叫数字IC?
IC就是半导体元件产品的统称,IC按照功能可分为:数字IC、模拟IC、微波IC及其他IC。数字IC就是传递、加工、处理数字信号的IC,是近几年来应用最广、发展最快的IC品种,可分为通用数字IC和专用数字IC。
通用IC:是指哪些用户多、使用领域广泛、标准型的电路,如存储器(DRAM)、微处理器(MPU)及微控制器(MCU)等,反映了数字IC的现状和水平。
专用IC(ASIC):是指为特定的用户、某种专门或特别的用途而设计的电路。
补充:RAM是什么?
RAM全称是Random Access Memory,中文名称是随机存储器。它是直接与核心中央处理器CPU直接的相连的,当电脑在运行的过程中,随机存储器用来数据的存储和读写,能够满足人们在上网过程中因为应用运行所产生的内存存放。其作用就是暂时存放CPU中的运算数据,以及硬盘等外部存储器交换的数据。只要计算机在运行,CPU就会把需要运算的数据调到内存中进行运算,当运算完成后CPU再将结果传送出来,内存的运行也决定了计算机的稳定运行。
3.FPGA设计流程
以Xilinx Vivado开发工具为例,主要有以下步骤:
系统规划、RTL输入、行为仿真、逻辑综合、综合后仿真(可选)、综合后设计分析(时序及资源)、设计实现(包括布局布线及优化)、布线后仿真、板级调试、bitstream固化。
1)系统规划: 在 FPGA 设计项目开始之前,需要进行系统的功能定义和模块的划分。然后根据任务要求(系统的功能和复杂度),对工作速度和器件本身的资源,成本,以及连线的可布性进行评估,从而选择合适的设计方案和器件类型。
2)RTL 输入:RTL,Register Transfer Level,直译为寄存器转换级,要描述各级寄存器(时序逻辑中的寄存器),以及寄存器之间的信号的是如何转换的(时序逻辑中的组合逻辑)。通俗来讲,RTL 的输入一般为两种,使用硬件描述语言 Verilog HDL/VHDL 进行编写或者原理图输入。原理图就是比较老的做法了,通过门电路的拖拽连接起来设计系统,所以现在基本都是用语言来描述了。
3)行为仿真/功能仿真:在编译前对用户所设计的电路进行逻辑功能验证,此时是没有任何延迟信息的,仅对初步的功能进行检测。
4)逻辑综合:综合的含义就是将高级层次的描述转化为低级层次的描述,就目前层次来看,综合优化是指将设计输入编译成基本逻辑单元组成的逻辑连接网表。
5)综合后仿真(可选):综合后仿真检查综合结果是否和原设计一致。仿真时,将综合生成的标准延时文件反标注到综合仿真模型中,可以估计门延时带来的影响,但是无法估计线延时,因此和布线后的实际情况有一定的差距。一般的设计可以省略这一步。
6)综合后设计分析(时序及资源):综合之后会告诉我们,目前的系统设计消耗了多少 FPGA 的资源,比如,消耗了多少 LUT、RAM、DSP48,等等。我们可以根据这些报告来选择对设计进行优化。
7)设计实现(包括布局布线及优化):利用实现工具把逻辑映射到目标器件结构的资源中。布局将逻辑网表中的硬件原语和底层单元合理的配置到芯片内部的固有硬件结构上,需要在速度最优与面积最优之间做出选择;布线在布局的基础上,利用芯片内部的各种连线资源,合理正确的连接各个元件。
8)布线后仿真:意思与前面的综合后仿真一致,因为此时已经进行了布局布线,所以在时序中包含的延迟信息更真实。能较好地反映芯片的实际工作情况。
9)板级调试:产生使用的数据文件(bitstream-比特流文件),然后将编程数据下载到 FPGA产生使用的数据文件(bitstream-比特流文件),然后将编程数据下载到 FPGA接口,而且一般人手头没有逻辑 。那比较实用的方向就是使用内嵌式逻辑分析仪 ILA。【详情可见本人视频,开发笔记第二期-开发流程】 。
10)bitstream 固化:这其实是最最最最后一步了。只有在你确保当前的设计已经完美无瑕可以拿来用的时候,才会把它固化到 FPGA 上。这样,每次上电运行的就变成这个系统了。
4.对FPGA开发的理解
目前的FPGA应用于三个方向:
方向一:就是传统方向主要用于通信设备的高速接口电路设计,这一方向主要是用FPGA处理高速接口的协议,并完成高速的数据收发和交换。
方向二:可以称为数字信号处理方向或数字计算方向,因为很大程度上这一方向已经大大超出了信号处理的范畴。
方向三:就是所谓的SOPC方向,其实严格意义上讲这个已经在FPGA设计的范畴之内,只不过利用FPGA这个平台搭建的一个嵌入式系统的底层硬件环境,然后设计者主要是在上面进行嵌入式开发而已。(目前的发展不如前两个方向)
5.FPGA内部资源
目前主流的FPGA都采用了SRAM工艺的查找表(LUT)结构,LUT本质上就是一个RAM。FPGA内部组成部分主要有:可编程输入/输出块(IOB)、可配置逻辑块(CLB)、嵌入式块RAM(BRAM)、丰富的布线资源、底层内嵌功能资源、内嵌专用硬核资源等。
(1)可编程输入/输出块:为了便于管理和适应多种电器标准,FPGA 的 IOB 被划分为若干个组(bank),每个 bank 的接口标准由其接口电压 VCCO 决定,一个 bank 只能有一种 VCCO,但不同 bank 的 VCCO 可以不同。只有相同电气标准的端口才能连接在一起,VCCO 电压相同是接口标准的基本条件。
(2)可配置逻辑块:由查找表和可编程寄存器组成,查找表完成纯组合逻辑功能,内部寄存器可配置成触发器或锁存器。
(3)嵌入式块 RAM:可以配置成单端口 RAM、双端口 RAM、内容地址存储器(CAM)以及 FIFO等常用存储结构。
(4)丰富的布线资源:布线资源连通 FPGA 内部的所有单元,而连线的长度和工艺决定着信号在连线上的驱动能力和传输速度。主要分为四类:全局布线资源、长线资源、短线资源、分布式布线资源。
(5)底层内嵌的功能单元:主要包括 DLL、PLL、DSP、CPU 等,现在越来越丰富的内嵌的功能单元,使得 FPGA 成为了系统级的设计工具,使其具备了软硬件联合设计的能力,逐步向SOC 平台过渡。
(6)内嵌专用硬核资源:内嵌的专用硬核是相对底层软核而言的,指 FPGA 处理能力强大的硬核,等效于 ASIC 电路。主要有乘法器、串并收发器、PCI-E、以太网控制器等。
6.IC设计流程
1) 确定项目需求首先做一款芯片需要有市场,一般公司会先做市场调研,比如最近市面上比较火的人工智能芯片,物联网芯片,5G 芯片,需求量都比较大。有了市场的需求我们就可以设计芯片的spec 了。先由架构工程师来设计架构,确定芯片的功能,然后用算法进行模拟仿真,最后得出一 个可行的芯片设计方案。有了芯片的 spec,下一步就可以做 RTL coding 了。
2) 前端设计架构/算法设计分析目的:完成芯片中数字部分的高层次算法或架构的分析与建模,为硬件提供一个正确的软件功能模型,更为重要的是,通过大量的高层次仿真和调试,为 RTL 实现提供总体性的设计指 导。数字部分越复杂,这一点越重要。
工具:MATLAB、C++、C、System C、System Verilog 等。不同类型的芯片都不同的选择, 如数字信号处理类芯片,偏好 MATLAB。特点: 这部分工作至关重要,基本上奠定了整个芯片的性能和功耗的基础。这部分工作主要由具有通信、信号处理、计算机、软件专业背景的工程师完成,也有很多微电子专业背景的 工程师参与。
3) RTL 实现目的: 依据第一步的结果,完成由高层次描述到 Verilog HDL 实现的过程。工具: GVim/Emac、Verilog/VHDL特点: 这一步能明显区别训练有素的工程师和初学者。前者在写代码的过程中,具有极强 的大局观,能够在书写 Verilog HDL、描述逻辑功能的同时,还能够兼顾逻辑综合、STA、 P&R、DFX、功耗分析等多方面因素,最终提供一份另其他环节的工程师都赏心悦目的代码。 初学者则处处留地雷,一不小心就引爆。Coding Style Check目的: 排除 RTL 代码中 CDC(Clock Domain Cross)、Lint 等问题。CDC: 跨时钟域检查LInt: 代码潜在问题检查(例如 A+B 的进位溢出)工具: Syglass、LEDA、0inCDC特点: 目前大部分芯片中的数字部分基本上都采用局部同步和全局异步的设计策略,因此, 在设计中需要小心注意跨时钟域的数据同步问题。输入: RTL,SDC,lib/sglib输出: wave file,report
4) 功能验证目的: 在无延迟的理想情况在,通过大量的仿真,发现电路设计过程中的人为或者非人为引起的 bug。主要指标是功能覆盖率。工具: Modelsim、VCS、NC-Verilog、(DVE/Verdi 波形查看器)语言: C++、C、System C、System Verilog,基于 UVM 的方法学等。主要是System Verilog, 一般哪个方便用哪个。特点: 验证工程师近年来已经成为 IC 设计中需求量最大的岗位。这个阶段会占用大量的时 间,数以月计。
5) 逻辑综合+DFT目的: 将 RTL 代码映射为与工艺库相关的网表。工具: DesignCompiler、RTL Compiler。DesignCompiler 在市场中占有垄断性地位,几乎成 为逻辑综合的标准。特点:a.从芯片生产的角度来看,在该步骤之前,所有的工作都可近似看做一个虚拟性的,与现实无关。而从逻辑综合起,后续所有的工作都将与工艺的物理特性、电特性等息息相关。逻辑 综合工具的功能主要是将 VerilogHDL 格式的文本映射为网表格式的文本,因此,它的功能 等同于文本编译器。那么转换的方式有很多种,工具如何选取呢?逻辑综合过程中,整个文 本格式的编译过程是在给定的人为约束条件下进行的,通过这些约束和设定的目标来指导工 具完成 Compiler 的工作。所以,逻辑综合过程可以看成一个多目标(频率、面积、功耗) 多约束的工程优化问题。b.该步骤中,通常会插入 DFT、clock gating 等。c.该步骤中通常加入 Memory、各种 IP 等。为了在各种工艺库以及 FPGA 原型验证平台之间 有一个更方便的移植,注意适当处理这些 Memory、IP 等的接口。该步骤中也可加入 I/O、 PLL 等。DFT(Design For Test): 为了保证芯片内部的制造缺陷尽量能够哦被检测到,通过在电路中插入扫描链(Scan Chain)的方式,测试 IC 在生产制造过程中是否出现问题。加入 DFT 会增 加 20%~30%的面积。但为了保证准确率,为了给客户的片子是合格的需要将具有缺陷(工厂制 造缺陷)的片子筛除。输入文件:a.RTL 代码:由 ASIC design engineers 团队提供;交接前,必须保证在第 3 步的 check 中没 有任何问题;b.工艺库(.db):由晶圆厂提供;c.约束(SDC):由逻辑综合工程师和 ASIC design engineers 共同商定。输出文件:a.网表:包含了 RTL 中的所有的逻辑信息,除此以外,可能还会有 DFT、clock gating、I/O等;网表主要用于 P&R 等流程;b.标准延迟文件 SDF:主要包含了网表中所有器件的延迟信息,用于时序仿真;PT 会结合 后端工具生成的一个更为精确的 sdf ,所以,通常会用 PT 的 sdf 文件做后仿真。Project 文件:.ddc;c.各种报告:timing report、area report、constrain report、clock report、violation report 等等,以及工具的 log 文件。(此处最好能够熟悉各种脚本语言,将各种 report 处理为友好易读形式)
6) 形式验证目的: RTL 代码和逻辑综合后的网表是否具有一致的功能。(尤其是在后端做 ECO 的时候)工具: Formality、Conformal输入文件: RTL 代码、netlist(逻辑综合输出)、约束输出文件: match 和 verify 报告。
7) 静态时序分析目的: 分析设计中所有的路径,确保满足内部时序单元对建立时间和保持时间的要求。工具: PrimeTime、Tempus。PrimeTime 在市场中占有垄断性地位,几乎成为 STA 的标准特点:输入: spef 文件、PnR 网表,标准单元库 db 文件,IP 的 dp 文件输出: SDF,timing ECO 文件特点:a.从逻辑综合开始,基本上每做一步大的调整,都会完成一次 STA 分析,以保证每步都能实现时序收敛。鉴于该特性非常重要,PrimeTime 成为了 Signoff 的重要工具。b.所用到的 SDC 同逻辑综合;c.通常设计中会存在大量的违例路径,STA 要修大量的 setup、hold 等,如何修这些违例,可以体现工作经验的重要性。此外,如果是前端修 timing 违例,一般会修的很快,但是会带 来一个重大的问题,代码被前端修改后是否存在新的 bug,还需重新仿真确认,仿真会消耗 掉数以月计的时间,所以除非万不得已,不会找前端修 timing。注:静态时序分析和形式验证这属于验证范畴。STA 主要是在时序上对电路进行验证,检查电路是否存在建立时间(setup time)和保持时 间(hold time)的违例(violation)。而形式验证是从功能上对综合后的网表进行验证。常用的就是等价性检查(LEC)方法,以功能验证后的 HDL 设计为参考,对比综合后的网表功能,他们是否在功能上存在等价性。
静态时序分析和形式验证出现在设计流程中前后端过程,有一些地方在前端中没有提到,应该是在后端当中比较重要,作为验证设计工作的一部分,在前端中也加入静态时序分析和形式验证可以提高设计的可靠性。
7.对数字IC的理解
越老越吃香!客观的说,ICer 并不是严格意义上的程序员,我们是数字电路的设计者和维护者,我们的每一行语言都会转换成物理意义上真实存在的与或非门,被光刻机印刻在芯片的最深处,成为所有现代工业物品中最核心的“大脑”,为它们赋予智慧。
没有回复内容