正版香港挂牌-正版四不像图解特肖-正版管家婆一句赢大钱
做最好的网站
您的位置:正版香港挂牌 > 科研成果 > 为微电路全生命周期,健康顾问

为微电路全生命周期,健康顾问

2019-09-08 09:25

2017年度北京市科学技术奖成果: 为芯片全生命周期“健康”保驾护航

给芯片当“健康顾问”

■本报记者 陆琦

图片 1

图片 2

3S综合验证平台

2017年度计算机体系结构国家重点实验室评估现场,李晓维向专家介绍情况。

图片 3

大到占地上万平米的数据中心,小到一枚助听器,其中都有芯片的身影。芯片虽然没有生命,但也和生命体一样面临“健康”问题,即可靠性问题。修复软件的Bug可以通过修改源代码来实现,可芯片的“健康”一旦出了问题就不那么容易恢复了。

CPU芯片是现代信息技术的引擎,是数据处理的核心。我们生活中用到的电脑、智能手机、电视机、电冰箱、汽车……其中都有芯片的身影,它的质量直接关系到千家万户的日常生活。

中科院计算所计算机体系结构国家重点实验室李晓维团队通过多年潜心研究,在验证、测试、容错等方面取得了一系列国际领先的科研成果,从设计、制造到服役,为芯片全生命周期的可靠性“保驾护航”。

如今,芯片使用量正在呈指数级增长,对其质量的要求也越来越高。验证、测试和容错技术则是芯片质量保障的三道技术关卡。

处理器芯片是现代信息技术的引擎,是数据处理的核心。然而,设计过程中可能由于考虑不周导致制造出的芯片功能故障,制造过程中会遭受芯片缺陷而导致逻辑正确的芯片不能成为合格产品,即便在服役期也会由于一些物理机理的作用产生老化等问题……

中国科学院计算技术研究所,计算机体系结构国家重点实验室常务副主任李晓维研究员带领团队自2000年起,在科技部、国家自然科学基金委和北京市科委相关项目的资助下,紧密结合国产高性能CPU芯片的研制,实现了测试验证和片上容错设计关键技术的突破。系列研究成果曾获国家技术发明奖和国家科学技术进步奖,最新研究成果已在多款高性能CPU的设计验证、测试与容错设计中转化应用,并获得了2017年度北京市科学技术奖二等奖。

我国高性能处理器芯片长期依赖进口,2000年以来,随着我国积极推动国产高性能处理器的研制及其产业化,对高性能处理器设计正确性的验证和制造缺陷的检测提出了迫切的需求。

芯片也有“生病烦恼”

“设计过程中的问题需要通过验证的方法来解决,制造过程中遭受的一些随机杂质等因素造成的缺陷可以通过芯片测试来筛除,而服役期的可靠性则必须通过设置一定的容错机制来保障。”李晓维说。

芯片虽然没有生命,但也和其它生命体一样面临可靠性问题,通俗可以理解为芯片的“健康”问题。

这在很多特殊的应用领域具有非常重要的意义,例如飞行在深空的航天装备中的芯片如果出了问题很难及时更换,所以对可靠性的要求尤其苛刻。2005年起,李晓维团队开启了芯片全生命周期的可靠性构建研究。

修复软件的故障可以通过修改源代码来实现,但是芯片的故障就不那么容易修复了。

打破封锁实现有效测试验证

例如在芯片设计的过程中可能会由于考虑不周,导致制造出的芯片发生功能故障。制造的过程中也会遭受芯片缺陷,导致逻辑正确的芯片仍然不能成为合格的产品,即便在服役期也会由于一些物理机理的作用产生老化等问题。

测试验证,是芯片服役前要过的第一关。

就像我们通过体检可以查验出身体可能会出现的健康问题一样,对于芯片来说,“体检”也是十分有必要的。

如同妈妈们通过孕检来确认即将出生的小宝宝是否健康,科研人员则通过测试验证来保证设计和制造出来的芯片符合设计要求,解除系统失效的隐患。

“简单地说,设计过程中的问题需要通过验证的方法来解决,制造过程中遭受的一些随机杂质等因素造成的缺陷可以通过芯片测试来筛除,而服役期的可靠性则必须通过设置一定的容错机制来保障了。”李晓维说。

测试验证使用的最主要的方法是模拟。该方法主要的难点在于输入的数据量巨大,想要完全地测试验证处理器,需要的时间非常长。为了加速测试验证的过程,需要把输入进行分类,仅挑选每一类中的代表对处理器进行测试验证。

这在很多特殊的应用领域具有非常重要的意义,也对芯片设计正确性的验证和制造缺陷的检测提出了迫切的需求。例如飞行在深空的航天装备中的芯片如果出了问题很难更换,所以对可靠性的要求尤其严苛。

但处理器的设计非常复杂,输入的组合和分类情况同样是极其复杂的。于是,李晓维团队对测试验证的方法进行探索,提出了一系列形式化和半形式化的方法解决了这一难题。

给芯片做“产检”

在生产环节,西方国家对我国测试设备出口时关键性能指标——时钟频率的限制,使我们甚至无法利用测试设备的时钟直接支持高性能处理器芯片的实速测试,妨碍了我国高性能处理器的顺利发展。

要想让CPU芯片一出生就“健康茁壮”,在芯片的IC设计阶段,就要通过设计验证来检验设计方案是否符合规范,发现不同设计阶段引入的设计Bug。

李晓维团队通过在芯片电路里的一个特殊设计,实现了高性能处理器芯片的实速测试,打破了国外的技术封锁。

“芯片作为人类工业史上最复杂的产业之一,设计验证是其设计流程中的瓶颈,复杂芯片设计验证所投入的人员和时间都已超过设计本身。”李晓维说。

为应对服役期的芯片健康问题,他们发展了传统的基于多模冗余的容错技术,给芯片装上“急救包”。这些“急救包”部署在芯片内部一些容易出现问题的位置,例如关键的运算单元、重要的数据链路等。

测试和验证是非常重要的环节。如果测试和验证的环节有问题,将会导致有问题的处理器芯片组装到系统里,将可能造成巨大的经济损失。

“遇到一些容易处理的伤病,芯片自己就可以解决,不必为了处理一些小问题而专程请‘大夫’了。”李晓维说。

例如,1994年Intel奔腾芯片的浮点除法错误,使Intel公司损失近5亿美元,就是因为芯片在投产前未能保证设计的正确性,事后又未能测试出该问题。

如今,芯片在设计、制造、服役这三个环节的可靠性问题都解决了,但这还远远不够。李晓维的理想是,未来能够在可靠部件的基础上构建可靠系统。

据介绍,测试验证使用的最主要的方法是模拟。该方法主要的难点在于输入的数量巨大,想要完全地测试验证处理器,需要的时间非常长。为了加速测试验证的过程,需要把输入进行分类,仅挑选每一类中的代表对处理器进行测试验证。

自2010年以来,李晓维团队的成果已经应用于包括安全认证芯片、星载微处理器芯片、多媒体处理核心芯片、高端通用处理器芯片等10余款高性能处理器的设计验证、可测试性设计与片上容错设计。其中,使用他们成果的安全认证芯片在指纹考勤门禁领域的市场占有率超过50%,国产星载微处理器芯片已成功应用于10余个国产卫星的控制计算机。

但处理器的设计非常复杂,输入的组合和分类情况同样是极其复杂的。于是,项目研发团队对测试验证的方法进行探索,提出了一系列形式化和半形式化的方法解决了这一难题。

“不断创新,推动技术进步,造福人类。”李晓维做研究并不是为了自己获利,让梦想成真才是他不懈的追求。

“研究成果应用以来,已检出了多款芯片的设计错误,有效避免了潜在重大损失。”李晓维说。

从最初的产品质量测试,到全生命周期的可靠性构建,深耕细作近20年,李晓维始终没有停下探索的脚步。他的下一个目标,是安全。

为芯片装上“急救包”

“可靠不等于安全。”他说,“目前我国无处不在的处理器绝大多数都是进口的,有没有把重要信息泄露出去,有没有恶意植入的木马甚至逻辑炸弹……我们要想办法去除这些不安全因素,把隐藏的‘间谍’揪出来。”

为了应对服役期芯片的健康问题,项目团队发明了片上容错技术,将芯片内置了多种保障芯片可靠工作的功能单元。这就好比人自备“急救包”,遇到一些容易处理的伤病自己就可以解决,不必为了处理一些小问题而专程去医院。

《中国科学报》 (2018-04-26 第8版 双创)

“这种片上‘急救包’就是片上容错的核心单元。”李晓维说,这些“急救包”部署在芯片内部一些容易出现问题的位置,例如关键的运算单元、重要的数据链路等。

经过团队十余年的科研攻关,攻克了“自测试、自诊断、自修复”容错技术的难题,可以准确地检测到故障是否存在,并精确判定服役期的芯片出现故障的具体位置,从而通过预先设定的机制进行故障修复。

通过实时故障检测和修复来屏蔽局部失效核对芯片和系统整体性能的影响,能够满足相关装备高可靠性、长寿命的需求。

助力CPU芯片产业发展

据了解,该项目成果已经应用于包括安全认证芯片、星载微处理器芯片、多媒体处理核心芯片、高端通用处理器芯片等十余款高性能 CPU 的设计验证、可测试性设计与片上容错设计中,显著提升了我国微处理器的可靠设计能力,促进了我国高性能处理器验证测试技术的发展。

使用该成果的国产星载微处理器芯片已成功应用于十余个高端装备的控制计算机,运行稳定、安全可靠,取得了显著社会效益。

应用该成果的Godson-T 芯片入选了 2011 年《Microprocessor Report》杂志遴选的全球十大服务器处理器;BR 系列安全认证芯片在指纹考勤门禁领域的市场占有率超过50%。

据李晓维介绍,通过采用这项技术,他们把某款存储器芯片的成品率从30%提升到80%。

从最初的产品质量测试,到全生命周期的可靠性构建,项目团队不断致力于用技术创新促进产业链的完善。

2018年8月14日,我国集成电路测试专业委员会正式成立。李晓维担任专委会主任委员。

“委员会的成立预示着我国芯片测试与容错领域,在制定技术标准、促进产学研用融合和贯通等方面开始迈出重要一步。”李晓维告诉记者。

“为了产业的健康发展,必须要排除人为因素,通过自动化、人工智能等技术手段,进行全生命周期的安全排查。为此,建立国家行业标准,时不我待。”李晓维说。

本文由正版香港挂牌发布于科研成果,转载请注明出处:为微电路全生命周期,健康顾问

关键词: