专访李晓维:中国技术进入“国际大循环”的同时要补短板

出品|《新基建访谈》No.52

采访|刘沐琪

文章|本站智能

中国科学院计算所,一直都是中国科学界响当当的名字。

它创建于1956年,是中国第一个专门从事计算机科学技术综合性研究的学术机构,1965年,成功研制出中国第一台109乙大型通用晶体管计算机。1971年,成功研制111型通用计算机是中国第一批集成电路计算机。2002年9月,计算所发布了龙芯1号通用CPU芯片。

那么,计算所是如何保持技术优势的,计算所专家又如何看待目前的全球科技发展态势,对中国对技术发展有哪些思考?本站科技本期《新基建访谈》独家专访了中国科学院特聘研究员、计算所学位评定委员会副主席、计算机体系结构国家重点实验室常务副主任、博导李晓维。

他于1991年获中国科学院博士学位,1993年8月任北京大学计算机系副教授,2000年9月任中科院计算所研究员、博士生导师,现任计算所学位评定委员会副主席、计算机体系结构国家重点实验室(中国科学院计算技术研究所)常务副主任、中国计算机学会监事长、JCST副主编。

曾获国家技术发明奖和国家科技进步奖。2013年入选国家百千万人才工程并获“有突出贡献中青年专家”称号、2014年入选“科技北京”百名领军人才培养工程;2016年获中国科协第七届“全国优秀科技工作者”荣誉称号。

李晓维表示,从计算机到通用处理器,再到智能处理器、数据处理器等专用加速芯片都是我们国家计算机发展的缩影。这些年的发展得益于两方面,一是半导体工艺的进步,比如九十年代技术还是微米级,而现在已经纳米级;二是体系结构的进步,体系结构的进步和工艺的细化交替推进计算机硬件和架构的更新换代。

面对纷繁复杂的大环境,李晓维谈到,我国加入世贸组织之后、科研也参与到国际大循环,可以公平使用商品化设计工具和半导体代工服务,加上中国人的勤奋,完全可以使我们研发的芯片进入世界领先行列,但公平公正的全球大循环还只是一个理想化的世界。如今我们被卡脖子、就需要补短板了,像目前国内集成电路的成熟工艺和国际顶尖水平之间大约还有五代左右的差距。

他还特别指出,年轻一代要有通过科技进步推动物质文明发展的激情:现在的学生比我们当年可选择的范围要多,挺羡慕现在的学生有这样一个好机遇,我也希望一代更比一代强,他们是未来国家的希望,要超越我们,然后再超越他们自己。

以下是专访实录摘要:

问:您是研究VLSI测试、容错计算、硬件安全方面的专家,请您简单讲一讲近年来我国计算机技术和信息产业的发展。

李晓维研究员:我是中国科学院计算技术研究所的研究员,计算所是中国第一个专门从事计算机科学技术综合性研究的学术机构。所以就以计算所为例,因为计算所的科研成果也是我国计算机技术的进步、推动信息产业发展的一个缩影。

计算所是我国计算机事业的摇篮,成立初期研制的计算机主要服务国防建设事业、在研制两弹一星工作当中使用。八十年代进入了改革开放的新时期,由为国防建设服务转变为面向国民经济建设的主战场;研制的计算机系统用于石油勘探、气象预报等。九十年代研制的曙光系列服务器打破国外高技术封锁、开始商业化应用。2000年之后,计算所就开始做核心芯片,其中标志性的是龙芯处理器,同期我们国家也在做操作系统。2010年开始研制智能处理器,寒武纪是有国际影响力的,联想、曙光、寒武纪等上市企业都是依托计算所科研成果发展的典型。诞生于计算所的计算机系统,通用处理器、智能处理器、数据处理器等专用加速芯片都是我国计算机发展的缩影。

这些年的发展得益于两方面,一是半导体工艺的进步,比如九十年代技术还是微米级,而现在已经接近纳米级;二是体系结构的进步,体系结构的进步和工艺的细化交替推进计算机硬件和架构的更新换代。九十年代的手机叫大哥大,像一块砖头。现在的手机不仅小且性能很强,各种技术集成在里面,几乎是人人离不开的通讯设备,这就是计算机技术和通信技术结合的产物。

问:近年来,计算机技术发展进入加速度阶段,您认为我们国家是靠什么达到如今的高度?又如何看待现阶段我们取得的这些成绩呢?

李晓维研究员:这种快速发展得益于中央政府强有力的引导。比如加入世贸组织之后、科研也参与到国际大循环,我国达到世界领先水平的超级计算机神威·太湖之光和华为手机,其核心芯片都是我国自主研制的。加入世贸组织之后放到国际大循环中去做,借助于商品化设计工具和半导体代工服务,再加上中国人的勤奋,完全可以使我们研发的芯片进入世界领先行列,但公平公正的全球大循环还只是一个理想化的世界。

如今我们在若干领域被卡脖子、就需要补短板了,像目前国内集成电路的成熟工艺和国际顶尖水平之间大约还有五代左右的差距。这种情况下我们仍可以在体系结构方面做一些工作,通过开源和敏捷设计等创新设计方法,有望打破封锁。在体系结构和敏捷设计方面,采用不太先进的成熟工艺加上比较先进的硬件架构,有望弥补与基于先进工艺产品的技术差距。所以仍有机会变道追赶,我们在这方面还是有信心的。

另外,各种信息电子装备都需要大量的集成电路,而我国集成电路目前主要还依赖进口。细分一下会发现,其中大概80%都不是最先进的工艺。换句话说这80%的进口是可以用我们国内成熟工艺生产的,但我们没有生产,主要是考虑经济成本效益,还有一些知识产权问题,很多常用芯片的IP都是欧美日韩的。在良性的国际大循环中,我们可以有偿使用他国的创造发明成果,所以全球一体化或者产业大循环对所有参与的国家和地区都是好事。

问:我们了解到从2000年开始,您在计算机体系结构国家重点实验室的团队就开启了芯片全生命周期的可靠性建构研究,那么您认为“芯片的可靠性”的基石是什么?然后请详细谈谈容错技术方向。

李晓维研究员:CMOS集成电路是以硅为主体的,硅半导体工艺的细化程度从30年前的微米级发展到现在已接近纳米级。遵循摩尔定律、单片集成电路会容纳越来越多的晶体管,硅半导体工艺进入超深亚微米之后存在着工艺的偏差或波动。

每一个集成电路的设计均需要进行严格的设计验证、每一片集成电路芯片均需要进行严格的测试。出厂测试合格的芯片有的能够工作几年,有的只能工作几天,这就存在可靠性问题。为此从芯片设计初期就需要考虑对生产出来的芯片进行检测和修复的内部架构。需要集成电路全生命周期的可靠性分析。特别要进行芯片容错设计,可以采用我们提出的自测试、自诊断、自修复技术,在不能够人为替换的情况下让芯片自己修复,从而达到长寿命的目标。

目前,芯片容错主要基于功能修复,就是在芯片上多做一些备用器件。我们团队2000年开始做这项工作,目前来说已经行成技术体系,也已经容错架构用在若干个芯片的设计里。为此我们还专门研制了一套软件工具,让芯片设计人员去使用它,用于芯片的容错设计。最近计算所鼓励我们把这套软件工具进行产业化,让更多的人受益,为此成立一个产业化的公司来把它变成产品,目前正在做这个工作。

芯片容错细分来讲,包括生产过程中的容缺陷,生产出的芯片容故障,再到芯片用于系统中的容差错。所以容缺陷,容故障到容差错是一体技术,这个技术和现在大型计算机系统中的容错计算机是衔接的。我们现在的容错计算机在银行、证券、航空航天领域的控制系统都要使用,它的单个器件如果采用我们的基于自测试、自诊断、自修复的容错技术,那么整体就会有更长的使用寿命,更有力的可靠性保障。

目前我们团队开始与地方政府合作,目前在北京市,很快就将推广到长三角地区。那里的集成电路从设计、生产、封装都比较齐全,但是缺少全生命周期的可靠保障,这正好去弥补短板。

在容缺陷、容故障、容差错之外,我们还有增加一点就是对安全性的检测。现在国家越来越重视国家信息安全,但这仅仅靠个人意识和政策是不够的,需要通过技术设置防线来保障信息安全。

问:您个人作为一名科研人员,是什么让您坚持在科研这条道路上一直走下去,您新阶段的目标是什么呢?

李晓维研究员:作为一名科技工作者,是要有科学家精神的。我们国家是制造业大国,集成电路产业的先进制造的代表,如何杜绝假冒伪劣产品呢?严格的测试,是最基本的办法,在测试技术下假冒伪劣产品无所遁形,包括恶意植入的硬件木马等都能被发现。从芯片产品质量到硬件安全隐患检测我们都可以去做。一名科研工作者对事情要有精益求精的态度,做测试要做到“吹毛求疵”的程度,一定要做到完美。

新阶段的目标有两点,一是向前推进技术,把相当多的精力放在硬件安全隐患的检测和芯片防止被人恶意修改的工作上。二是追求完美,培养更多人才。然后尽力多做一些科普,让更多人了解集成电路从质量到可靠和安全的重要性。

问:作为中科院的“优秀研究生导师”,您是如何与学生共处的?如何看待新一代年轻人在科研领域的新作用新机遇,有哪些建言。

李晓维研究员:30年前我是出于对科学家的崇敬,对中国科学院这样科学殿堂的向往来读书的。作为科技工作者,我觉得要有为国科研、为国奉献,为国家做事的心。在这点上,我们计算所的特点就是结合承担的科研任务来培养学生,让学生参与做科研,在科研中培养学生。我们跟学生之间的关系很融洽,学生和我们做科研不仅仅是学习,更有机会一起去探索新的东西。

现在的学生比我们当年可选择的范围要大很多,随着互联网高速发展,相关论文资料都可以方便下载阅读,挺羡慕现在的学生有这样一个好机遇,我也希望一代更比一代强,他们是未来国家的希望,希望取得更好的成绩,要超越我们,然后再超越他们自己。