欢迎访问龙岩市科学技术协会网站! 2019年8月14日   在线投稿 设为主页 加入收藏
首 页 科协简介 公告通知 重要新闻 科学普及 学会活动 科技人物 基层动态 政策法规 科普博览 科普惠农 文件下载
j 龙岩市科学技术协会 >> 绉戞妧浜虹墿 关闭窗口
“中国巨型计算机之父”金怡濂:不辞夕阳铸“神威”
发布人:admin 发布时间:2020/8/26 浏览次数:5519


    家风与教育铸就坚实根基

    1929年9月,金怡濂出生在一个知识分子家庭。金怡濂的父亲是留学美国的工程师,母亲是家学渊源的大家闺秀。

    虽然成长在动荡的时代,但父亲金奎对中国人才智的肯定和认可始终没有变。他用詹天佑、茅以升等人作榜样,告诉子女,中国虽然暂时穷困,但中国人非常聪明,只要下功夫、肯努力,开动脑筋,外国人能办到的事情,中国人也一定能做到。金怡濂称,父亲的话长久地留在他的脑海中,对他的治学生涯产生了莫大的影响。

    1935年,他进入天津耀华学校开始接受启蒙教育,耀华是当时天津的一流学校。金怡濂的启蒙老师善于培养、调动孩子们的兴趣,讲课时循循善诱, 借助童话和故事情节来达到对知识的理解。而让金怡濂最难忘的校长赵君达一位知名教育家,爱国敬业,一身正气,建树颇丰。1938年6月, 赵校长遭到了日本特务的暗杀,他的牺牲,使金怡濂和同学们悲愤万分,在他们幼小的心灵中激起了为中华民族崛起强大而努力学习的热情。

    进入中学,学习难度大了,金怡濂更加刻苦。学校既重视概率论、排列组合、几何、物理等数理方面的教学,也非常重视语文方面的培养。国文课中不仅讲授《论语》《孟子》《诗经》《左传》等经典,同时也介绍《滕王阁序》《岳阳楼记》等古典名篇。在耀华学校的12年间,培养了金怡濂爱国热忱及对理科的兴趣和偏爱,为他今后事业的起飞做了良好的铺垫。

    1947年,金怡濂中学毕业报考大学,同时被清华大学、北洋大学等四所大学录取。他首选了清华大学电机系。清华大学非常重视基础课的教学,那时许多知名教授都教一门基础课和一门专业课。大一物理共开四班,分别由霍秉权、王竹溪、孟昭英、余瑞璜教授讲授;大二的工程力学共开两班,分别由张维和钱伟长教授讲授。教授们特别强调“基本概念”的理解。如闵乃大教授讲课时,对理论公式推导总是写满了黑板,推演完毕后,他便反复问学生是否抓住了“概念”,闵教授认为不论问题多么复杂,推导的公式有多长,关键是抓住基本概念和理论实质, 其他问题就会迎刃而解。名教授们讲课深入浅出,生动形象,金怡濂感到很“过瘾”,听后受益很大。虽然当时用的教材并不太深,但师生互动,学生学得比较“透”,加之学校严把考试关,不及格要重修。因此,学生的知识基础、思维能力、创新能力得到了很好的培养。

    动荡年代研制大型机

    金怡濂大学毕业后,服从国家分配,被派到上海的中国电话公司工作。他在工作中的表现和与计算机接近的专业背景为他赢得了去莫斯科深造的机会。

    当年年底,金怡濂抵达莫斯科, 被分配到苏联科学院精密机械与计算技术研究所进修学习。当时苏联的计算机技术比较先进,运算速度达2万次/秒。金怡濂在留学期间学习非常刻苦勤奋,据他回忆说:“我们当时住在莫斯科南边的苏联科学院研究生宿舍,而研究所在北边。 每天早晨,我们很早就起床, 先倒两次公交车,再坐地铁, 尔后又转乘公交,路上一般要花上一个半小时。我们在那里主要是做一些有关新型加法器方面的实验,回宿舍的时候就 借些资料学习,尽管很累,但 仍常常学到深夜。”由于忙,在莫斯科呆了一年半的金怡濂,居然从没听过《莫斯科郊外的晚上》《红莓花儿开》等风靡全苏联且唱红到中国的名曲。

    进修完的金怡濂回到国内想有所施展,迎接他的却是“大跃进”的浪潮。

    金怡濂只回原单位和领导报了到,就奔赴位于中关村的中科院计算机所,参加我国第一台大型计算机104机的研制,作为技术骨干冲在了研制第一线。

    当时,计算机所的集体宿舍还没有建成,金怡濂就住在计算机所大楼5层的一个空房间里,同住的还有20多位同事。工作之余,他还要和同事到马路、工地上捡废铁,供所内的小高炉炼钢。除此以外,金怡濂几乎所有时间都待在机房里。1958年9月,104机进入机房安装阶段,每个插件都有数量可观的焊点,金怡濂时任机房值班长,为了排查虚焊问题,他想了很多点子。除了目视观测,还要用榔头敲,用木片划拉。金怡濂认为,成型的104机整体质量很好,与排查虚焊的工夫到家有不可分割的关系。他也进一步体会到,计算机是个特别的东西,工艺质量和设计质量都至关重要。

    经过多轮调试,1959年国庆节期间,104机正式宣布完成,中国有了第一台平均浮点运算速度达到每秒1万次的大型计算机。我国第一颗原子弹的相关科学计算,就是由104机完成的。不过金怡濂并没有参与104机最后的调试。1959年初,他被原单位召回,开始参加总参某研究院代号为“5号”的大型计算机研制工作,并担任逻辑设计组的副组长,同时担任运算控制分组的分组长。
    
    1963年4月,金怡濂所在的研究所转移到西南山区,这一去就是 20 年。 艰苦的生活环境和研究条件,特别是当时的“不懂ABC,照样能造计算机” 等错误言论的冲击,没有影响金怡濂他们为国家研制新型计算机的信念和决 心。山区生活艰苦是小事,关键是科研条件太艰苦。当时国家电子工业基础 薄弱,大型机研制举步维艰:一些元器件由玩具厂生产;数以万计的组件, 要靠钳子、螺丝刀、电烙铁,一个一个组装起来。由于地处偏僻,参考资料 也极其匮乏。为查询资料,金怡濂要跑上海、北京等地。为此,得先在崎岖的山路坐大卡车颠簸半天,然后挤上列车,在硬座车厢里度过两三个昼夜的旅途。查完资料,匆匆背上一大包同事们让他捎带的肥皂、牙膏、糖果回到大山里,继续他的研制工作。由于国外对技术的封锁,大型计算机全靠我国 自主设计生产,金怡濂主要负责硬件部分的设计把关,每一张图纸都自行设计绘制,一台机器下来,图纸不下数万张,摞起来像个小山。

    当时孩子还很小,妻子也是搞计算机的,两人常常连星期天也不能顾及孩子,他说不清楚自己的孩子是如何长大的。条件的艰苦更激发了金怡濂创新的活力,他提出并指导研制成功了穿通进位链高速加法器,把多项并行技术应用于计算机中, 实现了由单机向并行机器转化,研制的计算机居全国先进水平。到了20世纪70年代初,金怡濂在国内首次提出了双处理机体制,实现了并行处理和结构多重化等理念,在他与同事的共同主持下,完成了大型晶体管通用计算机、大型集成电路计算机的研制,把我国计算机的运算速度提升到350万次/秒, 实现我国计算机研制技术的一次次重大突破。

    攀登巨型机高峰

    “文化大革命”结束后,“尊重知识、尊重人才”成了社会的主流思潮,重新焕发出科研活力的金怡濂成了我国大型机研发领域的领头羊。

    1978年3月,金怡濂在第一次全国科学大会上首次意识到科学研究的春天即将到来。而科学的发展要从开阔眼界开始。是年5月,金怡濂等5名大型机专家专门赴美国和日本进行考察,除了计划购买一台大型机,也希望对世界上的计算机技术发展能有一个感性的认识。这次行程虽然收获不小,也让他们清醒地认识到了差距。

    随着高性能计算机的出现,计算机行业的发展实现了新的飞跃。邓小平表示,中国要搞四个现代化,不能没有巨型机。905工程亿次机的研制很快提上了日程。

    从905乙机每秒350万次的运算速度直接提升到每秒1亿次,是个不小的挑战。金怡濂是905工程亿次机主机的研制负责人。1986年5月,项目正式完成并通过了国家鉴定。905整机国产元器件占85%,有着很高的国产化水平,金怡濂等人也获得了国家科学技术进步奖特等奖。

    金怡濂多次讲过一个故事:20世纪80年代,我国花巨资进口了一台大型计算机,却附带了两名“监工”——中方工作人员受到种种限制,比如不能将计算机另作他用,不能接触机仓内的核心部件,只能由外国监工操作开机关机流程等。机房内的控制室都是“中方人员禁止入内”的。这让金怡濂大感屈辱,他由此深刻地认识到,高科技是花钱买不到的,必须发展中国自己的巨型机,否则只能受制于人。

    当我国研制成功运算速度达到每秒1亿次的巨型机时,世界上运算速度最快的巨型机已经能达到每秒200亿次。金怡濂担任研究所的所长后,希望在最短的时间内缩短差距,迎头赶上。1985年,他主持研制10亿次主机的方案时,意识到闭门造车是无法跟上科技发展速度的,必须与国际接轨。因此他决定新机型使用国际通用的32位处理器芯片,向大规模并行计算机发展。这一决定确定了中国巨型机未来的发展方向。

    在10亿次机之前,研究所的几代机型都采用自主研发、自力更生的思路,与国际的兼容性差,而且研制和生产效率低。这一次,金怡濂和他带领的科学家开始“放眼看世界”,瞄准世界最先进的软硬件技术,并力图在其基础上推陈出新。最终在1991年底,我国第一台10亿次巨型机系统研制成功。

    1992年,国家并行计算机工程技术研究中心成立,金怡濂担任该中心的主任。虽然离开了巨型机研制的第一线,但是他肩负起了对巨型机战略性研究的新使命。

   老骥伏枥展“神威”

    随着国家并行计算机工程技术研制中心的成立,新一代巨型机“神威”立项申请提上了日程,在随后的“神威”机研制方案论证会上,金怡濂提出的“以平面格栅网为基础的分布式”设想,与预研小组提出的“集中主存模式”成为会场上热议的话题,两种方案分别有支持者,讨论十分热烈。

    到1992年深秋的第四次“神威”研制方案讨论会上,预研小组已经将运算速度提高到了500亿次,与会代表也认为这个方案虽然有技术困难,但基本可行。就在波澜不惊的讨论即将圆满落幕时,主持会议的领导突然提出了一个当时看来颇为大胆的想法:如果跨越百亿级别,直接让这台超级计算机的运算速度迈上千亿级的台阶,是否可行?

    与会者陆续发言,纷纷强调技术上面临的困难,认为直接研制千亿级的计算机短期内并不可行。

    金怡濂却认为中国具备研制千亿级计算机的能力,而且只有下定决心,才能够挺立潮头。在当时的情境下,金怡濂自称“绝对的少数派”。

    金怡濂回到家,和夫人陈敬说起了白天会场上的情景。陈敬埋怨他“如今身份变了,又不具体管事,还那么较真儿”,金怡濂回答,“现在是我国巨型机发展的关键当口,提一点有价值的参考意见,也是应该的。”当天晚上,金怡濂一直待在书房,查找资料论证研制千亿级计算机的可行性。

    又经过了几轮论证,直接制造千亿级机的方案基本被确定下来,金怡濂则被指定为“神威”的总设计师。这个任命虽然出乎金怡濂的预料,但是他本着要么不干,要干就干好的精神,扛起了这杆帅旗。

    在金怡濂看来,1000亿次是一个具有分水岭意义的指标。他在这台机器上尝试了设想的“分布共享存储”方案,也就是在每个处理器旁设一个存储器,使用频率高的数据就近存取、缩短访存时间。这个方案将分布和共享两种存储方式的优点结合起来,再加上平面格栅网的互联技术,保证了“神威”计算速度进入千亿次的可行性。这种结构几年后在国际上流行,被称为NUMA结构。包括NUMA在内,“神威”采用的很多关键技术,当时都处于国际领先水平。

    1994年,中国工程院成立,金怡濂当选为首届工程院院士。

    从1993年起,美国劳伦斯·伯克利国家实验室、田纳西大学和德国曼海姆大学每年进行两次全球超级计算机500强评比。这个排行榜迅速成为行业内的风向标。金怡濂要求“神威”出机时能够进入世界先进行列,最直观的指标就是在Top500榜上有名。为了达到这个目标,他先后多次结合计算机行业的国际新成果,调整“神威”的方案,以便提高其关键的技术指标。当“神威”进入整机调试阶段后,金怡濂再次把握机会,扩大规模,将“神威”的运算速度从1000亿次一举提高到每秒3000亿次以上。

    1996年9月下旬,“神威”正式出机。测试结果,“神威”的峰值运算速度达到了每秒3120亿浮点结果。在随后的鉴定会上也得到了37名鉴定委员的一致认可。为了这个完美的成绩,年近七旬的金怡濂经常加班到凌晨,回到家要在沙发上躺半个小时才有力气说话。

   “能干点对国家有帮助的事,就会觉得很高兴”

    在“神威”成功后,金怡濂又主持了“神威Ⅱ”的研发。他用“神威Ⅰ”建立模拟环境,对新机型展开20天的监测,开创了用上一代巨型机模拟新一代巨型机的先河。用液冷代替风冷也是金怡濂在“神威Ⅱ”上的一大创新。
 
    2001年底,“神威Ⅱ”终于问世,运行速度达到每秒13.1万亿次,系统效率达75%,超过了当时世界上排名第一的计算机58.8%的效率指标。机器体积和能耗等指标也处于国际先进水平。从“神威”系列开始,中国制造的超级计算机正式在Top500找到了立足之地,打破了美日垄断榜单前列的局面。

    2003年2月,金怡濂在第三届国家科学技术奖励大会上获得了最高科学技术奖。作为技术顾问,他又开始积极参与国产CPU芯片的研制和开发,并指导了使用“中国芯”的“神威·蓝光”高性能计算机的研制。

    2013年1月26日,中国计算机学会(CCF)将2012“CCF终身成就奖”授予金怡濂,而在金怡濂看来,这个“终身成就奖”只是一个阶段性的总结,内涵是“以资鼓励,继续努力”。

   (来源:中国科技网)

福建龙岩市科学技术协会 版权所有  闽ICP备16038052号-1  访问量:2395222
主办:福建龙岩市科学技术协会  地址:龙岩大道1号市行政中心东附楼4层  邮编:364000
电话 :0597-3213020  传真:0597-3213011  电子信箱:fjlyskx@163.com  技术支持:福建创高科技有限公司