动态详情

侠之大者•纪念郝柏林先生


转载 《科学网》
作者: 龙五?龙舞!

2016年11月4日,我最后一次见到郝先生,这也是16年参加学术会议时第三次见到郝先生。这倒不是说以前就没见过郝先生,事实上2004年在清华举办第二届“国际生物信息学研讨会”(International Bioinformatics Workshop)的时候就听过郝先生的报告,那个报告讲的不是CVTree,而是用五阶隐马尔科夫模型初步设计了一个水稻基因的预测工具。报告的内容我记不清楚了,但郝先生报告讲完之后,许多人都站起来提问。提问内容并不完全是科学的,很夹杂着个人的情绪。这是因为在当时生物信息学是个新学科,还处于很初级的发展阶段,国内外的行家都是屈指可数的。在郝先生报告之前,大家多多少少已经知道郝先生当年是搞理论物理的,转入生信也不过是近几年的事情。换句话来说,大家都是新手,凭什么您在上面作报告我们在底下当听众?其次,当时据说是郝先生为了转生信,每天坚持背单词,这事儿说出去能有人信吗?这是不可能的对吧?当年转生信的一帮年轻人,哪个不是眼高于顶自负平生的?20多岁的人都坚持不下来的事情,60多的老先生能做得到?所以大家普遍不服。第三是郝先生讲的东西,隐马尔可夫模型,大家事实上都听得懂。这就有问题了:大牛们做报告难道不是应该讲得让大家听不懂才能让大家觉得有水平吗?您讲得东西大家听得懂,那岂不是很没有水平?所以听众们百般不爽,千般不服,问的问题自然也就不怎么怀好意了。那么郝先生是怎么回应的?凡是科学的问题,郝先生有理说理;凡是个人情绪的问题,郝先生不吭气,任你批评指责。当年在会场的时候,感觉郝先生也实在太没有掌控力了,怎么说也是院士,您要一拍桌子说你们问的不是科学问题吧?马上就能让大家闭嘴,问题是大家都已经开始人身攻击了,您还照单全收这算几个意思啊?这件事情当年无论如何没有办法理解,过了很多年之后才觉得敬佩。第一,对于一个新的研究方向,前途不明朗又充满风险,无论资深科学家怎么忽悠,都不会比以身作则自己先投身这个领域更有说服力和号召力。第二,做科研究竟要做的让同行听得懂,还是让同行听不懂?当然喽,如果做得东西同行们都听不懂,那么这样的生信工作是“0级”(Level 0),也就是“未入门级”(关于生信研究的分级请参加《如何成为顶级生物信息学家》)。第三,所谓的学术批评,既不一定客观也不一定完全是科学问题,好听的大家都愿意听,可不好听呢?要是换咱这帮年轻的,那是无论如何要硬怼回去,放低身段?不存在的。所以郝先生对待领域里的年轻人,都是很平等的当同行来看待,一位地位崇高的著名科学家,身段放的之低是难以想象的。
16年4月14-15日,中国生物信息学及相关领域的研究者在北京香山饭店召开第557次香山科学会议,主题为“生物大数据和精准医学时代的生物信息学核心理论问题与应用体系”。郝先生没有参加。郝先生不参加有两个原因,第一是怹夫人张淑誉老师身体不好,第二是院士80岁之后资深,郝先生觉得既然已经资深了,那领域的风风雨雨怹也就不必再过问了。郝先生夫妇感情极笃,公共场合两位永远是一起出席,看到两位老人家我们这帮后辈自然是既尊敬又羡慕。因此郝先生的好朋友,台湾中央大学系统生物所、台湾中原大学物理系李宏谦(Hoong-Chien Lee)教授戏称郝先生夫妇为“连体婴”(参见《挑灯看剑集:贺郝柏林院士八十华诞》,科学出版社,2014)。李先生1941年出生,比郝先生小7岁,其父黄浦军校四期毕业,孙立人将军的挚友和副官,委员长的得意门生,委员长大公子的眼中钉和骨中刺。李先生在台湾上的中学和大学,后来去加拿大留学。1972年郝先生去加拿大开会的时候结识李先生,从此成为至交。1997年郝先生赴台访学,和李先生讨论之后,决定共同从理论物理转入生物信息学领域,这就是中国生信史上最重要的事件之一“郝-李转换”(Hao-Lee transfer)。冯德培之疑、彭桓武之问、徐京华之手和郝柏林之换,这是中国早期生信史中的四件大事,其他的事件以后再讨论。郝-李转换是中国生信早期发展史中唯一一个同时对两岸有巨大影响的事件:郝先生直接参与推动了大陆的生物信息学发展,在咱生信家的气宗和剑宗形成的过程中都发挥了极其重要的作用;李先生则迅速推动台湾建立生物资讯学研究方向。两位老先生共同发起的、两年一届的“海峡两岸生物学启发的理论问题研讨会”,自1998年到今年已经要开第11届了。讲到李先生,这就有个很重要的问题:郝先生的名字怎么读?这是一个很重要的问题,因为公开场合大家都是恭恭敬敬一句:郝先生。问题是给学生上课总不能也称郝先生吧,这样学生不知道是谁,所以讲课得讲人名儿。至少我朋友里,99.9%的人都是把“柏”字读成“博”音的。11年去台湾的时候,专门就此事请教过李先生。李先生说当然念“博”,这是因为郝先生的父亲、中国林学大家郝景盛先生1934年赴德国留学,先后在柏林大学理学院和爱北瓦林业专科大学攻读博士学位,郝先生在柏林出生,所以一词双关,即表示德国首都,又表示常青树木。写这篇文章之前专门查了资料,发现大家把郝先生的名字都念错了。郝先生的“柏”要读成“百”。郝先生1991年撰写的《郝景盛》一文中,提到郝景盛先生1934年春告别已经怀孕的妻子独自去的德国,郝先生作为长子在北京出生之后,1935年夏郝母赵为楣女士才带着郝先生去的柏林。其次,在郝先生所撰写的英文论文里,署名是“Bai-lin Hao”或“Bailin Hao”。所以这是本篇要讲的第二个问题。
16年7月8-10日,内蒙古科技大学在包头组织召开了“科学大数据前沿国际研讨会”,开这个会主要是给中国生信领域的另一位重量级学者罗辽复先生贺寿。罗先生1935年出生,比郝先生小一岁,两位老先生早年都在理论物理学领域有突出的贡献,罗先生当年主要从事粒子物理和高能天体物理,郝先生主要从事统计物理和非线性科学,两位后期都转入理论生命科学,也就是当代生信的前身,或者是孙之荣教授认为的“生物信息学萌芽阶段”。两位是多年的好友,所以郝先生夫妇自然就来参会了。罗先生自1958年扎根内蒙以来,培养的弟子门生无数, 15年众弟子合议给罗先生祝寿,但被否了,说不要大张旗鼓。因此16年搞了这个会,虽说是祝寿,事实上也希望加强内蒙与国际、国内同行之间的交流。因为罗先生的研究领域跨物理和生物学两个方向,这两个方向的故友门生都不少,所以这个会有两个分会场,生物信息和天文信息。当时我纳闷,天文信息究竟做的啥?于是进会场听了几分钟,结果发现一个字没听懂,只好低着头出去听生物信息的报告去了。进到会场正好是郝先生的报告,题目是“基于基因组数据的细菌亲缘关系与分类”,属于CVTree的延伸和应用。所以这里就得讲到郝先生在生信领域里的科学贡献。CVTree中的CV指的是“组分矢量”(Composition Vector),事实上就是拿长度为k的字符串(k-mer)作为核酸或蛋白质序列特征,来进行“无比对”(Alignment-free)的序列比对。所以这是新算法、新工具设计,属于标准的Level 2工作,优点是运算速度快,缺点是稍微降低一些准确性。k-mer的思想不是郝先生提出的,但这套方法能应用于序列比对郝先生做了许多工作,尤其是用于细菌分类这属于原创性工作。k-mer的方法用的很广,不光是序列比对,翻译后修饰位点预测里也有用这个算法的,所以是可以写到生信课本里的。此外,郝先生同时代的老一辈中国生信学者,能做出Level 2工作的屈指可数,所以不知道郝先生在其他领域如何,至少在生信领域,差不多是“出道即巅峰”。
在包头的这次开会是第一次能够跟郝先生比较长时间的正式交流,这是因为第一,我那时候正在看中国早期生信发展的资料,史料不全且有很多疑问,之前请教了一圈老先生们之后都答曰:问郝先生,怹知道多;第二是之前一直比较怵,主要是之前参会听郝先生讲报告之后,问的问题也不那么客观,怕挨批。后来发现不存在的,郝先生的要比想象中宽容的多了。所以开会期间,在酒店用餐的时候大家都是争先恐后的跟郝先生夫妇坐一桌,为什么?听郝先生讲段子。别人讲段子一般饭桌上讲讲,顶多饭后写篇博文,郝先生讲段子是出书的,并且还不止一本,例如《物理学和计算机》(科学出版社,2005年)、《相变和临界现象》(科学出版社,2005年)、《混沌与分形:郝柏林科普与博客文集》(上海科学技术出版社,2015年)和《负戟吟啸录》(八方文化创作室,2009年)。前两本我一个字儿没看懂,所以书买来一直放着没动过,后两本则认真读过,其中个人最喜欢的一篇是《朗道百年》。郝先生讲段子跟一般人不一样,第一是记性极好,几十年前发生过的事情,时间地点人物事件经过结果记得分毫不差;第二是郝先生擅长讲水平极高的冷笑话,往往听完要反应半天才搞明白,呃,您老又在说笑话。郝先生讲过的段子很多,例如我们问怹当年在苏联留学闹着转专业结果被批斗的事情,郝先生说当年怹苏联本来是学矿山的,但怹喜欢物理要转专业结果被批斗,后来要被遣返回国的时候,教育部来函同意转专业。所以郝先生后来就高高兴兴去学物理了。当年转物理的还有位郝先生后来的好友陈春先先生,一众志同道合的好友们文革期间在固体理论和统计物理方面有突出的贡献,有“陈春先学派”的美誉(参见《怀念陈春先》)。
16年10月6-9日,咱生信家的气宗在成都开第七届“全国生物信息学与系统生物学学术大会”,每两年一度的华山论剑,这次参会人员超过1000。后来咱生信家的剑宗好友问我,说剑宗气宗这套体系是谁分的?我说,我。剑宗强调产业发展,气宗强调基础研究,谁对?一个硬币有两面,至少都没错吧。白天开大会,晚上一众好友聚一起开小会,会议期间只匆匆见了郝先生一面,要了一本书《负戟吟啸录》。到了11月4-6日,这是咱生信家的剑宗,也就是华大基因每年一度的“国际基因组学大会”,16年是第11届。4号下午我有个报告,所以咱上午就早早赶到会场,踩场、热身、拉拉声带,估一下温度、湿度、背景噪音,再看看会场外的风向、植株、雾霾情况,掏个罗盘出来测一下风水,这就可以收工进去跟好友打招呼去了。中午吃饭的时候正好遇到郝先生夫妇,于是很愉快的聊了很久。聊的内容不外乎是听郝先生继续讲段子,其中就讲到了徐京华先生。2017年5月12日下午,当年“星谋为双翼,郝帅居中间”的郑伟谋先生来访,就讲到“理论生命科学的三狗”,这是因为徐先生1922年出生,郝先生1934年出生,郑先生1946年出生,三位老先生都属狗,所以一时成为佳话。再后来就讲到文革时批判爱因斯坦的问题。其中有一个段子是,开会有年轻人发言说,根据相对论,珍宝岛事件中谁先开枪,只要换一个参考系就可能颠倒过来。郝先生在书里跟了一句评论:他忘记了罗伦兹变换保持因果性不变这一原理(参见《“批判爱因斯坦”追忆》)。这个笑话实在太冷了,没有读过狭义相对论的应该是笑不起来的。另一个段子是郝先生的忘年交和晚辈刘韧老师讲的,说是上次在西藏,问郝先生,您这名字看,是不是跟台湾的郝柏村有什么关系?先生一脸高冷地说,我这是树林,他只是个村,我比他大得多。
4号下午作报告的时候,剑宗的精神领袖杨院士也在,会场结束后,杨院士建议气宗明年可以专门设一个生信分会场,并说已经和郝先生商量过,郝先生主持,让我给打个下手。我听了杨院士的建议,就满会场找郝先生,希望能征求怹的意见,看这个分会场该怎么组织,可惜天色已晚郝先生夫妇已经回去休息了,第二天我有其他事情离开深圳,后来因为比较忙所以组织分会场这件事情也就忘于脑后了。到17年上半年,杨院士来华科讲课,又提到办分会场的事情。那时候郝先生已经基本不出门参加活动了,所以我琢磨来琢磨去,后来翻书发现“郝-李转换”发生于97年,于是这个分会场就以纪念“郝-李转换”20周年为名义,邀请了台湾和大陆各7位生信同行,包括李先生,在17年10月28日下午开了个两岸论剑的分会场。
2018年3月7日晚上20:05,有好友发来消息,说郝先生当天下午四点半去世了。大约两个半小时之后,中科院理论物理所发讣告深切缅怀郝先生,次日复旦大学发讣告沉痛悼念郝先生。郝先生地位崇高,人生经历极其丰富,高中毕业后留苏因为转专业所以被批斗,毕业回国之后从事高分子半导体研究,1961年去莫斯科大学物理系读研究生并且通过了朗道的“最低标准”,文革期间因批判爱因斯坦的事情硬怼陈伯达、领导天线小型化的理论计算工作、研究相变、计算机科学和三维伊辛模型等。和清华大学雷锦志副研究员讨论时,雷兄认为,郝先生这一代人普遍经历丰富,这是因为当年国家非常缺乏各类人才,所以哪里需要就在哪里上,做过的贡献非常多,这跟我们现在只在一个方向上一条路走到黑的经历是不一样的,现在的人在一条路上走顺了,不愿意改变方向,而郝先生这一代人不一样,敢于接受各种挑战。基本上来说,郝先生大约每20年一个方向,60-80年代主要是统计物理,80-90年代末主要是非线性动力学,97年至今主要是生物信息学。郝先生和刘寄星先生主编的《理论物理与生命科学》一书(上海科学技术出版社,1997年),吹响了早期生物信息学萌芽正式转向生物信息学的号角,郝先生2000年出版的《生物信息学手册》(上海科学技术出版社,2002年第二版),是当年为数极少的生信教材和参考书之一,也是许多年轻学子的入门读物。郝先生以CVTree为代表性的工作达到Level 2,在老一辈生信学者中做到顶级,与李先生发起“海峡两岸生物学启发的理论问题研讨会”,对两岸生信发展都有极为深远的影响。郝先生的科学思想和勇于探索的精神至少影响和激励了几乎整个75-85年龄段的年轻一代华人生物信息学者。郝先生是著名生物信息学家、中国生物信息学领域的开拓者和奠基人之一,郝先生的离世是中国生物信息学领域不可估量的损失。
纵观郝先生的生平,怹始终本着“顺乎历史潮流,坚持个人奋斗”的信念,负戟吟啸,挑灯看剑,正所谓:侠之大者。
注:本篇内容不完全是作者思考所得。“侠之大者”的评价,语出北京基因组所张治华研究员的纪念文章;k-mer算法与郝先生弟子、复旦大学戚继教授讨论过。另外,还感谢中科院北京生命科学研究院赵方庆研究员和基因组所章张研究员的讨论。

原文链接地址: http://blog.sciencenet.cn/blog-404304-1105782.html