动态详情

应该学生物信息学的N个理由【一】


转载 《科学网》
作者: 龙五?龙舞!

今年三月底与众好友在华农开“第二届国际•华中地区生物信息学研讨会”,参会的学者大多来自华中及邻近省市。虽然是地区性的会议,可大会报告的水平并不低。台湾生物资讯学(就是咱大陆讲的生信,各叫各的) 的领袖李老先生一听说有年轻人开会,二话不说开着保时捷911就飙到桃园机场,然后飞过来给大家讲网络药理学的进展。这位李先生咱以前写博客讲了很多次,顶有乐趣的学者,和咱大陆的郝先生是多年的好朋友,两人年轻的时候都搞理论物理,后来俩人都觉得不好玩,于是大约是20年前,两位同时转做生信,或者说,理论生物物理,因为那时候生信这个名词还没有普及。后来我问他,说您为啥转生物啊?李先生扔下报纸:好玩儿啊!得,搞了这么多年就为了个玩啊!
李先生的爱好多,比如说开跑车啦…呃,这个爱好比较费钱;飙摩托,还飙的特别快;骑自行车、跑步、游泳。这回见了面,上来第一句:对了,我又找了个女朋友,你知道吗?我说你女朋友不是Data吗 (一条台湾黑狗,据说是名种)?李先生沮丧,说我出去访学半年,寄存在同事家里,等回来之后同事太太坚决不还了…感慨:真是没有天理啊!所以只好又找了一个,不过没有Data漂亮。我安慰李先生,说,Data跑了就跑了吧,反正您也没喂过它。李先生抗议,说我偶尔有喂好吧?
好,讲完闲话说正事儿。话说第二个大会报告是师兄作的。上来就忽悠大家,说现在大家应该做生信,然后幻灯上列了几条理由,吧啦吧啦讲半天,讲的有趣。会后讨论的时候,师兄就讲你应该看看Casey Bergman (英国曼彻斯特大学的研究员,主要做计算和进化生物学)写的博文“应该做生信/计生的博士或博后的前N条理由”(Top N Reasons To Do A Ph.D. or Post-Doc in Bioinformatics/Computational Biology)。会后咱回去认真看了博文,全文比较长,这做简要的编译和介绍,有兴趣的也可以直接看原文。
话说Casey曾经给即将攻读分子生物学博士的学生作过报告,忽悠他们应该考虑做生信研究。Casey说我这么满怀激情的忽悠学生,是因为我强烈的认为21世纪的生物学家多多少少要懂点儿计算,并且接受计算的训练最好的时间就是在攻读博士或博士后期间。所以Casey决定在之前报告的基础上,继续完善并增加忽悠的理由。Casey博士指出虽然计算生物学 (Computational Biology) 和生物信息学 (Bioinformatics)有重大区别,但他不做区分,两者在概念上可以等价。
关于计生和生信的区别,这个咱以前也写过博文,大致是鸡蛋炒西红柿和西红柿炒鸡蛋的区别。斯坦福大学的Russ B. Altman教授有博文表示这俩根本就不是一码事(BIOINFORMATICS& COMPUTATIONAL BIOLOGY = SAME? NO)。Russ教授何许人?显然是牛人,在生信圈儿里跟Michael Levitt是一个级别的。Russ教授的贡献很多,其中之一是选了44篇生信领域经典的论文,这个文章列表基本没有争议。其中文章列表的第一篇就是Russ本人关于蛋白质结构预测的论文,第五篇也是Russ的论文。Micheal Levitt的论文当然必须有入选,也是两篇,其中一篇的第一作者是耶鲁大学的Mark Gerstein教授。所以Michael拿诺奖了之后,Mark很高兴,到处炫耀说他博后的老板拿奖。Russ认为计生是利用计算的方法来研究生物学,目标是得到新的生物学知识,因此这是科学;生信则是设计能够解决问题的工具、算法和数据库,目标是建立分析生物数据的有用工具,所以是工程。因此Russ有时候做科学 (计生),有时候做工程 (工程)。那么你肯定要问,啥时候做科学,啥时候做工程呢?兄弟我的回答是:跟中国的生物学家交流你一定要说你在做科学,不然会被鄙视;跟其他学者交流你要说你在做方法,不然照样会被鄙视。所以同济大学的勇哥总结的好:不做科学,同事看不起;不做方法,同行看不起。大致如此。
Casey表示,虽然他这个理由的列表主要是为了忽悠分子生物学背景的学生转做生信,但其实也适用于忽悠其他方向比如生态学和神经科学等方向的学生或学者。因此Casey在2012年7月底写了这篇博文,内容如下:
0. 计算是21世纪生物学研究的核心技能。点解?因为生物学正越来越变成一门定量的科学。在过去的三个世纪里,生物学从一门观察性科学转变为实验科学,并即将变为一门数据科学。由于既漂亮又容易搞定的姑娘们早已经被小伙儿们娶回家变成娃儿他妈了(简单的发现已经没有了),想泡既漂亮又难搞的小姑娘们就得有新招了 (仅靠观察和实验作重要发现已越来越难)。在未来,新的发现需要大数据集的支持,以及新分析方法的使用。大数据和复杂模型需要计算技能,想逃避这个现实是不可能的。如果你觉得Casey在玩儿忽悠,不妨听听分子生物学的领军人物、诺奖获得者Walter Gilbert在20年前是怎么说的:若要利用充斥全世界计算机网络的、海量的序列信息,生物学家不仅必须要成为计算机学者,并且要改变解答生命问题的方式。或者听听另一位分子生物学家、诺奖获得者Sydney Brenner的意见:俺已经喋喋不休的劝说大家计算对生物学来说不仅是重要的工具,并且也能够提供分析复杂性的模型…测序技术的发展和广泛应用已经产生了海量的信息,因此对计算机的需求不应该再成疑问。
1. 计算技能是高度可转移的。大家要面对现实:不是所有人读博士或做博后以后都从事学术研究。华盛顿邮报的报道称:生物学和生命科学的博士大约仅有14%毕业后五年内能够获得教职。所以你在博士和博后期间接受的训练,有很高的概率是需要用到学术之外,所以为啥不学学应用度最广的技能?实验技能仅能用于诸如实验室里做实验,或者生物科学相关的医药市场之类的工作 (比如销售),而计算技能不仅搞生物用得着,在其他领域也照样有用。提高你的计算水平不仅能为找工作提供更好的机会,并且能让你终生受益,因为大家的日常生活已越来越离不开计算机。(君不见当年大家蹲马桶都是抱本书,现在清一色的手机、iPad是不?)
2. 计算能够帮助提高你的核心科学技能。生物学本质上就一个杂乱无章并且毫无头绪的领域。那些受过严格训练的生物学家通过漂亮的实验设计和统计分析 (例如Casey搞生态的兄弟姐妹们) 来处理这堆乱麻。但现实情况是大多数生物学家在数据收集和分析方面的习惯并不好。计算会强迫你面对并克服做科研的人为倾向,因此自然而然就发展处核心的科学技能例如:有逻辑性的设计实验,持续的收集数据,设计可重复的方法学,并利用合适的统计方法分析数据。所以即使你不愿放弃实验学研究,计算训练也能提供最好的科学训练并且增强你的实验技能。
3. 应当在博士或博后期间获得新的技能。绝大多数生物学者读博士的时候,实验方面的训练来自高中或大学的学习。所以这些训练一般不是最领先的,你也没有经过更高级的研究来强化你的实验技能,所以一般也就只能自己摸索着训练自己。此外,很多生物学的博士生没有经过科学计算技能的训练,所以也就只会用用Excel或者有图形化界面的统计软件。因此在博士或博后期间,应该接受一些新的、并且你之前木有的训练,获得新的技能。Casey的观点是,学生信最好的时间是读博,其次是博后。这是因为读博士的时候你会有时间,并且你老板有钱有装备来让你瞎折腾,并且这种能够心无旁骛瞎折腾的机会这辈子你也就这一次。博后的时候学生信也蛮好,但合同比较短,要依赖于PI,并且还有要发好文章的压力,这样时间上就没有博士充裕。(当然博后转生信做的好的也有,比如胖子就是博士学天文物理,博后转的生信,所以这个不能算是事儿)
4. 能够在生物学里建立更独特的技能。上面讲了,大多数生物学家接受的都是实验训练,只有很少一部分懂计算。虽然这个现状正在改变,但如果你编程的话,在至少10年内还是很有机会获得竞争的优势,或者从后基因组生物学中获得更多的结果。因为你能拿到其他很多人拿不到的结果,所以事实上你也就获得了脱颖而出的技能,这样争取工作的时候你也就更有竞争力。

原文链接地址: http://blog.sciencenet.cn/blog-404304-883906.html