首页  >  热点  >  新闻特写  >  文章正文
shRNA表达克隆

可重复性:培训是关键

Oct 08, 2016 No Comments

可重复性:培训是关键

 

想学习如何设计实验、分析数据?培训是关键。

当研究生Alyssa Ward参加科学政策实习时,她的预期是学习科学政策。但结果大大出乎她的意料,她花费了大量时间和精力来弥补自己在生物医学培训上的不足。

当时她负责编撰一本关于实验可重复性的书。其中有一篇关于Meta分析的文章指出,科学家经常无法解释为什么一个实验中要选用那么多的样本数量。Ward看到这篇文章时,“诧异的不是这方面的遗漏,而是我自己甚至都不知道何时、如何去计算样本数量。”尽管她已经是研究生了,但她并没有学过实验设计的几大类型,或是P值的局限性。(尽管P值可以帮助判断一个科学证据的证明力度,但它并不能代表假设为真的概率。而非常多人是这样认为的。)

Ward的博士课程中有研究伦理课,但她已经知道不能操控数据。相反,她想学习的是如何设计无偏实验,以及如何严格分析数据。Ward指出,研究错误比研究造假更重要, 她想学习的是避免研究错误的课程。因此,她自己设计了一个这样的课程。

实习结束后,她说服了自己就读的约翰霍普金斯医学院(Johns Hopkins School of Medicine)的领导,让她为一年级研究生开设了一门为期7周、名为“方法、逻辑和实验设计”( Method, Logic and Experimental Design)的试点课程。明年起,这门课程的扩展版本将在约翰霍普金斯医学院大面积推广,成为更多学生的必修课。

科学的不可重复——无法重复别人的实验和得出一致的结论——日益受关注。不可重复问题很大程度上可归因于不合理的实验设计和实验分析,以至于研究者们无意地偏向了令人兴奋的结论。今年《自然》(Nature)杂志的一项调查(Nature 533, 452–454; 2016)发现,1500多名受访的科研人员中,87%把不合理的实验设计列入不可重复的原因; 89%把统计分析列入不可重复的原因。目前极少数新手研究者接受过正式的科学素养培养。事实上,当Ward试图招募教师来讲授她的课程时,一些人拒绝了她的邀请,因为他们自己就没接受过类似的培训。

 

主动学习

马里兰州贝塞斯达美国卫生研究所(NIH)研究培训项目的负责人Alison Gammie指出,新手科学家不可能在自己的实验室,甚至院系学习到所有需要的东西。她还表示,科学发展日新月异,现在的教授、研究员们接受的培训可能落后于科学进步的脚步。因此很多可获得的培训机会是全新的,且并不为人所熟知的,想提高分析技巧的科学家必须自己主动去寻找或创造合适的资源(图:寻找资源)。

 

寻找资源

 

一些研究人员以书籍、文章和网上节目的形式提供相关咨询。马萨诸塞州剑桥市诺华生物医学研究所(Novartis Institutes for BioMedical Research in Cambridge)的负责人David Glass之所以把自己教授的一个简短课程转换成《生物学家实验设计手册》(Experimental Design for Biologists),部分原因是有用的正式培训太少了。Glass 表示,居然没有教研究生怎么去展开科学研究,这很奇怪。

澳大利亚沃尔特伊丽莎医学研究所(Walter and Eliza Hall Institute of Medical Research)的细胞生物学家David Vaux也写了一些类似的文章。Vaux写到,使用实验来排除其它可能的解释,比单用统计来比较各组之间的差异更具说服力。例如,研究人员可以使用目的基因被敲除的细胞或小鼠进行验证猜想。然而,这种处理不适用于人类试验。他还指出,在临床科学中,你需要使用数据统计。但在基础生物学上,你应该通过实验设计来获取明确的答案。

在解读结果时,思维方式比任何具体的数据处理更重要。他指出,太多学生更注重死记硬背式的计算,而不检查自己的数据。研究人员应当多次重复实验,带着怀疑的眼光来处理数据。相同的实验数据波动过大,意味着可能是实验出了问题;小的波动则意味着可能出现了无意识的偏差。

Vaux表示,如果可能的话,最好的选择是绘制数据点,看看是否每个数据都单独指向结论。这比使用平均值和标准误差更具有说服力,因为数据点曲线更能说明每次测量数据的分布。

加州大学伯克利分校(University of California, Berkeley)的统计学家Bin Yu指出,学习数据分析之前,需要处理大量数据的研究人员需要学习“数据智慧”——评估现有数据如何以及是否能回答一个科学问题的能力。 她与人合著了《有效统计实践的10条简单规则》(Ten simple rules for effective statistical practice)一文,该文自6月发表后,浏览次数已超过10万次(R. E. Kass et al. PLoS Comput. Biol. 12, e1004961; 2016)。她还表示,如果数据不可靠,任何统计方法都没用。

 

寻求建议

其实,可获得的实验设计和分析方面的帮助超乎很多研究者的想象。接受NIH临床和转化科学奖项目(NIH Clinical and Translational Science Awards)资金支持的60多个研究机构对外提供了数据统计建议。弗吉尼亚州夏洛茨维尔的开放科学中心(Center for Open Science)则免费以网络研讨会的形式提供统计咨询,并以短期家教形式提供预注册(一种要求研究者在收集数据前正式记录数据分析计划,以便避免偏差的策略)等技术的咨询。此外,CHDI基金会,一个非营利性的、针对亨廷顿舞蹈病(Huntington’s disease)的药物开发机构召集了一大波实验方案和数据统计方面的专家,以为该领域的研究者提供指导。

纽约纪念斯隆-凯特琳癌症中心(Memorial Sloan Kettering Cancer Center)的生物统计学家Andrew Vickers指出,许多科学家不知道如何有效地与统计学家进行合作。例如,最好是在研究早期就和统计学家商讨,理想情况是在收集数据前。

纳什维尔范德比尔特大学(Vanderbilt University)针对二年级研究生开设了一门教授如何与统计学家合作的课程。学生们把实验室的数据带到学校的“统计学家诊所”,学习如何平衡数据检验和严格性。但最重要的是,他们知道了统计学家诊所的存在——课程设计者和药理学家Joey Barnett希望,这个消息能传达到学生的导师那里。“如果他们都是好学生,他们将作为媒介,把信息传达到导师那里。”Barnett还观察到,结束课程学习后,一些学员开始寻求实验室以外的资源。这样的培训的意义在于,帮助和鼓励研究者们寻求帮助。

 

参加课程

大多数研究型大学提供应用统计学课程,越来越多的学校也开设了数据分析课程。这些可能是有用的,但学员可能会发现自己和经济学、商学学生混在一起上课。不同学科的学生的关注点不同,学习重点也不同。正如弗罗里达大学(University of Florida)的生态学家Ethan White所说的那样,对科学家们来说,专门接受针对该学科的课程,比起大乱炖式的培训,效果更佳。

Ward设计的课程的教授者之一、分子生物学家Randall Reed指出,这种针对各学科的统计分析课并不多见,但学生可以向教师求助,绝大多数情况下,老师们并不会拒绝提供帮助。Reed 还表示,Ward在这方面做得非常好。她向多个老师求助,并且成功地邀请大家来授课。

Ward邀请了十多位教师来做客座讲师。招聘教授相对容易,难的是如何保持教学难度和实用度之间的平衡。Ward指出,她们想的是,教授一般性的、足以帮助所有人的东西,但是也要足够具体,让学生们能应用学到的东西。她提出了一种额外作业的解决方案。例如,要求研究生验证自己实验室试剂的有效性。随后几年的计划包括一系列在线课程,面对面讨论会和针对特定学科的项目。

相关的资源不一定要来自于学员所在的机构。明年,三组实验心理学家将会推出为期一周的、由全球心理学专家和统计学家教授、内容为可重复科学方法的课程。哈佛大学(Harvard University)的Rafael Irizarry开设了可重复性基因组学数据分析的大型在线课堂,大约3万人报名了该课程。

Gammie表示,科学学会也采取了类似措施。例如,美国神经科学学会(US Society for Neuroscience)为成员提供了一系列关于实验设计、分析的网络研讨会和报告。美国生理学会(American Physiological Society)也设立了类似的资源。其他组织,如美国细胞生物学学会(American Society for Cell Biology)和美国实验生物学会联合会(Federation of American Societies for Experimental Biology)也赞助了相关的研讨会,并制定了准则。

德国夏里特医院(Charité University Hospital)的医学生Peter Grabitz共同创立了开放科学小组(Open Science Group),以学习如何更有效地处理,并更广泛地共享数据。该小组初期是在网络平台Meetup上举办研究者和开放科学拥护者的非正式聚会,但现在该小组已拥有450名热衷于交换数据管理工具技术的相关技巧的成员。Grabitz指出,如果研究人员努力寻求帮助,他们在小组内总能找到愿意帮忙的人。

原文检索:Monya Baker. (2016) Reproducibility: Seek out stronger science. Nature, 537(1038): 703-704.
张洁/编译

新闻特写, 热点
No Responses to “可重复性:培训是关键”

Leave a Reply


six + 5 =