内容提纲
  • 科学文献简史
  • 在科学研究中应用科学文献
  • 从文献中获得数据
  • 获取科学文献
你知道么?
你知道么,科学文献最早可以追溯到公元前六世纪——古巴比伦在泥板上记录了月食。科学建立在前人发现的基础上,因此,理解科学家如何使用科学文献,是理解如何做科学的关键。
关键概念
  • 科学文献提供了研究的档案,科学家在探究的全程都会用到科学文献。
  • 科学家引用文献,以说明:这个研究课题上什么是已经做了的、他们使用的数据来源,他们的解读如何融合到过往发表的科学知识中
  • 通过重新分析或整合文献里的数据,可以探究新的问题。
  • 科学家个人会犯错。科学文献表明,当新研究和新解读出现时,科学知识基础能够自我纠正。
想一件你了解得非常深入的事情。比如你知道关于自己最爱的乐队的一切。当有朋友问起时,你可以列出乐队所有的歌曲、所有成员的名字,你对他们的历史如数家珍,甚至可以根据所知道的情况预测他们的下一个热门专辑何时推出。朋友问你怎么知道这么多,你说自己读过一本关于他们的书,有他们所有的专辑,而且你在他们的网页上关注他们的巡演日期。你去过他们的音乐会并看过他们的表演。你引用消息来源,解释你如何知道这些以及为什么能轻松做出预测——朋友因此信任你所说的,你的意见是有分量的。
科学家使用参考文献的方式大致相同:利用现有信息进行研究。不同于你发表对乐队的看法,科学家有义务提供他们从哪里获得这些信息的详细信息。科学文献旨在成为可靠的科学研究档案,为新的科学探究打下不断积累的稳定基础。当科学家向大家展示他们的新观点和结果时,他们运用科学文献(此前的知识积累)来支持自己的观点。如果科学家没有体现自己对文献的理解,这就像你告诉朋友你喜欢某个乐队的一切,虽然你只听过他们的一首歌。简而言之,科学文献对于整个科学的成长和发展至关重要。
科学文献简史
最早的科学文献是信件、书籍等文字记录,是个人为了分享自己的研究而撰写或发表的。举例来说,早在公元前6世纪,巴比伦人就在泥板上记录了月食等重大天文事件(请参阅“科学研究中的描述:观察与多个有效假说”模块)。1011年至1021年期间,来自伊拉克巴士拉的著名科学家阿尔哈森 (Alhazen) 在埃及开罗被软禁期间,手写了一篇关于光学领域实验的七卷论文(请参阅“科学研究中的实验:变量与控制”模块) 。伽利略·伽利雷的许多开创性工作,以一系列信件的形式出版,例如他的《关于太阳黑子的信件》或《给克里斯蒂娜大公夫人的信》。艾萨克·牛顿的里程碑式著作《自然哲学数学原理》于1686年以系列丛书的形式出版,费用大部分出自英国天文学家埃德蒙·哈雷的个人财产。
图1 《学者期刊》首刊的标题页
如今,虽然还有科学家出版书籍和信件,但科学文献大都是以同行评审期刊论文的形式出现这种做法始于十七世纪中期。论文由至少两名具有同一科学领域专业知识的科学家审阅,他们对论文发表评论,并决定是否应该发表。1665年3月,伦敦皇家学会(参见“科学机构与科学圈”模块)开始出版《伦敦皇家学会哲学汇刊》(Philosophical Transactions of the Royal Society of London)。该系列不仅描述皇家学会每周会议上发生的事件,还包括其成员在皇家学会会议之外进行的科学研究的结果。该出版物向其他科学家和公众开放,因此有助于科学研究档案的建立。
大约在同一时间还出现了其他期刊,可以让科学家发表其研究结果。法国《学者期刊》(Journal des sçavans译为 Journal of the Savants——“学者”是学术团体的成员)开始出版的时间比《伦敦皇家学会哲学汇刊》早几个月,但开始刊登科学研究报告的时间要晚些(图 1)。意大利期刊《自然实验论文》 (Saggi di naturali esperienzi)于1667年由佛罗伦萨西芒托学院(Accademia del Cimento)首次出版。到了十八世纪中叶,大多数欧洲主要城市都有自己的科学协会,每个协会都有自己的科学出版物
科学期刊数量越来越多,这有助于推动科学的进步。虽说牛顿发表自己的研究要靠富有的捐助者资助,但有能力发表其研究结果的不再是最富有或最知名的个人。由此,更多的人被鼓励从事科学研究并发表自己的研究成果。这又反向导致科学研究数量、研究中产生的知识数量激增
然而科学文献多了也是个挑战。随着科学知识基础的增长,跟踪新发现变得越来越困难。到了十八世纪,许多期刊收录其他期刊上发表的科学研究论文的摘要或简短摘要,以便读者能够及时了解最新的科学进展。
1945年,美国科学家兼政治家范尼瓦尔·布什 (Vannevar Bush) 在《大西洋月刊》上首次发表的一篇文章,其中强调了科学文献中包含的研究档案的重要性,他写道:“一份对科学有用的记录,是不断被扩展并保存的,重点是被他人查阅(A record if it is to be useful to science, must be continuously extended, it must be stored, and above all it must be consulted.) 
受布什这篇文章的启发,美国科学家尤金·加菲尔德(Eugene Garfield)创立了科学信息研究所(ISI,Institute for Scientific Information)。1960 年,ISI推出了科学引文索引(SCI, Science Citation Index),这是第一个针对科学学术期刊的引文索引。SCI基于科学论文固有的链接特征:一篇科学论文会引用它所基于的早期研究,这篇论文最终也会被未来的研究引用。因此,每一篇发表的论文都是引用网络中的一个节点。为了让这一网络变得更清晰,科学引文索引强调了科学文献的关键点——它基于自身不断扩展。在每篇科学期刊论文附带的参考文献列表中可以看到,科学家会参考不断积累的科学记录。了解科学家如何利用科学文献,是理解如何做科学的关键。
在科学研究中应用科学文献
美国生物学家和科学史学家弗雷德里克·霍姆斯(Frederic Holmes)在一次讨论科学写作和科学发现之间联系的讲座中说道:
当科学家提到他们领域的“文献(literature)”时,他们所想到的,迥异于与我们一般谈论的文学literature)。科学专业领域的文献是该领域期刊中包含的研究文章的积累语料库,它被视为定义该领域状态的知识的主要存储库。(Holmes,1987)
正如范尼瓦尔·布什所说,文献只有在被查阅时才有用,科学家必须在自己的工作中明确表明,他们实际上已经查阅了“研究论文库”。“引用来源”这个概念我们不陌生,例如,记者指出他或她在撰写新闻文章时咨询过的专家。而当科学家在科学期刊论文中引用来源时,他们不只是展示自己咨询了哪些专家。科学家查阅文献,以了解有关特定研究领域的所有信息,然后引用这些论文,既承认他们正在讨论的想法由他人创始,也帮助读者理解自己如何推理得出结论
对于所有科学家来说,使用文献是一个持续、迭代的过程。例如,当开始在加利福尼亚州东北部的华纳山脉进行地质实地调查时,安妮·艾格(Anne Egger)首先在 GeoRef(一个以地球科学为主题的期刊文章数据库)中进行搜索,看看是否有人在该领域发表过地质图或其他调查。她不想重复已经完成的工作,想看看有哪些信息可用。她看到美国地质调查局(U.S. Geological Survey)的两位地质学家于1986年发表的一篇论文,其中介绍了他们确定该地区火山岩年龄的工作(Duffield & McKee,1986)。这些数据对于了解该地区的火山历史非常有用。此外,她还使用了许多科学家在检索文献时使用的一种技术:查阅论文中的参考文献列表,因为它提供了大量额外的论文供检索。其中一篇论文是理查德·乔尔·拉塞尔 (Richard Joel Russell) 题为“加州东北部华纳山脉的盆地山脉结构和地层学”的出版物,是1928年由加州大学出版社出版的,看起来该地区科学调查的最早文献(Russell,1928)。美国地质调查局的这两位地质学家为拉塞尔的工作添加了更多细节,但仅限于该山脉的南部。这些文献表明,人们对该山脉的中部和北部地区的地质情况知之甚少,于是艾格和她的同事下决定将重点放在该山脉的中部和北部地区。此外,艾格通过这些文献了解到,还有哪些问题尚未得到解答。
其中一个悬而未决的问题,是华纳山脉沉积岩层的起源(见图2)。几位地质学家注意到,这些沉积岩层中存在花岗岩鹅卵石。一般来说,鹅卵石表明沉积物是由一条大河沉积而成的,但花岗岩鹅卵石的存在表明了另一件事:虽然花岗岩在加利福尼亚州其他地区很常见,但附近没有花岗岩,因此它们以前一定是被河水携带了很长的距离。通过观察花岗岩鹅卵石的年龄和化学成分,艾格和同事可以将它们与其他地区的花岗岩进行比较,并尝试确定鹅卵石的来源。他们在现场和实验室收集了数据,最终撰写了一篇关于他们所做工作的科学期刊文章,题为“西北盆地和山脉始新世-渐新世沉积岩的来源和古地理意义”(Egger等,2009)。
图2:华纳山脉的沉积岩。
论文作者认识到,他们正在研究的沉积岩有许多不同的名称,他们希望向其他人清楚地表明他们使用的术语如何对应其他人的研究。他们介绍了从1928年第一次调查以来该地区工作的历史进程,并参考了沿途的文章,表明自己的新工作如何利用先前建立的名称。摘录如下:
华纳山脉暴露出厚厚的沉积岩和火山岩层序……该层序的底部主要是沉积岩和火山碎屑岩;Rusell最初将其称为Lower Cedarville 组(1928 年)。根据Cedarville和Lake City之间部分范围的详细野外测绘,Martz(1970)将Cedarville地层下层细分为5个单元,并在其中绘制的不整合面不止Duffield(1976)人在绘制Granger Canyon和Eagleville之间的South Warner Wilderness地图时,没有细分沉积层序,但他们根据成分、颜色和植被暗示至少存在三个可识别的单元。Myers (1998,2006) 在该序列中化石组合的古植物区系分析中保留了Martz (1970) 的命名法 (Myers, 1998; 2006)。我们在2004年和2005年绘制的新地图确认了Martz(1970)提出的地层边界,并将这些细分范围延伸到了Cedar Pass和South Warner Wilderness之间的南部,因此我们在这里使用这些地层名称。——摘(Egger等2009)
作者明确说明了其他科学家工作,这表明作者已检查该研究的档案,以便在此基础上进一步发展,利用已积累的知识与对该地区的了解,提出有关沉积岩的新问题。在论文的后面部分,作者希望确定自己所描述的岩石的年龄。岩石年龄的数据,可以来自岩石中存在的化石,但这些数据不是他们自己收集的。在这种情况下,他们引用了其他科学家仔细观察化石的论文:
斯廷博特地层包括两个含化石层……在Cedarville北部的底部,有详细记录的花卉组合标志着从最新的始新世到渐新世的过渡(Myers,2006)。这些化石产于1米厚的粉砂岩中,横向延伸(主要向南)约7千米(Myers,2006)。...[并且]包括整个序列中出现的蕨类植物和针叶树...——摘Egger2009)
迈尔斯(Myers)关于化石的数据,确定了沉积岩的年龄(始新世到渐新世,大约有3500万年的历史)。基于这些现有数据,艾格和她的合著者可以展示该地区当时的河流状况。他们在现场收集的数据,包括古水流指标(paleocurrent indicators ),即显示沉积物沉积的水流流动方向的测量值。于是他们测量了通道中花岗岩卵石的方向,称为叠瓦状( imbrication,见图3)。
图3:现场测量鹅卵石的叠瓦结构(左);叠瓦结构的特写视图(右)。红线表示作者测量的方向。
单道内的叠瓦方向基本一致,但不同道之间的差别高达180度。来自Cottonwood Canyon的数据例证了这种关系:在暴露底部附近的河道中进行的17 次测量,显示出强烈的向西北方向的古水流方向,而在地层层序中大约30米较高的河床中进行的16次测量显示出与平均值东南偏东相比有更多的变异性(见图 2)。虽然辫状河往往在古水流方向上表现出更多的一致性,但在粗冲积扇或冲积平原中,古水流方向预计会出现180°的扩展(例如 Miall,1977)。——摘Egger2009)
在上面引用的段落中,作者描述了他们自己的数据(古水流指标的测量),然后提出了对这些数据的解释:鹅卵石方向的这种巨大变化是非常宽阔和陡峭河流的典型特征——冲积平原(alluvial plain)。他们引用米尔(Miall)的研究。米尔最早描述“向古水流方向扩散”这个发现,即鹅卵石朝向多个方向这个事实表明存在广阔的冲积平原。米尔在不同的背景下得出了相似的结论。就这样,作者在文献中寻找类似的情况和相似的发现,以表明自己的解释是合理的,并展示它如何融入已有的研究。
在这篇论文(其他科学论文也一样)中,作者参考文献,至少做了三件关键的事情:表明该地区或该主题已经做了哪些其他工作,引用所使用数据的来源,支持对数据的解释(或表明他们的解释与以前的解释有何不同)。引用来源是交流研究的一个组成部分(有关更多信息,请“理解科学期刊与论文:如何阅读期刊论文”模块)。同行评审员通常熟悉作者使用的文献,因此他们的职责之一是仔细检查这些参考文献,看看作者是否准确地描述了他们的来源,或者他们是否遗漏了任何重要的来源(请参阅“同行评审”模块以获取更多信息)。
【考考自己】科学家
a. 利用其他科学家的工作成果,以现有研究为基础。
b.不应参考其他科学家的工作。所有新的研究都应该不受他人的影响。
从文献中获得数据
在某些情况下,文献本身可以作为数据收集的来源。例如,古生物学就是如此:过去数百年的许多调查都涉及发布化石地点的描述,包括不同岩层中存在哪些物种和属。1982年,小约翰·塞普科斯基 (John Sepkoski Jr.) 发表了一份数据汇编,其中介绍了个别海洋化石物种何时首次出现在岩石记录中以及何时不再在岩石中出现。这些数据来自数千份已发表的报告(Sepkoski,1982)。在几篇早期论文中,塞普科斯基分析了这些汇编数据,并根据该分析,提出了有关随时间变化的分类多样性的新观点(Sepkoski,1979)。1984年,塞普科斯基和同事戴维·劳蒲(David Raup)完全基于从已发表文献中收集的数据,发表了一篇有争议的论文,该论文讨论随着时间的推移,大规模灭绝事件明显规律地发生(Raup & Sepkoski,1984)。如果没有科学文献提供的可靠研究档案,这种类型的分析(通常称为荟萃分析meta-analysis)就无法完成。荟萃分析在医学和气候科学等领域特别有用,可以将不同方法的研究结果结合起来,产生更可靠的结果
当然,我们对自然世界的认识和理解不断发展,不可避免地暴露出已有文献中一些解释上的错误,并导致一些材料和观点变得过时。塞普科斯基认识到这种可能性,并于1993年发表了一篇题为《图书馆十年:新数据确认古生物学模式》的论文(Sepkoski,1993)。在那篇文章中,他指出:
1982年手稿刚付印,我就发现新的旧古生物学文献中,起源和灭绝时间有了变化……出版后……原始数据受到了分类学专家的特别审查,公布出令人尴尬的错误以及过时的数据。
塞普科斯基收集了数据变化,重新分析了数据。有趣的是,他发现他之前发表的关于演化模式的结论几乎没有什么不同(Sepkoski,1993)。对于古生物学来说,这一结果具有重要意义。正如塞普科斯基所说:
……演化的主要模式对新化石的发现和分类学解释的变化相当不敏感,这表明只要考虑到生物圈的很大一部分,对瞬时数据的分析就可以是稳健的。
对科学文献这个整体,我们也可以得出类似的结论——尽管发表了一些错误,并且我们的解释发生了变化,但总体而言,文献是可靠的,是科学数据的可靠来源
【考考自己】科学文献中发表了错误,_______
a. 因此整个科学文献是不可信的。
b.但科学文献作为一个整体是可靠的来源。
获取科学文献
掌握所在领域的最新文献是一项挑战——每天发表的研究成果远远多于能阅读数量。现在,当新一期出版时,许多期刊都会向订阅者发送电子邮件通知,包括目录和每篇文章的链接,这让科学家能够快速浏览新问题并查看是否有与他们的工作相关的文章。科学家经常通过会议上的演讲或与不同机构同事的其他互动,在论文发表前就看到或听到早期版本(请参阅“科学机构与科学圈”模块)。
获取科学文献对于“做科学”至关重要。如今,数字和在线数据库让人们可以更轻松地搜索文献,访问科学期刊文章。然而,绝大多数期刊(甚至是数字期刊)的访问都受到订阅的限制,订阅费用可能高达数千美元。这种情况,不利于没有资源支付这些订阅费用的机构中的科学家(Evans & Reimer,2009)。最近,许多期刊,如《科学》期刊,在规定的时间段(通常是一年)后提供对其内容的开放获取;有些期刊,例如《公共科学图书馆》( Public Library of Science),从一开始就提供开放获取(open access)。这一变化反映出,人们认识到观点的多样性可以提高我们的科学理解,并且每个人都应该能够获取科学文献
获取文献之所以如此重要,是因为它是科学研究的可靠档案。可靠并不意味着每一篇发表的论文都是正确的,可靠意味着科学理解的进展可以随着时间的推移而被追踪。当发现错误甚至欺诈时,可以撤回论文,从而将其从文献中删除并确保记录仍然可靠(请参阅“科学伦理”模块)。通过这种方式支持或反驳早期的想法,并且积累多种证据,能帮助科学家建立科学的大想法(big ideas)——板块构造学、原子理论、演化论这些强大的理论。
资料来源:
Anne E. Egger, Ph.D., Anthony Carpi, Ph.D. “Utilizing the Scientific Literature” Visionlearning Vol. POS-2 (7), 2009.
https://www.visionlearning.com/en/library/process-of-science/49/utilizing-the-scientific-literature/173
我们不需要英雄
但我们需要榜样
几只青椒
长按二维码关注
References
  • Duffield, W. A., & McKee, E. H. (1986). Geochronology, structure, and basin-range tectonism of the Warner Range, northeastern California. Geological Society of America Bulletin, 97(2), 142-146.
  • Egger, A. E., Colgan, J. P., & York, C. (2009). Provenance and paleogeographic implications of Eocene-Oligocene sedimentary rocks in the northwestern Basin and Range. International Geology Review, 51(9-11), 900–919.
  • Evans, J. A., & Reimer, J. (2009). Open access and global participation in science. Science, 323(5917), 1025-.
  • Gross, A. G., Harmon, J. E., & Reidy, M. (2009). Communicating science: The scientific article from the 17th century to the present. Parlor Press.
  • Holmes, F. L. (1987). Scientific writing and scientific discovery. Isis, 220-235.
  • Raup, D. M., & Sepkoski, J. J. (1984). Periodicity of extinctions in the geologic past. Proceedings of the National Academy of Sciences of the United States of America, 81(3), 801-805.
  • Russell, R. J. (1928). Basin Range structure and stratigraphy of the Warner Range, northeastern California. University of California Publications in Geological Sciences, 17(11), 387-496.
  • Sepkoski, J. J. (1979). A kinetic model of Phanerozoic taxonomic diversity; II, Early Phanerozoic families and multiple equilibria. Paleobiology, 5(3), 222-251.
  • Sepkoski, J. J. (1982). A compendium of fossil marine families. Contributions in Biology and Geology, 51.
  • Sepkoski, J. J. (1993). Ten years in the library; new data confirm paleontological patterns. Paleobiology, 19(1), 43-51.
继续阅读
阅读原文