转自:中国科学报
近日,《自然》发表一篇题为《超过200万篇研究论文从互联网上消失》的文章。来自英国伦敦大学伯克贝克学院的研究人员MartinEve通过研究超过700万篇数字出版物,发现超过200万篇学术文章没有得到妥善的存档和保存。
这意味着,你辛辛苦苦发表的论文,某天很可能也会凭空消失!
目前,数字对象标识符(DOI)用于标识和链接特定出版物。这串由数字、字母和符号组成的标识符,就像论文的“身份证号”,具有唯一性,通过它可以方便、可靠地链接到论文全文,保证了在网络环境下对数字化对象的准确提取。
然而,芬兰赫尔辛基汉肯商学院的MikaelLaakso表示:“许多人盲目认为,只要有DOI,论文就永久存在,但事实并非如此。”他与同事在2021年的报告中指出,从2000年至2019年间,有170多份开放获取期刊从互联网上消失。
为什么手持“身份证号”,论文也会消失不见呢?其原因多种多样,包括DOI或URL更改失效、数字存档网络服务器故障、期刊或出版商倒闭等。
这一“奇怪”现象的背后,是两个主要原因在“作祟”:一方面,随着学术产出迅速增长,现有的数字存档系统无法满足所有研究成果的保存需求;另一方面,小型出版商在保存文章方面的风险高于大型出版商。
纽约市数字档案服务公司Portico的执行董事KateWittenberg表示:“保存内容需要花费金钱,小型出版商往往没有足够的资金和技术支持来保留所有的学术成果。”
那么,作为最大的DOI注册机构,Crossref的表现如何呢?
Crossref为约2万名会员分配标识符,包括出版商、博物馆和其他机构。Eve参与了Crossref的研发工作,他检查了700万件带有DOI的作品是否保存在档案中。结果显示,尽管有活跃的DOI,但其中28%的作品(超过200万篇文章)并未出现在主要的数字档案中。只有58%的DOI引用至少存储在一个档案里。另外14%的文章因发表时间较晚、非期刊文章或来源不可识别等原因被排除在研究之外。
Eve也指出了研究的局限性。本研究仅关注带有DOI的文章,并没有在每个数字存储库中搜寻文章。
有人认为,DOI搜索不到论文,对学术研究影响不大,无须大惊小怪。是这样吗?
对此,我们要厘清的是,整个科学和研究的认知理论都依赖于脚注链。脚注链上的每篇文献都是知识产生和理论创新的重要组成部分,而引文关系断裂,意味着知识体系的断裂。
论文作为学术成果的载体,DOI失效意味着相关研究的传播和应用受到阻碍,也无法核实前人的研究信息。最终导致“只能对那些无法亲自阅读的文献产生盲目的信仰”,这显然是不符合科学研究原则的。当研究者无法获取某些关键信息,必然会影响他们的研究进展和学术成果质量。
读到这里,有人不禁会好奇,类似问题也存在于国内吗?答案是肯定的。
一位知乎用户发文称:“我有一篇文章被录用了且获得了该论文的DOI,但我通过DOI检索的时候却显示无该文章。”这种困惑不仅存在于论文撰写者,论文引用者同样也会遭遇。有微博网友吐槽:“原来真的有知道题目、知道作者、知道期刊、知道DOI号.......都找不到的论文啊!真是跪了。”
Eve的研究正如一声“警钟”,提醒我们切勿忽视数字保存领域所面临的挑战。
当前中国的DOI注册和应用尚处于初级阶段,但已取得了一定的进步。从2006年起,中国知网开始为大部分的中文学术期刊分配DOI,与国际通用的DOI系统充分整合;到2012年,国家标准委员会发布《数字资源标识符》,正式确立DOI作为我国数字资源表示方法的国家标准。
可以说,我国学术界和出版界一直积极推广和应用DOI,使得中国的学术成果能够在全球范围内被识别、访问和引用,提升国内论文的国际影响力。尽管如此,我国仍面临着数字保存和长期访问的挑战,毕竟论文DOI无法找到的问题,不仅仅是一个技术性错误。
正如Eve所言:“虽然大家普遍关注论文发表后能带来的即时收益,但我们同样应关心学术生态系统整体的可持续性问题。试想在你离世100年后,人们是否能读到你辛辛苦苦发表的论文?”
参考文献:
https://www.nature.com/articles/d41586-024-00616-5
贺燕.走中国DOI发展之路[J].图书馆理论与实践,2009(7):5.