文献阅读:系统追踪和自动分析文献

1 现实价值意义

对于科研新手或者非专业人士,科研文献的系统追踪和自动分析,似乎是快速了解研究领域、确定研究方向的一大利器。

对于领域科研专家,及时追踪文献进展、关注领域动态是他们的首要工作。因为工作是否领先、观点是否足够有创新性,将会决定他们正在完成的科研成果是否能够有突破并得到同行重视。

2 可用工具平台

2.1 工具清单

  • 谷歌学术 google schalar。这个平台首屈一指,可谓科研工作之必备。
knitr::include_url(url = "https://scholar.google.com/")
knitr::include_url(url = "https://www.semanticscholar.org")
knitr::include_url(url = "https://www.connectedpapers.com")
  • 文萃 paper digest。最大的不同是对文献进行了AI解构和信息提取。可惜还处在测试阶段,语义结构和信息提取结果对于人类还不是很友好(缺乏逻辑)。而且不少官方介绍的期刊平台文献都查询不到结果。
knitr::include_url(url = "https://www.paper-digest.com/")

2.2 应用对比

下面以如下一篇讨论“因果推断”的文章为例,该文章收录在ArXiv开放数据库:

2.2.1 google学术分析结果

google学术检索,会给出两类记录信息的检索结果。一是被引论文情况;二是相关文章情况。本次案例检索中,记录被引论文共23篇。因为是被引论文,因此这23篇都是在2018年以后的文章。

knitr::include_url(url = "https://scholar.google.com/scholar?cites=15306902070220841445&as_sdt=2005&sciodt=0,5&hl=zh-CN")

Figure 2.1: 谷歌学术google scholars的文章引用关系

2.2.2 semantic scholar分析结果

语义学术semantic scholar对于被引(citations)情况有了更进一步的分类。

例如,区分了Background Citations、Methods Citations、Results Citations。

knitr::include_url(url = "https://www.semanticscholar.org/paper/The-lure-of-causal-statements%3A-Rampant-of-causality-Mehler-Kording/9940107dbc58e4a30ef205538d8d704bf0ccc5bf")

Figure 2.2: 语义学术semantic scholar的文章关系

2.2.3 connect paper分析结果

文链connect paper共追踪到了2009-2020年间相关论文39篇左右。相似度最高(匹配值也仅有11.7)的一篇文献是2019年发表在nature上的:Reid, Andrew T., Drew B. Headley, Ravi D. Mill, Ruben Sanchez-Romero, Lucina Q. Uddin, Daniele Marinazzo, Daniel J. Lurie, Pedro A. Valdés-Sosa, Stephen José Hanson, and Bharat B. Biswal. “Advancing Functional Connectivity Research from Association to Causation.” Nature Neuroscience 22, no. 11 (2019): 1751–60.

knitr::include_url(url = "https://www.connectedpapers.com/main/9940107dbc58e4a30ef205538d8d704bf0ccc5bf/The-lure-of-causal-statements-Rampant-misinference-of-causality-in-estimated-connectivity/graph")

Figure 2.3: 文链connect paper的文章关系图

3 几点忠告建议

  • 机器只能做它擅长的,人的作用仍旧无法替代。显然,一些文献检索分析平台逐渐建立了庞大的基础检索数据库(Google学术);另一些平台则利用现代用户交互界面提供友好人机检索和结果展示(如connect paper);还有一些文献平台则尝试使用AI方法进行文章信息的结构和提取(如paper digest)。科研思想的原创性增长,离不开上述基础数据库的完善,但也更需要进一步发现和挖掘知识海洋的精华。大数据和人工智能的作用在辅助科研工作开展方面,持续地提供了便利性、及时性和透明度。但是无论如何,这些平台对于创新观点、思想延续和发展扩散等,仍旧需要研究人员进行综合评估和分析判断。

  • 对于研究专家而言,文献平台的自动化分析可能并不是那么重要。言外之意,对于大部分的初级入门或非专业人士,他们仅仅是希望快速掌握特定领域的基本状况,那么这些文献分析平台无疑是很有帮助的。事实上,对于长期沉浸某个特定研究领域、甚至终其一生都在研究思考的科研工作者,他们早已对特定研究领域的全貌、动态、主流、新的可能性谙熟于心。对于他们而言,最重要的是知识疆域里突然出现的天才创意和各种灵光乍现。

Related