返回顶部

为什么颠覆性研究越来越少?科学家从4500万篇论文中得到答案

[复制链接]
梦艺场Lv.6 显示全部楼层 发表于 2023-6-1 21:25:59 |阅读模式 打印 上一主题 下一主题
詹士 萧箫 发自 凹非寺
量子位 | 公众号 QbitAI
颠覆性研究正在衰落,人类庞大科技进步正放缓。
上述观点来自本周Nature封面文,主标题:NET LOSS(净亏损),颇为夺目。

文章作者以为,尽管近几十年来创新和科学研究呈爆炸式增长,但是,知识的增长并未带来庞大进展
通太过析过去60年来4500万篇论文及390万项专利数据,作者发现,这些研究对现有科技的颠覆性越来越少。
他们进一步指出,此种征象可能预示着——科学技术的性质发生了根本转变
目前,该观点及内容已被经济学人、福布斯等主流媒体介绍,推特、Reddit及Hacker News上亦有不少关注。

以是,这个结论是怎么得出的?
答案还得从研究本身里找。
怎样判断论文开拓性?

研究重要通过两类方法,来衡量论文创新程度的变革。
第一种方法是根据论文引用情况判断。
这种方法会将新研究分成两类。
一类在现有理论基础上实现突破,本质上巩固了已有研究理论(Consolidation);另一类则是颠覆已有理论,本质上是开拓性的新工作(Destabilization)。
举个栗子,DNA双螺旋结构和密度泛函理论(DFT,Density Functional Theory)都获得了诺贝尔奖。
如果按上面的方式进行分类,DNA双螺旋结构显然是颠覆性的研究,由于它否定了生物界权威鲍林的“三螺旋结构”研究。
密度泛函理论,却是建立在之前研究的基础上提出来的,与DNA双螺旋结构的开拓性程度并不雷同。

怎样判断一篇论文更具开拓性?
作者们接纳了一种叫CD指数的方法(CD index)。
如下图,玄色代表目前待判断的研究,白色代表前人的研究,灰色是后来的新研究,CD指数范围在±1之间。
如果一篇论文(玄色)是基于已有研究做出改进,那么新研究(灰色)在引用这篇论文时,肯定也会引用前人的研究(白色),CD指数为负:

反之,这篇论文颠覆了之前的研究,那么新研究都会以这篇论文为基底,而不会再去引用之前的研究,CD指数为正:

以是,虽然DNA双螺旋结构和密度泛函理论的论文引用量都非常大,但它们的CD指数却分别是0.62和-0.22。下面这张图显示了论文和专利CD指数的分布:

第二种方法,则是通过论文中的词汇多样性来判断。
一方面观察论文中出现新词的情况。
注意,这里的造新词并非老词新造(给已有的界说换个说法),而是新出现的、在后来的论文内容和标题中会重复利用的词汇。
另一方面统计与“创造”干系的动词数量。
比方,与创造、发现干系的动词通常包罗produce、form、prepare和make,雷同的还包罗determine、report以及measure等。
与之相反,方向改进、优化以致应用一类的动词,则包罗improve、enhance、increase,以及use和include等等。
作者们接纳这两种方法,分别计算了4500万篇论文和390万项专利的CD指数和词汇多样性。
仍然有新突破出现

具体来说,研究得出的结论如下。
先看创新性随年份的变革。如下图,从1945年到2010年间,左侧各年份论文平均CD5指数(统计时间范围为论文发表后5年)有明显降落。差别领域降幅略有差别,社科为91.9%,物理为100%。
技术专利创新性也呈降落趋势。根据美国国家经济研究所(NBER)数据,从1980年到2010年间,计算机与通信领域CD5降幅达93.5%,药物与医疗领域降幅为96.4%。

从“语言说话”变革中也能看到干系迹象。
在1945-2010年论文中,其内容所利用的独特词汇及新造词汇均呈降落态势。

有意思的是,说话上50年前后论文中“创新性”的干系动词的出现频率也更占主导,排在前面的高频动词包罗:产出、陈诉、确定、丈量……
与之对应,2010年论文,排在火线的高频动词为:基于、改善、联系、加强……
上述动词同既有科学发现结果的“联系意味”更强。
同样的情况,也发生在专利内容统计中。
△ 1950年及2010年论文每百个动词中的高频词统计
但值得明白的是,尽管论文创新性的比例在降落,但从绝对数量看,创新结果产出量趋于稳定。
如下图所示,左侧针对1950-2010论文统计,右侧针对1980-2010专利数量,差别颜色的线条,代表了差别CD5指数区间。
能看出,尽管蓝色线条随年份变革快速上升,但该部门代表创新性较弱的论文及专利数。相对而言,高创新性的论文及专利,绝对数量趋于平稳:

数据统计外,本文作者也枚举了一些比年庞大突破,诸如引力波、新冠疫苗。
他们指出,整体的创新性降落并不能让我们忽视许多高创新性的研究结果及发明。
那么,是什么导致了整体创新性的降落?
研究者推测,该趋势与各研究领域的知识增长干系。
为此,他们统计了数十年论文及专利的引用多样性、自引均值、被引作品平均年份。
结果显示,无论论文照旧专利,几十年来引用多样性在降落,自引均值上升,且引文中平均发表年份也在增长。

通过上述统计结果,研究者推断,科学家与发明家们更多依赖熟悉的现有知识技术,且这些知识高度同源。
这可能导致创新性结果的不足。
目前,这项研究引来了不少干系从业者及科技爱好者的关注。
一位生物医学家以为这毫不惊讶,并表现研究内容挺有意思。

还有网友以为,资源也是导致上述征象的一大因素。
他补充道,在过去50年中,更多资金从产出颠覆变革的基础研究,转向收益直接可见的应用研究。

对此,你怎么看?
论文地址:
https://www.nature.com/articles/s41586-022-05543-x
参考链接:
https://pubsonline.informs.org/doi/epdf/10.1287/mnsc.2015.2366
— 完 —
量子位 QbitAI · 头条号签约
关注我们,第一时间获知前沿科技动态
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

天盟传媒网是一个由会员自行发布传媒的平台,一家集新闻稿发布平台,软文发稿平台,广告交易平台,媒体投放平台,为一体的全网媒体资源自助发布平台。尽一网在手,晓其所有!人人都是传媒者!。
  • 官方手机版

  • 微信公众号

  • 客户端下载