banner
Maison / Blog / Les papiers et les brevets deviennent moins perturbateurs au fil du temps
Blog

Les papiers et les brevets deviennent moins perturbateurs au fil du temps

Jun 09, 2023Jun 09, 2023

Nature volume 613, pages 138–144 (2023)Citer cet article

290 000 accès

43 Citations

4052 Altmétrique

Détails des métriques

Les théories du changement scientifique et technologique considèrent la découverte et l'invention comme des processus endogènes1,2, dans lesquels les connaissances accumulées antérieurement permettent des progrès futurs en permettant aux chercheurs, selon les termes de Newton, de « se tenir sur les épaules de géants »3,4,5,6,7. Les dernières décennies ont vu une croissance exponentielle du volume des nouvelles connaissances scientifiques et technologiques, créant ainsi les conditions propices à des avancées majeures8,9. Pourtant, contrairement à ce point de vue, des études suggèrent que les progrès ralentissent dans plusieurs domaines majeurs10,11. Ici, nous analysons ces revendications à grande échelle sur six décennies, en utilisant des données sur 45 millions d'articles et 3,9 millions de brevets provenant de six ensembles de données à grande échelle, ainsi qu'une nouvelle métrique quantitative - l'indice CD12 - qui caractérise la façon dont les articles et les brevets modifient les réseaux de citations. en science et technologie. Nous constatons que les documents et les brevets sont de moins en moins susceptibles de rompre avec le passé de manière à pousser la science et la technologie dans de nouvelles directions. Ce modèle s'applique universellement à tous les domaines et est robuste pour plusieurs mesures différentes basées sur les citations et le texte1,13,14,15,16,17. Par la suite, nous relions ce déclin de la perturbabilité à un rétrécissement de l'utilisation des connaissances antérieures, ce qui nous permet de réconcilier les modèles que nous observons avec la vision des « épaules de géants ». Nous constatons qu'il est peu probable que les baisses observées soient dues à des changements dans la qualité de la science publiée, des pratiques de citation ou de facteurs spécifiques au domaine. Dans l'ensemble, nos résultats suggèrent que le ralentissement des taux de perturbation peut refléter un changement fondamental dans la nature de la science et de la technologie.

Bien que le siècle dernier ait été témoin d'une expansion sans précédent des connaissances scientifiques et technologiques, on craint que l'activité d'innovation ne ralentisse18,19,20. Des études documentent une baisse de la productivité de la recherche dans les semi-conducteurs, les produits pharmaceutiques et d'autres domaines10,11. Les articles, les brevets et même les demandes de subvention sont devenus moins nouveaux par rapport aux travaux antérieurs et moins susceptibles de relier des domaines de connaissances disparates, qui sont tous deux des précurseurs de l'innovation21,22. L'écart entre l'année de la découverte et l'attribution d'un prix Nobel s'est également creusé23,24, suggérant que les contributions d'aujourd'hui ne sont pas à la hauteur du passé. Ces tendances attirent de plus en plus l'attention des décideurs politiques, car elles constituent des menaces importantes pour la croissance économique, la santé et le bien-être humains et la sécurité nationale, ainsi que les efforts mondiaux pour lutter contre les grands défis tels que le changement climatique25,26.

De nombreuses explications à ce ralentissement ont été proposées. Certains soulignent une pénurie de « fruits à portée de main » car les innovations facilement disponibles améliorant la productivité ont déjà été réalisées19,27. D'autres mettent l'accent sur le fardeau croissant du savoir ; les scientifiques et les inventeurs ont besoin de plus en plus de formation pour atteindre les frontières de leurs domaines, laissant moins de temps pour repousser ces frontières18,28. Pourtant, il reste beaucoup d'inconnues, non seulement sur les causes du ralentissement de l'activité d'innovation, mais aussi sur la profondeur et l'ampleur du phénomène. Le déclin est difficile à concilier avec des siècles d'observation par les philosophes des sciences, qui caractérisent la croissance de la connaissance comme un processus endogène, dans lequel les connaissances antérieures permettent la découverte future, un point de vue rendu célèbre par l'observation de Newton selon laquelle s'il avait vu plus loin, c'était par 'debout sur les épaules de géants'3. De plus, à ce jour, les preuves indiquant un ralentissement sont basées sur des études de domaines particuliers, utilisant des mesures disparates et spécifiques à un domaine10,11, ce qui rend difficile de savoir si les changements se produisent à des rythmes similaires dans tous les domaines de la science et de la technologie. On ne sait pas non plus si les modèles observés dans les indicateurs agrégés masquent des différences dans la mesure dans laquelle les travaux individuels repoussent la frontière.

Nous comblons ces lacunes dans la compréhension en analysant 25 millions d'articles (1945-2010) dans le Web of Science (WoS) (Méthodes) et 3,9 millions de brevets (1976-2010) dans la base de données des brevets de l'Office américain des brevets et des marques (USPTO). (Méthodes). Les données WoS comprennent 390 millions de citations, 25 millions de titres d'articles et 13 millions de résumés. Les données de Patents View comprennent 35 millions de citations, 3,9 millions de titres de brevets et 3,9 millions de résumés. Par la suite, nous reproduisons nos principaux résultats sur quatre ensembles de données supplémentaires - JSTOR, le corpus de l'American Physical Society, Microsoft Academic Graph et PubMed - comprenant 20 millions d'articles. À l'aide de ces données, nous joignons une nouvelle mesure basée sur les citations12 à des analyses textuelles des titres et des résumés pour comprendre si les articles et les brevets forgent de nouvelles directions au fil du temps et dans tous les domaines.

Pour caractériser la nature de l'innovation, nous nous appuyons sur les théories fondamentales du changement scientifique et technologique2,29,30, qui distinguent deux types de ruptures. Premièrement, certaines contributions améliorent les flux de connaissances existants et consolident ainsi le statu quo. Kohn et Sham (1965)31, un article lauréat du prix Nobel, ont utilisé des théorèmes établis pour développer une méthode de calcul de la structure des électrons, qui a cimenté la valeur des recherches antérieures. Deuxièmement, certaines contributions perturbent les connaissances existantes, les rendant obsolètes et propulsant la science et la technologie dans de nouvelles directions. Watson et Crick (1953)32, également lauréat du prix Nobel, ont introduit un modèle de la structure de l'ADN qui a remplacé les approches précédentes (par exemple, la triple hélice de Pauling). Kohn et Sham et Watson et Crick étaient tous deux importants, mais leurs implications pour le changement scientifique et technologique étaient différentes.

Nous quantifions cette distinction à l'aide d'une mesure, l'indice CD12, qui caractérise la nature consolidante ou perturbatrice de la science et de la technologie (Fig. 1). L'intuition est que si un document ou un brevet est perturbateur, le travail ultérieur qui le cite est moins susceptible de citer également ses prédécesseurs ; pour les futurs chercheurs, les idées qui sont entrées dans sa production sont moins pertinentes (par exemple, la triple hélice de Pauling). Si un article ou un brevet se consolide, les travaux ultérieurs qui le citent sont également plus susceptibles de citer ses prédécesseurs ; pour les futurs chercheurs, les connaissances sur lesquelles s'appuie le travail sont toujours (et peut-être plus) pertinentes (par exemple, les théorèmes utilisés par Kohn et Sham). L'indice CD varie de −1 (consolidant) à 1 (perturbateur). Nous mesurons l'indice CD cinq ans après l'année de publication de chaque article (indiqué par CD5, voir Extended Data Fig. 1 pour la répartition des CD5 parmi les articles et les brevets et Extended Data Fig. 2 pour les analyses utilisant des fenêtres alternatives)33. Par exemple, Watson et Crick et Kohn et Sham ont tous deux reçu plus d'une centaine de citations dans les cinq ans suivant leur publication. Cependant, l'article de Kohn et Sham a un CD5 de -0,22 (indiquant une consolidation), tandis que l'article de Watson et Crick a un CD5 de 0,62 (indiquant une perturbation). L'indice CD a été largement validé dans des recherches antérieures, notamment par corrélation avec des évaluations d'experts12,34.

Cette figure montre une visualisation schématique de l'index du CD. a, valeur de l'indice CD de trois articles lauréats du prix Nobel31,32,58 et de trois brevets notables59,60,61 dans notre échantillon, mesuré à partir de cinq ans après la publication (indiqué par CD5). b, Répartition du CD5 pour les articles de WoS (n = 24 659 076) entre 1945 et 2010 et les brevets de Patents View (n = 3 912 353) entre 1976 et 2010, où un seul point représente un article ou un brevet. La dimension verticale (haut-bas) de chaque «bande» correspond aux valeurs de l'indice CD (avec les valeurs d'axe indiquées en orange à gauche). La dimension horizontale (gauche-droite) de chaque bande permet de minimiser les points de chevauchement. Les zones plus sombres sur chaque tracé de bande indiquent des régions plus denses de la distribution (c'est-à-dire des valeurs de CD5 plus couramment observées). Des détails supplémentaires sur la distribution de l'indice CD sont donnés dans la Fig. valeur consolidante maximale (CDt = −1). Le panneau fournit également l'équation de l'indice CD et un calcul illustratif.

Dans tous les domaines, nous constatons que la science et la technologie deviennent moins perturbatrices. La figure 2 trace le CD5 moyen au fil du temps pour les articles (Fig. 2a) et les brevets (Fig. 2b). Pour les papiers, la baisse entre 1945 et 2010 va de 91,9 % (où le CD5 moyen est passé de 0,52 en 1945 à 0,04 en 2010 pour les « sciences sociales ») à 100 % (où le CD5 moyen est passé de 0,36 en 1945 à 0 en 2010 pour les "sciences physiques" ); pour les brevets, la baisse entre 1980 et 2010 va de 78,7 % (où le CD5 moyen est passé de 0,30 en 1980 à 0,06 en 2010 pour « l'informatique et les communications ») à 91,5 % (où le CD5 moyen est passé de 0,38 en 1980 à 0,03 en 2010 pour 'drogue et médical'). Pour les articles et les brevets, les taux de déclin sont les plus élevés dans les premières parties de la série chronologique, et pour les brevets, ils semblent commencer à se stabiliser entre les années 2000 et 2005. Pour les articles, depuis 1980 environ, le taux de déclin a été plus modeste en « sciences de la vie et biomédecine » et sciences physiques, et plus marquée et persistante en sciences sociales et « technologie ». Dans l'ensemble, cependant, par rapport aux époques antérieures, les articles et brevets récents font moins pour pousser la science et la technologie dans de nouvelles directions. La similitude générale des tendances que nous observons dans les champs est remarquable à la lumière des théories des « fruits à portée de main »19,27, qui prédiraient probablement une plus grande hétérogénéité dans le déclin, car il semble peu probable que les champs « consomment » leurs fruits à portée de main à des taux similaires. tarifs ou horaires.

a,b, Baisse du CD5 au fil du temps, séparément pour les articles (a, n = 24 659 076) et les brevets (b, n = 3 912 353). Pour les articles, les lignes correspondent aux domaines de recherche WoS ; de 1945 à 2010, l'ampleur du déclin varie de 91,9 % (sciences sociales) à 100 % (sciences physiques). Pour les brevets, les lignes correspondent aux catégories de technologies du National Bureau of Economic Research (NBER) ; de 1980 à 2010, l'ampleur du déclin varie de 93,5 % (informatique et communications) à 96,4 % (médicaments et médical). Les bandes ombrées correspondent aux intervalles de confiance à 95 %. Comme nous l'expliquons dans les méthodes, ce modèle de déclin est robuste à l'ajustement pour la confusion des changements dans les pratiques de publication, de citation et d'auteur au fil du temps.

Données source

Le déclin de la science et de la technologie perturbatrices est également observable à l'aide d'indicateurs alternatifs. Parce qu'ils créent des écarts par rapport au statu quo, les articles et brevets perturbateurs sont susceptibles d'introduire de nouveaux mots (par exemple, les mots utilisés pour créer un nouveau paradigme peuvent différer de ceux qui sont utilisés pour développer un paradigme existant)35,36. Par conséquent, si la perturbabilité diminue, nous nous attendrions à une diminution de la diversité des mots utilisés en science et technologie. Pour évaluer cela, les Fig. 3a, d documentent le rapport type-token (c'est-à-dire mots uniques / totaux) des titres de papier et de brevet au fil du temps (section Informations supplémentaires 1). On observe des baisses importantes, surtout dans les périodes antérieures, avant 1970 pour les papiers et 1990 pour les brevets. Pour les titres d'articles (Fig. 3a), la baisse (1945-2010) varie de 76,5 % (sciences sociales) à 88 % (technologie) ; pour les titres de brevets (Fig. 3d), la baisse (1980-2010) va de 32,5 % (chimie) à 81 % (informatique et communications). Pour les résumés d'articles (Extended Data Fig. 3a), la diminution (1992-2010) varie de 23,1 % (sciences de la vie et biomédecine) à 38,9 % (sciences sociales) ; pour les abrégés de brevets (Extended Data Fig. 3b), la baisse (1980-2010) varie de 21,5 % (mécanique) à 73,2 % (informatique et communications). Sur la figure 3b, e, nous démontrons que ces déclins de la diversité des mots s'accompagnent de déclins similaires de la nouveauté combinatoire ; au fil du temps, les mots particuliers que les scientifiques et les inventeurs utilisent dans les titres de leurs articles et brevets sont de plus en plus susceptibles d'avoir été utilisés ensemble dans les titres de travaux antérieurs. Conformément à ces tendances linguistiques, nous observons également une diminution de la nouveauté dans les combinaisons de travaux antérieurs cités par des articles et des brevets, sur la base d'une mesure précédemment établie de «combinaisons atypiques»14 (Extended Data Fig. 4).

a,d, Chiffres montrant une baisse de la diversité du langage utilisé en science et technologie sur la base des mots uniques/total des titres d'articles de 1945 à 2010 (a, n = 24 659 076) et des titres de brevets de 1980 à 2010 (d, n = 3 912 353). b,e, Chiffres montrant une baisse de la nouveauté du langage utilisé en science et technologie sur la base du nombre de nouvelles paires de mots/total de paires de mots introduites chaque année dans les titres d'articles WoS de 1945 à 2010 (b) et dans les brevets Afficher les titres de brevets de 1980 à 2010 (réfs.1,17) (e). Pour les articles en a et en b, les lignes correspondent aux domaines de recherche WoS (n = 264 domaine de recherche WoS × observations de l'année). Pour les brevets en d et en e, les lignes correspondent aux catégories de technologie NBER (n = 229 catégorie de technologie NBER × observations de l'année). c,f, Chiffres montrant la fréquence des verbes les plus couramment utilisés dans les titres papier pour la première (rouge) et la dernière (bleue) décennie de la période d'observation en papier (c, n = 24 659 076) et brevet (f, n = 3 912 353 ) titres.

Données source

Le déclin de l'activité perturbatrice est également apparent dans les mots spécifiques utilisés par les scientifiques et les inventeurs. Si la perturbation diminue, nous avons estimé que les verbes faisant allusion à la création, à la découverte ou à la perception de nouvelles choses devraient être utilisés moins fréquemment au fil du temps, tandis que les verbes faisant allusion à l'amélioration, à l'application ou à l'évaluation de choses existantes pourraient être utilisés plus souvent35,36. La figure 3 montre les verbes les plus courants dans les papiers (Fig. 3c) et les titres de brevets (Fig. 3f) dans la première et la dernière décade de chaque échantillon (Informations supplémentaires, section 2). Bien qu'il soit difficile de caractériser précisément et quantitativement les mots comme « consolidants » ou « perturbateurs » en l'absence de contexte, la figure met en évidence un changement clair et qualitatif dans le langage. Dans les décennies précédentes, les verbes évoquant la création (par exemple, « produire », « former », « préparer » et « faire »), la découverte (par exemple, « déterminer » et « rapporter ») et la perception (par exemple, « mesurer » ') sont répandus à la fois dans les titres de papier et de brevet. Au cours des dernières décennies, cependant, ces verbes sont presque complètement remplacés par ceux qui tendent à être plus évocateurs de l'amélioration (par exemple, 'améliorer', 'renforcer' et 'augmenter'), de l'application (par exemple, 'utiliser' et ' comprennent ») ou l'évaluation (par exemple, « associé », « intermédiaire » et « relatif ») des connaissances et des artefacts scientifiques et technologiques existants. Pris ensemble, ces modèles suggèrent un changement substantiel dans la science et la technologie au fil du temps, la découverte et l'invention devenant de moins en moins perturbatrices, conformément à nos résultats à l'aide de l'indice CD.

Les tendances globales que nous documentons masquent une hétérogénéité considérable dans le caractère perturbateur des articles et brevets individuels et une stabilité remarquable du nombre absolu d'œuvres hautement perturbatrices (Méthodes et Fig. 4). Plus précisément, malgré de fortes augmentations de la productivité scientifique, le nombre d'articles et de brevets avec des valeurs de CD5 à l'extrême droite de la distribution reste presque constant au fil du temps. Cette « conservation » du nombre absolu d'articles et de brevets hautement perturbateurs tient malgré une rotation considérable dans les domaines sous-jacents responsables de la production de ces travaux (Extended Data Fig. 5, encadré). Ces résultats suggèrent que la persistance de percées majeures - par exemple, la mesure des ondes de gravité et les vaccins COVID-19 - n'est pas incompatible avec le ralentissement de l'activité innovante. En bref, la diminution de la perturbabilité globale n'exclut pas les travaux individuels hautement perturbateurs.

Cette figure montre le nombre d'articles perturbateurs (a, n = 5 030 179) et de brevets (b, n = 1 476 004) sur quatre plages différentes de CD5 (les articles et brevets avec des valeurs de CD5 dans la plage [−1,0, 0) ne sont pas représentés dans la figure). Les lignes correspondent à différents niveaux de perturbation mesurés par CD5. Malgré des augmentations substantielles du nombre d'articles et de brevets publiés chaque année, il y a peu de changement dans le nombre d'articles et de brevets très perturbateurs, comme en témoignent les lignes rouges, vertes et orange relativement plates. Ce modèle aide à rendre compte des observations simultanées de preuves agrégées de ralentissement de l'activité d'innovation et de percées apparemment majeures dans de nombreux domaines de la science et de la technologie. Les graphiques en médaillon montrent la composition des articles et des brevets les plus perturbateurs (définis comme ceux avec des valeurs de CD5 > 0,25) par domaine au fil du temps. La stabilité observée dans le nombre absolu d'articles et de brevets hautement perturbateurs se maintient malgré un roulement considérable dans les domaines sous-jacents de la science et de la technologie responsables de la production de ces travaux. « Sciences de la vie » désigne le domaine de recherche des sciences de la vie et de la biomédecine ; « électrique » désigne la catégorie des technologies électriques et électroniques ; « drogues » désigne la catégorie des médicaments et des technologies médicales ; et « ordinateurs » désigne la catégorie des ordinateurs et des technologies de communication.

Données source

Qu'est-ce qui est à l'origine de la baisse de la perturbabilité ? Plus tôt, nous avons suggéré que nos résultats ne sont pas cohérents avec les explications qui lient le ralentissement de l'activité innovante à la diminution des « fruits à portée de main ». Données étendues La Fig. 5 montre qu'il est peu probable que la baisse de la perturbation soit due à d'autres facteurs spécifiques au domaine en décomposant la variation de CD5 attribuable aux effets du domaine, de l'auteur et de l'année (Méthodes).

Il est peu probable que la baisse des taux d'activité perturbatrice soit causée par la diminution de la qualité de la science et de la technologie22,37. Si c'était le cas, les modèles observés à la Fig. 2 devraient être moins visibles dans un travail de haute qualité. Cependant, lorsque nous restreignons notre échantillon aux articles publiés dans des lieux de publication de premier plan tels que Nature, Actes de l'Académie nationale des sciences et des sciences ou aux découvertes lauréates du prix Nobel38 (Fig. 5), la tendance à la baisse persiste.

Cette figure montre les changements de CD5 au fil du temps pour les articles publiés dans Nature, Actes de l'Académie nationale des sciences (PNAS) et Science (graphique en médaillon, n = 223 745) et les articles lauréats du prix Nobel (graphique principal, n = 635), avec plusieurs exemples notables31,32,58,62,63,64,65,66 mis en évidence. Les couleurs indiquent les trois journaux différents dans le graphique en médaillon ; les couleurs indiquent les trois domaines différents dans lesquels le prix Nobel est décerné dans l'intrigue principale. Les bandes ombrées correspondent aux intervalles de confiance à 95 %. Pour l'exhaustivité historique, nous traçons les scores d'index CD pour tous les articles Nobel jusqu'en 1900 (la première année où le prix a été décerné) ; cependant, nos principales analyses commencent dans l'ère post-1945, lorsque les données WoS sont généralement plus fiables. La figure indique qu'il est peu probable que les changements dans la qualité de la science publiée au fil du temps soient responsables de la baisse des perturbations.

Données source

De plus, la tendance n'est pas motivée par les caractéristiques des données WoS et UPSTO ou par notre dérivation particulière de l'indice CD ; nous observons des déclins similaires de la perturbation lorsque nous calculons le CD5 sur des articles dans JSTOR, le corpus de l'American Physical Society, Microsoft Academic Graph et PubMed (Methods), dont les résultats sont présentés dans Extended Data Fig. 6. Nous montrons en outre que le déclin est pas un artefact de l'indice CD en signalant des modèles similaires à l'aide de dérivations alternatives13,15 (Méthodes et données étendues Fig. 7).

Les baisses de la perturbabilité ne sont pas non plus attribuables à l'évolution des pratiques de publication, de citation ou d'auteur (Méthodes). Tout d'abord, en utilisant des approches de la littérature bibliométrique39,40,41,42,43, nous avons calculé plusieurs versions normalisées de l'indice CD qui ont ajusté la tendance croissante des articles et des brevets à citer des travaux antérieurs44,45. Les résultats utilisant ces indicateurs alternatifs (Extended Data Fig. 8a,d) étaient similaires à ceux que nous avons rapportés dans la Fig. 2. Deuxièmement, en utilisant la régression, nous avons estimé des modèles de CD5 en fonction des variables indicatrices pour chaque année de publication de papier ou de avec des contrôles spécifiques pour le domaine × niveau de l'année—nombre de nouveaux articles/brevets, nombre moyen d'articles/brevets cités, nombre moyen d'auteurs ou d'inventeurs par article—et au niveau de l'article ou du brevet—nombre d'articles ou de brevets cités—facteurs. Les prédictions de ces modèles ont indiqué une baisse des articles et des brevets perturbateurs (données étendues, Fig. 8b, e et tableau supplémentaire 1), ce qui était cohérent avec nos principaux résultats. Enfin, à l'aide de simulations de Monte Carlo, nous avons recâblé au hasard les réseaux de citations observés tout en préservant les caractéristiques clés du comportement de citation des scientifiques et des inventeurs, y compris le nombre de citations faites et reçues par des articles et des brevets individuels et l'écart d'âge entre les travaux citant et cités. Nous constatons que les valeurs de CD5 observées sont inférieures à celles des réseaux simulés (Extended Data Fig. 8c,f), et l'écart se creuse : au fil du temps, les articles et les brevets sont de moins en moins perturbateurs que ce à quoi on pourrait s'attendre par hasard. Prises ensemble, ces analyses supplémentaires indiquent qu'il est peu probable que la baisse des CD5 soit due à l'évolution des pratiques de publication, de citation ou d'auteur.

Nous avons également examiné le lien entre la diminution de la perturbabilité et la croissance des connaissances (Extended Data Fig. 9). D'une part, les scientifiques et les inventeurs sont confrontés à une charge croissante de connaissances, qui peut inhiber les découvertes et les inventions qui perturbent le statu quo. D'autre part, comme indiqué précédemment, les philosophes des sciences suggèrent que les connaissances existantes favorisent la découverte et l'invention3,6,7. À l'aide de modèles de régression, nous avons évalué la relation entre le stock d'articles et de brevets (un indicateur de la connaissance) dans les domaines et leur CD5 (Informations supplémentaires section 3 et Tableau supplémentaire 2). Nous trouvons un effet positif de la croissance des connaissances sur la perturbabilité des articles, en cohérence avec les travaux antérieurs20 ; cependant, nous constatons un effet négatif pour les brevets.

Compte tenu de ces résultats contradictoires, nous avons envisagé la possibilité que la disponibilité des connaissances puisse différer de leur utilisation. En particulier, la croissance de l'édition et des brevets peut amener les scientifiques et les inventeurs à se concentrer sur des tranches plus étroites de travaux antérieurs18,46, limitant ainsi le stock « effectif » de connaissances. À l'aide de trois proxys, nous documentons une baisse de l'utilisation des connaissances antérieures parmi les scientifiques et les inventeurs (Fig. 6). Premièrement, nous constatons une diminution de la diversité des travaux cités (Fig. 6a, d), ce qui indique que la science et la technologie contemporaines s'intéressent à des tranches plus étroites de connaissances existantes. De plus, cette baisse de la diversité s'accompagne d'une augmentation de la part des citations des 1 % d'articles et de brevets les plus cités (Fig. 6a (i), d (i)), qui diminuent également en diversité sémantique (Fig. 6a (ii),d (ii)). Au fil du temps, les scientifiques et les inventeurs citent de plus en plus les mêmes travaux antérieurs, et ces travaux antérieurs deviennent de plus en plus similaires sur le plan thématique. Deuxièmement, nous constatons une augmentation de l'auto-citation (Fig. 6b, e), un indicateur courant de la poursuite d'un flux de recherche préexistant47,48,49, ce qui est cohérent avec le fait que les scientifiques et les inventeurs s'appuient davantage sur des connaissances très familières. Troisièmement, l'âge moyen du travail cité, une mesure courante de l'utilisation de connaissances datées50,51,52, augmente (Fig. 6c,f), ce qui suggère que les scientifiques et les inventeurs peuvent avoir du mal à suivre le rythme de l'expansion des connaissances. et à la place s'appuyer sur des travaux plus anciens et familiers. Les trois indicateurs pointent vers une histoire cohérente : une portée plus étroite des connaissances existantes informe la découverte et l'invention contemporaines.

a–f, Changements dans le niveau de diversité de l'utilisation des connaissances scientifiques et technologiques existantes parmi les articles (a, n = 264 domaine de recherche WoS × observations de l'année ; b et c, n = 24 659 076 articles) et les brevets (d, 229 catégorie de technologie NBER × années d'observations ; e et f, n = 3 912 353 brevets) sur la base des mesures suivantes : diversité des travaux cités (a et d), nombre moyen d'auto-citations (b et e) et âge moyen des travaux cités (c et f) . Les bandes ombrées (b,c,e et f) correspondent aux intervalles de confiance à 95 %. Les diagrammes en médaillon de a et d montrent les changements dans la part des citations des 1 % des articles les plus cités (a(i) et d(i)) et dans la diversité sémantique des 1 % les plus cités au fil du temps (a (ii) et d(ii)). Les valeurs des deux mesures sont calculées au sein du champ et de l'année, et sont ensuite moyennées à travers les champs pour le traçage. La diversité sémantique repose sur les titres d'articles et de brevets ; les valeurs correspondent au rapport de l'écart-type à la similarité moyenne par cosinus (c'est-à-dire le coefficient de variation) entre les titres des 1 % d'articles et de brevets les plus cités par domaine et par année. Pour permettre des comparaisons sémantiques, les titres ont été vectorisés à l'aide d'incorporations de mots pré-entraînés. Pour les articles, des lignes sont indiquées pour chaque domaine de recherche WoS ; pour les brevets, des lignes sont indiquées pour chaque catégorie de technologie NBER. Dans les analyses de régression ultérieures utilisant ces mesures, nous constatons que l'utilisation d'un travail moins diversifié, plus de son propre travail et d'un travail plus ancien est associée à des documents et des brevets moins perturbateurs (Méthodes et données étendues, tableau 1).

Données source

Les résultats d'une série ultérieure de modèles de régression suggèrent que l'utilisation d'un travail moins diversifié, plus de son propre travail et un travail plus ancien sont tous négativement associés à la perturbation (méthodes, tableau de données étendu 1 et tableau supplémentaire 3), une tendance qui se maintient même après la prise en compte pour l'âge moyen et le nombre d'œuvres antérieures produites par les membres de l'équipe. Lorsque l'éventail des travaux utilisés par les scientifiques et les inventeurs se rétrécit, l'activité perturbatrice diminue.

En résumé, nous signalons un déclin marqué de la science et de la technologie perturbatrices au fil du temps. Nos analyses montrent qu'il est peu probable que cette tendance soit induite par des changements dans les pratiques de citation ou la qualité des travaux publiés. Au contraire, le déclin représente un changement substantiel dans la science et la technologie, qui renforce les inquiétudes concernant le ralentissement de l'activité d'innovation. Nous attribuons cette tendance en partie au recours des scientifiques et des inventeurs à un ensemble plus restreint de connaissances existantes. Même si les philosophes des sciences ont peut-être raison de dire que la croissance des connaissances est un processus endogène - dans lequel la compréhension accumulée favorise la découverte et l'invention futures - l'engagement avec un large éventail de connaissances existantes est nécessaire pour que ce processus se déroule, une exigence qui semble plus difficile avec le temps. S'appuyer sur des tranches plus étroites de connaissances profite aux carrières individuelles53, mais pas au progrès scientifique en général.

De plus, même si la prévalence des travaux perturbateurs a diminué, nous constatons que leur nombre est resté stable. D'une part, ce résultat peut suggérer qu'il existe une « capacité de charge » fixe pour la science et la technologie hautement perturbatrices, auquel cas les interventions politiques visant à accroître ce travail peuvent s'avérer difficiles. D'un autre côté, notre observation d'un roulement considérable dans les domaines sous-jacents responsables de la production de science et de technologie perturbatrices suggère l'importance potentielle de facteurs tels que l'évolution des intérêts des bailleurs de fonds et des scientifiques et la "maturité" des connaissances scientifiques et technologiques pour les percées, dans lesquelles Dans ce cas, la production d'un travail perturbateur peut être sensible aux leviers politiques. Dans les deux cas, la stabilité que nous observons dans le simple nombre d'articles et de brevets perturbateurs suggère que la science et la technologie ne semblent pas avoir atteint la fin de la « frontière sans fin ». Il reste de la place pour les déviations régulières que les travaux perturbateurs contribuent au progrès scientifique et technologique.

Notre étude n'est pas sans limites. Notamment, même si la recherche à ce jour soutient la validité de l'indice CD12,34, il s'agit d'un indicateur relativement nouveau de l'activité innovante et bénéficiera de travaux futurs sur son comportement et ses propriétés, en particulier à travers les sources de données et les contextes. Des études qui examinent systématiquement l'effet de différentes pratiques de citation54,55, qui varient selon les domaines, seraient particulièrement instructives.

Dans l'ensemble, nos résultats approfondissent la compréhension de l'évolution des connaissances et peuvent guider la planification de carrière et la politique scientifique. Pour promouvoir la science et la technologie perturbatrices, les universitaires peuvent être encouragés à lire largement et avoir le temps de suivre l'évolution rapide de la frontière du savoir. Les universités peuvent renoncer à l'accent mis sur la quantité et récompenser plus fortement la qualité de la recherche56, et peut-être subventionner davantage les congés sabbatiques d'un an. Les agences fédérales peuvent investir dans des récompenses individuelles plus risquées et à plus long terme qui soutiennent des carrières et pas simplement des projets spécifiques57, donnant aux universitaires le temps nécessaire pour sortir de la mêlée, s'inoculer de la culture publier ou périr et produire un travail vraiment conséquent. Comprendre plus complètement le déclin de la science et de la technologie perturbatrices permet de repenser les stratégies nécessaires pour organiser la production de la science et de la technologie à l'avenir.

Nous limitons notre attention aux articles de recherche publiés entre 1945 et 2010. Bien que les données du WoS commencent en 1900, l'échelle et l'organisation sociale de la science ont considérablement changé dans l'après-guerre, rendant ainsi les comparaisons avec le présent difficiles et potentiellement trompeuses67, 68,69. Nous terminons nos analyses d'articles en 2010 car certaines de nos mesures nécessitent plusieurs années de données consécutives à la publication de l'article. Les données WoS archivent 65 millions de documents publiés dans 28 968 revues entre 1900 et 2017 et 735 millions de citations parmi eux. En outre, les données WoS incluent les titres et le texte intégral des résumés de 65 et 29 millions d'enregistrements, respectivement, publiés entre 1913 et 2017. Après avoir éliminé les documents non liés à la recherche (par exemple, les critiques de livres et les commentaires) et sous-réglé les données pour la fenêtre 1945-2010, l'échantillon analytique se compose de n = 24 659 076 articles.

Nous nous concentrons uniquement sur les brevets délivrés à partir de 1976, qui est la première année pour laquelle des enregistrements lisibles par machine sont disponibles dans les données de la vue Brevets. Comme nous l'avons fait pour les articles, nous terminons nos analyses en 2010 car certaines mesures nécessitent des données d'années ultérieures pour le calcul. Les données de Patents View sont la source la plus exhaustive de données historiques sur les inventions, avec des informations sur 6,5 millions de brevets délivrés entre 1976 et 2017 et leurs 92 millions de citations correspondantes. Les données de Patents View incluent les titres et les résumés de 6,5 millions de brevets délivrés entre 1976 et 2017. Suite à des travaux antérieurs12, nous avons concentré notre attention sur les brevets d'utilité, qui couvrent la grande majorité (91 % dans nos données) des inventions brevetées. Après avoir éliminé les brevets de non-utilité et regroupé les données dans la fenêtre 1976-2010, l'échantillon analytique se compose de n = 3 912 353 brevets.

Les observations (et les affirmations) sur le ralentissement des progrès scientifiques et technologiques sont de plus en plus courantes, étayées non seulement par les preuves que nous rapportons, mais également par des recherches antérieures issues de diverses perspectives méthodologiques et disciplinaires10,11,18,19,20,21,22,23 ,24. Pourtant, comme indiqué dans le texte principal, il existe une tension entre les observations de ralentissement des progrès à partir de données agrégées d'une part, et les rapports continus de percées apparemment majeures dans de nombreux domaines de la science et de la technologie - couvrant tout, de la mesure des ondes de gravité à la séquençage du génome humain, d'autre part. Dans un effort pour concilier cette tension, nous avons envisagé la possibilité que si, dans l'ensemble, la découverte et l'invention peuvent être moins perturbatrices au fil du temps, la vision de haut niveau adoptée dans les travaux antérieurs peut masquer une hétérogénéité considérable. En d'autres termes, les preuves globales d'un ralentissement des progrès n'excluent pas la possibilité qu'un sous-ensemble de découvertes et d'inventions soit hautement perturbateur.

Pour évaluer cette possibilité, nous traçons le nombre d'articles perturbateurs (Fig. 4a) et de brevets (Fig. 4b) au fil du temps, où les articles et brevets perturbateurs sont définis comme ceux avec des valeurs de CD5> 0. Dans chaque panneau, nous traçons quatre lignes, correspondant à quatre intervalles régulièrement espacés—(0, 0,25], (0,25, 0,5], (0,5, 0,75], (0,75, 1,00])—sur les valeurs positives de CD5. Les deux premiers correspondent donc à des papiers et brevets relativement peu disruptifs, alors que les deux derniers correspondent à ceux qui le sont plus fortement (par exemple, où l'on peut s'attendre à voir des ruptures majeures comme certaines de celles citées ci-dessus). le nombre d'articles et de brevets publiés chaque année, nous constatons peu de changement dans le nombre d'articles et de brevets très perturbateurs, comme en témoignent les lignes rouges, vertes et orange relativement plates. au fil du temps dans la composition des domaines scientifiques et technologiques responsables de la production des travaux les plus perturbateurs (Fig. 4, graphiques en médaillon). preuve d'un ralentissement des progrès.

Nos résultats montrent une diminution constante de la perturbabilité de la science et de la technologie au fil du temps. De plus, les modèles que nous observons sont généralement similaires dans les grands domaines d'études, ce qui suggère que les facteurs à l'origine du déclin ne sont pas propres à des domaines spécifiques de la science et de la technologie. Le déclin pourrait être entraîné par d'autres facteurs, tels que les conditions de la science et de la technologie à un moment donné ou les individus particuliers qui produisent la science et la technologie. Par exemple, des facteurs exogènes tels que les conditions économiques peuvent encourager des pratiques de recherche ou d'invention moins perturbatrices. De même, les scientifiques et les inventeurs de générations différentes peuvent avoir des approches différentes, ce qui peut entraîner des tendances plus ou moins grandes à produire des travaux perturbateurs. Nous avons donc cherché à comprendre la contribution relative des facteurs domaine, année et auteur (ou inventeur) au déclin des sciences et technologies perturbatrices.

Pour ce faire, nous avons décomposé la contribution relative des effets fixes domaine, année et auteur au pouvoir prédictif des modèles de régression de l'indice CD. L'unité d'observation dans ces régressions est l'auteur (ou inventeur) × année. Nous entrons dans les effets fixes de domaine à l'aide d'indicateurs de sous-domaine granulaires (c'est-à-dire 150 domaines WoS pour les articles, 138 sous-catégories NBER pour les brevets). Par souci de simplicité, nous n'avons pas inclus de covariables supplémentaires au-delà des effets fixes dans nos modèles. Les effets fixes de domaine capturent tous les facteurs spécifiques au domaine qui ne varient pas selon l'auteur ou l'année (par exemple, le sujet de base); les effets fixes de l'année capturent tous les facteurs spécifiques à l'année qui ne varient pas selon le domaine ou l'auteur (par exemple, l'état des technologies de communication) ; les effets fixes de l'auteur (ou de l'inventeur) capturent tous les facteurs spécifiques à l'auteur qui ne varient pas selon le domaine ou l'année (par exemple, l'année d'obtention du doctorat). Après avoir spécifié notre modèle, nous déterminons la contribution relative des effets fixes de terrain, d'année et d'auteur au R2 ajusté du modèle global en utilisant la décomposition de Shapley-Owen. Plus précisément, étant donné nos n = 3 groupes d'effets fixes (domaine, année et auteur), nous évaluons la contribution relative de chaque ensemble d'effets fixes en estimant le R2 ajusté séparément pour les modèles 2n en utilisant des sous-ensembles de prédicteurs. La contribution relative de chaque ensemble d'effets fixes est ensuite calculée à l'aide de la valeur de Shapley issue de la théorie des jeux70.

Les résultats de cette analyse sont présentés dans les données étendues de la figure 5, pour les articles (barre supérieure) et les brevets (barre inférieure). La taille totale de la barre correspond à la valeur du R2 ajusté pour le modèle entièrement spécifié (c'est-à-dire avec les trois groupes d'effets fixes). Conformément à nos observations à partir des graphiques de l'indice CD au fil du temps, nous observons que pour les articles et les brevets, les facteurs spécifiques au domaine apportent la contribution relative la plus faible au R2 ajusté (0,02 et 0,01 pour les articles et les brevets, respectivement). Les effets fixes auteur, en revanche, semblent contribuer beaucoup plus au pouvoir prédictif du modèle, tant pour les articles (0,20) que pour les brevets (0,17). Les chercheurs et les inventeurs qui sont entrés dans le domaine au cours des dernières années peuvent être confrontés à une charge de connaissances plus élevée et donc recourir à la construction de tranches plus étroites de travaux existants (par exemple, en raison d'une formation doctorale plus spécialisée), ce qui conduirait généralement à une science et des technologies moins perturbatrices. technologie produite au cours des années suivantes, conformément à nos conclusions. Le schéma est plus complexe pour les effets fixes d'année ; bien que les facteurs spécifiques à l'année qui ne varient pas selon le domaine ou l'auteur aient plus de pouvoir explicatif que le domaine pour les articles (0,02) et les brevets (0,16), ils semblent être nettement plus importants pour les seconds que pour les premiers. Pris ensemble, ces résultats suggèrent que des facteurs relativement stables qui varient selon les scientifiques et les inventeurs peuvent être particulièrement importants pour comprendre les changements de perturbation au fil du temps. Les résultats confirment également que les facteurs spécifiques au domaine dans tous les domaines de la science et de la technologie jouent un très petit rôle dans l'explication du déclin de la perturbabilité des articles et des brevets.

Nous avons également examiné si les modèles que nous documentons peuvent être des artefacts de notre choix de sources de données. Bien que nous observions des tendances constantes dans les données WoS et Patents View, et que les deux bases de données soient largement utilisées par la communauté Science of Science, nos résultats peuvent éventuellement être influencés par des facteurs tels que des changements de couverture (par exemple, des revues ajoutées ou exclues de WoS au fil du temps) ou même des erreurs de données plutôt que des changements fondamentaux dans la science et la technologie. Pour évaluer cette possibilité, nous avons donc calculé le CD5 des articles dans quatre bases de données supplémentaires : JSTOR, le corpus de l'American Physical Society, Microsoft Academic Graph et PubMed. Nous avons inclus tous les enregistrements de 1930 à 2010 de PubMed (16 774 282 articles), JSTOR (1 703 353 articles) et American Physical Society (478 373 articles). Les données JSTOR ont été obtenues via une demande spéciale d'ITHAKA, le responsable des données (http://www.ithaka.org), tout comme les données de l'American Physical Society (https://journals.aps.org/datasets). Nous avons téléchargé les données Microsoft Academic Graph de CADRE à l'Université de l'Indiana (https://cadre.iu.edu/). Les données PubMed ont été téléchargées à partir du serveur FTP de la National Library of Medicine (ftp://ftp.ncbi.nlm.nih.gov/pubmed/baseline). En raison de l'échelle exceptionnellement grande de Microsoft Academic Graph et de la charge de calcul associée, nous avons extrait au hasard 1 million d'articles. Comme le montre la figure 6 des données étendues, la tendance à la baisse de la perturbation est évidente dans tous les échantillons.

Plusieurs articles récents ont introduit des spécifications alternatives de l'index CD12. Nous avons évalué si les baisses de perturbation que nous observons sont corroborées en utilisant deux variations alternatives. Une critique de l'index CD a été que le nombre d'articles qui citent uniquement les références de l'article principal domine la mesure13. Bornmann et al.13 propose \({{\rm{DI}}}_{l}^{{\rm{nok}}}\) comme variante moins sensible à ce problème. Une autre faiblesse potentielle de l'index CD est qu'il pourrait être très sensible à de petits changements dans les schémas de citations vers l'avant des articles qui ne font pas de citations vers l'arrière15. Leydesdorff et al.15 suggèrent DI* comme autre indicateur de perturbation qui résout ce problème. Par conséquent, nous avons calculé \({{\rm{DI}}}_{l}^{{\rm{nok}}}\) où l = 5 et DI* pour 100 000 articles et brevets tirés au hasard chacun de notre échantillon analytique . Les résultats sont présentés dans Extended Data Fig. 7a (articles) et b (brevets). Les lignes bleues indiquent une perturbation basée sur Bornmann et al.13 et les lignes orange indiquent une perturbation basée sur Leydesdorff et al.15. Dans l'ensemble de la science et de la technologie, les deux mesures alternatives montrent toutes deux une baisse des perturbations au fil du temps, similaire aux tendances observées avec l'indice CD. Pris ensemble, ces résultats suggèrent que les déclins des perturbations que nous documentons ne sont pas un artefact de notre opérationnalisation particulière.

Nous avons également examiné si nos résultats pouvaient être attribués à des changements dans les pratiques de publication, de citation ou d'auteur, plutôt qu'à des changements substantiels dans la découverte et l'invention. Peut-être le plus critique, comme indiqué dans le texte principal, il y a eu une expansion marquée de l'édition et des brevets au cours de la période de notre étude. Cette expansion a naturellement augmenté la quantité de travaux antérieurs pertinents pour la science et la technologie actuelles et donc risquant d'être cités, une tendance reflétée dans l'augmentation marquée du nombre moyen de citations faites par des articles et des brevets (c'est-à-dire des articles et les brevets citent plus de travaux antérieurs que dans les époques précédentes)44,45. Rappelons que l'index CD quantifie le degré auquel un travail futur cite un travail focal avec ses prédécesseurs (c'est-à-dire les références dans la bibliographie du travail focal). Une plus grande citation d'une œuvre focale indépendamment de ses prédécesseurs est considérée comme la preuve d'un processus social de perturbation. Cependant, à mesure que les articles et les brevets citent davantage de travaux antérieurs, la probabilité qu'un travail focal soit cité indépendamment de ses prédécesseurs peut diminuer mécaniquement; plus un travail focal fait de citations, plus il est probable que le travail futur le cite avec l'un de ses prédécesseurs, même par hasard. Par conséquent, l'augmentation du nombre d'articles et de brevets disponibles pour citation et du nombre moyen de citations faites par les scientifiques et les inventeurs peut contribuer à la baisse des valeurs de l'indice CD. En bref, étant donné les changements marqués de la science et de la technologie au cours de notre longue fenêtre d'étude, l'index CD des articles et brevets publiés au cours des périodes antérieures peut ne pas être directement comparable à ceux des millésimes plus récents, ce qui pourrait à son tour rendre nos conclusions sur le déclin dans la science et la technologie perturbatrices suspectes. Nous avons abordé ces préoccupations en utilisant trois approches distinctes mais complémentaires : la normalisation, l'ajustement de la régression et la simulation.

Tout d'abord, conformément à la pratique courante en recherche bibliométrique39,40,41,42,43, nous avons développé deux versions normalisées de l'index CD, dans le but de faciliter les comparaisons dans le temps. Parmi les différentes composantes de l'index CD, nous avons concentré notre attention sur le nombre d'articles ou de brevets qui ne citent que les références de l'ouvrage central (Nk), car ce terme semblerait plus susceptible d'évoluer avec l'augmentation de l'édition et des brevets et de la nombre moyen de citations faites par des articles et des brevets à des travaux antérieurs13. Des valeurs plus grandes de Nk conduisent à des valeurs plus petites de l'indice CD. Par conséquent, des augmentations marquées de Nk au fil du temps, en particulier par rapport aux autres composantes de la mesure, peuvent entraîner un biais à la baisse, inhibant ainsi notre capacité à comparer avec précision la science et la technologie perturbatrices des années ultérieures avec les périodes antérieures.

Nos deux versions normalisées de l'indice CD visent à remédier à ce biais potentiel en atténuant l'effet des augmentations de Nk. Dans la première version, que nous appelons 'Papier normalisé', nous soustrayons de Nk le nombre de citations faites par l'article ou le brevet focal aux travaux antérieurs (Nb). L'intuition derrière cet ajustement est que lorsqu'un article ou un brevet focal cite plus de travaux antérieurs, Nk est susceptible d'être plus grand car il y a plus d'opportunités pour les travaux futurs de citer les prédécesseurs de l'article focal ou du brevet. Cette augmentation de Nk se traduirait par des valeurs inférieures de l'indice CD, mais pas nécessairement parce que l'article ou le brevet focal serait moins perturbateur. Dans la deuxième version, que nous appelons "champ × année normalisée", nous soustrayons Nk du nombre moyen de citations rétrogrades faites par des articles ou des brevets dans le domaine de recherche WoS ou la catégorie de technologie NBER du document focal ou du brevet, respectivement, au cours de son année de publication (nous étiquetons cette quantité \({N}_{{\rm{b}}}^{{\rm{m}}{\rm{e}}{\rm{a}}{\rm{n} }}\)). L'intuition derrière cet ajustement est que dans les domaines et les périodes où les scientifiques et les inventeurs ont une plus grande tendance à citer des travaux antérieurs, Nk est également susceptible d'être plus grand, conduisant ainsi à des valeurs inférieures de l'indice CD, bien que là encore pas nécessairement. du fait que l'article ou le brevet focal est moins perturbateur. Dans les cas où Nb ou \({N}_{{\rm{b}}}^{{\rm{m}}{\rm{e}}{\rm{a}}{\rm{n }}}\) dépasse la valeur de Nk, nous fixons Nk à 0 (c'est-à-dire que Nk n'est jamais négatif dans les mesures normalisées). Les deux adaptations de l'indice CD sont inspirées d'approches établies dans la littérature scientométrique et peuvent être comprises comme une forme de « normalisation du côté citant » (c'est-à-dire une normalisation en corrigeant l'effet des différences de longueur des listes de références)40.

Dans Extended Data Fig. 8, nous traçons les valeurs moyennes des deux versions normalisées de l'indice CD au fil du temps, séparément pour les articles (Extended Data Fig. 8a) et les brevets (Extended Data Fig. 8d). Conformément à nos conclusions rapportées dans le texte principal, nous continuons d'observer une baisse de l'indice CD au fil du temps, ce qui suggère que les modèles que nous observons dans la science et la technologie perturbatrices ne sont pas susceptibles d'être entraînés par des changements dans les pratiques de citation.

Deuxièmement, nous avons ajusté la confusion potentielle en utilisant une approche basée sur la régression. Cette approche complète les normalisations bibliométriques que nous venons de décrire en nous permettant de tenir compte d'un éventail plus large de changements dans les pratiques de publication, de citation et d'auteur en général (ces dernières n'étant pas directement prises en compte dans l'approche de normalisation ou l'approche de simulation décrite ci-après) , et augmente la quantité de travaux antérieurs pertinents pour la science et la technologie actuelles en particulier. Dans le tableau supplémentaire 1, nous rapportons les résultats des modèles de régression prédisant le CD5 pour les articles (modèles 1 à 4) et les brevets (modèles 5 à 8), avec des variables indicatrices incluses pour chaque année de notre fenêtre d'étude (les catégories de référence sont 1945 et 1980 pour les articles et les brevets, respectivement). Les modèles 1 et 4 sont les modèles de base et n'incluent aucun autre ajustement au-delà des indicateurs de l'année. Dans les modèles 2 et 5, nous ajoutons des effets fixes de sous-domaine (domaines WoS pour les articles et sous-catégories de technologie NBER pour les brevets). Enfin, dans les modèles 3-4 et 7-8, nous ajoutons des variables de contrôle pour plusieurs domaines × niveau de l'année - nombre de nouveaux articles ou brevets, nombre moyen d'articles ou de brevets cités, nombre moyen d'auteurs ou d'inventeurs par article - et article ou caractéristiques au niveau des brevets (nombre d'articles ou de brevets cités), permettant ainsi des comparaisons plus solides des modèles de science et de technologie perturbatrices sur la longue période couverte par notre étude. Pour les modèles papier, nous incluons également un contrôle au niveau du papier pour le nombre de références non liées (c'est-à-dire le nombre de citations d'œuvres qui ne sont pas indexées dans WoS). Nous constatons que l'inclusion de ces contrôles améliore l'ajustement du modèle, comme l'indiquent les tests de Wald statistiquement significatifs présentés sous les modèles pertinents.

Dans les huit modèles présentés dans le tableau supplémentaire 1, nous constatons que les coefficients des indicateurs de l'année sont statistiquement significatifs et négatifs, et augmentent en ampleur au fil du temps, ce qui est cohérent avec les modèles que nous avons rapportés sur la base de l'indice des valeurs CD5 non ajustées dans le texte principal. (Fig. 2). Dans Extended Data Fig. 8, nous visualisons les résultats de notre approche basée sur la régression en traçant les valeurs de CD5 prévues séparément pour chacun des indicateurs d'année inclus dans les modèles 4 (articles) et 8 (brevets). Pour permettre des comparaisons avec les valeurs brutes de CD5 indiquées dans le texte principal, nous présentons les prévisions distinctes faites pour chaque année sous forme de graphique linéaire. Comme le montre la figure, nous continuons d'observer une baisse des valeurs de l'indice CD dans les articles et les brevets, même en tenant compte des changements dans les pratiques de publication, de citation et d'auteur.

Troisièmement, à la suite de travaux connexes dans la science des sciences14, 71, 72, 73, nous avons examiné si nos résultats pouvaient être un artefact de l'évolution des modèles dans les pratiques de publication et de citation en utilisant une approche de simulation. Essentiellement, l'indice CD mesure la perturbation en caractérisant le réseau de citations autour d'un article ou d'un brevet focal. Cependant, de nombreux réseaux complexes, même ceux résultant de processus aléatoires, présentent des structures qui produisent des valeurs non triviales sur des mesures de réseau courantes (par exemple, le regroupement)74,75,76. Au cours de la période couverte par notre étude, les réseaux de citations de la science et de la technologie ont connu des changements significatifs, avec des augmentations marquées à la fois du nombre de nœuds (c'est-à-dire d'articles ou de brevets) et de bords (c'est-à-dire de citations). Ainsi, plutôt que de refléter un processus social significatif, les déclins observés des perturbations peuvent résulter de ces changements structurels dans les réseaux de citation sous-jacents.

Pour évaluer cette possibilité, nous avons suivi les techniques standard de la science des réseaux75,77 et mené une analyse dans laquelle nous avons recalculé l'indice CD sur des réseaux de citations recâblés de manière aléatoire. Si les modèles que nous observons dans l'indice CD sont le résultat de changements structurels dans les réseaux de citation de la science et de la technologie (par exemple, la croissance du nombre de nœuds ou de bords) plutôt qu'un processus social significatif, alors ces modèles devraient également être visibles dans des réseaux aléatoires comparables qui subissent des changements structurels similaires. Par conséquent, le fait de constater que les modèles que nous observons dans l'indice CD diffèrent pour les réseaux de citations observés et aléatoires servirait de preuve que la baisse de la perturbation n'est pas un artefact des données.

Nous avons commencé par créer des copies du réseau de citation sous-jacent sur lequel les valeurs de l'index CD utilisé dans toutes les analyses rapportées dans le texte principal étaient basées, séparément pour les articles et les brevets. Pour chaque réseau de citations (un pour les articles, un pour les brevets), nous avons ensuite recâblé les citations à l'aide d'un algorithme de randomisation préservant les degrés. Dans chaque itération de l'algorithme, deux arêtes (par exemple, A–B et C–D) sont sélectionnées dans le réseau de citations sous-jacent, après quoi l'algorithme tente d'échanger les deux extrémités des arêtes (par exemple, A–B devient A–D et C–D devient C–B). Si le degré de centralité de A, B, C et D reste le même après l'échange, l'échange est conservé ; sinon, l'algorithme ignore l'échange et passe à l'itération suivante. Lors de l'évaluation de la centralité des diplômes, nous prenons en compte les « in-degree » (c'est-à-dire les citations d'autres articles ou brevets vers l'article ou le brevet focal) et les « out-degree » (c'est-à-dire les citations de l'article ou du brevet focal vers d'autres articles ou brevets) séparément. En outre, nous avons également exigé que la répartition par âge des articles ou brevets citants et cités soit identique dans les réseaux originaux et recâblés. Plus précisément, les échanges n'étaient retenus que lorsque l'année de publication des citations originales et candidates était la même. À la lumière de ces choix de conception, notre algorithme de recâblage doit être considéré comme assez conservateur, car il préserve une structure substantielle du réseau d'origine. Il n'y a pas de consensus scientifique sur le nombre d'échanges nécessaires pour garantir que les réseaux d'origine et recâblés sont suffisamment différents les uns des autres; la règle que nous adoptons ici est 100 × m, où m est le nombre de bords du réseau en cours de recâblage.

À la suite de travaux antérieurs14, nous avons créé dix copies recâblées des réseaux de citation observés pour les articles et les brevets. Après avoir créé ces réseaux de citations recâblés, nous avons ensuite recalculé CD5. En raison de la grande échelle des données WoS, nous basons nos analyses sur un sous-échantillon aléatoire de dix millions d'articles ; Le CD5 a été calculé sur le réseau recâblé pour tous les brevets. Pour chaque article et brevet, nous calculons ensuite un score z qui compare la valeur CD5 observée à celles du même article ou brevet dans les dix réseaux de citations recâblés. Des scores z positifs indiquent que la valeur de CD5 observée est supérieure (c'est-à-dire plus perturbatrice) que ce à quoi on pourrait s'attendre par hasard ; les scores z négatifs indiquent que les valeurs observées sont moindres (c'est-à-dire plus consolidantes).

Les résultats de ces analyses sont présentés dans Extended Data Fig. 8, séparément pour les articles (Extended Data Fig. 8c) et les brevets (Extended Data Fig. 8f). Les lignes correspondent au score z moyen parmi les articles ou brevets publiés au cours de l'année focale. Les tracés révèlent un schéma de changement dans l'index CD au-delà de celui « intégré » à la structure changeante du réseau. Nous constatons qu'en moyenne, les articles et les brevets ont tendance à être moins perturbateurs que ce à quoi on pourrait s'attendre par hasard, et de plus, l'écart entre les valeurs d'indice CD observées et celles des réseaux recâblés au hasard augmente avec le temps, ce qui est cohérent avec nos résultats. d'un déclin de la science et de la technologie perturbatrices.

Pris ensemble, les résultats des analyses précédentes suggèrent que bien qu'il y ait eu des changements marqués dans la science et la technologie au cours de notre longue fenêtre d'étude, en particulier en ce qui concerne les pratiques de publication, de citation et d'auteur, le déclin de la science et de la technologie perturbatrices que nous document utilisant l'index du CD est peu susceptible d'être un artefact de ces changements, et représente plutôt un changement substantiel dans la nature de la découverte et de l'invention.

Nous évaluons la relation entre la perturbabilité et l'utilisation des connaissances antérieures à l'aide de modèles de régression, en prédisant le CD5 pour les articles et les brevets individuels, sur la base de trois indicateurs de l'utilisation des connaissances antérieures : la diversité des travaux cités, le nombre moyen d'auto-citations et l'âge moyen du travail. cité. Notre mesure de la diversité des travaux cités est mesurée au niveau du domaine × de l'année ; toutes les autres variables incluses dans les régressions sont définies au niveau de l'article ou du brevet. Pour tenir compte des facteurs de confusion potentiels, nos modèles incluaient des effets fixes d'année et de terrain. Les effets fixes annuels tiennent compte des facteurs variant dans le temps qui affectent toutes les observations (articles ou brevets) de la même manière (par exemple, les tendances économiques mondiales). Les effets fixes sur le terrain tiennent compte des facteurs spécifiques au domaine qui ne changent pas au fil du temps (par exemple, certains domaines peuvent intrinsèquement valoriser le travail perturbateur par rapport à celui qui consolide). Contrairement à nos diagrammes descriptifs, pour nos modèles de régression, nous ajustons les effets de terrain en utilisant les 150 sujets étendus WoS plus granulaires (par exemple, "biochimie et biologie moléculaire", "biophysique", "biotechnologie et microbiologie appliquée", " biologie cellulaire », « biologie du développement », « biologie évolutive » et « microbiologie » sont des sujets étendus dans le domaine de recherche des sciences de la vie et de la biomédecine) et 38 sous-catégories technologiques du NBER (par exemple, « agriculture », « alimentation », « textile » ; « revêtement », « gaz », « organique » et « résines » sont des sous-catégories de la catégorie des technologies chimiques).

En outre, nous incluons également des contrôles pour « l'âge moyen des membres de l'équipe » (c'est-à-dire « l'âge de la carrière », défini comme la différence entre l'année de publication de l'article ou du brevet principal et la première année au cours de laquelle chaque auteur ou inventeur a publié un article ou un brevet) et le « nombre moyen d'œuvres antérieures produites par les membres de l'équipe ». Bien que l'augmentation des taux d'auto-citations puisse indiquer que les scientifiques et les inventeurs se concentrent de plus en plus sur leur propre travail, ces taux peuvent également être en partie dus à la quantité de travaux antérieurs disponibles pour l'auto-citation. De même, bien que les augmentations de l'âge au travail citées dans les articles et les brevets puissent indiquer que les scientifiques et les inventeurs ont du mal à suivre, elles peuvent également être motivées par le vieillissement rapide de la main-d'œuvre dans les sciences et la technologie78,79. Par exemple, les scientifiques et les inventeurs plus âgés peuvent être plus familiers ou plus attentifs aux travaux plus anciens, ou peuvent résister activement au changement80. Ces variables de contrôle aident à rendre compte de ces explications alternatives.

Le tableau supplémentaire 3 présente des statistiques récapitulatives pour les variables utilisées dans les modèles de régression des moindres carrés ordinaires. La diversité des travaux cités est mesurée par l'entropie normalisée, qui varie de 0 à 1. Des valeurs plus élevées sur cette mesure indiquent une distribution plus uniforme des citations à un plus large éventail de travaux existants ; des valeurs plus faibles indiquent une distribution plus concentrée des citations à un plus petit éventail de travaux existants. Les tableaux montrent que l'entropie normalisée dans un domaine et une année donnés a une entropie moyenne presque maximale de 0,98 pour la science et la technologie. Environ 16 % des articles cités dans un article sont rédigés par un auteur de l'article principal ; le nombre correspondant pour les brevets est d'environ 7 %. Les articles ont tendance à s'appuyer sur des travaux plus anciens et des travaux dont l'âge varie plus fortement (mesuré par l'écart type) que les brevets. De plus, le CD5 moyen d'un article est de 0,04 alors que le CD5 moyen d'un brevet est de 0,12, ce qui signifie que l'article moyen a tendance à être moins perturbateur que le brevet moyen.

Nous constatons que l'utilisation d'un travail plus diversifié, moins de son propre travail et un travail plus ancien tend à être associé à la production d'une science et d'une technologie plus perturbatrices, même après avoir pris en compte l'âge moyen et le nombre de travaux antérieurs produits par les membres de l'équipe. Ces résultats sont basés sur nos résultats de régression, présentés dans le tableau de données étendu 1. Les modèles 6 et 12 présentent les modèles de régression complets. Les modèles indiquent une tendance cohérente à la fois pour la science et la technologie, dans laquelle les coefficients de diversité des travaux cités sont positifs et significatifs pour les articles (0,159, P < 0,01) et les brevets (0,069, P < 0,01), ce qui indique que dans les domaines où il y a est plus l'utilisation du travail diversifié, il y a plus de perturbations. En tenant toutes les autres variables à leur moyenne, le CD5 prédit des articles et des brevets augmente respectivement de 303,5 % et de 1,3 % lorsque la diversité des travaux cités augmente de 1 sd Les coefficients du rapport des autocitations au total des travaux cités sont négatifs et significatif pour les articles (−0,011, P < 0,01) et les brevets (−0,060, P < 0,01), montrant que lorsque les chercheurs ou les inventeurs s'appuient davantage sur leur propre travail, la découverte et l'invention ont tendance à être moins perturbatrices. En tenant à nouveau toutes les autres variables à leur moyenne, le CD5 prédit des articles et des brevets diminue de 622,9 % et 18,5 %, respectivement, avec une augmentation de 1 sd du ratio. Les coefficients de l'interaction entre l'âge moyen du travail cité et la dispersion de l'âge du travail cité sont positifs et significatifs pour les articles (0,000, P < 0,01) et les brevets (0,001, P < 0,01), suggérant que - en maintenant la dispersion de l'âge des travaux cités de façon constante — les articles et les brevets qui s'intéressent à des travaux plus anciens sont plus susceptibles d'être perturbateurs. Le CD5 prévu des papiers et des brevets augmente de manière frappante de 2 072,4 % et 58,4 %, respectivement, lorsque l'âge moyen du travail cité augmente de 1 sd (environ neuf et huit ans pour les papiers et les brevets, respectivement), maintenant à nouveau toutes les autres variables à leurs moyens. En résumé, les résultats de la régression suggèrent que des changements dans l'utilisation des connaissances antérieures peuvent contribuer à la production d'une science et d'une technologie moins perturbatrices.

De plus amples informations sur la conception de la recherche sont disponibles dans le résumé des rapports sur le portefeuille Nature lié à cet article.

Les données associées à cette étude sont disponibles gratuitement dans un référentiel public à https://doi.org/10.5281/zenodo.7258379. Notre étude s'appuie sur des données provenant de six sources : l'American Physical Society, JSTOR, Microsoft Academic Graph, Patents View, PubMed et WoS. Les données de Microsoft Academic Graph, Patents View et PubMed sont accessibles au public, et notre référentiel comprend des données complètes pour les analyses de ces sources. Les données de l'American Physical Society, JSTOR et WoS ne sont pas accessibles au public et ont été utilisées sous licence de leurs éditeurs respectifs. Pour faciliter la réplication, notre référentiel comprend des versions limitées des données de ces sources, ce qui permettra le calcul de statistiques descriptives de base. Les auteurs mettront à disposition des versions complètes de ces données sur demande et avec l'autorisation de leurs éditeurs respectifs. Les données sources sont fournies avec ce document.

Le code open source lié à cette étude est disponible sur https://doi.org/10.5281/zenodo.7258379 et http://www.cdindex.info. Nous avons utilisé Python v.3.10.6 (pandas v.1.4.3, numpy v.1.23.1, matplotlib v.3.5.2, seaborn v.0.11.2, spacy v.2.2, jupyterlab v.3.4.4) pour assembler, analyser et visualiser des données et effectuer des analyses statistiques. Nous avons utilisé MariaDB v.10.6.4 pour regrouper les données. Nous avons utilisé R v.4.2.1 (ggplot2 v.3.36, ggrepel v.0.9.0) pour visualiser les données. Nous avons utilisé StataMP v.17.0 (reghdfe v.5.7.3) pour effectuer des analyses statistiques.

Fleming, L. Incertitude recombinante dans la recherche technologique. Gérer. Sci. 47, 117-132 (2001).

Article Google Scholar

Schumpeter, J. Capitalisme, socialisme et démocratie (Perennial, 1942).

Koyré, A. Une lettre inédite de Robert Hooke à Isaac Newton. ISIS 43, 312–337 (1952).

Article MathSciNet MATH Google Scholar

Popper, K. Conjectures et réfutations : la croissance des connaissances scientifiques (Routledge, 2014).

Fleck, L. Genesis and Development of a Scientific Fact (Univ. Chicago Press, 2012).

Acemoglu, D., Akcigit, U. & Kerr, WR Réseau d'innovation. Proc. Natl Acad. Sci. États-Unis 113, 11483–11488 (2016).

Article ADS CAS Google Scholar

Weitzman, ML Croissance recombinante. QJ Éco. 113, 331–360 (1998).

Article MathSciNet MATH Google Scholar

Tria, F., Loreto, V., Servedio, VDP & Strogatz, SH La dynamique des nouveautés corrélées. Sci. Rep. 4, 1–8 (2014).

Article Google Scholar

Fink, TMA, Reeves, M., Palma, R. & Farr, RS Sérendipité et stratégie dans l'innovation rapide. Nat. Commun. 8, 1–9 (2017).

Article CAS Google Scholar

Pammolli, F., Magazzini, L. & Riccaboni, M. La crise de productivité dans la R&D pharmaceutique. Nat. Rev. Drug Discov. 10, 428–438 (2011).

Article CAS Google Scholar

Bloom, N., Jones, CI, Van Reenen, J. & Webb, M. Les idées deviennent-elles de plus en plus difficiles à trouver ? Suis. Écon. Rév.110, 1104–1144 (2020).

Article Google Scholar

Funk, RJ & Owen-Smith, J. Une mesure de réseau dynamique du changement technologique. Gérer. Sci. 63, 791–817 (2017).

Article Google Scholar

Bornmann, L., Devarakonda, S., Tekles, A. & Chacko, G. Les indicateurs d'indice de perturbation sont-ils valides de manière convergente ? La comparaison de plusieurs variantes d'indicateurs avec des évaluations par les pairs. Quant. Sci. Étalon. 1, 1242-1259 (2020).

Article Google Scholar

Uzzi, B., Mukherjee, S., Stringer, M. & Jones, B. Combinaisons atypiques et impact scientifique. Sciences 342, 468–472 (2013).

Article ADS CAS Google Scholar

Leydesdorff, L., Tekles, A. & Bornmann, L. Une proposition de révision de l'indice de perturbation. Prof. Inf. 30, e300121 (2021).

Lu, C. et al. Analyser la complexité linguistique et l'impact scientifique. J. Informetr. 13, 817–829 (2019).

Article Google Scholar

Hofstra, B. et al. Le paradoxe diversité-innovation en science. Proc. Natl Acad. Sci. États-Unis 117, 9284–9291 (2020).

Article ADS CAS Google Scholar

Jones, BF Le fardeau de la connaissance et la « mort de l'homme de la renaissance » : l'innovation devient-elle plus difficile ? Rev. Econ. Étalon. 76, 283–317 (2009).

Article MATH Google Scholar

Gordon, RJ The Rise and Fall of American Growth (Princeton Univ. Press, 2016).

Chu, JSG & Evans, JA Ralentissement des progrès canoniques dans de vastes domaines scientifiques. Proc. Natl Acad. Sci. États-Unis 118, e2021636118 (2021).

Article CAS Google Scholar

Packalen, M. & Bhattacharya, J. Financement du NIH et poursuite de la science de pointe. Proc. Natl Acad. Sci. États-Unis 117, 12011-12016 (2020).

Article ADS CAS Google Scholar

Jaffe, AB & Lerner, J. Innovation and its Discontents: How Our Broken Patent System Met en danger l'innovation et le progrès, et que faire à ce sujet (Princeton Univ. Press, 2011).

Horgan, J. La fin de la science : faire face aux limites de la connaissance au crépuscule de l'ère scientifique (Basic Books, 2015).

Collison, P. & Nielsen, M. La science en a moins pour son argent (Atlantique, 2018).

Nolan, A. L'intelligence artificielle et l'avenir de la science. oecd.ai, https://oecd.ai/en/wonk/ai-future-of-science (25 octobre 2021).

Politiques efficaces pour favoriser la recherche à haut risque/à haut rendement. Documents d'orientation de l'OCDE sur la science, la technologie et l'industrie (OCDE, 2021).

Cowen, T. La grande stagnation : comment l'Amérique a mangé tous les fruits à portée de main de l'histoire moderne, est tombée malade et se sentira (éventuellement) mieux (Penguin, 2011).

Einstein, A. Le monde tel que je le vois (Citadel Press, 1949).

Arthur, WB La structure de l'invention. Rés. Politique 36, 274–287 (2007).

Article Google Scholar

Tushman, ML & Anderson, P. Discontinuités technologiques et environnements organisationnels. Adm. Sci. Q. 31, 439–465 (1986).

Article Google Scholar

Kohn, W. & Sham, LJ Équations autocohérentes incluant les effets d'échange et de corrélation. Phys. Rév. 140, A1133 (1965).

Article ADS MathSciNet Google Scholar

Watson, JD & Crick, FHC Structure moléculaire des acides nucléiques : une structure pour l'acide nucléique désoxyribose. Nature 171, 737–738 (1953).

Article ADS CAS Google Scholar

Bornmann, L. & Tekles, A. L'indice de perturbation dépend de la longueur de la fenêtre de citation. Prof. Inf. 28, e280207 (2019).

Wu, L., Wang, D. & Evans, JA De grandes équipes se développent et de petites équipes perturbent la science et la technologie. Nature 566, 378–382 (2019).

Article ADS CAS Google Scholar

Kuhn, TS La structure des révolutions scientifiques (Univ. Chicago Press, 1962).

Brad Wray, K. Kuhn et la découverte des paradigmes. Philos. Soc. Sci. 41, 380–397 (2011).

Article Google Scholar

Ioannidis, JPA Pourquoi la plupart des résultats de recherche publiés sont faux. PLoS Med. 2, e124 (2005).

Article Google Scholar

Li, J., Yin, Y., Fortunato, S. & Wang, D. Un ensemble de données d'enregistrements de publication pour les lauréats du prix Nobel. Sci. Données 6, 1–10 (2019).

Article Google Scholar

Bornmann, L. & Marx, W. Méthodes de génération de scores d'impact de citation normalisés en bibliométrie : quelle méthode reflète le mieux les jugements d'experts ? J. Informetr. 9, 408–418 (2015).

Article Google Scholar

Waltman, L. Une revue de la littérature sur les indicateurs d'impact de citation. J. Informetr. 10, 365–391 (2016).

Article Google Scholar

Waltman, L. & van Eck, NJ dans Springer Handbook of Science and Technology Indicators (eds. Glänzel, W. et al.) 281–300 (Springer, 2019).

Bornmann, L. Comment normaliser l'impact des citations en bibliométrie ? Une nouvelle approche combinant la normalisation côté citation et les centiles de citation. Quant. Sci. Étalon. 1, 1553-1569 (2020).

Article Google Scholar

Petersen, AM, Pan, RK, Pammolli, F. & Fortunato, S. Méthodes pour tenir compte de l'inflation des citations dans l'évaluation de la recherche. Rés. Politique 48, 1855-1865 (2019).

Article Google Scholar

Bornmann, L. & Mutz, R. Taux de croissance de la science moderne : une analyse bibliométrique basée sur le nombre de publications et de références citées. J. Assoc. Inf. Sci. Technol. 66, 2215-2222 (2015).

Article CAS Google Scholar

Bornmann, L., Haunschild, R. & Mutz, R. Taux de croissance de la science moderne : une approche de courbe de croissance latente par morceaux pour modéliser les numéros de publication à partir de bases de données de littérature établies et nouvelles. Humanité. Soc. Sci. Commun. 8, 1–15 (2021).

Article Google Scholar

Jones, BF & Weinberg, BA Dynamique des âges dans la créativité scientifique. Proc. Natl Acad. Sci. États-Unis 108, 18910–18914 (2011).

Article ADS CAS Google Scholar

Bonzi, S. & Snyder, H. Motivations pour la citation : une comparaison de l'auto-citation et de la citation aux autres. Scientometrics 21, 245–254 (1991).

Article Google Scholar

Fowler, J. & Aksnes, D. L'autocitation est-elle payante ? Scientometrics 72, 427–437 (2007).

Article Google Scholar

King, MM, Bergstrom, CT, Correll, SJ, Jacquet, J. & West, JD Men placent leurs propres citations en haut : le genre et l'autocitation dans tous les domaines et dans le temps. Socio 3, 2378023117738903 (2017).

Article Google Scholar

Mukherjee, S., Romero, DM, Jones, B. & Uzzi, B. Le lien presque universel entre l'âge des connaissances passées et les percées scientifiques et technologiques de demain : le hotspot. Sci. Adv. 3, e1601315 (2017).

Annonces d'article Google Scholar

Merton, RK Singletons et multiples dans la découverte scientifique : un chapitre de la sociologie des sciences. Proc. Suis. Philos. Soc. 105, 470–486 (1961).

Google Scholar

Wang, D., Song, C. & Barabási, A.-L. Quantifier l'impact scientifique à long terme. Sciences 342, 127-132 (2013).

Article ADS CAS Google Scholar

Leahey, E. Pas uniquement par la productivité : comment la visibilité et la spécialisation contribuent aux revenus académiques. Suis. Social. Rév. 72, 533–561 (2007).

Article Google Scholar

Tahamtan, I. & Bornmann, L. Éléments de base dans le processus de citation des publications : aperçu conceptuel de la littérature. J. Informetr. 12, 203-216 (2018).

Article Google Scholar

Tahamtan, I. & Bornmann, L. Que mesure le nombre de citations ? Une revue actualisée des études sur les citations dans les documents scientifiques publiés entre 2006 et 2018. Scientometrics 121, 1635–1684 (2019).

Article Google Scholar

Bhattacharya, J. & Packalen, M. Stagnation and Scientific Incentives (document de travail 26752), https://www.nber.org/papers/w26752 (2020).

Azoulay, P., Graff Zivin, JS & Manso, G. Incitations et créativité : preuves issues des sciences de la vie académiques. RAND J. Econ. 42, 527-554 (2011).

Article Google Scholar

Baltimore, D. ADN polymérase virale dépendante de l'ARN : ADN polymérase dépendante de l'ARN dans les virions des virus tumoraux à ARN. Nature 226, 1209-1211 (1970).

Article ADS CAS Google Scholar

Page, L. Méthode de classement des nœuds dans une base de données liée. Brevet américain 6 285 999 (2001).

Axel, R., Wigler, MH & Silverstein, SJ Procédés d'insertion d'ADN dans des cellules eucaryotes et de production de matières protéiques. Brevet américain 4 634 665 (1983).

Hawbaker, MS Variété de soja SE90346. Brevet américain 6,958,436 (2005).

Katsuki, T. & Sharpless, KB La première méthode pratique pour l'époxydation asymétrique. Confiture. Chim. Soc. 102, 5974–5976 (1980).

Riess, AG, et al. Preuve observationnelle des supernovae pour un univers en accélération et une constante cosmologique. Astre. J. 116, 1009 (1998).

Dirac, PAM La théorie quantique de l'électron. Proc. R. Soc. Londres. Une mathématique. Phys. Sci. 117, 610–624 (1928).

ANNONCES MATH Google Scholar

Sanger, F., Nicklen, S. & Coulson, Séquençage de l'ADN AR avec des inhibiteurs de terminaison de chaîne. Proc. Natl Acad. Sci. États-Unis 74, 5463–5467 (1977).

Article ADS CAS Google Scholar

Bednorz, JG & Müller, KA Possible supraconductivité à haute Tc dans le système Ba-La-Cu-O. Z. Phys. B Condens. Matière 64, 189–193 (1986).

Wuchty, S., Jones, BF & Uzzi, B. La domination croissante des équipes dans la production de connaissances. Sciences 316, 1036-1039 (2007).

Article ADS CAS Google Scholar

Guimera, R., Uzzi, B., Spiro, J. & Amaral, LAN Les mécanismes d'assemblage d'équipe déterminent la structure du réseau de collaboration et les performances de l'équipe. Sciences 308, 697–702 (2005).

Article ADS CAS Google Scholar

Jones, BF, Wuchty, S. & Uzzi, B. Équipes de recherche multi-universitaires : impact changeant, géographie et stratification en science. Sciences 322, 1259-1262 (2008).

Article ADS CAS Google Scholar

Grömping, U. Estimateurs d'importance relative dans la régression linéaire basée sur la décomposition de la variance. Suis. Statistique. 61, 139–147 (2007).

Article MathSciNetGoogle Scholar

Mukherjee, S., Uzzi, B., Jones, B. & Stringer, M. Une nouvelle méthode pour identifier les recombinaisons de connaissances existantes associées à une innovation à fort impact. J. Prod. Innov. Gérer. 33, 224-236 (2016).

Article Google Scholar

Christianson, NH, Sizemore Blevins, A. & Bassett, DS Architecture et évolution des réseaux sémantiques dans les textes mathématiques. Proc. R. Soc. A 476, 20190741 (2020).

Article ADS MathSciNet MATH Google Scholar

Newman, MEJ La structure des réseaux de collaboration scientifique. Proc. Natl Acad. Sci. États-Unis 98, 404–409 (2001).

Article ADS MathSciNet CAS MATH Google Scholar

Newman, MEJ Réseaux de collaboration scientifique. I. Construction du réseau et résultats fondamentaux. Phys. Rev. E 64, 016131 (2001).

Article ADS CAS Google Scholar

Uzzi, B. & Spiro, J. Collaboration et créativité : le problème du petit monde. Suis. J. Social. 111, 447–504 (2005).

Article Google Scholar

Funk, RJ Tirer le meilleur parti de l'endroit où vous vous trouvez : géographie, réseaux et innovation dans les organisations. Acad. Gérer. J. 57, 193–222 (2014).

Article Google Scholar

Barabasi, A.-L. Science du réseau (Cambridge Univ. Press, 2016).

Blau, DM & Weinberg, BA Pourquoi la main-d'œuvre américaine en science et ingénierie vieillit rapidement. Proc. Natl Acad. Sci. États-Unis 114, 3879–3884 (2017).

Article ADS CAS Google Scholar

Cui, H., Wu, L. & Evans, JA Scientifiques vieillissants et progrès ralentis. Préimpression sur https://doi.org/10.48550/arXiv.2202.04044 (2022).

Azoulay, P., Fons-Rosen, C. & Graff Zivin, JS La science avance-t-elle un enterrement à la fois ? Suis. Écon. Rév. 109, 2889–2920 (2019).

Article Google Scholar

Télécharger les références

Cette étude a été soutenue par la National Science Foundation (subvention n° 1829168, 1932596 et 1829302).

Carlson School of Management, Université du Minnesota, Minneapolis, MN, États-Unis

Michael Park et Russell J. Funk

École de sociologie, Université d'Arizona, Tucson, Arizona, États-Unis

Erin Leahey

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

RJF et EL ont collaboré à la conception et à la conception de l'étude. RJF et MP ont collaboré à l'acquisition, l'analyse et l'interprétation des données. RJF a créé le logiciel utilisé dans l'étude. RJF, EL et MP ont rédigé et révisé le manuscrit en collaboration.

Correspondance à Russell J. Funk.

Les auteurs ne déclarent aucun intérêt concurrent.

Nature remercie Diana Hicks et les autres examinateurs anonymes pour leur contribution à l'examen par les pairs de ce travail. Les rapports des pairs examinateurs sont disponibles.

Note de l'éditeur Springer Nature reste neutre en ce qui concerne les revendications juridictionnelles dans les cartes publiées et les affiliations institutionnelles.

Cette figure donne un aperçu de la répartition des CD5 pour les articles (n = 24 659 076) et les brevets (n = 3 912 353). Les panneaux a et c montrent le nombre d'articles et de brevets sur des intervalles discrets de CD5. Les panneaux b et d montrent la distribution de CD5 dans le temps, à des intervalles de 10 (articles) et 5 (brevets) ans, à l'aide de diagrammes de valeurs alphabétiques. Ces diagrammes sont similaires aux boîtes à moustaches, mais fournissent généralement des résumés plus fiables pour les grands ensembles de données. Ils sont dessinés en identifiant la médiane de la distribution sous-jacente, puis en dessinant de manière récursive des boîtes vers l'extérieur à partir de là dans les deux sens qui englobent la moitié des données restantes.

Données source

Cette figure évalue la sensibilité de nos résultats à l'utilisation de différentes fenêtres de citation directe lors du calcul de l'indice CD pour les articles (n = 24 659 076) et les brevets (n = 3 912 353). Dans le corps du texte, l'indice est calculé sur la base des citations d'articles et de brevets et de leurs références rétroactives à partir de 5 ans après l'année de publication. a et c tracent l'indice CD en utilisant une fenêtre prospective plus longue de 10 ans, pour les articles et les brevets, respectivement. b et d tracent l'indice CD en utilisant toutes les citations vers l'avant d'échantillons d'articles et de brevets à partir de l'année 2017. Les bandes ombrées correspondent à des intervalles de confiance à 95 %. Dans l'ensemble, les résultats reflètent ceux rapportés dans le texte principal, bien que la baisse soit un peu plus prononcée en utilisant des fenêtres de citations plus longues, ce qui suggère que nos résultats primaires peuvent représenter une estimation plus prudente.

Données source

Cette figure montre les changements dans le rapport des mots uniques au total (également connu sous le nom de rapport type-token) au fil du temps sur la base des données des résumés des articles (a, n = 76 domaine de recherche WoS × observations de l'année) et des brevets (b, n = 229 catégorie de technologie NBER × observations de l'année). Pour les articles, les lignes correspondent aux domaines de recherche WoS ; pour les brevets, les lignes correspondent aux catégories de technologie NBER. Pour les résumés d'articles, les lignes commencent en 1992 car WoS n'enregistre pas de manière fiable les résumés des articles publiés avant le début des années 1990. Le rapport entre les mots uniques et le nombre total de mots est calculé séparément par domaine (c'est-à-dire que l'unicité des mots et le nombre total de mots sont déterminés dans les domaines de recherche WoS et les catégories technologiques NBER). Si la perturbation diminue, nous pouvons vraisemblablement nous attendre à voir une diminution de la diversité des mots utilisés par les scientifiques et les inventeurs, car les découvertes et les inventions seront moins susceptibles de créer des écarts par rapport au statu quo, et seront donc moins susceptibles de devoir introduire nouvelle terminologie. Pour les articles et les brevets, nous observons une diminution de la diversité dans l'utilisation des mots au fil du temps, ce qui est conforme à cette attente et corrobore nos conclusions à l'aide de l'index CD.

Données source

Cette figure montre l'évolution des modèles de nouveauté/conventionnalité combinatoire des articles (a, n = 24 659 076) et des brevets (b, n = 3 912 353), en utilisant une mesure précédemment proposée des « combinaisons atypiques »14. La mesure quantifie le degré auquel les travaux antérieurs cités par un article ou un brevet seraient attendus par hasard. Pour les articles, nous suivons les travaux antérieurs14 et considérons des combinaisons de revues citées. Si un article a fait trois citations de travaux antérieurs et que ces travaux ont été publiés dans trois revues différentes – Nature, Cell et Science – alors il y a trois combinaisons – Nature × Cell, Nature × Science et Science × Cell. Pour déterminer dans quelle mesure chaque combinaison serait attendue par hasard, la fréquence des appariements observés est comparée à celle de 10 copies «recâblées» du réseau de citations global, à l'aide d'un score z. Pour les brevets, il n'y a pas d'analogue naturel aux revues, et par conséquent, nous envisageons des paires de codes primaires du système de classification des brevets des États-Unis (USPC). Nous présentons les résultats de cette analyse suivant l'approche des travaux antérieurs14, qui tracent la fonction de distribution cumulative de la mesure. En général, il y a un déplacement vers la droite dans les distributions cumulatives au fil du temps, ce qui suggère que pour les articles et les brevets, les combinaisons sont plus conventionnelles que ce à quoi on pourrait s'attendre par hasard, conformément à ce que nous anticipions sur la base de nos résultats en utilisant l'indice CD. Pour les brevets, il y a aussi un plus petit déplacement dans la direction opposée sur le côté gauche de la distribution, ce qui suggère que les nouveaux brevets des dernières décennies sont un peu plus nouveaux que les nouveaux brevets des décennies précédentes. Dans l'ensemble, cependant, la majeure partie de la distribution se déplace vers la droite, ce qui indique une plus grande conventionnalité.

Cette figure montre la contribution relative des effets fixes domaine, année et auteur au R2 ajusté dans les modèles de régression prédisant CD5. La barre supérieure montre les résultats pour les articles (n = 80 607 091 articles × observations de l'auteur) ; la barre inférieure montre les résultats pour les brevets (n = 8 319 826 brevets × observations d'inventeurs). Les résultats suggèrent que, tant pour les articles que pour les brevets, les caractéristiques stables des auteurs contribuent de manière significative aux schémas de perturbation. De plus, relativement peu de la variation est expliquée par des facteurs spécifiques au domaine.

Données source

Cette figure montre les changements de CD5 au fil du temps sur quatre sources de données supplémentaires (les lignes WoS [n = 24 659 076] et Patents View [n = 3 912 353] sont incluses pour référence) : JSTOR (n = 1 703 353), le corpus de l'American Physical Society (n = 478 373), Microsoft Academic Graph (n = 1 000 000) et PubMed (n = 16 774 282). Les couleurs indiquent les six sources de données différentes. Les bandes ombrées correspondent aux intervalles de confiance à 95 %. Le chiffre indique qu'il est peu probable que la baisse des perturbations soit due à notre choix d'échantillons d'articles WoS et de brevets.

Données source

Cette figure montre la baisse de la perturbation des papiers (a, n = 100 000) et des brevets (b, n = 100 000) sur la base de deux mesures alternatives de la perturbation. Les lignes bleues calculent la perturbation en utilisant une mesure proposée dans Bornmann et al.13, \({{DI}}_{l}^{{nok}}\) où l = 5, ce qui rend la mesure plus résistante aux changements marginaux de le nombre d'articles ou de brevets qui ne citent que les références du travail focal. Les lignes orange calculent la perturbation à l'aide d'une mesure proposée dans Leydesdorff et al.15, DI*, qui rend la mesure moins sensible aux petits changements dans les schémas de citation vers l'avant des articles ou des brevets qui ne font pas de citations vers l'arrière. Les bandes ombrées correspondent aux intervalles de confiance à 95 %. Avec les deux mesures alternatives, nous observons une diminution de la perturbation pour les articles et les brevets, ce qui suggère que la baisse n'est pas un artefact de notre opérationnalisation de la perturbation.

Données source

Ce chiffre évalue si les baisses de perturbation peuvent être attribuées à des changements dans les pratiques de publication, de citation et de paternité des articles (n = 24 659 076) et des brevets (n = 3 912 353). Les panels a et d s'ajustent à ces changements en utilisant une approche de normalisation. Nous présentons deux versions alternatives de l'index CD, qui tiennent toutes deux compte de la tendance des articles et des brevets à citer davantage de travaux antérieurs au fil du temps. Les lignes bleues indiquent la normalisation au niveau de l'article (en tenant compte du nombre de citations faites par l'article/le brevet focal). Les lignes orange indiquent une normalisation au niveau du domaine et de l'année (en tenant compte du nombre moyen de citations faites par des articles/brevets dans le domaine et l'année ciblés). Les panels b (articles) et e (brevets) ajustent les changements dans les pratiques de publication, de citation et de paternité en utilisant une approche de régression. Les panneaux montrent les valeurs prédites de CD5 sur la base des régressions rapportées dans les modèles 4 (articles) et 8 (brevets) du tableau supplémentaire 1, qui s'ajustent pour le domaine × année - Nombre de nouveaux articles/brevets, nombre moyen d'articles/brevets cités, moyenne nombre d'auteurs/inventeurs par article/brevet — et au niveau de l'article/du brevet — nombre d'articles/brevets cités, nombre de références non liées — caractéristiques. Les prévisions sont faites séparément pour chaque indicateur annuel inclus dans les modèles ; nous connectons ensuite ces prédictions séparées avec des lignes pour faciliter l'interprétation. Enfin, les panels c (articles) et f (brevets) s'ajustent aux changements dans les pratiques de publication, de citation et de paternité en utilisant une approche de simulation. Les panneaux tracent des scores z qui comparent les valeurs de CD5 obtenues à partir des réseaux de citations observés à celles obtenues à partir de copies recâblées au hasard des réseaux observés. Sur les six panels, les bandes ombrées correspondent à des intervalles de confiance à 95 %.

Données source

Ce chiffre montre le nombre d'articles (n = 24 659 076) publiés (a) et de brevets (n = 3 912 353) accordés (b) au fil du temps. Pour les articles, les lignes correspondent aux domaines de recherche WoS ; pour les brevets, les lignes correspondent aux catégories de technologie NBER.

Données source

Sections supplémentaires 1 à 3, tableaux 1 à 3 et références.

Springer Nature ou son concédant (par exemple une société ou un autre partenaire) détient les droits exclusifs sur cet article en vertu d'un accord de publication avec le ou les auteurs ou autre(s) titulaire(s) des droits ; l'auto-archivage par l'auteur de la version manuscrite acceptée de cet article est uniquement régi par les termes de cet accord de publication et la loi applicable.

Réimpressions et autorisations

Park, M., Leahey, E. & Funk, RJ Les documents et les brevets deviennent moins perturbateurs au fil du temps. Nature 613, 138-144 (2023). https://doi.org/10.1038/s41586-022-05543-x

Télécharger la citation

Reçu : 14 février 2022

Accepté : 08 novembre 2022

Publié: 04 janvier 2023

Date d'émission : 05 janvier 2023

DOI : https://doi.org/10.1038/s41586-022-05543-x

Toute personne avec qui vous partagez le lien suivant pourra lire ce contenu :

Désolé, aucun lien partageable n'est actuellement disponible pour cet article.

Fourni par l'initiative de partage de contenu Springer Nature SharedIt

Journal de Chemininformatique (2023)

Comportement humain naturel (2023)

Génie biomédical de la nature (2023)

Communication Nature (2023)

Nature (2023)

En soumettant un commentaire, vous acceptez de respecter nos conditions d'utilisation et nos directives communautaires. Si vous trouvez quelque chose d'abusif ou qui ne respecte pas nos conditions ou directives, veuillez le signaler comme inapproprié.