Un index géant comprenant des millions de documents de recherche est mis en ligne gratuitement

Avatar photo

Avec la quantité de recherches publiées chaque jour dans le monde entier, un moteur de recherche ultra-rapide est devenu essentiel pour aider à analyser les innombrables documents universitaires. Face à ce défi, un technologue a trouvé un moyen de déverrouiller les documents de recherche du monde entier pour en faciliter l’analyse informatisée. Il a publié un index de quelque 107,2 millions d’articles de journaux en ligne, y compris de nombreux documents de recherche payants, totalisant 38 To de données sous leur forme non compressée.

L’index général, créé par l’archiviste américain Carl Malamud, a été publié le 7 octobre et peut être utilisé gratuitement. L’index contient plus de 355 milliards de fragments de phrases et de mots répertoriés à côté des articles dans lesquels ils apparaissent. “Il s’agit d’un effort pour aider les scientifiques à utiliser des logiciels pour glaner des informations dans les travaux publiés, même s’ils n’ont pas d’accès légal aux articles sous-jacents”, a déclaré M. Malamud à la revue Nature.

L’objectif premier de cet index est d’aider à l’exploration de textes, un processus qui consiste à utiliser des ordinateurs pour analyser rapidement des millions de points de données afin de trouver des références à quelque chose de spécifique. Les humains ne peuvent pas lire les données de millions d’articles de journaux, mais un programme informatique connecté à l’index général le peut.

Un ensemble de chercheurs, qui ont eu un accès précoce à l’index, l’ont qualifié d’évolution majeure. Gitanjali Yadav, biologiste informaticien à l’université de Cambridge, au Royaume-Uni, qui étudie les composés organiques volatils émis par les plantes, a déclaré que cet index aidera les chercheurs à accéder à de nombreux articles de recherche qui existaient déjà mais qui étaient auparavant perdus quelque part. Auparavant, les chercheurs étaient limités à l’exploration des articles en libre accès ou de ceux auxquels ils étaient abonnés. Mais cet index leur sera d’une grande aide.

M. Malamud a déclaré que son index ne contient que des bribes de cinq mots maximum, de sorte que sa publication n’enfreint pas les restrictions des éditeurs en matière de droits d’auteur.


Pour connaître les dernières nouvelles et critiques technologiques, suivez Gadgets 360 sur Twitter, Facebook, et Google News. Pour les dernières vidéos sur les gadgets et la technologie, abonnez-vous à notre chaîne YouTube.

La vidéo du test de vitesse Google Pixel 6 Pro vs iPhone 13 Pro Max montre un résultat très serré.

Related Posts