Notebookcheck Logo

Le projet pilote de l'Index européen du Web ouvert donne accès à près d'un pétaoctet de données explorées

L'Open Web Index européen entre en phase pilote en juin (Source de l'image : Dall-E 3)
L'Open Web Index européen entre en phase pilote en juin (Source de l'image : Dall-E 3)
Le mois prochain, le consortium OpenWebSearch.eu ouvrira son projet pilote d'index fédéré Open Web Index, qui permettra aux chercheurs et aux développeurs d'accéder à près d'un pétaoctet de données web européennes.

Le consortium OpenWebSearch.eu ( ) ouvrira le premier Open Web Index (OWI) fédéré et paneuropéen à des testeurs externes le mois prochain. Ce projet pilote donne accès à près d'un pétaoctet de données web explorées et marque la première étape d'un index à long terme conçu pour atteindre 5 Po et, à terme, 10 Po de contenu.

Contrairement à un moteur de recherche classique, l'OWI fonctionne comme une bibliothèque numérique partagée que des services tiers - portails de recherche, fournisseurs de grands modèles linguistiques ou équipes de recherche - peuvent interroger pour récupérer des documents. Un partenariat de 14 membres composé d'universités, de centres de supercalcul, d'entreprises technologiques et du CERN finance l'infrastructure dans le but de réduire la dépendance de l'Europe à l'égard des index propriétaires gérés par Google, Microsoft et d'autres opérateurs basés aux États-Unis.

Les partisans de cette initiative affirment que la centralisation autour de plateformes axées sur la publicité a affaibli la qualité de la recherche et limité la couverture linguistique. En gérant un index à but non lucratif et fondé sur des normes au sein de l'espace réglementaire européen, le consortium espère encourager les services qui respectent les règles locales de protection des données, affichent des résultats en plusieurs langues et évitent la publicité agressive ou l'autoréférencement. Les régulateurs de Bruxelles et de Londres ont à plusieurs reprises contesté la domination des entreprises technologiques américaines pour ces mêmes raisons.

Pendant la durée du projet pilote, les groupes universitaires, les jeunes entreprises et les développeurs individuels peuvent obtenir l'ensemble des données sous une licence de recherche générale ou demander une licence commerciale. Ursula Gmelch, responsable de la communauté, décrit ce lancement comme "un premier pas vers une véritable souveraineté numérique européenne", ajoutant que les premières réactions permettront de déterminer comment l'indice évoluera pour s'adapter à la demande du monde réel. L'équipe est particulièrement intéressée par la recherche verticale et argumentée, la génération augmentée par la recherche et les applications d'IA connexes.

Le calendrier s'aligne sur InvestAI, le programme de la Commission européenne qui vise à mobiliser 200 milliards d'euros (environ 224,7 milliards de dollars) pour des projets d'intelligence artificielle. Une session Zoom ouverte, prévue le 6 juin de 10 heures à midi (CEST), permettra aux participants de se familiariser avec la plateforme et de recevoir des informations d'identification. En cas de succès, l'essai pourrait donner aux petites et moyennes entreprises européennes la matière première nécessaire pour créer des outils de recherche et d'intelligence artificielle compétitifs, indépendamment des écosystèmes américains dominants.

Source(s)

OpenWebSearch (en anglais)

Please share our article, every link counts!
Mail Logo
> Revues et rapports de ordinateurs portatifs et smartphones, ordiphones > Archives des nouvelles 2025 05 > Le projet pilote de l'Index européen du Web ouvert donne accès à près d'un pétaoctet de données explorées
Nathan Ali, 2025-05-20 (Update: 2025-05-20)