Le consortium OpenWebSearch.eu ( ) ouvrira le premier Open Web Index (OWI) fédéré et paneuropéen à des testeurs externes le mois prochain. Ce projet pilote donne accès à près d'un pétaoctet de données web explorées et marque la première étape d'un index à long terme conçu pour atteindre 5 Po et, à terme, 10 Po de contenu.
Contrairement à un moteur de recherche classique, l'OWI fonctionne comme une bibliothèque numérique partagée que des services tiers - portails de recherche, fournisseurs de grands modèles linguistiques ou équipes de recherche - peuvent interroger pour récupérer des documents. Un partenariat de 14 membres composé d'universités, de centres de supercalcul, d'entreprises technologiques et du CERN finance l'infrastructure dans le but de réduire la dépendance de l'Europe à l'égard des index propriétaires gérés par Google, Microsoft et d'autres opérateurs basés aux États-Unis.
Les partisans de cette initiative affirment que la centralisation autour de plateformes axées sur la publicité a affaibli la qualité de la recherche et limité la couverture linguistique. En gérant un index à but non lucratif et fondé sur des normes au sein de l'espace réglementaire européen, le consortium espère encourager les services qui respectent les règles locales de protection des données, affichent des résultats en plusieurs langues et évitent la publicité agressive ou l'autoréférencement. Les régulateurs de Bruxelles et de Londres ont à plusieurs reprises contesté la domination des entreprises technologiques américaines pour ces mêmes raisons.
Pendant la durée du projet pilote, les groupes universitaires, les jeunes entreprises et les développeurs individuels peuvent obtenir l'ensemble des données sous une licence de recherche générale ou demander une licence commerciale. Ursula Gmelch, responsable de la communauté, décrit ce lancement comme "un premier pas vers une véritable souveraineté numérique européenne", ajoutant que les premières réactions permettront de déterminer comment l'indice évoluera pour s'adapter à la demande du monde réel. L'équipe est particulièrement intéressée par la recherche verticale et argumentée, la génération augmentée par la recherche et les applications d'IA connexes.
Le calendrier s'aligne sur InvestAI, le programme de la Commission européenne qui vise à mobiliser 200 milliards d'euros (environ 224,7 milliards de dollars) pour des projets d'intelligence artificielle. Une session Zoom ouverte, prévue le 6 juin de 10 heures à midi (CEST), permettra aux participants de se familiariser avec la plateforme et de recevoir des informations d'identification. En cas de succès, l'essai pourrait donner aux petites et moyennes entreprises européennes la matière première nécessaire pour créer des outils de recherche et d'intelligence artificielle compétitifs, indépendamment des écosystèmes américains dominants.
Source(s)
OpenWebSearch (en anglais)
Top 10
» Le Top 10 des PC portables multimédia
» Le Top 10 des PC portables de jeu
» Le Top 10 des PC portables de jeu légers
» Le Top 10 des ordinateurs portables bureautiques
» Le Top 10 des PC portables bureautiques premium/professionnels
» Le Top 10 des Stations de travail mobiles
» Le Top 10 des Ultraportables
» Le Top 10 des Ultrabooks
» Le Top 10 des Convertibles
» Le Top 10 des Tablettes
» Le Top 10 des Tablettes Windows
» Le Top 10 des Smartphones
» Le Top 10 des PC Portables á moins de 300 euros
» Le Top 10 des PC Portables á moins de 500 euros
» Le Top 25 des meilleurs écrans d'ordinateurs