Le Web sémantique tel que l’ont imaginé les chercheurs n’est pas pour demain. Même que, pour certains analystes, il ne verra jamais le jour. Ce qui n’empêche nullement les entreprises de commencer à mettre ses techniques en application.
Les pages Web ont été conçues pour être lues par l’homme, et non par les machines. La masse de documents fournis par les moteurs de recherche en réponse à une simple interrogation ne peut être interprétée que par l’esprit humain. Un exemple souvent évoqué pour illustrer ce processus parfois lourd est celui des réservations de voyage. Une personne souhaitant passer deux semaines sur une plage des Caraïbes et qui soumet les informations pertinentes à un engin de recherche dans Internet devra consacrer un certain temps à examiner la volumineuse documentation qu’il recevra en retour.
Pourquoi ne pourrait-on pas confier la compilation des résultats à nos systèmes? Il serait alors possible d’épargner un temps précieux et de gagner en efficacité. Voilà ce à quoi rêvent nombre de chercheurs depuis les années 90. Les progrès des recherches menées à ce sujet ont donné naissance au concept de Web sémantique. Selon ce dernier, les systèmes ne font pas que répondre aux commandes qu’on leur soumet, mais sont capables d’une certaine réflexion, à la façon du cerveau humain. Pour y arriver, il importe d’ajouter à la Toile une couche permettant de donner un sens aux données. Davantage qu’un catalogue, le Web devient alors un guide.
Revenons à notre exemple. Avec le Web sémantique, tous les documents portant sur les réservations de voyage seraient analysés et hiérarchisés. Idéalement, la recherche produirait un forfait aussi complet et soigné que s’il avait été préparé par un agent de voyage.
En linguistique, la sémantique analyse le sens des mots. D’où l’appellation de ce Web nouveau genre. L’expression est apparue pour la première fois en 2001, dans un article coécrit par l’inventeur du World Wide Web, Tim Berners-Lee, et deux collègues. Certains le nomment aussi Web 3.0, ce qui implique que le Web sémantique succédera à l’actuel Web 2.0.
La nature exacte du Web 3.0 a donné lieu à bien des interprétations. Toutefois, on semble s’accorder de plus en plus sur la définition proposée par le journaliste John Markoff du New York Times, dans un article très remarqué, paru l’année dernière. Selon lui, le Web 3.0 est un « ensemble de technologies conférant aux ordinateurs des façons novatrices et efficaces de structurer les données et d’en tirer des conclusions ».
Le Web sémantique demeure à l’état embryonnaire. D’ici à ce qu’un volume minimal de données soit converti en un format que les systèmes pourront lire, on ne peut que l’imaginer. Entretemps, les sceptiques ne manquent pas. D’aucuns doutent que des gens d’affaires occupés puissent créer suffisamment de métadonnées pour faire fonctionner un tel modèle. D’autres se demandent si les ontologies destinées à interpréter les données aideront véritablement les ordinateurs à comprendre des concepts humains complexes.
Le monde des affaires entre dans la danse
Malgré tout, les adeptes se font de plus en plus nombreux. Si des géants tels HP et IBM s’y intéressent vivement, de jeunes entreprises embrassent aussi le concept. Parmi elles, la Californienne Radar Networks, qui a mis au point une technologie destinée à établir des relations entre des fragments d’information dans le cyberespace. Son fondateur, Nova Spivack, a aussi lancé EarthWeb dans les années 90, l’une des premières sociétés point-com.
Pour lui, le Web sémantique est une réalité. L’idée, croit-il, n’est pas d’avoir un seul Web sémantique, mais des milliers, voire des millions d’entre eux, chacun dans son secteur particulier. Le Web sémantique n’est pas distinct du Web actuel; il ne fait que s’y ajouter. Il fonctionne également à l’extérieur de la Toile, dans les applications et les bases de données, par exemple. Nova Spivack est d’avis que, même sans intelligence artificielle, on peut dores et déjà tirer avantage du concept.
On dit d’ailleurs que la prochaine phase du Web consistera en un amalgame de sémantique et de 2.0. Les entreprises ont commencé à combiner les deux. Eric Miller, qui a dirigé les recherches du World Wide Web Consortium (W3C) sur le Web sémantique, a fondé récemment la société de services-conseils Zepheira. À ses clients, il recommande de relier entre elles leurs sources d’informations disparates, tels intranets, bases de données et disques durs. Pour ce faire, ils ont recours au format RDF (Resource Description Framework) et à d’autres techniques simples du Web sémantique, qui aident à trouver et à filtrer l’information plus efficacement.
D’autres petites et grandes entreprises misent sur le Web sémantique. Citigroup, Eli Lilly, Kodak, Oracle, Google, Yahoo, Metaweb Technologies, Powerset et Zoominfo n’en sont que quelques exemples. Selon certaines estimations, la valeur du marché des produits et services fondés sur le Web 3.0 pourrait atteindre 50 milliards de dollars en 2010, alors qu’elle est de 7 milliards aujourd’hui.
À lire aussi cette semaine: Enrichissez votre vocabulaire
Perspectives : le Web sémantique Repères : le Web sémantique