Bezelweb

Les facettes du Web

Schema.org : Les moteurs de recherche s’associent pour normaliser les formats de données sémantiques

En juin 2011, Google, Bing et Yahoo ont lancés le site Schema.org dans le but de créer un référentiel pour la représentation des données sémantiques et ainsi améliorer l’indexation des sites.

En 2006, les 3 acteurs majeurs de la recherche s’étaient déjà mis d’accord pour le format sitemap qui permet de décrire l’organisation d’un site. Cette fois c’est la structure et le sens des données sur la page qui sont concernés.

Tim Berners Lee en 1998 dans une Introduction à l’architecture du web sémantique, explique le besoin et la solution :

… la plupart des informations sur le web sont conçues pour la consommation humaine … et la structure des données n’est pas évidente pour un robot qui parcours le web … laissant de côté l’intelligence artificielle qui essaie de se comporter comme les humains, l’approche du web sémantique est de développer à la place un langage pour exprimer les informations dans une forme traitable par les machines.

Le format microdata est mis en avant par schema.org, mais microformat ou RDFa sont aussi supportés par les moteurs de recherche. Microdata est un format mis au point par Google. Il allie l’extensibilité de RDFa et la simplicité de microformat  :

  • RDFa : ajout de vocabulaire au XHTML par des namespaces,
  • Microformat : utilise des classes HTML pour décrire les entités,
  • Microdata : spécification proposée d’abord au WHATWG puis en brouillon auW3C qui ajoute des attributs itemprop, itemscope, itemtype au HTML5

Des centaines de représentations existent d’ors et déjà, comme la description d’une personne, d’un lieu, d’un événement, classés en grandes catégories :

  • Avis
  • Personnes
  • Produits
  • Entreprises et organisations
  • Recettes
  • Événements

Sur les pages de résultats de recherche Google, cela se traduit par l’affichage d’extraits enrichis ( rich snippets ) en dessous des liens donnant par exemple les détails des horaires d’une séance de cinéma, le tarif, les acteurs etc

Article original sur PaaSthru ( Suivez le Blog PaaSthru pour l’actu des API, de l’OpenData et du développement Web  )

Sources :

http://googleblog.blogspot.com/2011/06/introducing-schemaorg-search-engines.html

http://www.developpez.com/actu/32823/Web-semantique-Microsoft-Google-et-Yahoo-collaborent-sur-un-microformat-pour-structurer-le-HTML-pour-les-moteurs-de-recherche/

WordPress SEO fine-tune by Meta SEO Pack from Poradnik Webmastera

Page optimized by WP Minify WordPress Plugin

Close