RDFa, Microformatos..... y Google!

Nota: artículo largo (1000 palabras, ~5 min).

Hace algunos días me informé vía Nico, Twine y otros sobre el soporte que dará Google a los microformatos y en general a los metadatos "embebidos" en las páginas web. Esto es una gran noticia y, si quieres saber por qué, sigue leyendo.

¿Qué son los microformatos?

Las páginas web contienen mucha información, de diversos tipos. Por ejemplo, en las páginas de una empresa podemos encontrar la descripción de las actividades de ésta, las personas que trabajan en ella, los productos que ofrecen, entre otras muchas cosas. Así por ejemplo, podemos tener algo como:

<html>
    <head><title>Página de Juan Perez</title></head>
    <body>
    <p>
        Juan Perez, Gerente General<br/>
        <a href="http://www.acme.com">Empresas ACME S.A.</a><br/>
        Tel: 555-6789<br/>
        Email: jperez@acme.com<br/>
    </p>
    </body>
</html>

Aunque esto es (X)HTML válido e incluso sea fácil de entender para los humanos (qué parte del texto es el nombre, cuál el teléfono, etc.), no es tan fácil para los computadores: con ellos hay que ser muy específico de qué cosa es que.

Es así que se crearon los microformatos, que son sintaxis para especificar información sobre dominios muy específicos, tales como contactos, eventos, licencias y muchos más. Para especificar la información (cuál es el nombre, cuál es el teléfono) para que las máquinas lo puedan entender, podemos usar el microformato hCard, que aplicado al ejemplo anterior, quedaría así:

<html>
    <head><title>Página de Juan Perez</title></head>
    <body>
        <div class="vcard">
        <p>
            <span class="fn">Juan Perez</span>, <span class="title">Gerente General</span><br/>
            <a class="fn org url" href="http://www.acme.com">Empresas ACME S.A.</a><br/>
            Tel:<span class="tel">555-6789</span><br/>
            Email:<span class="email">jperez@acme.com</span><br/>
        </p>
        </div>
    </body>
</html>

Las diferencias no son muchas con el código anterior: comenzamos agregando un div de clase vcard para encerrar toda la información: Así especificamos que dentro de ese contenido nos encontraremos con información sobre una persona. El nombre Juan Perez lo ponemos entre 2 tags llamados span cuya clase es "fn". Algo similar hacemos con "Gerente General", indicando de esa manera que ese es el título de esa persona. El resto de los tags son más o menos intuitivos, pero en definitiva la única diferencia es que los datos están rodeados por span los cuales incluyen una clase y todo está "envuelto" en un div (el uso de estos tags no son obligatorios, pueden ser otros dependiendo de la situación, lo importante son los atributos). Algo tan simple como esto puede ayudar mucho para mejorar los resultados de búsquedas. Citando a Jim Hendler: "Con un poco de semántica ya se consigue ir muy lejos" .

¿Qué es RDFa?

RDFa es una sintaxis que permite incluir triples RDF en páginas XHTML. En cierta medida es similar a los microformatos, sin embargo, al ser una forma de incluir anotaciones semánticas en general, se puede usar para agregar información para la cual estos no existen. Para seguir con el ejemplo, si queremos escribir la misma información anterior pero en RDFa, tendríamos algo como:

<html xmlns:contact="http://www.w3.org/2001/vcard-rdf/3.0#">
    <head><title>Página de Juan Perez</title></head>
    <body>
        <p about="http://acme.com/people/jperez">
            <span property="v:fn">Juan Perez</span>, <span property="v:title">Gerente General</span><br/>
            <a rel="v:org" href="http://www.acme.com">Empresas ACME S.A.</a><br/>
            Tel:<span property="v:tel">555-6789</span>
            Email:<a rel="v:email" href="jperez@acme.com">jperez@acme.com</a>
        </p>
    </body>
</html>

Para el caso de RDFa, en el tag html definimos el espacio de nombres que vamos a utilizar (en este caso el de vcard-rdf para describir información sobre personas). En el tag p basta agregar sobre quién vamos a hablar (en algún momento escribí sobre la necesidad de tener un identificador para describir cosas y personas en la Web Semántica). Luego, el nombre lo encerramos en con un span que contenga un atributo "v:fn". Una diferencia importante es cuando nos referimos a la empresa: al no ser esta un valor (como el nombre), sino otra entidad (que puede tener características propias), nos referimos usando el atributo rel="v:org", donde lo que decimos es "La persona http://acme.com/people/jperez trabaja en la organización http://www.acme.com".

Nuevamente, sólo agregando algunos atributos y etiquetas más nuestra página queda completamente marcada y permite que los buscadores que trabajen con un poco de semántica puedan "entender" sobre qué se está escribiendo. Es importante destacar que para el despliegue en pantalla, la información se ve igual. Más aún, muchas páginas con información como ésta (tal como tu perfil de Facebook, Twitter, u otros) funcionan con una "plantilla" donde el sistema coloca la información pertinente. De esta forma no es necesario cambiar el formato de todos los usuarios de facebook, sino sólo en la plantilla.

¿Cómo se usan los MF?

Los microformatos no son usados directamente por los usuarios, sino para hacerle la vida más fácil a los motores de búsqueda. Cuando una araña de Google visite la página descrita, se encontrará con información enriquecida por los tags y atributos que hemos agregado: Así, las heurísticas de Google no tendrán que "adivinar" de qué estamos hablando, pues estamos siendo bien específicos. Estamos diciendo "Hay una persona, llamada Juan Perez, quien trabaja como Gerente General de la empresa ACME S.A. Su teléfono es el 555-6789 y su email es jperez@acme.com". Esto puede aprovecharse de 2 formas: Google dará mejores respuesta a consulta basadas en keywords, tales como buscar "acme gerente general". Otro acercamiento puede ser preguntarle a Google (quizás usando un lenguaje similar a SQL) "Dime el nombre y el email del gerente general de ACME S.A."

En resumen....

La idea de los microformatos, así como RDFa es simple, fácil de implementar y, sobre todo, permite que los buscadores puedan encontrar información "enriquecida" con metadatos, facilitando el trabajo de desambiguar términos y por lo tanto entregar mejores respuestas. Lo único que está faltando es tener una cantidad suficientemente grande de gente usando estas tecnologías. Creo que gracias al espaldarazo que Google le está dando a los microformatos y RDFa, estos se volverán más comunes y más sitios los utilizarán, haciendo la Web un poquito más "inteligente".

Imagen: Sitio de microformats.org

Tu voto: None Promedio: 5 (1 vote)

Comentarios

Foto de Nico

le interesa a otros sitios proveer datos?

A mi me interesa este tema!

Tengo una duda al respecto: Si bien el espaldarazo de google es bueno (y el de yahoo también), no me queda claro dónde esta el incentivo para que otros sitios que proveen información (amazon, imdb, last.fm, por nombrar algunos) utilicen RDFa o microformatos. Para nosotros es obvio que utilizar sólo meta tags para ayudar a la máquinas de búsqueda no equivale al poder que otorga la web semántica, pero... será obvio para los proveedores de contenidos?

Foto de Mañungo

Operator para Firefox

Si hay formas en que los usuarios hagan uso "ahora ya" de los microformatos... con la extensión Operator de Firefox.

Por ejemplo, puedes agendar los conciertos que promociona Last.fm con el esfuerzo de 2 clicks :)

--
Mañungo

Foto de Alvaro

¿Porqué no?

Se me ocurren otras objeciones, pero en particular, a ti como proveedor de contenidos te interesa que éste sea accesado por otros (por algo lo estás publicando). Ahora, si puedes enriquecer la información que entregas, quizás pierdas tamaño de audiencia, pero ganarás especificidad (gente que busca realmente la información que tu entregas).

Ahora el asunto es dar a conocer que es posible hacer esto a las diversas organizaciones... Quizás lo más difícil (en este momento) sea monetizar varios aspectos del proceso de publicación, pero sin duda, quien lo logre va a hacerse millonario ;-)


agraves

Foto de Nico

y qué haremos al respecto?

gracias por la respuesta!

y, siguiendo con el ejercicio: qué se te/les ocurre que manzana mecánica podría proveer como datos semánticos?
Por ejemplo, podríamos poner datos de autoría, artículos referenciados, imágenes usadas, etc. Pero... cómo dar el salto a que el conocimiento incrustado en el artículo esté disponible para las nuevas y astutísimas máquinas de búsqueda?

Foto de Alvaro

Buena pregunta

El integrar RDFa es muy específico de cada herramienta. Personalmente no conozco gente trabajando con Drupal (además de no considerarme un experto sobre este), pero una búsqueda rápida me da algunos links que pueden ser de utilidad

RDF Content Construction Kit

Módulo para RDF en Drupal

Ahora, otro desafío es crear GUI que permita anotar dentro de los artículos RDFa sin que esto sea un proceso tedioso, pero eso es harina de otro costal de lo cual no he visto mucho (Nata?)

Finalmente les dejo con un video sobre como usar RDFa en Drupal

n/d
Foto de Mig

se viene?

la manzana semántica? :-)

"Cultura libre con buena semántica"

Mig.
Manzana Mecánica: ¿Como quieres inmortalizar tu cultura?
Mi Twitter

Enviar un comentario

El contenido de este campo se mantiene como privado y no se muestra públicamente.
  • HTML permitido: <a> <em> <strong> <pre> <ul> <ol> <li> <img> <blockquote> <br> <div> <h2> <h3> <hr> <object> <embed>
  • Saltos automáticos de líneas y de párrafos.
  • Las direcciones de las páginas web y las de correo se convierten en enlaces automáticamente.

Más información sobre opciones de formato