Rankings, Google y Web Semántica

Durante el último siglo hemos visto como la cantidad de información disponible ha aumentado exponencialmente. Esto se hace más evidente con la llegada de la Web donde es posible tener al alcance de unos pocos clicks cantidades monstruosas de información, más allá de toda capacidad de un solo ser humano para procesarla y asimilarla. Más aún, nos encontramos con que mucha de ella no es lo que realmente estamos buscando.

Es así que necesitamos alguna forma de discriminar entre una cantidad abismante de información disponible. Las técnicas de Recuperación de la Información para la Web se han basado tradicionalmente en palabras claves o keywords. Sin embargo es difícíl diferenciar entre varios -posiblemente millones- de páginas cuál contiene la información más útil con respecto a lo que estamos buscando. Para lograr este objetivo es necesario discriminar. La idea de discriminar es la base de cualquier ranking(*), esto es, definir un orden (total o parcial) de un grupo de entidades basados en un conjunto de criterios.

Esta es una buena forma de manejar información, ya que no tenemos los recursos necesario (sean estos memoria, tiempo, etc.) para navegar entre todas las posibles páginas disponibles. Y esto es exactamente lo que hace Google: Nosotros preguntamos "Necesito encontrar páginas que contengan la palabras X, Y y Z" y Google responde "De acuerdo a mi algoritmo y la información que tengo, aquí hay una lista ordenada de qué es lo que creo que es lo más relevante a tu consulta".

La Web Semántica conlleva problemas similares, pero en este caso no estamos hablando sólo de páginas y links, sino sobre cualquier cosa (personas, autos, páginas web, ontologías, etc.) relacionadas de diversa forma (las personas tienen amigos, los autos tienen piezas, las páginas tiene autores y las ontologías describen conceptos). Así, el problema es mucho más complejo, ya que hay mucha más información disponible.

Asimismo aparecen varias preguntas nuevas: ¿Cual ontologías debería usar para cierto trabajo, dado que hay una docena de posibles candidatos? Si realizo una consulta basada en esta ontología y tengo un millón de posibles resultados (entre los que están mezclados autos, personas y páginas web), ¿Son todos los resultados igualmente relevantes para mi? Sino, ¿cuales se deberían mostrar primero?

La idea de la Web Semántica de abrir, compartir y mezclar los datos abre grandes oportunidades, así como hace todo mucho más complejo: No es suficiente tener mil respuestas posibles, como usuario quiero las más adecuadas para mi (independiente de lo que esto signifique).

(*) Como punto aparte, no existe una traducción de ranking en castellano..... si alguien conoce una palabra equivalente, agradeceré hacérmelo saber.

Imagen: W3C

Tu voto: None Promedio: 4 (2 votos)

Comentarios

Foto de Janoma

"Rank"

He leído y comentado en varias partes y con diversas personas que "rank" parece ser una de las palabras con más usos en inglés, y al mismo tiempo una de las más difíciles de traducir adecuadamente. En este caso parece mejor tu descripción que cualquier palabra: un orden sobre un conjunto de elementos de acuerdo a un criterio.

Foto de Janoma

Ése fui yo. Había olvidado

Ése fui yo. Había olvidado que tenía cuenta.

This is Snake. Do you read me, Otacon?

Foto de ChaTo

¿Ranking = Ordenación?

Yo normalmente uso "ordenación", ej.: "algoritmo de ordenación". Igual me suena muy raro :-)

ChaTo

Foto de Mig

Crees que Google se va a tener que meter en lo semántico

para mantener su supremacía como motor de busqueda principal?
yo creo que eso es lo principal para probar estos conceptos, hacerlos llegar a todo el mundo y que se auto-validen.

alguien le puede preguntar a Brin? :-)

Mig.
Manzana Mecánica: ¿Como quieres inmortalizar tu cultura?
Mi Twitter

Foto de Alvaro

google semántico

Mi impresión es que en algún momento lo va a tener que hacer. He escuchado de algunos proyectos en los que trabaja Google, así como ciertas críticas de Peter Norvig (Director de búsquedas de Google) hacia la aplicabilidad de la WS. Aún suponiendo que todas las críticas sean insolubles, hay un montón de oportunidades en el área de las X-informatics [geo|astro|quimio|bio|etc...], gobierno electrónico, sólo por nombrar algunas, donde la WS puede ser tremendamente exitosa..... y Google puede sacar provecho de ello.


agraves

Enviar un comentario

El contenido de este campo se mantiene como privado y no se muestra públicamente.
  • HTML permitido: <a> <em> <strong> <pre> <ul> <ol> <li> <img> <blockquote> <br> <div> <h2> <h3> <hr> <object> <embed>
  • Saltos automáticos de líneas y de párrafos.
  • Las direcciones de las páginas web y las de correo se convierten en enlaces automáticamente.

Más información sobre opciones de formato