Androide

Investigador de Google apunta a datos estructurados de la Web

Módulo 5 Semana 3 ⭐ Actividades integradoras 5 y 6 ? Prepa-SEP

Módulo 5 Semana 3 ⭐ Actividades integradoras 5 y 6 ? Prepa-SEP
Anonim

se centró en gran medida en el rastreo de texto en las páginas web, pero Google está inmerso en investigaciones sobre cómo analizar y organizar datos estructurados, dijo un científico de la compañía el viernes.

"Hay muchos datos estructurados en la Web y estamos no haciendo un buen trabajo presentándolo a nuestros usuarios ", dijo Alon Halevy durante una conferencia en la conferencia del Día de la Base de Datos de Nueva Inglaterra en el Instituto de Tecnología de Massachusetts,

Halevy se refería en parte a las llamadas fuentes de" Web profunda ", como las bases de datos que se encuentran detrás de los sitios web basados ​​en formularios como Cars.com o Realtor.com. Google ha estado enviando consultas a varios formularios durante un tiempo, recuperando las páginas web resultantes e incluyéndolas en su índice de búsqueda si la información parece útil.

[Más información: los mejores servicios de transmisión de TV]

Pero la empresa también quiere analizar los datos encontrados en tablas estructuradas en muchos sitios web, dijo Halevy, ofreciendo como ejemplo una tabla en una página web que enumera los presidentes de los Estados Unidos.

Y hay montones de esas tablas: el índice de Google apareció 14 mil millones de ellos, según Halevy. "Se dio cuenta muy rápidamente de que más del 98 por ciento de estos no son tan interesantes", pero incluso después de un filtrado significativo quedan aproximadamente 154 millones de tablas que vale la pena indexar, dijo.

Uno de los objetivos principales de Google es proporcionar resultados que organicen "aspectos "de una consulta de búsqueda, en particular una exploratoria como" viaje de Vietnam ", en oposición a una consulta de un hecho específico como" población de Vietnam ", dijo Halevy. La primera consulta generaría información sobre los requisitos de visa, el clima y los paquetes turísticos, por ejemplo.

La idea tiene ecos del servicio de búsqueda ofrecido por Kosmix, pero Google quiere ir más allá, según Halevy. "Kosmix le dará un 'aspecto', pero está adjunto a una fuente de información", dijo.

La búsqueda de "viajes a Vietnam" en Kosmix brinda un conjunto organizado de resultados que incluyen reseñas de restaurantes del New York Times, imágenes de Yahoo y Flickr, información comercial de Shopping.com y resultados web generales de Google.

"En nuestro caso, todos los aspectos podrían ser solo resultados de búsqueda web, pero los organizaríamos de manera diferente", dijo Halevy.