Módulo 5 Semana 3 ⭐ Actividades integradoras 5 y 6 ? Prepa-SEP
se centró en gran medida en el rastreo de texto en las páginas web, pero Google está inmerso en investigaciones sobre cómo analizar y organizar datos estructurados, dijo un científico de la compañía el viernes.
"Hay muchos datos estructurados en la Web y estamos no haciendo un buen trabajo presentándolo a nuestros usuarios ", dijo Alon Halevy durante una conferencia en la conferencia del Día de la Base de Datos de Nueva Inglaterra en el Instituto de Tecnología de Massachusetts,
Halevy se refería en parte a las llamadas fuentes de" Web profunda ", como las bases de datos que se encuentran detrás de los sitios web basados en formularios como Cars.com o Realtor.com. Google ha estado enviando consultas a varios formularios durante un tiempo, recuperando las páginas web resultantes e incluyéndolas en su índice de búsqueda si la información parece útil.
[Más información: los mejores servicios de transmisión de TV]Pero la empresa también quiere analizar los datos encontrados en tablas estructuradas en muchos sitios web, dijo Halevy, ofreciendo como ejemplo una tabla en una página web que enumera los presidentes de los Estados Unidos.
Y hay montones de esas tablas: el índice de Google apareció 14 mil millones de ellos, según Halevy. "Se dio cuenta muy rápidamente de que más del 98 por ciento de estos no son tan interesantes", pero incluso después de un filtrado significativo quedan aproximadamente 154 millones de tablas que vale la pena indexar, dijo.
Uno de los objetivos principales de Google es proporcionar resultados que organicen "aspectos "de una consulta de búsqueda, en particular una exploratoria como" viaje de Vietnam ", en oposición a una consulta de un hecho específico como" población de Vietnam ", dijo Halevy. La primera consulta generaría información sobre los requisitos de visa, el clima y los paquetes turísticos, por ejemplo.
La idea tiene ecos del servicio de búsqueda ofrecido por Kosmix, pero Google quiere ir más allá, según Halevy. "Kosmix le dará un 'aspecto', pero está adjunto a una fuente de información", dijo.
La búsqueda de "viajes a Vietnam" en Kosmix brinda un conjunto organizado de resultados que incluyen reseñas de restaurantes del New York Times, imágenes de Yahoo y Flickr, información comercial de Shopping.com y resultados web generales de Google.
"En nuestro caso, todos los aspectos podrían ser solo resultados de búsqueda web, pero los organizaríamos de manera diferente", dijo Halevy.
El software Double-Take apunta al centro de datos de utilidades
Especialista en software de protección de datos Double-Take Software apunta a ingresar al mercado de centros de datos de servicios públicos.
Microsoft Research desarrolla búsqueda de mapas para datos no estructurados
Microsoft Research India desarrolla tecnología diseñada para búsquedas de mapas utilizando datos de dirección no estructurados.
Investigador: los hackers pueden causar atascos al manipular datos de tráfico en tiempo real
Los piratas informáticos pueden influir en el flujo de tráfico en tiempo real "Sistemas de análisis para hacer que las personas conduzcan a los embotellamientos o para mantener las carreteras despejadas en áreas donde mucha gente usa los sistemas de navegación Google o Waze", un investigador alemán demostró en BlackHat Europa.