Componentes

Bienvenido a Web 3.0: búsquedas semánticas

3.1 Introducción a la Web Semántica

3.1 Introducción a la Web Semántica
Anonim

El modo palabra clave omnipresente de la técnica de búsqueda en Internet está a punto de ser adoptado por una nueva clase de tecnología de búsqueda semántica, según analistas de la firma de investigación Ovum.

Mientras que la búsqueda por palabra clave sigue siendo el método más popular, con los usuarios obteniendo a veces hasta 30,000 visitas en una búsqueda y luego teniendo que revisar una lista de resultados de palabras clave poco relacionadas para encontrar documentos relevantes.

"Aquí entra en juego una nueva clase de las llamadas tecnologías semánticas. algoritmos de clasificación como el PageRank de Google para predecir la relevancia, la búsqueda semántica se sumerge en el significado del lenguaje para producir resultados de búsqueda altamente relevantes ", según un informe publicado por los analistas de Ovum Mike Davis y Madan Sheina.

Semanti notable c Los proveedores web seleccionados por los analistas incluyen Expert System, Powerset, Yedda, Trovix y Hakia. Según los autores, la concientización sobre la búsqueda semántica aumentó cuando Microsoft eligió dos empresas de búsqueda semántica Powerset y Zoomix.

En el caso de Expert System, su aplicación, llamada Cogito, está diseñada según los principios de la comprensión humana para permitir que el contenido ser entendido de la manera en que el autor pretendió ser. Esto es algo que la búsqueda por palabras clave ignora.

"Una búsqueda en Google de la palabra 'jaguar' levantaría contenido alrededor del animal y el automóvil. La búsqueda semántica buscaría no solo la palabra clave sino también otras palabras como 'jungle' 'o' salón 'para separar los dos significados ", dijeron los autores.

Análisis más profundo

Además de la búsqueda semántica, hay otras formas, incluidas la heurística y la ontología, la lingüística y la minería de textos, y estadísticas. Sin embargo, Expert System afirma que estos enfoques son insuficientes y abordan solo los aspectos morfológicos y gramaticales del análisis.

Otros buscadores a menudo chocan contra una pared de ladrillos cuando se trata de un análisis profundo. Por ejemplo, cuando un motor de búsqueda conducido por la heurística ve dos adjetivos en una oración, generalmente los elimina y puntúa la oración como neutral porque no comprende dónde apuntan los dos adjetivos separados.

En comparación, la búsqueda semántica se ve tanto en la lógica de oraciones - cómo se relacionan las palabras en una oración - y en el análisis semántico - entendiendo el contexto de las palabras clave.

Cuando un término es ambiguo, lo que significa que puede tener varios significados, por ejemplo, corteza, es necesario un análisis semántico en otras palabras, que se ajustan para darle su verdadero significado y contexto.

Una base de datos léxica

Los ingenieros de Expert Systems dicen que Cogito puede hacer un esfuerzo adicional porque tiene una red semántica: una base de datos léxica que proporciona una representación del conocimiento de las definiciones de palabras y sus relaciones. Introdujo el diccionario de Webster en una base de datos en memoria, que comprende 350,000 palabras y 2,8 millones de relaciones. La red semántica de Expert System también se enfoca en palabras comunes. Eso es diferente de la mayoría de los enfoques ontológicos que se refieren a envolver el significado y el contexto en torno a contenido, como términos científicos, y omitir palabras comunes que comprenden el 90 por ciento de todo el contenido ", dijeron los autores de Ovum.

Sin embargo, la búsqueda semántica aún está plagada de" mucha exageración teórica pero poca sustancia real o prueba de que funciona mejor que la tecnología de búsqueda actual.

"Las redes semánticas son difíciles de construir y no todas son iguales. Es poco probable que las tecnologías semánticas puedan ofrecer una precisión del 100% en sus análisis y resultados. Además, aún existen interrogantes sobre problemas de rendimiento potencialmente pegajosos con búsquedas semánticas que consumen más ciclos de procesamiento. "