Windows

Hadoop obtiene más búsqueda con MapR, Cloudera publica

Chandler Hoisington, D2iQ | D2iQ Journey to Cloud Native

Chandler Hoisington, D2iQ | D2iQ Journey to Cloud Native
Anonim

Los usuarios de la plataforma de procesamiento de datos Hadoop ahora tienen otras dos herramientas para ayudarlos a clasificar sus montañas de información.

La nueva distribución M7 de MapR elimina las capas Hadoop JVM para aumentar el rendimiento

Hadoop el distribuidor MapR ha integrado LucidWorks Search en su propia distribución. Cloudera, por su parte, lanzó el primer lanzamiento completo de su motor de consulta Open Impala SQL para Hadoop.

[Más información: los mejores servicios de transmisión de TV]

"Usar la búsqueda como interfaz de usuario para Big Data es muy interesante. La búsqueda es adecuada para aprovechar una gran cantidad de diferentes tipos de información, especialmente información no estructurada ", dijo Jack Norris, director de marketing de MapR. "Estamos viendo algunas aplicaciones realmente interesantes con los motores de búsqueda en su núcleo, incluso si un usuario típico no pensaría en ellas como motor de búsqueda."

LucidWorks Search es la versión comercial de la fuente abierta Apache Lucene / Solr completa - motor de búsqueda de texto. Con la nueva integración MapR, LucidWorks Search puede buscar a través de datos en Hadoop File Systems (HDFS) o en archivos en otros sistemas de archivos.

LucidWorks Search ofrece instantáneas y espejos de alta disponibilidad, y elimina gran parte del trabajo requerido para instala Lucene / Solr desde cero. También ofrece soporte nativo para más fuentes de datos, una interfaz gráfica de usuario y un marco de seguridad.

El motor de búsqueda podría usarse en una aplicación web dinámica para recuperar rápidamente fotos, publicidad, recomendaciones de productos y otra información que pueda usarse para poblar sitios web sobre la marcha. "Este no es un sustituto de menor costo para los almacenes de datos. Se trata de aprovechar nuevas fuentes de datos y hacer algunas cosas que tienen un impacto dramático en el negocio ", dijo Norris.

MapR y LucidWorks han estado trabajando juntos en el emparejamiento de sus tecnologías desde 2011, cuando formaron un acuerdo de marketing conjunto. A principios de este año, lanzaron un conector que facilita el uso de Lucene / Solr con la distribución de MapR Hadoop.

LucidWords Search funciona con la nueva distribución M7 de MapR, en formato beta. Además de soportar LucidWorks Search, la edición M7 ha sido reestructurada para eliminar compactaciones o verificaciones de consistencia de fondo, acelerando el rendimiento.

También esta semana, Cloudera lanzó la versión 1.0 de Cloudera Impala, un motor de consulta de código abierto compatible con SQL para Hadoop. SQL es el lenguaje de interfaz de base de datos utilizado en los sistemas de administración de bases de datos relacionales (RDMS) y es conocido por los administradores de bases de datos.

Impala fue diseñado para ejecutar consultas más rápido que Hiveop's Hive, porque no usa el framework MapReduce, que requiere resultados de búsqueda para escribir en el disco. En cambio, los usuarios pueden consultar los datos almacenados en HDFS y HBase directamente. Los usuarios pueden consultar datos de forma interactiva o mediante procesos por lotes.

Cloudera lanzó por primera vez una versión de este motor en octubre pasado como versión beta. Desde entonces, el software ha sido probado por compañías como 37signals y Expedia.

Impala es el componente principal del paquete complementario Cloudera Enterprise RTQ (Consulta en tiempo real) para la plataforma Cloudera Hadoop. Impala puede descargarse sin costo.

Actualizado el 6 de mayo para corregir la información sobre la tecnología Cloudera Impala.