Androide

Las compañías ofrecen servicios para procesar los datos brutos del gobierno

[PSEINT] Diagrama de Flujo y Pseudocódigo que calcula el salario de un trabajador.

[PSEINT] Diagrama de Flujo y Pseudocódigo que calcula el salario de un trabajador.
Anonim

¿Qué pasaría si un presidente de los EE. UU. Solicitara la publicación de una serie de datos gubernamentales, pero los números en bruto eran difíciles de entender?

A Un puñado de empresas y un proyecto de desarrollo de código abierto intentan asegurarse de que eso no suceda, ya que el presidente de EE. UU., Barack Obama, impulsa el gobierno abierto en los primeros días de su administración.

Los modelos comerciales difieren, pero algunas compañías están utilizando los datos brutos publicados en Data.gov y en otros lugares para demostrar el poder de sus servicios de publicación de datos y de procesamiento de números.

El lanzamiento de todos estos datos es una buena movida, pero gran parte está en formato crudo, lo que hace es difícil presentarlo de una manera que las personas puedan entender, dijo Kevin Merritt, CEO y fundador de Socrata, una compañía de dos años enfocada en ayudar a las agencias gubernamentales y otros usuarios de los datos a reorganizarla y republicarla en la Web.

Socrata llama a su ser vicio de reorganizar los datos en cuadros interactivos fáciles de leer y gráficos "descubrimiento de datos sociales".

"Los datos son valiosos, pero los datos sociales también son valiosos", dijo Merritt, un ex ejecutivo de Microsoft. "Una cosa es poner los datos en línea, pero otra cosa es obtener un ciclo de retroalimentación cívico".

Solo en Data.gov, había casi 400 conjuntos de datos sin procesar disponibles a partir del miércoles por la mañana.

Hay un base de datos de personas, informadas por país y región, que recibieron asilo en los EE. UU. entre 1998 y 2008; hay datos sobre sustancias químicas tóxicas liberadas en Guam en 2005; hay una base de datos de tornados, granizo grande e informes de viento dañinos de 1950 a 2006; hay datos sobre la geoquímica de las muestras de agua en los EE. UU.; y hay una base de datos de fundiciones de cobre en todo el mundo.

También hay datos sobre solicitudes de patentes, muertes en el lugar de trabajo, gastos federales de TI y rutas migratorias para aves. Hay 109,000 conjuntos de datos geográficos adicionales.

Vivek Kundra, CIO federal, se le preguntó en un foro reciente de la Comisión Federal de Comunicaciones de los EE. UU. Sobre la filosofía de la administración Obama sobre la publicación de datos. "Realmente no sabemos qué fuentes de datos conducirán a un mejor análisis", dijo. "Lo que estamos haciendo es que estamos tratando de liberar la mayor cantidad de datos posible. Como resultado de eso, estamos descubriendo que está ocurriendo una gran cantidad de innovación".

A medida que se publican los datos, muchos residentes de EE. UU. están detectando tendencias que los trabajadores del gobierno no habían visto antes, agregó. Por ejemplo, según los datos sobre los vuelos aéreos que suelen llegar tarde, los viajeros comienzan a evitar los vuelos de algunas aerolíneas a ciertas horas del día, dijo.

Socrata apunta sus productos a agencias gubernamentales, periodistas, investigadores y otras personas que desean dar sentido a los datos brutos. Ofrece un puñado de productos, incluida una oferta de nivel de entrada gratuita que permite a cualquier persona alojar datos en Socrata.com y un sitio de datos de marca alojado para grandes organizaciones. Socritta puede ayudar a las agencias gubernamentales a reducir los costos de almacenamiento y entrega de datos, dijo Merritt.

Socrata reformatea los datos de una variedad de formatos y permite a los usuarios compartir los datos en Twitter, Digg, Facebook y otros sitios web. La compañía opera desde la filosofía de que los datos deben compartirse, dijo Merritt.

"Los datos se vuelven más valiosos a medida que se propagan lejos de su origen", dijo. "La teoría es que, cuanto más se aleja de su origen, más personas la utilizan y, por lo tanto, los datos deben ser intrínsecamente más valiosos".

Otras empresas, incluidas iCharts y Visual i / o, están utilizando los datos del gobierno que continúan publicándose para demostrar el poder de sus productos de análisis visual o de publicación de gráficos.

Además, Sunlight Labs, creada por Sunlight Labs, está desarrollando un software de código abierto que hace uso de datos gubernamentales, y está alentando a otros desarrolladores a hacer lo mismo. Este año, Sunlight Labs ha organizado dos concursos para alentar el desarrollo de aplicaciones basadas en datos gubernamentales, y ha recibido más de 90 presentaciones.

Parte de la razón por la que la Sunlight Foundation comenzó Sunlight Labs fue para ayudar a periodistas tradicionales y ciudadanos con informes de investigación, dijo Clay Johnson, director de Sunlight Labs.

"A medida que la administración Obama comienza a publicar más datos, no hay suficientes dedos en los teclados aquí en Sunlight Labs para manejar todo esto ", dijo Johnson. "¿Pudo la administración Obama tener más datos del gobierno disponibles? Estás hablando con el hombre con la sed más insaciable para eso, que nunca dirá que tiene éxito".

ICharts no se enfoca exclusivamente en el gobierno datos, pero funciona para ayudar a los editores del sitio web a presentar la información en un formato fácil de buscar y buscar, dijo Seymour Duncker, fundador y CEO de iChart. "Hay una gran abundancia de datos abiertos, por ejemplo, producidos a través del gobierno y a través de las universidades", dijo. Hay una oportunidad de hacer que los datos sean accesibles para todos, agregó.

La iniciativa de Obama de transparencia gubernamental le da a iCharts una gran cantidad de nuevos datos sin procesar para trabajar, dijo. "Vemos que proporcionar los datos brutos no es suficiente", agregó Duncker. "Necesita proporcionar contexto. Veo una nueva cadena de valor emergente aquí".

Por ejemplo, uno de los gráficos destacados de iChart en su página principal sigue el producto interno bruto de EE. UU. De 1948 a 2009. Este año, como debería esperarse en una recesión, el PIB se redujo significativamente.

Visual i / o llama a sus productos software de análisis visual. Los usuarios pueden crear diagramas y gráficos interactivos y compartirlos con otras personas usando las herramientas basadas en Web de Visual i / o, dijo Angela Shen-Hsieh, directora ejecutiva y directora ejecutiva de Visual i / o. Los usuarios de los gráficos pueden, con unos pocos clics, crear diferentes vistas basadas en diferentes parámetros.

"Cuando miras los conjuntos de datos Data.gov, van a ser interesantes cuando los preparas juntos", Shen -Hsieh dijo. Los datos se vuelven más útiles a medida que los usuarios superponen conjuntos de datos como enfermedades crónicas con información geográfica, agregó.

Dos analistas de TI dijeron que ven una tendencia creciente de compañías como iCharts y Visual i / o que usan datos del gobierno para demostrar sus productos y servicios. Pero tanto Shawn McCarthy, un analista de proveedores gubernamentales con IDC, como David Curle, analista principal de Outsell, cuestionaron si una empresa podría construir un modelo de negocio completamente para reutilizar los datos del gobierno.

Parece que hay pocas oportunidades de venta fuera de la venta los datos reutilizados de nuevo a las agencias gubernamentales, y con los datos disponibles para todos, el potencial de competencia sería excelente, dijo Curle.

Muchos grupos de interés público ya crean cuadros y gráficos con datos del gobierno, agregó McCarthy.

"Lo que he encontrado es que la mayoría de los datos que he visto necesitan una mayor manipulación para que sean realmente valiosos", dijo. "Cualquiera que esté tomando los datos y haciendo algo con ellos es muy probable que le agregue valor".