What we learned from 5 million books
Para aquellos que alguna vez se han preguntado cuántos libros diferentes hay en el mundo, Google tiene una respuesta para usted: 129,864,880, según Leonid Taycher, un ingeniero de software de Google que trabaja en el proyecto Google Books.
Estimando el número de libros en el mundo es más que un ejercicio de curiosidad para el gigante de las búsquedas: también proporciona una hoja de ruta del trabajo que queda por hacer para cumplir el ambicioso objetivo de la compañía de organizar toda la información del mundo.
"Cuando usted es parte de una compañía que intenta digitalizar todos los libros del mundo; la primera pregunta que suele hacerse es: "¿Cuántos libros hay?", explicó Taycher en una publicación de blog que anunciaba el presupuesto.
[Más información: los mejores servicios de transmisión de TV]Para llegar a una aproximación razonable, la compañía comenzó por ingerir información de libros de múltiples sistemas de catalogación, como los Números de Libro Estándar Internacional (ISBN).
Dichos catálogos, aunque útiles, no proporcionan un recuento definitivo, sin embargo. Por ejemplo, los ISBN solo se han asignado a libros desde la década de 1960, y tienden a usarse solo en los países occidentales.
También se han asignado varios libros a números ISBN individuales, y el editor ha asignado números ISBN a artículos que no sean libros, como camisetas y DVD.
Así que los ingenieros de Google han escrito programas para peinar aproximadamente 150 de tales catálogos y directorios, y eliminar tantas entradas duplicadas como puedan encontrarse.
La compañía también tuvo que hacer una serie de decisiones difíciles sobre lo que es y no es un libro, explicó Taycher.
Por ejemplo, las ediciones de tapa blanda y cubierta dura de un texto se cuentan como dos libros, como lo son las muchas versiones diferentes de un texto popular, como el de Shakespeare. "Hamlet", debido a los comentarios y comentarios que pueden contener. Las series pueden contar como libros individuales o como un trabajo recopilado.
A partir de junio, la compañía ha escaneado 12 millones de libros, según una presentación del gerente de ingeniería de Google Books Jon Orwant en la Conferencia Técnica Anual de USENIX en Boston. Estos libros se han escrito en aproximadamente 480 idiomas (incluidos 3 libros en el idioma Klingon originado en Star Trek).
La compañía planea completar el escaneo de libros existentes en una década. La colección virtual resultante constará de cuatro mil millones de páginas y dos billones de palabras, dijo Orwant.
Alrededor del 20 por ciento de los libros del mundo son de dominio público, explicó Orwant. Alrededor del 10 al 15 por ciento de estos libros están impresos. Los libros restantes, la gran mayoría de todos los títulos, están aún sujetos a derechos de autor pero agotados. Google está en el proceso de tomar prestadas copias de estos libros para digitalizarlos, de cerca de 40 bibliotecas grandes de todo el mundo.
Es este acto de escaneo en libros que están descatalogados pero que aún están cubiertos por derechos de autor que se han cumplido con cierta resistencia por parte de la industria editorial.
La compañía ahora está esperando una sentencia del Tribunal de Distrito de los Estados Unidos para el Distrito Sur de Nueva York, sobre si puede escanear estos libros.
En 2005, el Gremio de Autores y la Asociación de Editores Estadounidenses presentó por separado demandas colectivas contra el gigante de las búsquedas, afirmando que la compañía está infringiendo los derechos de autor al escanear en los libros.
Google ha afirmado que quiere vender copias digitales de estas, por lo demás, imprima libros y reserve regalías para que los autores los reclamen. La compañía también espera revelar fragmentos de estos libros en las búsquedas web, y afirma que este uso se enmarca en la doctrina del Uso Justo de EE. UU.
El escaneo en todos los libros del mundo dará otros beneficios además de mejorar las búsquedas, explicó Orwant. Una vez que todos estos volúmenes se digitalizan, sus contenidos pueden someterse a análisis, lo que puede conducir a nuevos conocimientos. Los lingüistas pueden descubrir cuándo se generalizaron ciertas palabras, o quién comenzó a utilizarlas.
La Búsqueda de libros de Google también podría ayudar a responder algunas preguntas históricas sobresalientes: por ejemplo, podría informar el debate sobre si Isaac Newton y Gottfried Leibniz -o alguien más enteramente- inventó el cálculo.
"Podemos buscar no solo una frase pero por un concepto ", explicó Orwant. "Podemos tomar todas las formas diferentes [en las que se puede inflexionar la idea de] infinito, traducir eso a diferentes idiomas y hacer una búsqueda en paralelo."
"Mi esperanza es que a medida que empecemos a exponer mucho más de Esta colección permitirá a las personas hacer preguntas como esta que no pudieron hacer antes ", dijo.
El editor del Servicio de Noticias de IDG, Juan Carlos Pérez, contribuyó a este informe.
Joab Jackson cubre software empresarial y noticias de última hora sobre tecnología general para The IDG News Service. Sigue a Joab en Twitter en @Joab_Jackson. La dirección de correo electrónico de Joab es [email protected]
Cómo elegir diferentes GPU para diferentes aplicaciones en Windows 10

Para mejorar el rendimiento de una aplicación específica, puede personalizar las preferencias de rendimiento de gráficos eligiendo tu mejor GPU. Windows 10 le permite elegir diferentes GPU para diferentes aplicaciones. Puede asignar aplicaciones pesadas para usar GPU de gama alta o forzarlas a usar una GPU de ahorro de energía para ahorrar batería.
Mostrar diferentes Live Tiles para diferentes cuentas de correo electrónico en Windows 8

Si tiene varias cuentas de correo electrónico en la pantalla de inicio de Windows 8 el mosaico Live del correo muestra los correos más recientes de todas sus cuentas. Aquí hay un consejo sobre el uso de diferentes Live tile para diferentes cuentas de correo.
Conviértete en un autor de libros electrónicos publicado con la ayuda de bookiejar

Vea cómo convertirse en un autor de libros electrónicos publicados con la ayuda de BookieJar.