Whatsapp

gImageReader: extrae texto de imágenes y archivos PDF en Linux

Anonim

gImageReader es un lector de PDF gratuito y de código abierto con la capacidad de extraer texto de imágenes y archivos PDF. Está construido como un front-end Gtk/Qt simple para Tesseract-OCR, un motor OCR de código abierto para reconocer textos y patrones en documentos e imágenes usandoInteligencia artificial

Por sí solo, Tesseract es una herramienta de línea de comandos que está restringida al uso de usuarios de Linux lo suficientemente familiarizados con sus terminales. Gracias a gImageReader, ahora todos pueden aprovechar la eficiencia de OCR del motor.

gImageReader funciona escaneando textos de PDF o archivos de imagen en cualquiera de los varios idiomas que admite gracias a la existencia de caracteres Unicode . Cuenta con una interfaz de usuario personalizable, sencilla y bien organizada a través de la cual puede realizar tareas de revisión ortográfica y traducción.

Funciones en gImageReader

gImageReader es fácil de usar y admite el trabajo con documentos en copia electrónica, así como instantáneas de medios cargados, p. capturas de pantalla Incluso tiene la opción de seleccionar el área de texto que le interesa y agregar solo el texto que necesita. En última instancia, gImagereader funciona tanto como un lector de PDF como una herramienta de extracción de texto. Cosas tontas.

Instalar gImageReader en Linux

Para usar gImageReader al máximo, debe instalar manualmente Tesseract paquetes de idiomas para que pueda analizar correctamente imágenes y archivos.El paquete se llama 'Tesseract-ocr-eng' y está disponible desde el administrador de software en Debiany Fedora distribuciones.

Si está ejecutando Ubuntu, simplemente puede agregar el PPAy ejecute el comando de instalación usando los siguientes comandos:

$ sudo add-apt-repositorio ppa:sandromani/gimagereader
$ sudo apt actualizar
$ sudo apt install gimagereader

En Debian, Fedora y OpenSUSE instálelo desde el administrador de paquetes.

$ sudo apt install gimagereader
$ sudo dnf instalar gimagereader
$ sudo zypper instalar gimagereader

No se sienta excluido si está ejecutando Arch Linux o cualquiera de sus derivados. El AUR lo tiene cubierto. Y si prefiere reconstruir la aplicación desde el origen, las instrucciones se encuentran en el enlace Wiki del repositorio de GitHub.

¿Eres de los que extraen texto impreso de las imágenes? Incluso puede tomar instantáneas de áreas seleccionadas con su teléfono y cargarlas en su computadora portátil. Lo que es aún más genial es su soporte multilingüe, que aunque no es perfecto, ya es una de las mejores opciones en la comunidad en este momento.

gImageReader es uno de los mejores lectores de PDF en el mundo de código abierto, especialmente con su capacidad OCR, así que pruébelo y vea como te gusta.

Como de costumbre, puede compartir sus experiencias con la aplicación con nosotros si tiene alguna. Y para agregar otras sugerencias en la sección de comentarios a continuación.