document-image-processing

Star

Here are 20 public repositories matching this topic...

Language:All

Filter by language

All20 Python10 HTML3 Java1 JavaScript1 Jupyter Notebook1

Sort:Most stars

Sort options

Most stars Fewest stars Most forks Fewest forks Recently updated Least recently updated

Unstructured-IO /unstructured

Star13.3k

Convert documents to structured data effortlessly. Unstructured is open-source ETL solution for transforming complex documents into clean, structured formats for language models. Visit our website to learn more about our enterprise grade Platform product for production grade workflows, partitioning, enrichments, chunking and embedding.

nlp pdf machine-learning natural-language-processing information-retrieval ocr deep-learning ml docx preprocessing pdf-to-text data-pipelines donut document-image-processing document-parser pdf-to-json document-image-analysis llm document-parsing langchain

UpdatedNov 24, 2025
HTML

Layout-Parser /layout-parser

Star5.6k

A Unified Toolkit for Deep Learning Based Document Image Analysis

ocr computer-vision deep-learning object-detection document-image-processing layout-analysis document-layout-analysis detectron2 layout-parser layout-detection

UpdatedAug 15, 2024
Python

fh2019ustc /Awesome-Document-Image-Rectification

Star498

A comprehensive list of awesome document image rectification papers.

awesome deep-learning document-image-processing document-unwarping document-image-rectification document-dewarping

UpdatedAug 16, 2025

fh2019ustc /DocTr

Star413

The official code for “DocTr: Document Image Transformer for Geometric Unwarping and Illumination Correction”, ACM MM, Oral Paper, 2021.

ocr document-image-processing pytorch-implementation document-unwarping document-image-rectification

UpdatedJun 18, 2025
Python

fh2019ustc /DocScanner

Star279

The official repo for “DocScanner: Robust Document Image Rectification with Progressive Learning”, IJCV, 2025.

ocr document-image-processing document-image-rectification document-image-dewarping

UpdatedJun 18, 2025
Python

hpanwar08 /detectron2

Star187

Detectron2 for Document Layout Analysis

python computer-vision deep-learning pytorch neural-networks segmentation object-detection text-detection semantic-segmentation document-image-processing document-layout maskrcnn mask-rcnn dla document-layout-analysis detectron2 publaynet document-image-analysis

UpdatedAug 2, 2024
Python

GiftMungmeeprued /document-parsers-list

Star165

A comprehensive list of document parsers, covering PDF-to-text conversion and layout extraction. Each tested for support of tables, equations, handwriting, two-column layouts, and multi-column layouts.

pdf ocr preprocessing pdf-to-text document-image-processing data-pipeline document-parser document-parsing langchain

UpdatedJul 14, 2025

jiangnanboy /Doc-Image-Tool

Star110

文档图像处理工具(Document image processing tool)，包括漂白 / 文字方向矫正 / 清晰增强 / 笔记去噪美化 / 去阴影 / 扭曲矫正 / 切边增强(DocBleach / TextOrientationCorrection / DocSharpening / HandwritingDenoisingBeautifying / DocShadowRemoval / document_image_dewarping / DocTrimmingEnhancement)。

document-image-processing

UpdatedAug 27, 2024
Python

fh2019ustc /DocGeoNet

Star86

The official code for “Geometric Representation Learning for Document Image Rectification”, ECCV, 2022.

ocr distortion-correction document-image-processing pytorch-implementation document-image-rectification document-image-dewarping

UpdatedJun 18, 2025
Python

Nomiluks /Handwritting-OCR

Star15

Android App for English Handwritten Text Recognition

neural-network android-application optical-character-recognition document-image-processing

UpdatedSep 20, 2017
Java

caltechlibrary /documentarist

Star12

Process Caltech Archives' digital documents and photos, and annotate each page or image with information about its contents

machine-learning annotation tagging image-classification image-recognition document-classification annotator document-image-processing htr handwriting-recognition handwritten-text-recognition image-tagging handwritten-character-recognition document-image-classification handwritten-mathematical-symbols math-recognition

UpdatedMay 5, 2022
Python

jchazalon /smartdoc15-ch1-pywrapper

Star7

Python wrapper to facilitate data manipulation for the SmartDoc 2015 - Challenge 1 Dataset.

computer-vision datasets document-image-processing

UpdatedJun 17, 2024
Jupyter Notebook

Transkribus /competitions

Star6

The ScriptNet / competitions site.

competition django handwriting-ocr benchmark-framework keyword-spotting evaluation-functions django-bootstrap3 document-image-processing writer-identification

UpdatedDec 16, 2018
Python

tony-xlh /quality-evaluation-of-scanned-document-images

Star3

A web app evaluating the quality the scanned document images

document-image-processing image-quality-assessment

UpdatedFeb 1, 2024
HTML

jiangnanboy /docimg_tool

Star3

复杂背景图像漂白，文字方向矫正，清晰增强，笔记去噪美化，去阴影，扭曲矫正，去黑点以及切边增强。complex background image bleaching, text direction correction, clarity enhancement, note to blur beautification, shadow removal, distortion correction, black spots removal and cutting edge enhancement。

document-image-processing

UpdatedMay 23, 2024

ajaycode /unstructured

Star2

Open source libraries and APIs to build custom preprocessing pipelines for labeling, training, or production machine learning pipelines.

nlp pdf machine-learning natural-language-processing information-retrieval ocr deep-learning ml docx preprocessing pdf-to-text data-pipelines donut document-image-processing pdf-to-json document-ai document-image-analysis document-parsing langchain

UpdatedMar 3, 2023
HTML

mx3123 /Py-document-cropper

Star0

This script automates the process of extracting text from various file formats (images, PDFs, DOCX) using Optical Character Recognition (OCR) powered by Azure Cognitive Services. The script supports image preprocessing, text extraction, and uploading of the processed files to Google Cloud Storage (GCP).

python mongodb google-cloud-storage archive document-management document-image-processing azure-computer-vision