- Notifications
You must be signed in to change notification settings - Fork8
📝 针对文档类图像做内容提取,将文档类图像一比一输出到Word或者Txt中,便于进一步使用或处理。后续计划支持输入PDF/图像,输出对应json格式、Txt格式、Word格式和Markdown格式。
License
NotificationsYou must be signed in to change notification settings
RapidAI/RapidDoc
Folders and files
Name | Name | Last commit message | Last commit date | |
---|---|---|---|---|
Repository files navigation
整体功能还没开发完哈!欢迎加入一起搞
该项目主要针对文档类图像做内容提取,将文档类图像一比一输出到Word或者Txt中,便于进一步使用或处理。后续计划支持输入PDF/图像,输出对应json格式、Txt格式、Word格式和Markdown格式。
以下为整体框架依赖包,均为RapidAI出品。
- rapid_orientation
- rapid_layout
- rapid_table /TableStructureRec
- rapid_latex_ocr
- rapidocr_onnxruntime
- rapidocr_layout_recover
flowchart TD A[/文档图像/] --> B([文档方向分类 rapid_orientation]) --> C([版面分析 rapid_layout]) C --> D([表格识别 rapid_table]) & E([公式识别 rapid_latex_ocr]) & F([文字识别 rapidocr_onnxruntime]) --> G([版面还原 rapid_layout_recover]) G --> H[/结构化输出/]
- 输入:文档类图像
- 输出:TXT或Word
pip install -r requirements.txt
git clone https://github.com/RapidAI/RapidDoc.gitcd RapidDocpython demo.py
About
📝 针对文档类图像做内容提取,将文档类图像一比一输出到Word或者Txt中,便于进一步使用或处理。后续计划支持输入PDF/图像,输出对应json格式、Txt格式、Word格式和Markdown格式。
Topics
Resources
License
Uh oh!
There was an error while loading.Please reload this page.
Stars
Watchers
Forks
Uh oh!
There was an error while loading.Please reload this page.