🗒️Paperless-ngx:开源无纸化文档管理系统
00 min
2024-1-5
2024-1-5
type
date
slug
status
summary
tags
category
password
icon
一个开源的文档管理系统,可以将你的物理文档转换成可搜索的在线档案,从而减少纸张的使用。

一、资源介绍

它内置了OCR功能,可以自动对上传的扫描文档执行OCR。能够识别文档中的文字,并将其转换为可编辑和可搜索的文本格式。
然后对文档进行分类和索引,你可以随时搜索查阅。
主要功能:
1、组织和索引文档:使用标签、通信者、类型等对文档进行分类和索引。
2、执行OCR:对文档执行光学字符识别(OCR),即使是只有图像的文档也能添加可搜索和可选择的文本。
支持多种语言:利用开源的Tesseract引擎识别超过100种语言。
3、文档保存格式:文档以PDF/A格式保存,这种格式设计用于长期存储,同时保留未经修改的原始文件。
4、机器学习自动标记:使用机器学习自动为文档添加标签、通信者和文档类型。
5】支持多种文件类型:支持PDF文档、图像、纯文本文件、Office文档(Word、Excel、Powerpoint及LibreOffice等价物)等。
6、直观的Web应用:提供定制化仪表板、过滤器、批量编辑、拖放上传、定制化视图、自定义字段、共享公共链接等功能。
7、支持全文搜索:提供自动完成、相关性排序、高亮显示匹配查询的文档部分等搜索功能。你可以使用关键词、标签或其他元数据进行搜索

二、自部署指南

部署无纸化的最简单方法是 docker compose

三、预览

notion image
上一篇
talebook:打造私人书库,在线阅读、导入书籍、推送到Kindle
下一篇
全新AI搜索引擎Aoyo:由GPT驱动!有望颠覆Google搜索