Skip to content

[功能建议] OCR解析图片文档 #1453

@nnjojo

Description

@nnjojo

功能描述
目前纯图片的PDF文档上传后,内容为空,需求能够自动OCR解析图片PDF文档

使用场景
很多文档是纸质件扫描成PDF的,为纯图片格式。这类文档无法上传到知识库,影响使用

实现建议
增加orc模型,如文字提取(Qwen-OCR),自动提取图片内容

Metadata

Metadata

Assignees

No one assigned

    Labels

    enhancementNew feature or request

    Type

    No type

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions