**功能描述** 目前纯图片的PDF文档上传后,内容为空,需求能够自动OCR解析图片PDF文档 **使用场景** 很多文档是纸质件扫描成PDF的,为纯图片格式。这类文档无法上传到知识库,影响使用 **实现建议** 增加orc模型,如文字提取(Qwen-OCR),自动提取图片内容