[功能建议] OCR解析图片文档

**功能描述**
目前纯图片的PDF文档上传后，内容为空，需求能够自动OCR解析图片PDF文档

**使用场景**
很多文档是纸质件扫描成PDF的，为纯图片格式。这类文档无法上传到知识库，影响使用

**实现建议**
增加orc模型，如文字提取(Qwen-OCR)，自动提取图片内容