BlogScribe

个人博客已经成为技术开发者分享知识、表达观点和展示个人技能的重要平台。然而，每次书写博客时，特别是涉及到文本排版和格式处理时，往往会影响创作者的效率，使得他们在真正的内容创作上花费的时间减少。为了解决这个问题，BlogScribe诞生了。BlogScribe是一个个人博客书写助手，旨在通过语音输入自动生成高效、符合博客格式的内容。

功能概述

1. 语音识别与转文本

使用Whisper模型进行语音转文本，用户上传音频文件(wav, mp3, ogg)，进行在线的语音识别。

2. 知识库与语音识别

用户上传词库文档 (PDF, TXT, DOCX)，与语音识别文本通过向量模型进行比对，检索到相似的文本。

3. 相似文本检索替换

检索到相似的文本，对语音转文本相似词进行替换。

4. 润色文本及Markdown格式下载

利用Yuan2B大模型进行文本润色和格式处理，自动生成博客文章标题及小标题，确保生成的内容符合博客格式。

5. 博客下载

提供md格式的博客源代码下载。

安装与使用

安装依赖

在BlogScribe01目录下在运行app.py之前，请确保您先运行了 requirements.txt

 git clone https://github.com/PoolBee/BlogScribe01.git

pip install -r requirements.txt

界面&使用

上传区

点击Browse files后选择文件上传，上传知识库词库支持(PDF、TXT、DOCX)格式点击Browse files后选择文件上传，上传语音文件支持(wav、mp3、ogg)格式

处理区

1.点击语音识别，进行语音识别，界面会显示语音转文本结果。
2.点击相似文本检索，BlogScribe会进行相似文本检索,在语音识别文本与知识库词库中进行相似词语检索，并替换语音识别文本中识别错误词语，替换后输出在替换后的文本中。
3.点击润色文本，会对处理后的文本进行添加标点符号、标题提取、语言润色，并输出到润色后的文本文本框中。
4.点击生成Markdown格式的博客对润色后的文本进行Markdown格式的输出。

下载区

点击下载Markdown文件进行.md文档格式下载。

streamlit run app.py --server.address 127.0.0.1 --server.port 6000

Name		Name	Last commit message	Last commit date
Latest commit History 18 Commits
.virtual_documents/AICamp_yuan_baseline/Demo		.virtual_documents/AICamp_yuan_baseline/Demo
AICamp_yuan_baseline		AICamp_yuan_baseline
BlogScribe		BlogScribe
BlogScribe01		BlogScribe01
IEITYuan/Yuan2-2B-Mars-hf		IEITYuan/Yuan2-2B-Mars-hf
.download.json		.download.json
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

BlogScribe

功能概述

1. 语音识别与转文本

2. 知识库与语音识别

3. 相似文本检索替换

4. 润色文本及Markdown格式下载

5. 博客下载

安装与使用

安装依赖

界面&使用

上传区

处理区

下载区

About

Uh oh!

Releases

Packages

Uh oh!

Languages

PoolBee/BlogScribe01

Folders and files

Latest commit

History

Repository files navigation

BlogScribe

功能概述

1. 语音识别与转文本

2. 知识库与语音识别

3. 相似文本检索替换

4. 润色文本及Markdown格式下载

5. 博客下载

安装与使用

安装依赖

界面&使用

上传区

处理区

下载区

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Languages

Packages