GitHub - capp-adocia/Embed-Subtitle-Extractor-Lite: 内嵌字幕提取器-轻量版调用了百度paddle接口来对视频字幕进行识别

简介

内嵌字幕提取器（Embed-Subtitle-Extractor-Lite）旨在打造一款简单实用且快速地识别视频内嵌字幕文本的一款工具。

产品架构

用户界面使用QtCpp编写
后台服务使用Flask进行图像的识别（调用了百度Paddle API）

注意：源码里面包含了Qt和Flask 目前Window平台经过测试可用，其他平台暂未开启测试

特点

操作简单
快速
轻量
仅需CPU

使用说明

~~方式一：使用已经部署在云服务器上的后台服务~~

~~想快速体验使用工具的可以使用此方式~~

~~1. 下载Releases中最新的压缩包（.zip） 2. 解压后双击exe文件即可使用~~

~~方式二：使用本地计算机来后台服务~~

~~自己想动手本地部署的也可以使用此方式~~

~~如果云服务器上的后台服务版本无法满足需要的识别精度，可以使用此方式的本地部署来提高识别精度~~

1. 和前一个使用一样，在Releases下载最新的压缩包 2. 克隆项目存储库git clone https://github.com/capp-adocia/Embed-Subtitle-Extractor-Lite.git 3. 安装flask所需要的pip包 注意这里pip包是对Windows平台适用 pip install -r requirements.txt # 仅使用CPU计算 如果想使用GPU（极大提高识别速度）计算，请不要使用以上命令，请前往百度paddle官网进行下载相应的pip包 4. 启动本地服务 python OCR.py 5. 成功启动后台服务后，就可以正常提取视频内嵌字幕了

以上方法均无效

正确使用

更新后直接先运行OCR.exe文件，启动本地服务，字幕识别时千万不要关闭。
再运行ESElite.exe文件，启动识别程序。
导入视频文件，开始识别字幕文字。

测试样例

这里使用的视频样例是在本存储库的testVideo.mp4文件

MP4
提取字幕
字幕导出
导出字幕VS实际字幕

联系我

如果遇到了任何问题，随时可以找我。

QQ: 请通过 2636427505 联系我。
QQ email: 请发送邮件至 [email protected] 联系我。
......

Name		Name	Last commit message	Last commit date
Latest commit History 23 Commits
ExtractSubtitle		ExtractSubtitle
Flask		Flask
.gitattributes		.gitattributes
.gitignore		.gitignore
ExtractSubtitle.sln		ExtractSubtitle.sln
LICENSE.txt		LICENSE.txt
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

简介

产品架构

特点

使用说明

正确使用

测试样例

联系我

About

Releases 2

Packages

Languages

License

capp-adocia/Embed-Subtitle-Extractor-Lite

Folders and files

Latest commit

History

Repository files navigation

简介

产品架构

特点

使用说明

正确使用

测试样例

联系我

About

Topics

Resources

License

Stars

Watchers

Forks

Releases 2

Packages 0

Languages

Packages