关于视频字幕(有无外挂字幕)的提取死磕一天的总结 您所在的位置:网站首页 如何提取网站中的视频 关于视频字幕(有无外挂字幕)的提取死磕一天的总结

关于视频字幕(有无外挂字幕)的提取死磕一天的总结

2024-07-08 18:29| 来源: 网络整理| 查看: 265

2021.03.12 关于视频字幕(有无外挂字幕)的提取死磕一天的总结 概述:

①有外挂字幕 ---->视频网页 ---->F12---->nework ----->打开字幕 ---->找到.json文件 ---->跑一下下面脚本就可以了

②硬字幕:无外挂字幕 ---->下载视频 ---->下载esrXP、格式工厂(分割) ---->视频导入esrxp设置区域 ---->导出OCR影像

问题描述:

密码学双语,外教语速之快。。。5分钟暂停后退无数次:印证无比真实评论区 在这里插入图片描述

一、外挂字幕

没有外挂字幕的视频……字幕怎么导出

找了无数教程,都是提取外挂字幕: 在这里插入图片描述

F12—刷新—clear—打开CC字幕—json文件 在这里插入图片描述

在这里插入图片描述 参考https://www.jianshu.com/p/66450e9554f8

# -- coding: utf-8 -- import json import math import os def convert_json_to_srt(json_files_path): json_files = os.listdir(json_files_path) srt_files_path = os.path.join(json_files_path, 'srt') #更改后缀后字幕文件的路径 isExists = os.path.exists(srt_files_path) if not isExists: os.mkdir(srt_files_path) for json_file in json_files: file_name = json_file.replace(json_file[-5:], '.srt') #改变转换后字幕的后缀 file = '' # 这个变量用来保存数据 i = 1 # 将此处文件位置进行修改,加上utf-8是为了避免处理中文时报错 with open(os.path.join(json_files_path, json_file), encoding='utf-8') as f: datas = json.load(f)# 加载文件数据 f.close() for data in datas['body']: start = data['from'] # 获取开始时间 stop = data['to'] # 获取结束时间 content = data['content'] # 获取字幕内容 file += '{}\n'.format(i) # 加入序号 hour = math.floor(start) // 3600 minute = (math.floor(start) - hour * 3600) // 60 sec = math.floor(start) - hour * 3600 - minute * 60 minisec = int(math.modf(start)[0] * 100) # 处理开始时间 file += str(hour).zfill(2) + ':' + str(minute).zfill(2) + ':' + str(sec).zfill(2) + ',' + str(minisec).zfill(2) # 将数字填充0并按照格式写入 file += ' --> ' hour = math.floor(stop) // 3600 minute = (math.floor(stop) - hour * 3600) // 60 sec = math.floor(stop) - hour * 3600 - minute * 60 minisec = abs(int(math.modf(stop)[0] * 100 - 1)) # 此处减1是为了防止两个字幕同时出现 file += str(hour).zfill(2) + ':' + str(minute).zfill(2) + ':' + str(sec).zfill(2) + ',' + str(minisec).zfill(2) file += '\n' + content + '\n\n' # 加入字幕文字 i += 1 with open(os.path.join(srt_files_path, file_name), 'w', encoding='utf-8') as f: f.write(file) # 将数据写入文件 if __name__ == '__main__': json_folder_path = 'D:\\video\\化学视频\\test\\src' #json字幕文件的路径(注意路径的格式) convert_json_to_srt(json_folder_path) 二、硬字幕

在这里插入图片描述

1. 下载esrXP

解决了讨厌的MCFee禁止下载的exe文件或者直接删除(无语子 找了无数教程 在这里插入图片描述 在这里插入图片描述 附上esrXP操作链接:https://docs.qq.com/doc/Bhq4pp0zdjAE3T5Lb54fHXne21rEQt3brULE4?undefined

2. 转换格式

试了很长时间esrXP导入视频没有响应,挨个尝试MP4、avi、rmvb。 看教程说大小限制,下载了格式工厂,分割60M的视频 ……沧桑几个小时后…… 导入成功 下载格式工厂,导入视频 在这里插入图片描述 在这里插入图片描述 在这里插入图片描述

在这里插入图片描述 在这里插入图片描述

3. 用esrXP过滤字幕

过滤器设置中,调整字幕颜色、边框颜色的设置

在这里插入图片描述 在这里插入图片描述 在这里插入图片描述



【本文地址】

公司简介

联系我们

今日新闻

    推荐新闻

    专题文章
      CopyRight 2018-2019 实验室设备网 版权所有