Pytorch

2024-07-16 17:00| 来源: 网络整理| 查看: 265

1 视频文件作为网络模型的输入数据

越来越多的神经网络模型开始以视频作为训练数据，比如基于视频数据的行为识别等等，这就需要我们将视频转换为可适用的张量，本文将以pytorch为例，展示一下视频数据转换为pytorch tensor的过程。

2 使用OpenCV-Python解码视频文件并将视频帧转换为Pytorch tensor 2.1 安装opencv-python

不赘述。

2.2 视频转换为tensor import torch import numpy as np import os def get_tensor_from_video(video_path): """ :param video_path: 视频文件地址 :return: pytorch tensor """ if not os.access(video_path, os.F_OK): print('测试文件不存在') return import cv2 cap = cv2.VideoCapture(video_path) frames_list = [] while(cap.isOpened()): ret,frame = cap.read() if not ret: break else: # 注意，opencv默认读取的为BGR通道组成模式，需要转换为RGB通道模式 frame = cv2.cvtColor(frame, cv2.COLOR_BGR2RGB) frames_list.append(frame) cap.release() # 转换成tensor result_frames = torch.as_tensor(np.stack(frames_list)) # 注意：此时result_frames组成的维度为[视频帧数量，宽，高，通道数] return result_frames if __name__ == '__main__': tensor = get_tensor_from_video(r'H:\Temp\P01_01_00_0_color(488x488).avi') print(tensor.shape)

详细的代码如上，请注意上述函数get_tensor_from_video返回的tensor的维度为[视频帧数量，宽，高，通道数]，而有的神经网络模型要求输入[通道数，视频帧数量，宽，高]，我们可以使用以下函数进行转换。

2.3 tensor维度交换 # T H W C -> C T H W result_frames = result_frames.permute(3, 0, 1, 2)

如果有兴趣，可以访问我的个人站哦：https://www.stubbornhuang.com

【本文地址】

公司简介

联系我们