记录monodepth2调试过程 | 您所在的位置:网站首页 › java深度调试技术 › 记录monodepth2调试过程 |
stereo training训练 命令行代码 (注意:我使用的数据集位置不一致,所以需要设置数据集的位置) --model_name stereo_model --frame_ids 0 --use_stereo --split eigen_full --data_path /home/csy_0418/dataset/kitti_datastereo训练,只放入了当前帧,与它对应的帧l/r进行训练。 eigen_full train_files---45200 每一张图片有一个编号(frame_index),一个编号对应一个l,r---用来训练stereo training val_files---1776 1.输入数据的理解在使用for循环迭代数据的时候, for batch_idx, inputs in enumerate(self.train_loader): 进入mono_dataset.py的__getitem__函数处理【输入数据】 这里是stereo training,所以它的输入数据如下,为两张对应的rgb图。
经过处理以后,输入数据变为以下: 一对数据(2)+4(scale)*2(K+inv_K)=10 input 经过preprocess处理----将彩色图像调整到所需的比例+数据增强处理 因此多了以下多个scale的input数据 然后删除原始大小图片即:( , ,-1) 加入一个depth_gt 总结一下所有的input K+K逆---4scale*2(k,k逆)=8 color image---4scale*2(0,s)=8 color image augmentation---4scale*2(0,s)=8 depth_gt---1 stereo_T---左右相机之间的变换。---1 共26。 2.process_batch1.输入编码网络encoderfeatures = self.models["encoder"](inputs["color_aug", 0, 0])输入数据增强过后的图片,当前帧,没缩放,到编码网络,输出此时得到的features。 提取了五层,输出feature(batchsize,channel,height,width) input_features输入到解码网络 输出output 有点问题没有解决 处理结束后,output变为以下 计算重投影损失+平滑损失 loss结果 命令行代码 (注意:我使用的数据集位置不一致,所以需要设置数据集的位置) --model_name mono_model --frame_ids 0 -1 1 --split eigen_full --data_path /home/csy_0418/dataset/kitti_datastereo训练,只放入了当前帧,与它对应的帧l/r进行训练。 1.输入数据的理解 |
CopyRight 2018-2019 实验室设备网 版权所有 |