论文资料
Deep Predictive Coding Networks for Video Prediction and Unsupervised Learning 论文 代码 torch-prednet torch prednet是e-lab实验室重新实现的一个预测网络 prednet_comment代码注释 该代码中为其他研究人员的相关注释。
代码运行示例,下面是在Caltech Pedestrian数据集上运行的下一帧预测结果,该模型在KITTI数据集中训练。
代码实现
# 训练相关
th main.lua --batch 1 --nlayers 3 -s --savedir results --dataDir dataSets --dataName data-small
# 测试相关
qlua main.lua --model results --dataDir dataSets --dataName data-small --visOnly --useGPU
PredNet-ConvGRU 使用convgru同时用pytorch实现prednet
论文资料
相关描述
实验证明,PredNet在视频预测任务表现一般,预测时间短且不够清晰;但在学习视频表征方面表现突出,可以提取物体动态特征,将这些特征用于分类器、参数估算等任务,相比于从静态图像中提取的特征,物体识别准确度会提高。
基本架构
项目需求
项目中需要类似的frame prediction功能,首先准备两个h5文件,其中一个包含图像数据,另一个包含图像数据的来源,比如视频A有30帧,视频B有30帧,这里,将数据预处理为(H, W, C)—-A…(H, W, C)—-B等等,这里有两个文件目录,其中为A和B文件夹表示视频来源,各个文件下