该数据集由广角卷帘快门相机捕获的许多视频序列组成,并带有相应的陀螺仪测量值。它是在 ICRA2015 的 [1] 中引入的,用于相机-陀螺仪校准。
该数据集由三个视频序列以及陀螺仪测量组成。
由于这是真实世界的数据,这意味着没有真正的基本事实可用。相反,每个序列都附有一组参考值(参见下面的“数据格式”),这是我们对相机陀螺仪校准参数的最佳估计(如 [1] 中使用的),可用于例如稳定视频.
如果您在出版物中使用此数据集,则应参考论文 [1]。
旋转:手持相机拍摄的静止不动的人的场景。大而平滑的旋转。
walk :相机从地面开始,然后被拾起并带走一小段路。
rccar :摄像头安装在一辆在土路上行驶的遥控车上。大量振动(高频运动)会导致非常明显的卷帘快门伪影。
每个序列包含三个文件:
视频文件:
.mp4陀螺仪数据文件:
_gyro.csv参考值:
_reference.csv视频需要 H.264 编解码器才能解码。
陀螺仪数据定时定时采样,CSV文件每陀螺仪测量一行。每条线具有三个角速度测量值,每个轴(x、y、z)一个。角速度测量值以弧度/秒表示。
参考值是当前对校准参数的最佳估计,并已用于生成补充材料中显示的稳定视频。参数名称具有以下含义(有关定义和用法,请参见 [1]):
Fg :时间比例因子/陀螺仪采样率 (Hz)
偏移量:时间偏移量(秒)
rot_x
rot_y
rot_z :陀螺仪到相机的转换。r = [rot_x, rot_y, rot_z] = alpha * n,是这个旋转的轴角表示。
gbias_x
gbias_y
gbias_z : 陀螺仪偏差 (rad/s)
视频文件保证在陀螺仪测量的时间范围内被捕获。即,视频记录在陀螺仪记录器之后开始并在陀螺仪记录器之前停止。
帧数 n 与陀螺仪样本 k 之间的时间关系可以表示为
1
t_frame = (n / CAMERA_FPS)
2
3
k = Fg * (t_frame + offset)
我们使用 CAMERA_FPS = 30.0。请注意,t_frame 对应于帧的开始,而 t_frame + readout,其中 readout 是滚动快门读出时间,对应于帧的结束。
数据是使用 STMicroelectronics L3G4200D 陀螺仪捕获的,其数据表可在供应商网站上找到:http: //www.st.com/web/catalog/sense_power/FM89/SC1288/PF250373
控制寄存器的内容如下
CTRL_REG1 = 0xFF
CTRL_REG2 = 0x00
CTRL_REG3 = 0x08
CTRL_REG4 = 0x00
CTRL_REG5 = 0x00
陀螺仪以同步数据速率提供样本,根据数据表,ODR=800 Hz,但实际上这意味着大约 855 Hz 的速率。
由于硬件问题,陀螺仪数据包含高频噪声分量(大约 340 Hz),可以在频谱图中清楚地看到。我们建议在使用数据之前应用陷波滤波器来消除它。
视频是使用 GoPro Hero3+ 黑色版在 1080p@30Hz(宽)模式下录制的。相机中的所有其他设置都保留为默认值。
相机使用滚动快门。对于所选模式,读数时间(以秒为单位)已校准为
readout = 0.0316734
我们使用 Devernay 和 Faugeras (2001) 的 FOV 模型对相机进行了校准,但使用了 [2] 中的简化形式:
r_d = arctan(r_u * omega) / omega
r_u = tan(r_d * omega) / omega
参数是:
内部相机校准矩阵
K = [[ 853.12703455, 0. , 988.06311256],2
[ 0. , 873.54956631, 525.71056312],3
[ 0. , 0. , 1. ]])
失真参数
omega = 0.8894355
和畸变中心
wc = [0.00291108, 0.00041897]
欢迎向 hannes.ovren@liu.se 或 per-erik.forssen@liu.se 提出问题、意见和建议。
Hannes Ovrén 和 Per-Erik Forssén,林雪平,2015 年 5 月
[1] Hannes Ovrén 和 Per-Erik Forssén。具有自动校准功能的基于陀螺仪的视频稳定。ICRA 2015 [2] 约翰·赫德堡和比约恩·约翰逊。GPU 上的实时相机自我运动补偿和镜头不失真。瑞典林雪平大学电气工程系技术报告,2007 年。
审核编辑 :李倩
全部0条评论
快来发表一下你的评论吧 !