0%

注意arxiv读音与archive一样,英[ˈɑːkaɪv],美[ˈɑːrkaɪv]

国内访问论文预发布平台arxiv巨慢无比,让人闹心!网上找了一个很好用的方法,按照这个方法配置之后arxiv就秒开了。原理就是将arxiv重定向到xxx.itp.ac.cn(中科院理论物理研究所镜像)。
如果此时你找到了一篇文章,地址是arxiv.org/abs/1911.11763,只需要把arxiv.org换成xxx.itp.ac.cn即可。但每次都手动配置就很麻烦,为了贯彻将懒惰进行到底的精神,我们需要将上述过程自动化。配置如下:

Read more »

从一系列的图像中恢复物体的3D结构是计算机视觉研究中一个热门课题,这使得我们可以相隔万里从google map中看到复活节岛的风景。这得益于图像来自于可控的条件,使得最终的重建效果一致性且质量都很高,但是这却限制了采集设备以及视角。畅想一下,假如我们不使用专业设备,而是利用sfm技术根据互联网上大量的图片重建出这个复杂世界。

Read more »

ETHZ ASL与Magicleap联名之作,CVPR 2020 Oral(论文见文末),一作是来自ETHZ的实习生,二作是当年CVPR2018 SuperPoint的作者Daniel DeTone。Sarlin小伙之前在MagicLeap实习,在ETHZ(苏黎世联邦理工) ASL 完成硕士,目前在 ETHZ CVG就读博士,不是TUM(慕尼黑工业大学)的CVG。

Read more »

SVD分解就是一种矩阵拆解术,它能够把任意矩阵$A \in \mathbb{R}^{m \times n}$拆解成3个矩阵的乘积形式,即:

其中,$U \in \mathbb{R}^{m \times m}$,$V \in \mathbb{R}^{n \times n}$都是正交矩阵,即$U^T U = I, V^T V = I$,即列向量是正交的单位向量,$U$称为left single vectors,$V$称为right single vectors;$\Sigma \in \mathbb{R}^{m \times n}$的对角阵(奇异值),奇异值$\geq 0$且按照顺序降序排列。

MIT Gilbert Strang 教授对 SVD 讲解得很清晰,如下:

Read more »

PNP即“Perspective-N-Points”,是求解 3D 到 2D 点对运动的方法。它描述了当我们知道n个3D空间点以及它们在图像上的位置时,如何估计相机所在的位姿。PnP 问题有很多种求解方法,例如用三对点估计位姿的 P3P(通常需要额外一个点进行验证结果),直接线性变换(DLT),EPnP(Efficient PnP,已知内参时用),UPnP(内参未知时用) 等等)。此外,还能用非线性优化的方式,构建最小二乘问题并迭代求解,也就是万金油式的 Bundle Adjustment

Read more »

可以说整个重定位就是一个精心设计的解算当前帧位姿的模块,秉持着不抛弃不放弃的精神,ORB-SLAM的作者简直把特征匹配压榨到了极致,仿佛在说“小伙子你有很多匹配点的,不要放弃,我们优化一下位姿再找找匹配点呗”。

Read more »

ORB-SLAM中使用了多种特征匹配的奇技淫巧,其中之一就是利用词袋信息进行引导匹配SearchByBoW:利用了BOW里的正向引导进行两帧之间的匹配,核心点在于位于同一个节点处的特征才有可能属于同一匹配,相较于暴力匹配匹配速度更快。

Read more »

由浙江大学CAD&CG国家重点实验室主办、浙江大学-商汤三维视觉联合实验室协办的“SLAM技术及应用”暑期学校于7月20日如期拉开序幕。
今天(2019/07/20)看到直播的时候已经是下午4点半了,只听到刘浩敏讲到末尾的一段,幸好主办方提供了讲座课件,Download下来慢慢看。

Read more »