澳门mg娱乐网址-从图像识别到物体识别 - mg娱乐官网-澳门mg娱乐官网

当前位置:首页 > 探索 > 科学

澳门mg娱乐网址-从图像识别到物体识别

2020-09-13 06:48:02

澳门mg娱乐网址|在增强现实(AR)与自动驾驶的时代到来之际,3D数据呈现出爆炸式快速增长。在旋即的将来,处置3D数据的算法将应用于像机器人自动巡弋、基于AR的智能用户界面等应用程序上。

澳门mg娱乐网址

不受此灵感,我们在Matroid公司所著的论文明确提出了FusionNet,这一框架用作在一个取名为PrincetonModelNet的标准数据集上做到3DCAD物体分类。  FusionNet的核心是全新的、应用于3D物体的三维卷积神经网络(ConvolutionalNeuralNetworks,CNN)。我们必需在多个方面调整传统的CNN以使其有效地。

为了说明得确切些,我们不妨再行看一下用作图像分类的二维CNN。这个思路是,机器学习研究者不会建构数个隐层构成的模型,每一层与前一层都以有所不同的形式相连。在第一层,你不会享有一个在二维图像上滑动的一块窗口区域作为输出。

因为这个区域继续执行了卷积操作者在窗口滑动时它交错其上,因此它被称作卷积层。其后还有几层有所不同形式的隐层,最后一层用作预测潜在的输入;每一种输入对应着图像标示中的某种分类。在ModelNet40Challenge数据集中于,不存在40个分类,因此模型中最后一层有40个神经元。

第一类有可能是猫,第二类有可能是车辆,以此类推迭代数据集包括的所有分类。如果第一个神经元在40个中唤起的最得意,那么输出样本就不会被判断为第一类,一只猫。

  整个模型假设输出是图片形式,即二维数据。你该如何将它扩展到三维呢?一种有可能的方法是,就像显示器表明三维物体那样,再行把物体通过投影处置成二维图像,然后在其上运营标准的二维CNN算法。实质上,现在在PrincetonModelNetChallenge数据集上已递交的拟合算法的思路是,把任何3D物体在多个角度上对物体展开一组2D投影展开像素传达,然后用于卷积神经网络。FusionNet显然也基于像素传达用于了CNN,但关键是,它同时还减少了一种新式的三维CNN。

  与在二维图像上滑动一个区域有所不同的是,我们可以在物体上滑动一块三维空间了!在这种传达之下,没适当做到投影这一步。这种方法用体积传达来处置物体。  在我们的体积传达中,3D物体被线性化作30*30*30的体素(译者录:volumepixel,文中全称voxel)网格。如果物体的任何部分坐落于1*1*1的体素中,就给体素赋值为1,反之则赋值为0.与之前的工作有所不同的是,我们在自学物体特征的过程中同时中用了像素传达和体素传达,这种方法对分类3DCAD物体而言,比分开用于其中一种要好。

其中一些例子如下:  图1.两种传达.左图:浴缸、低脚凳、坐便器与衣橱的2D投影。右图:体素化之后的浴缸、低脚凳、坐便器与衣橱.感激RezaZadeh获取图片  我们创建了两种处置体素数据的卷积神经网络(V-CNNI与V-CNNII),以及一种处置像素数据的网络(MV-CNN).右图表明了这些网络是如何融合在一起工作,并得出对于物体分类的最后辨别的。处置2D图像的标准CNN就不一样了,它们不能从图像中学到一些空间局部特征。

|澳门mg娱乐网址。

本文来源:澳门mg娱乐网址-www.gimpeltauben.com

热门推荐