1
点赞
0
评论
0
转载
收藏

2020-11-15 学习情况

看论文:《University-1652: A Multi-view Multi-source Benchmark for Drone-based Geo-localization》

    - 这是一篇“发布数据集”的论文,这个数据集是世界范围内72所大学的1652个建筑物的图像。
         作者将他整理好的数据集免费发出来,如果别人在训练模型的时候、或者在模型比较的时候,只要用到了他的数据集,那么别人在发布成果的时候就必须引用这一篇论文
         看完感觉:“证明数据集好”的工作量要大于“把好的数据集做出来”,证明过程值得学习。

    - 研究动机:
         想要用一张手机拍的建筑物照片,来定位建筑物的GPS坐标。可以让这张照片与“带有GPS标记的卫星图片集”进行匹配。但用地面视角去匹配卫星视角,即便对人来说也是个挑战。训练模型需要数据集,而主流的数据集视点太少(1张地面视角配1张卫星视角),难度很大。如果引入无人机视角,能降低难度。

    - 数据集是怎么做的:
         卫星俯瞰图:谷歌地图
         无人机航拍图:谷歌地球3D模型 + 模拟无人机镜头
         建筑物街拍图:谷歌地图街景(为主),图片搜索引擎(作补充)
         平均每个建筑物都有71.64张图像,其中有1张是卫星视角、54张是无人机视角、16.64张是地面视角。

    - 怎么证明数据集好:
         首先,横向比较,总结特点。

    • 与同类的其他数据集进行横向比较,列个表格。
              例如,其他5个数据集,每个地点有2张图片,而这个数据集,每个地点有71.64张图片,就说这个数据集有“More image per class”的特点,但不能说71.64张的比2张的好,因为现在还没有实验依据。

         其次,广泛实验,得出结论。

    •   引出实验课题:跨视点图像检索。

    •   定义评价指标,介绍模型结构、损失函数。

    •   根据同一种模型在不同情况下的表现,得出结论。
               例如,用这个数据集训练、和用其他几个数据集训练,哪个效果好;
               再例如,用不同的“image per class”训练,看是不是真的越多越好;
               再例如,对同一地点用多张图片检索,是不是比只用一张图片检索效果更好;

         最后,进一步讨论,排除无关因素。

    •   针对读者可能的疑虑,进行实验。
               例如,把实验用的损失函数换成其他的损失函数行不行;
               再例如,输入图像的尺寸改小一点或改大一点行不行;
               再例如,实验过程中带点主观成分的小改动是好是坏;

    •   需要用实验数据,证明最终实验的各处细节都是最好的,数据集和实验是足以当“benchmark”的。

   


做边缘平台:

    虽然KubeEdge平台上周搭好了,但现在还不知道怎么用它部署东西。这周在看KubeEdge的文档。

  


声明:本内容系学者网用户个人学术动态分享,不代表平台立场。

华南师范大学 计算机学院
近期热门动态
2020-12-06 学习情况
1365 2020-12-06 14:06:08
2022新生传帮带_钱程.pptx
885 2022-08-31 15:54:20
2020-10-04 学习情况
796 2020-10-04 09:30:46
2020-10-25 学习情况
720 2020-10-25 18:51:57
2020-09-06 学习情况
500 2020-09-06 08:53:11
SCHOLAT.com 学者网
免责声明 | 关于我们 | 联系我们
联系我们:
返回顶部