专题论坛:机器学习到机器理解是一步之遥还是遥不可及?
1、引导发言人:黄书强,黄翰(每人5分钟)
2、特邀嘉宾(每人20分钟)
特邀讲者:俞 扬 博士,副教授,南京大学
报告题目:无梯度机器学习
特邀讲者:刘 偲 博士,副研究员,中科院信工所
报告题目:像素级图像语义理解
特邀讲者:李冠彬 博士,副研究员,中山大学
报告题目:视觉感知建模及其在图像语义理解中的应用
3、自由发言和辩论(1小时30分钟)
论题1:机器理解是不是新瓶装旧酒?
论题2:机器理解是否会成为一个研究热点?
论题3:如何实现机器学习到机器理解跨越?
主持人:黄书强,黄翰,黄琼
特邀讲者1:俞扬
演讲题目:无梯度机器学习
演讲摘要:机器学习任务中常面临复杂优化问题,例如非凸、不可导、有大量局部 极值的函数等。有效解决复杂优化问题,将为机器学习新方法的设计带来更大 的自由度。无梯度优化不依赖函数梯度,适用于求解有不良数学性质的目标函 数。然而以往的无梯度优化方法多以启发式为主,缺乏有效的理论支持。报告 人对无梯度优化的理论基础开展了长期研究,在完善理论的基础上设计了新型 无梯度优化算法。本次报告将介绍无梯度优化及其在机器学习任务中的应用探索。
报告人:俞扬,博士,南京大学副教授,博士生导师。主要研究领域为人工智 能、机器学习、演化计算。分别于2004年和2011年获得南京大学计算机科学与 技术系学士学位和博士学位。2011年8月加入南京大学计算机科学与技术系、 机器学习与数据挖掘研究所(LAMDA)从事教学与科研工作。曾获2013年全国 优秀博士学位论文奖、2011年中国计算机学会优秀博士学位论文奖。发表论文 40余篇,包括多篇Artificial Intelligence、IJCAI、AAAI、NIPS、KDD等人 工智能、机器学习和数据挖掘国际顶级期刊和顶级会议论文,研究成果获得 IDEAL'16 Best Paper、KDD'12 Best Poster、GECCO'11 Best Theory Paper 、PAKDD'08 Best Paper、PAKDD’06数据挖掘竞赛冠军等论文和竞赛奖。任人 工智能领域国际顶级会议IJCAI'15/17高级程序委员,任IJCAI'16/17宣传共同 主席、IEEE ICDM'16宣传共同主席、ACML'16 Workshop共同主席。
特邀讲者2:刘偲
演讲题目: 像素级图像语义理解技术秀
演讲摘要: 像素级图像语义理解,又称语义分割,广泛应用于很多实际场景。本报告介绍针对语义分割的三个挑战研发的一系列技术。1:降低标注成本:在很多实用场景中,图像尺寸大且标签种类繁多,纯人工逐像素标注非常昂贵且低效。我们提出一套在不降低算法精度的前提下,极大减少人工标注成本的语义分割算法。2:提升分割精度: 通过综合考虑语义标签之间的上下文信息,如共生性和互斥性,极大地改进了分割精度。3:顺应大数据趋势:对于不断更新的海量数据和语义标签,研发了一套自适应的模型更新技术,使得语义分割技术真正达到智能化。我们的技术在智能相机、视频监控、智能家居、电商平台搜索、无人驾驶等多个领域取得了很好的应用效果。
报告人介绍: 刘偲,博士,中国科学院信息工程研究所副研究员,研究方向为图像视频处理,五年的海外留学经历。 2012年,发表业界首篇服饰搜索论文。2012~2013年,发表首篇服饰、妆容推荐论文。随后提出多种图像解析方法,准确度提升了一倍,速度提升了100倍。共发表了CCF A类论文 29篇,CCF B类论文 15篇。 Google Scholar引用次数为1900+。作为唯一被邀请的中国大陆学者,与 IBM T.J. Watson 共同撰写《visual attribute》一书。曾任VALSE 2015,ACM MM 2015 Tutorial特邀讲者。主持了面上项目以及基金重点各一项。2016年获CCF大数据与计算智能大赛综合特等奖。 2013年获CCF A 类会议ACM MM最佳论文奖。2012年获ACM MM 最佳技术展示奖。
特邀讲者3:李冠彬
演讲题目:视觉感知建模及其在图像语义理解中的应用
演讲摘要:视觉感知是人类视觉系统的重要特性之一,能让人在观察场景和感知周边世界的时候可以快速定位并获取到重要的信息。视觉感知建模是通过学习模拟人类视觉感知的机制,提取视觉数据中的显著区域或特征,辅助进行更精确的分析和识别任务。本次报告将简要介绍基于深度记忆神经网络的视觉感知模型的基本概念和算法,重点介绍其在图像多目标分类及物体检测中的应用,并给出视觉感知建模在其它计算机视觉中的应用现状。
报告人介绍:李冠彬,中山大学数据科学与计算机学院副研究员。分别于2009年和2012年在中山大学获学士和硕士学位,2016年在香港大学计算机科学系获博士学位,博士期间获得香港政府奖学金(HKPFS)资助。2016年10月至今在中山大学工作。目前从事深度学习和计算机视觉等方面的研究,是IEEE TPAMI,IEEE TIP,IEEE TC等多个权威期刊的审稿人,曾担任计算机视觉媒体会议CVM2017的委员会成员,已在包括IEEE TIP,CVPR,CG&A等会议和期刊上发表学术论文近二十篇,其中包括CCF A类论文5篇。在图像显著物体检测方面,曾连续三年以第一作者身份在计算机视觉顶级会议CVPR上发表论文三篇,两年内被引用115+次。作为课题骨干成员参与了国家重点研发计划项目“面向大范围场景透彻感知的视觉大数据智能分析关键技术与验证系统”课题4“场景视觉数据的层次化语义分析研究”。
论坛执行主席:
黄书强,教授,暨南大学理工学院,CCF YOCSEF广州2017-2018主席
杨育斌,CTO,蓝盾公司,CCF YOCSEF广州2016-2017主席
黄翰,教授,华南理工大学软件学院,CCF YOCSEF广州2017-2018副主席
黄琼,教授,华南农业大学数学与信息学院,CCF YOCSEF广州2017-2018副主席