多媒体数据管理
2021-12-23
研究内容
- 基于内容的实例检索技术:通过给定查询实例图像(如汽车、商品 logo 或建筑等),在海量视频集中使用基于视觉特征的方法进行快速、准确的自动实例查找,相关研究涉及到视觉特征抽取、BoW词典训练、高维视觉索引等技术,涉及机器学习、模式识别、多媒体检索等诸多学科,目前属于较前沿的方向。
- 多媒体语义分析技术:结合图像或视频的语义属性和矩阵分解、稀疏编码等多种机器学习技术,研究如何提取鲁棒性好、泛化能力强、区分度高的属性,从而识别出图像或视频的高层语义信息,实现多媒体数据的语义识别。在高层语义信息的基础上,重点开展对象检测与识别、视频事件检测等应用研究。
- 基于属性的人的检索与识别:利用人脸检测及人体区域分割技术,研究人的属性识别方法,在多属性查询过程中,结合极值理论、Weibull分布以及属性相关度的学习算法,提升属性融合的准确性,进而得到更准确的检索与识别结果。
科研项目
- 国家自然科学基金项目:数据驱动的大规模图像自动标注关键技术研究
- 国家自然科学基金项目:大规模视频数据的拷贝检测关键技术研究
- 横向课题:海量音视频处理及检索系统
- 横向课题:多媒体大数据检索分析关键技术
- 横向课题:大数据管理技术
科研奖励
- 2013年,江苏省科学技术三等奖,基于云计算的海量物联网数据存储与处理关键技术与平台的研发与产业化。
- 2010年,国家科学技术进步二等奖,面向大规模城域监控的流媒体关键技术及装备。
- 2010年,中国电子学会电子信息科学技术三等奖,视频监控实时行为分析关键技术及应用。
- 2007年,广东省科学技术二等奖,IPTV综合服务系统。
研究成果
- Jile Zhou, Guiguang Ding, Yuchen Guo, Qiang Liu, XinPeng Dong, Kernel-Based Supervised Hashing for Cross-View Similarity Search, ICME 2014
- Zijia Lin, Guiguang Ding, Mingqing Hu, Jianmin Wang, Multi-label Classification via Feature-aware Implicit Label Space Encoding, ICML 2014
- Zijia Lin, Guiguang Ding, Mingqing Hu, Yunzhen Lin, Shuzhi Sam Ge, Image Tag Completion via Dual-view Linear Sparse Reconstructions, CVIU 2014
- Jile Zhou, Guiguang Ding, Yuchen Guo, Latent Semantic Sparse Hashing for Cross-Modal Similarity Search, SIGIR 2014.
- Mingsheng Long, Jianmin Wang, Guiguang Ding, Philip Yu, Transfer Joint Matching for Visual Domain Adaptation, IEEE Conference on Computer Vision and Pattern Recognition (CVPR 2014).
- Guiguang Ding, Yuchen Guo, Jile Zhou, Collective Matrix Factorization Hashing for Multimodal Data, IEEE Conference on Computer Vision and Pattern Recognition (CVPR 2014).
- Zijia Lin, Guiguang Ding, Mingqing Hu, Image Auto-annotation via Tag-dependent Random Search over Range-constrained Visual Neighbours, Multimedia Tools and Applications (2014).
- Zijia Lin, Guiguang Ding, Mingqing Hu, Multi-source Image Auto-annotation, ICIP 2013: 2567-2571 (Oral, Top 10% Paper)
- Z. Lin, G. Ding, M. Hu, et al. Image Tag Completion via Image-Specific Linear Sparse Reconstructions, IEEE Conference on Computer Vision and Pattern Recognition (CVPR 2013).
- M.Long, G. Ding, J. Wang, Philip Yu, Transfer Sparse Coding for Robust Image Representation, IEEE Conference on Computer Vision and Pattern Recognition (CVPR 2013).
- J Shi, M Long, Q Liu, G Ding, J Wang, Twin Bridge Transfer Learning for Sparse Collaborative Filtering, Advances in Knowledge Discovery and Data Mining, 496-507
- W Zhang, G Ding, L Chen, C Li, C Zhang, Generating virtual ratings from chinese reviews to augment online recommendations, ACM Transactions on Intelligent Systems and Technology (TIST) 4 (1), 9.
- Z. Lin, G. Ding, M. Hu, J. Wang, J. Sun, Automatic image annotation using tag-related random search over visual neighbors, In Proceedings of the 21st ACM international conference on Information and knowledge management, CIKM '12.
- M. Long, J. Wang, G. Ding, D.Shen, Q. Yang, Transfer Learning with Graph Co-Regularization, In Proceedings of the Twenty-Sixth AAAI Conference on Artificial Intelligence, AAAI '12, pp.1033-1039.
- M Long, J Wang, G Ding, W Cheng, X Zhang, W Wang, Dual transfer learning, 12th SIAM International Conference on Data Mining (SDM 2012).
- 丁贵广; 林梓佳 ,基于标签图模型随机游走的图像自动标注方法及装置 ,2011/12/28, 11, (中华人民共和国国家专利局, CN201110147140.8 专利
- 丁贵广; 林梓佳 ,基于有向图非等概率随机搜索的图像自动标注方法及装置 ,2011/12/28, 11, (中华人民共和国国家专利局, CN201110147033.5 专利
- 丁贵广; 林梓佳; 文海龙; 王建民 ,基于对等结构的分布式高维索引并行查询框架 ,2012/8/1, 11, (中华人民共和国国家专利局, CN201210038115.0 专利