近日,第四届“泰迪杯”全国大学生数据挖掘挑战赛落下帷幕,来自国防科大电子科学与工程学院的研究生吴冰冰、邓志鹏、傅瑞罡团队提交的“基于MSER- CNN的商品图片字符检测与识别”作品获特等奖!栾鹏、陈玓玏、程骞提交的“网络招聘信息的分析与挖掘”作品获三等奖!
特等奖作品什么样?
没错!这就是斩获特等奖的团队,高颜值学霸!下面我们就听听他们对获奖作品的介绍吧!
纵横网购平台多年,不知道你有没有被商家的广告“欺骗”过?当我们看到一个打折广告,大大的写着3折!结果,等你买的时候才发现图片的角落里隐藏了一个 “起"字。大家往往习惯搜索图片信息来获取自己想要的商品。网络商城商品众多,很多商家图片都隐含文字信息,如果能够快速提取图片中的文字,不仅能帮助商 家更加有效地进行商品推荐,还能提供更好的售后服务,方便信息监管以维护良好的网购环境、保障消费者权益,具有十分重要的研究意义和实用价值。
“基于MSER-CNN的商品图片字符检测与识别”就是这样一种基于深度学习的智能信息文本自动提取方法。该算法利用了目前最热的深度学习的方法 (alphago 听过吧,就跟那个一样的深度学习方法),结合字符检测的基本算法,能够快速准确地提取图片中的字符,并对其进行识别。要想检测图片中大小不一的字符,目前 是比较难的,连字符检测很厉害的"汉王"都没有做到。而该算法突破了传统检测方法的局限,利用深度学习的特征,不仅可以提取图片各个角落里大小不一的字 符,还可以快速准确的告诉你那个字符是什么,实用性非常强。
什么是“泰迪杯”?
“泰迪杯”全国数据挖掘挑战赛:
是由全国大学生数学建模竞赛组织委员会主办
广州泰迪智能科技有限公司承办
广东省工业与应用数学学会、华南师范大学数学科学学院协办的
面向全国在校研究生和大学生的群众性科技活动!
目的在于:
激励学生学习数据挖掘的积极性,
提高学生利用数据分析方法解决实际问题的综合能力,
培养创造精神及合作意识,
推动数据挖掘技术在高校的推广和应用。
总的来说:
就是一群高能学霸斗智斗勇的大盛会!
含金量有多高?
此次竞赛历时一个半月,共有来自全国近300所高校1665支队伍参赛,评出特等并企业冠名奖作品3份、特等奖作品3份、一等奖作品44份、二等奖作品66份、三等奖作品93份。
来源:http://www.mod.gov.cn/education/2016-06/28/content_4683745.htm