科院考研推荐链接:
机器学习、大数据挖掘等人工智能领域
1997年8月-2000年7月 北京师范大学 模糊数学与人工智能专业 博士毕业,获博士学位
2000年8月北京师范大学博士毕业后,进入中国科学院计算技术研究所做博士后工作,出站后留所工作,现任中国科学院计算技术研究所研究员、博士生导师,中国科学院智能信息处理重点实验室机器学习与数据挖掘课题组负责人。兼任中国人工智能学会副秘书长,常务理事,机器学习专业委员会常务理事, 分布智能与知识工程专业委员会秘书长,中国电子学会云计算专家委员会和大数据专家委员会委员。
主要研究领域:机器学习与数据挖掘,基于云计算的大数据挖掘。主要学术贡献:提出了基于超曲面的覆盖学习算法;提出极小样本集抽样方法与相关理论;提出了基于进化规划的基于摄动的模糊聚类改进算法,解决了模糊聚类失真问题;证明了模糊集扩展原理在范畴论意义下的合理性;提出概念语义空间用于知识管理;提出基于极限学习机的分类、聚类、回归、异常发现算法。在国内外重要刊物和会议上发表近百篇学术论文,40多篇文章发表在SCI国际期刊,被EI收录66篇。
在云计算和大数据挖掘应用方面,2008年底,何清带领他的中科院计算所机器学习与数据挖掘团队,受中国移动研究院委托开发完成了基于云计算的并行数据挖掘平台,用于TB级实际数据的挖掘,实现了高性能、低成本的数据挖掘,通过这次创新,使我国获得了自主知识产权的基于云计算的数据挖掘技术。受大会邀请在第二、三、六届中国云计算大会上作了技术报告。 何清先后主持完成多个有关数据挖掘的国家自然科学基金项目和863项目,承担完成或参加完成的多项国家自然科学基金项目被评为优或特优。承担完成了两项863项目获得好评。提出了一系列有效的数据挖掘算法和多个并行机器学习算法。组织开发实现了四十多个并行机器学习算法,所开发的多个数据挖掘软件获得了软件著作权,并实际应用到电信、电力、信息安全、环保、保险行业的数十家企业,为企业带来了可观的经济效益和社会效益。2015年大数据挖掘算法与云服务科研成果获得吴文俊人工智能创新奖。
发明专利
( 1 ) 一种采用决策树的数据分类方法和系统, 发明, 2011, 第 2 作者, 专利号: 201110143821.7
( 2 ) 一种确定数据样本类别的方法及其系统 , 发明, 2010, 第 1 作者, 专利号: 200910077994.6
( 3 ) 一种关联规则挖掘方法及其系统 , 发明, 2010, 第 1 作者, 专利号: 200910077996.5
( 4 ) 一种数据挖掘系统中数据聚类的方法、系统及装置, 发明, 2011, 第 1 作者, 专利号: 201010102976.1
( 5 ) 数据关联规则挖掘实现方法与系统, 发明, 2011, 第 1 作者, 专利号: 200910091865.2
( 6 ) 聚类实现方法及系统 , 发明, 2011, 第 1 作者, 专利号: 200910091864.8
( 7 ) 聚类实现方法及系统, 发明, 2011, 第 1 作者, 专利号: 200910091866.7
( 8 ) 一种基于MapReduce的分布式垂直交叉网络爬虫系统, 发明, 2013, 第 2 作者, 专利号: 201310146080.7
( 9 ) 一种用于大数据的基于超曲面的分类方法及系统, 发明, 2013, 第 1 作者, 专利号: 201310926826.2,
( 10 ) 一种面向大数据的分布式主题发现方法及系统, 发明, 2013, 第 2 作者, 专利号: 201310526790.2
( 11 ) 描述型多维度复杂事件序列的并行频繁情节挖掘方法与系统, 发明, 2017, 第 5 作者, 专利号: 201610524750.8
( 12 ) 基于Spark的高效并行自动编码机及系统, 发明, 2016, 第 5 作者, 专利号: 2016101470075
( 13 ) 一种用于大数据的并行半定义分类方法与系统, 发明, 2016, 第 5 作者, 专利号: 201610570978.0
(14)一种多标记学习方法,发明,2018,第 5 作者,申请号:201810062864.4
软件著作权
1.Web挖掘云服务平台[简称WMCS]V1.0,中国2013SR027808
2.基于云计算的Web 挖掘系统[简称CWMS]V1.0,中国2012SR119823
3.数据挖掘云服务平台[简称COMS]V1.0,中国 2010SR060647
4.并行分布式数据挖掘软件系统[简称PDMiner]V1.0,中国 2010SR005800
5.迁移学习系统[简称TLS] V1.0,中国 2015SR195765
6.城市人口全生命周期数据挖掘系统[简称UWDMS]V1.0,中国 2015SR071535
7.基于几何超曲面的分类系统[简称HSC]V1.0,中国 2008SR02159
8.Web 智能信息处理软件[简称GHunt] V2.0,中国 2008SR35473
9.Web 智能信息处理软件[简称GHunt] V1.0,中国 2004SR07403
10.多策略数据挖掘平台[简称MSMiner] V1.0,中国 2003SR6886
11.潜在离网用户预测系统POSUPS V1.0,中国 2018SR045680