2.4. 张华平¶
张华平NLPIR 作者
张华平 博士 副教授 研究生导师
大数据搜索挖掘实验室(北京市海量语言信息处理与云计算应用工程技术研究中心) 主任
地址:北京海淀区中关村南大街 5 号 100081
电话:+86-10-68918642
Email:kevinzhang@bit.edu.cn
MSN: pipy_zhang@msn.com;
网站: http://www.nlpir.org (自然语言处理与信息检索共享平台)
http://www.bigdataBBS.com (大数据论坛)
微信公众号:大数据千人会
2.4.1. 一、基本情况:¶
北京理工大学副教授,博士,研究生导师,知名汉语分词系统 ICTCLAS 创始人,北京市海量语言信息处理与云计算工程中心大数据搜索与挖掘实验室主任,中国互联网协会大数据工作委员会(筹)执行主任,中国中文信息学会社会媒体处理专业委员会副秘书长,北京市顺义区政府专家咨询委员会委员,同时担任湖北汽车工业学院兼职教授,辽宁师范大学客座教授,首都师范大学兼职副教授;中国计算机学会青年科技论坛 YOCSEF 委员,中国计算机学会普及工委委员,国家自然科学基金函评专家,北京市重点产业知识产权联盟专家、同时担任《计算机学报》、《计算机研究与发展》、中国科技论文在线等杂志的特邀评审专家。2005 年博士毕业于中科院计算所,研究方向为:大数据搜索与挖掘、自然语言处理、信息检索与信息安全。曾先后获得 2016 年新疆自治区科技进步奖二等奖,2010 年度钱伟长中文信息处理科学技术奖一等奖,中科院院长优秀奖、中科院计算所所长特别奖,中科院计算所“百星计划”首批入选者。发表《大数据搜索与挖掘》、《大数据大家谈》、《信息检索:算法与启发式规则》、《自然语言理解》等专译著 4 部。并作为特邀大数据技术专家,先后在中央电视台、全球大数据技术峰会、中国网络科学大会、《中国计算机世界》上做演讲或专访,引起学术界与产业界广泛关注。
张华平作为课题组长主持开发了国家自然科学基金、863、973、242 等科研课题十余项,2004 年参加 TREC Novelty 比赛,综合排名国际第一;从 2002 年至今,研制汉语词法分析系统 ICTCLAS,是当前世界上最好的汉语词法分析器,ICTCLAS 在国家 973 评测和第一届国际汉语分词大赛中均获得了综合得分第 1 名;同时,ICTCLAS 也是中文自然语言开放平台(www.nlp.org.cn)上最受欢迎的开放源代码项目,目前,已经向国内外的企业和学术机构颁发了三十万多份授权,在学术界和产业界得到了广泛的应用。
2.4.2. 二、 学术经历:¶
2014 年全国社会媒体处理大会程序委员会主席 IJCNLP 2013 Workshop on Natural Language Processing for Social Media (SocialNLP) 程序委员会委员 Workshop on Natural Language Processing for Social Media (SocialNLP2014) 程序委员会委员 Big Data Summit 2014 Program Committee Member
2.4.3. 三、教育经历:¶
2007.11-2008.5 北京大学光华管理学院高级工商管理硕士进修班 6 期结业
2000.9-2005.7 中国科学院计算技术研究所 计算机软件与理论 博士学位,(硕士课题组长:刘群研究员中科院计算所;硕士导师:程学旗研究员 中科院计算所网络实验室主任;博士导师:白硕研究员 上海证券交易所总工程师)
1995.9-1999.7 北方工业大学 计算机应用 学士学位
2.4.4. 四、工作经历:¶
2009.11-至今,北京理工大学计算机学院 大数据搜索与挖掘实验室主任,副教授,研究生导师;
2006.9-2009.11,副研究员(破格晋升),中国科学院计算技术研究所硕士生导师,中科计算技术转移中心网络智能事业部负责人;
2005.7-2006.9 助理研究员,中国科学院计算技术研究所浅层语言处理课题组组长;
2.4.5. 五、主要科研成果:¶
作为课题第一负责人先后主持研制的课题有:中国证监会网络监测系统,网络话题的发现、传播及动态演化特征分析技术(863 课题);专项辅助**系统(国家 242 信息安全计划)、短文本分析(国家 242 信息安全计划)、面向证券市场的舆情动态分析(科学院支持课题)、社会舆情分析机制研究(计算所知识创新工程课题),面向中文搜索引擎的索引词分析技术(计算所知识创新工程课题);
从 2002 年至今,一直研制汉语词法分析系统 ICTCLAS,最新研制的 ICTCLAS2011 版本,速度达到了 1MB/s,精度达到 98.45%,是当前世界上最好的汉语词法分析器,曾获得了国家 973 专家组评测中获得第一名,获得了第一届国际汉语分词大赛中综合得分第 1 名。同时,ICTCLAS 也是中文自然语言开放平台(www.nlp.org.cn)上最受欢迎的开放源代码项目,目前,已经向国内外的企业和学术机构颁发了 10 万余份授权,我们提供的各种形式研究成果,在学术界和产业界得到了广泛的应用。
2.4.6. 六、主要获奖情况:¶
2016 年,新疆自治区科技进步二等奖,维吾尔文目标站点内容监测关键技术研究与系统开发;
中央网信办十佳讲师
2010 年获得钱伟长中文信息处理科学技术奖一等奖(中文信息领域最高奖)
2004 年获计算所所长特别奖(0.5%)
2004 年获中科院院长奖(0.2%)
2006 年获计算所优秀个人(1%)
2007 年获计算所优秀团队(1%)
2008 年获计算所优秀个人(1%)
2007 年计算所“百星计划”首批入选者(1%)
2.4.8. 八、主持的科研课题:¶
课题名称 来源 起始日期 完成人顺序
语义主题与社交关系融合的特定群体发现关键技术研究;国家自然科学基金面上项目(61772075); 2018.1-2021.12;61 万;在研 张华平
日志分析与用户画像* 国家 242 信息安全计划 70 2016.6-2017.5 课题负责人 2016A83
中国人民银行征信中心互联网公共信息自动抓取课题研究服务二次采购项目 2015.5-10 负责人
文本挖掘关键技术* 国家 242 信息安全计划 80 2014.11-2015.11 课题负责人 2014A10 社交网络分析及信息传播理论在舆情预警方面的示范验证 国家 973 重点基础研究发展计划 96 2013.1-2017.12 子课题负责人:张华平 2013CB329606
基于主体个性化的微博情感分析关键技术研究 国家自然科学基金面上项目 84 万 2013.1-2016.12 基金号:61272362 课题负责人:张华平
新疆维文语言网络舆情监测预警系统开发与应用 新疆自治区科技支撑计划课题 2012.1-2013.12 2 联合申请单位负责人
云计算安全隐患分析与战略对策研究 中国信息安全评测中心 2010.11-2011.11 1 主持
科技项目库构建与挖掘系统 中国科学技术信息研究所 2010.11-2011.11 1 主持
基于时空分析的气象公报自动生成 国家气象局 2010.9-2011.9 1 主持
中国邮政地址搜索引擎系统 中国邮政集团 2011.1-2011.3 1 主持
网络话题的发现、传播及动态演化特征分析技术 国家 863 计划 2007.9-2009.7 1 主持
基于消息的热点发现与信息追踪* 国家 242 信息安全计划 2005.11-2006.11 1 主持
辅助分析系统* 国家 242 信息安全计划 2007.10-2008.4 1 主持
面向热点话题发现系统* 工信部 2008.12-2009.5 1 主持
的舆情研究* 国家 242 信息安全计划 2008.11-2009.10 2 副组长
虚拟计算环境下的网络舆情自适应系统研究* 国家 242 信息安全计划 2008.11-2009.11 2 副组长
面向互联网的发现系统* 工信部 2008.6-2009.5 1 主持
中国证监会网络信息监控系统 中国证监会 2008.11-2009.6 1 主持
云计算安全战略研究 安全部 2010.11-2011.11 1 主持
社会舆情分析机制研究 2006 所知识创新基金 2006.6-2007.6 1 主持
面向证券市场的舆情动态分析 优秀博士学位论文、院长奖获得者科研启动专项资金 2006.07-2007.6 1 主持
上市公司商情挖掘系统开发应用 2007 计算所所知识创新基金百星计划 2007.11-2008.10 1 主持
基于大规模计算平台的互联网文本信息搜索引擎系统 中国移动研究院 2008.10-2009.6 1 主持
2.4.9. 九、新闻媒体报道:¶
2013-9-20 【计世网】“四问大数据”北理工计算机学院副教授张华平接受采访
2013-7-2 张博士再次接受 CCTV 新闻频道连线采访谈网络战
2013-6-14 张华平博士接受 CCTV 新闻频道采访谈棱镜项目 2012-6-8 张华平博士接受《中国远程教育》专访,畅谈网络搜索与挖掘
2.4.10. 十、指导学生情况:¶
学生姓名 身份 年份 毕业去向
万金晶北京理工大学 硕士 2017 在读
ihad 北京理工大学 博士 2018 在读(来自尼泊尔?)
Iham Nugraha 北京理工大学 博士 2018 在读(来自印尼)
ada 北京理工大学 博士 2017 在读(来自尼泊尔?)
sif Khan 北京理工大学 博士 2018 在读(来自巴基斯坦)
张宝华 北京理工大学 硕士 2018 在读
姜庆红 北京理工大学 硕士 2018 在读
刘子宇 北京理工大学 硕士 2018 在读
王刚 北京理工大学 硕士 2018 在读
. Sheryta Yvette 北京理工大学 硕士 2018 在读(来自多哥)
ram 北京理工大学 硕士 2016 毕业回国(巴基斯坦)
fazi 北京理工大学 硕士 2016 毕业回国(印尼)
高莘 北京理工大学 硕士 2016 北大读博
刘斌 北京理工大学 硕士 2016 中国联通
张玺 北京理工大学 硕士 2016 在读
徐程程 北京理工大学 硕士 2015 百度
吴松泽 北京理工大学 硕士 2015 百度
张亚男 北京理工大学 硕士 2015 百度
卢兵兵 北京理工大学 硕士 2015 部队
于 敏 北京理工大学 硕士 2014 福建三明学院任教
乔 杨 北京理工大学 硕士 2014 中国移动研究院
张 雨 北京理工大学 硕士 2014 百度
赵连伟 北京理工大学 硕士 2013 中国农业银行
史学文 北京理工大学 硕士 2013 转博
陈晓阳 北京理工大学 硕士 2012 微软苏州研究院
张瑞琦 北京理工大学 硕士 2012 解放军某部
李 蕾 北京理工大学 硕士(联合赵燕平教授) 2012 亚马逊
孙梦淑 北京理工大学 硕士(联合商建云教授) 2012 支付宝
王 琦 北京理工大学 硕士(联合商建云教授) 2012 央行
朱 倩 北京理工大学 硕士(联合商建云教授) 2012 工信部电子一所
李 然 北京理工大学 硕士 2012 百度赵小宝 北京理工大学 硕士 2011 华为
李清敏 首都师大 客座硕士 2011 工信部电子一所
李笑侃 北京理工大学 硕士(联合李玉岗博士) 2010 中国人寿
王晓冉 北京理工大学 硕士(联合赵燕平教授) 2010 京东方
潘迪 北京理工大学 硕士(联合赵燕平教授) 2010 新东方
高健 北京理工大学 硕士(联合赵燕平教授) 2009 北车集团
李恒训 首都师大 客座硕士 2008 公安部一所
刘治华 北方工业大学 客座硕士 2008 曙光公司
蒋骈 中国科技大学 客座硕士 2007 南京工业学院
张京阳 首都师大 客座硕士 2007 网易
秦鹏 首都师大 客座硕士 2007
2.4.11. 十一、学术论文论著:¶
【出版的专(译)著】
张华平,商建云,郭涛,刘兆友编著 大数据智能(2019),清华大学出版社(ISBN:978-7-121-30181-0)
张华平,商建云,白硕,段永朝等著 大数据大家谈(2017.1),电子工业出版社(ISBN:978-7-121-30181-0)
张华平,高凯,黄河燕,赵燕平.大数据搜索与挖掘.科学出版社.2014 出版(ISBN:978-7-03-040318-6)
张华平,李恒训,刘治华.信息检索算法与探索法(译著),人民邮电出版社, 2010 年 9 月(ISBN:978-7-115-23575-6)
刘群,张华平,骆卫华,孙健,自然语言理解(译著), 电子工业出版社, 2005 年 1 月(ISBN:7-121-00755-X)
高凯,仇晶,张晓明,王伟, 张华平,信息检索与智能处理,国防工业出版社,2014。
2.4.11.1. 【获得的专利】¶
完美双数组 TRIE 树词典管理与检索方法(专利号:200510130690.3),张华平、王思力,第一发明人
周建栋,赵燕平,张华平,李想.一种网络个体或群体情绪认知能力预测与可视化方法(授权专利号: 20140795679.8).专利
张华平,周建栋,赵燕平,孙梦淑.一种网络个体或群体价值观自动判别方法.专利(已申请立项)
一种基于微博特定事件的影响力计算方法 ? ?专利号:201610371596.5 申请日:2016.5.30
一种面向微博的疑似水军发现技术 ? 专利号:201610371264.7?申请日:2016.5.30
###【获得的软件著作权】
[1]计算所汉语词法分析系统 ICTCLAS,软件登记号为 2003SR0087。 [2]汉语命名实体识别系统,软件登记号:2004SR00677
###【发表的论文】
“Xi Zhang, Hua-Ping Zhang, Lei Zhao:
Reading More Efficiently: Multi-sentence Summarization with a Dual Attention and Copy-Generator Network. In: The Pacific Rim International Conferences on Artificial Intelligence, PRICAI 2018, Nanjing, Jiangsu, China, 28-31 August 2018, (1) 2018: 811-823″
Shen Gao, Huaping Zhang, Kai Gao. A Convolutional Neural Network Based Sentiment Classification and the Convolutional Kernel Representation[C]. Proceedings of 22nd International Conference on Natural Language & Information Systems(NLDB), Springer LNCS, Liège, Belgium, 21-23 June, 2017, EI Compendex index
Shen Gao, Huaping Zhang, Kai Gao. Text Understanding with a Hybrid Neural Network Based Learning[C]. Proceedings of the 3th International Conference of Pioneering Computer Scientists, Engineers and Educators (ICPCSEE), Springer LNCS, Changsha, China, 22-24 September, 2017, EI Compendex index.
SongZe Wu, Huaping Zhang, Chengcheng Xu, Tao Guo. Text Clustering on Short Message by Using Deep Semantic Representation. International Conference on Computational Sciences, Advanced Database and Computing, 2017.
“CHENGCHENG XU, HUAPING ZHANG, BINGBING LU AND SONGZE WU. Local
Community Detection Using Social Relations and Topic Features in Social Networks -[M]. Chinese Computational Linguistics and Natural Language Processing Based on
Naturally Annotated Big Data. Springer, Cham, 2017, 371-383.”
“BINGBING LU, HUAPING ZHANG, BIN LIU AND ZHONGHUA ZHAO. Research on
User Identification Algorithm Based on Massive Multi-site VPN Log [C]. IEEE, International Conference on Communication Technology. IEEE, 2017:1372-1381″ -张华平,商建云.面向社会媒体的开放领域新词发现.中文信息学报.第 31 卷第 3 期,115-121. 2017 年 5 月 -张华平,李恒训,李清敏. 情感词发现与极性权重自动计算算法研究.中文信息学报.第 31 卷第 3 期,60-66. 2017 年 5 月
A Convolutional Neural Network Based Sentiment Classification and the Convolutional Kernel Representation
News Abridgement Algorithm Based on Word Alignment and Syntactic Parsing[M]// Chinese Computational Linguistics and Natural Language Processing Based on Naturally Annotated Big Data. 2016. -
Qiao Y, Zhang Huaping(_), Yu M, et al. Sina-Weibo Spammer Detection with GBDT [M]// Social Media Processing. Springer Singapore, 2016.
Yang Qiao,Huaping Zhang_(张华平),.Effective Detecting Microblog Spammers Using Big Data Fusion Algorithm.WorldComp’16,July 25-28,Las Vegas,Nevada,USA -
Jiandong Zhou(周建栋), Yanping Zhao(赵燕平), Huaping Zhang*(张华平). Measuring Emotion Bifurcation Points for Individuals in Social Media[C].the Hawaii International Conference on System Science(国际系统科学年会 HICSS’49,管理 A 类会议, EI 检索), Jan.5-8, 2016, Honolulu, KAUAI, Hawaii USA.2016:1949-1958. - -李然,张华平,赵燕平,商建云.基于主题模型与信息熵的中文文档自动摘要技术研究(Automatic Text Summarization Research Based on Topic Model and Information Entropy).计算机科学.2014-11 - -张华平,孙梦姝,张瑞琦,李蕾.微博博主的特征与行为大数据挖掘.中国计算机学会通讯.2014.6.p36-p43 -
Huaping Zhang,Ruiqi Zhang,Yanping Zhao,Baojun Ma;Big Data Modeling and Analysis of Microblog Ecosystem;International Journal of Automation and Computing,2014.11(2) p119-127 -
Baojun Ma,Huaping Zhao,Guoqing Chen,Yanping Zhao;Investigating Associative Classification for Software Fault Prediction: An Experimental Perspective;Int’l Journal of Software Engineering and Knowledge Engineering,2013( SCI Indexed) -
Kai Gao*, Hua-ping Zhang, Sheng-wang Li, Wei Wang, Jing Qiu;Research on Classification Algorithm and its Application in Cased-Based Reasoning,2014 - -张华平,以主体为中心的微博计算方法,复杂系统与复杂性科学,2012 年第四期 p84-91 -
Hua-Ping Zhang,Huan-Ping Wu,Jian Gao,Yan-Ping Zhao,Zhong-Liang Lv,Meteorological Bulletin Automatic Generation based on Spatio-Temporal Reasoning,In Proceedings of 2011 International Conference on Machine Learning and Cybernetics in Guangxi, China,2011.7,p1927-1931 -
Hua-Ping Zhang, Qian Mo,He-Yang Huang,Structured POI data Extraction from Internet News,In Proceedings of the 4th International Universal Communication Symposium (IUCS 2010) in Beijing, China,2010.10,p115-120(特邀报告)
Hua-Ping ZHANG,Jian GAO,Qian MO, He-Yan HUANG. Incorporating New Words Detection with Chinese Word Segmentation. In Proceedings of CIPS-SIGHAN Joint Conference on Chinese Language Processing (CLP 2010).Beijing, China.2010.8 .p249-251.
Hua-Ping ZHANG,Zhi-Hua LIU,Qian MO,He-Yan HUANG. Chinese Personal Name Disambiguation Based on Person Modeling. In Proceedings of CIPS-SIGHAN Joint Conference on Chinese Language Processing (CLP 2010).Beijing, China.2010.8 .p374-378
Hua-Ping ZHANG, Jian Sun, Bin WANG, Shuo BAI. Computation on Sentence Semantic Distance for Novelty Detection; Chinese Journal of Computer Science and Tech. vol.3, 2005
Hua-Ping Zhang, Hong-Bo Xu, Shuo Bai, Bin Wang, Xue-Qi Cheng. Experiments in TREC 2004 Novelty Track at CAS-ICT. In Proc. of the 13th Text Retrieval Conference, Gaithersburg, Maryland, November, 2004, pp287 -张华平,刘群. 基于角色标注的中国人名自动识别研究. 计算机学报, vol.27, No.1, 2004, pp.85-91 被引用 31 次 -刘群,张华平,俞鸿魁,程学旗. 基于层叠隐马模型的汉语词法分析; 计算机研究与发展, 41 卷, No.8, 2004, pp.1421-pp.1429 被引用 43 次
Hua-Ping ZHANG, Qun LIU, Hong-Kui YU, Xue-Qi CHENG, Shuo BAI. Chinese Name Entity Recognition Using Role Model. Special issue “Word Formation and Chinese Language processing” of the International Journal of Computational Linguistics and Chinese Language Processing, vol.8, No.2, 2003, pp. 29-602
Hua-Ping ZHANG, Qun LIU, Xue-Qi CHENG, Hao Zhang, Hong-Kui Yu. Chinese Lexical Analysis Using Hierarchical Hidden Markov Model, Second SIGHAN workshop affiliated with 41st ACL; Sapporo Japan, July, 2003, pp. 63-70
Hua-Ping ZHANG, Hong-Kui Yu, De-Yi Xiong, Qun LIU. HHMM-based Chinese Lexical Analyzer ICTCLAS, Second SIGHAN workshop affiliated with 41th ACL; Sapporo Japan, July, 2003, pp. 184-187
Kevin Zhang (Hua-Ping Zhang), Qun Liu, Hao Zhang, Xueqi Cheng. Automatic Recognition of Chinese Unknown Words Based on Role Tagging, First SIGHAN affiliated with 19th COLING, September 2002, pp71-77 -张华平,刘群.基于 N-最短路径的中文词语粗分模型. 中文信息学报. 2002.9, Vol.16(5):pp.1-pp.7; 被引用 34 次