企鹅电竞竞猜

当前位置: 首页 >> 师资力量 >> 语言学及应用语言学 >> 正文

李斌(副教授)

作者:时间:2018-05-05点击数:

李斌,男,1981年生,企鹅电竞竞猜语言科技系副教授、硕导,南京师范大学校级学科带头人培养对象。主要从事计算语言学和数字人文方向的交叉学科研究,包括词法分析、认知语义计算、语料库、语言知识库、语法理论、历史人文计算与数据库构建方面。2003年毕业于企鹅电竞竞猜汉语言文学(文科基地)专业,获学士学位。2006年、2009年,在企鹅电竞竞猜师从陈小荷教授攻读研究生,分获计算语言学方向硕士和博士学位。后留校任教,讲授中文信息处理概论、句法学、数据结构、数理逻辑、人工智能、数字人文与数据库编程等研究生和本科课程。2010-2013年南京大学计算机科学与技术系博士后,2015年美国布兰迪斯大学计算机系访学学者。2019年8月至2020年3月,美国哈佛大学计量社会科学研究所访问学者。担任中国中文信息学会青年工作委员会委员、中国人工智能学会语言智能专委会委员、江苏省人工智能学会自然语言处理专委会委员、中国图象图形学学会可视化与可视分析专委会委员、中国古籍保护协会古籍智能开发与利用专委会秘书长。

主持完成国家社会科学基金青年项目1项,国家博士后基金1项,教育部青年社科项目1项,完成横向课题4项,参与完成国家自然科学基金、国家社会科学基金、211工程项目等多个研究项目。目前主持国家社科基金项目1项,横向课题1项。出版《动宾搭配的语义分析和计算》《词语认知属性的知识库构建和应用》《语言探秘》3部专著,在国内外期刊和重要会议上发表论文六十多篇,其中被SCI、EI、CSSCI、CSCD索引20多篇,3篇被《人大复印资料》和中国社会科学网转载。专利1项,软件著作权十多项。3项语言数据库在国际权威语言资源平台LDC发布。2017年获中国计算语言学会议CCL2017最佳论文奖。受邀在哈佛大学、宾夕法尼亚大学、社科院、北大、清华等高校讲座20多场次。

1.主要学术成果

(1)中文抽象语义依存语料库。为了解决中文句子语义分析的瓶颈难题,与美国布兰迪斯大学合作,设计编写了详细的标注规范和标注软件,制作了2万多句语料。获得国家社科基金资助和全国计算语言学大会CCL2017最佳论文奖。2020年与欧美多家高校联合主办国际跨语言语义自动分析评测MRP2020,给汉语句子语义分析带来重大突破,从原来60%左右的分析精度提升至80%,发表论文十多篇,软著3项。2022年在CCL大会上主办中文抽象语义解析评测CAMRP2022。

(2)古汉语深加工语料库与自动分析技术。制定先秦汉语分词和词性标注规范,主持建设了四百万字精加工的跨时代古汉语语料库、三十万词条的汉语历时词库(教育部项目)、三万多词条的古汉语义类词典(先秦WordNet)以及带有人物地理信息的《左传》、《史记》、《资治通鉴》数字人文知识库。设计完成基于深度学习的古汉语句读、分词、词性标注的自动分析软件(专利1项,软著2项)。2022年在LREC的子会议上主办第一届古汉语分词与词性标注国际评测EvaHan2022,大大推动了古汉语的自动分析技术。发表论文20多篇。

(3)汉语认知属性知识库。通过互联网上采集和校对数百万条的“词语-属性”对,如“猪-笨”、“花-红”等,建成国内第一个大规模认知属性知识库,成为中文隐喻计算和汉语特色文化经验的基础数据。获得国家社科基金青年项目资助,出版专著1部,论文十多篇,数据在国际LDC平台发布。

2.教学成果

[1]2010年 南京师范大学大学生暑期社会实践活动“优秀指导教师”(08(6)班小分队领队:王硕)

[2]2012年 指导本科生09(7)班张丽获南京师范大学本科生优秀毕业论文《江苏旅游问答系统的设计与实现》

[3]2013年 指导本科生11(7)班暑期社会实践小分队获学校暑期社会实践一等奖,指导学生获南京师范大学本科生大创项目(校级)结项良好徐杰

[4]2015年 指导学生获南京师范大学本科生大创项目(国家级)《左传历史人物时空检索平台》结项优秀 王璐等同学

[5]2016年 指导学生获南京师范大学本科生优秀毕业论文(王璐)、研究生(刘雪扬)优秀毕业论文各一项

[6]2017年 指导南京师范大学本科生大创项目(国家级)《数字人文之史记大事件检索平台》滚动项目2项

[7]2017年 指导学生获江苏省高等学校本专科优秀毕业设计(论文)三等奖(王璐)2017.06江苏省教育厅

[8]2019年 指导学生获江苏省高等学校本专科优秀毕业设计(论文)二等奖(李雅欣)2019.06江苏省教育厅

[9]2021年 指导学生获中国大学生计算机设计大赛三等奖(唐华玥,陈舒凡,周宇涵)2021.07教育部

3.出版专著

[1]语言探秘.南京师范大学出版社,2018年12月.

[2]动宾搭配的语义分析和计算.世界图书出版公司·北京公司,2011年11月.

[3]词语认知属性的知识库构建和应用.世界图书出版公司·北京公司,2017年9月.

4.发表论文

[1]Bin Li, Yiguo Yuan, Jingya Lu, Minxuan Feng, Chao Xu, Weiguang Qu and Dongbo Wang, The First International Ancient Chinese Word Segmentation and POS Tagging Bakeoff: Overview of the EvaHan 2022 Evaluation Campaign. Proceedings of the Second Workshop on Language Technologies for Historical and Ancient Languages (ISBN: 979-10-95546-78-8). France, 2022.

[2]Liming Xiao, Bin Li, Zhixing Xu, Kairui Huo, Minxuan Feng, Junsheng Zhou and Weiguang Qu. Align-smatch: A Novel Evaluation Method for Chinese Abstract Meaning Representation Parsing based on Alignment of Concept and Relation.Proceedings of the 13th Conference on Language Resources and Evaluation (LREC 2022), pages 5938–5945. Marseille, 20-25 June 2022.

[3]郑童哲恒,李斌,冯敏萱,常博林,王东波.历史典籍的结构化探索——《史记·列传》数字人文知识库的构建与可视化研究,大数据(CSCD),2022-05.

[4]肖力铭,李斌,许智星,霍凯蕊,冯敏萱,周俊生,曲维光.基于概念关系对齐的中文抽象语义表示解析评测方法[J].中文信息学报,2022,36(01):21-30+38.

[5]赵连振,张逸勤,刘江峰,王东波,冯敏萱,李斌.面向数字人文的先秦两汉典籍自动标点研究——以SIKU-BERT预训练模型为例[J/OL].图书馆论坛,2022:1-12.

[6]孙超,曲维光,魏庭新,顾彦慧,李斌,周俊生.基于神经网络的连动句识别[J].中文信息学报,2022,36(02):12-21.

[7]常博林,万晨,李斌,陈欣雨,冯敏萱,王东波.基于词和实体标注的古籍数字人文知识库的构建与应用——以《资治通鉴·周秦汉纪》为例[J].图书情报工作, 2021, 65(22): 134-142.

[8]Kairui Huo, Bin Li, Yuanyuan Xie, Minxuan Feng and Weiguang Qu. An Overview of Metaphor Computation. International Journal of Asian Language Processing. Vol. 31, No. 02, 2021.

[9]Huidan Xu, Siyu Chen, Jingjing Cai, Lin Cao, Chen Wan, Bin Li. The Construction and Statistical Analysis of Pre-Qin Ancient Chinese WordNet. International Journal of Knowledge and Language Processing, vol.12,no.1, pp.48-61, 2021.

[10]Yiguo Yuan, Bin Li. A Study on the Diachronic Evolution of Ancient Chinese Vocabulary Based on a Large-Scale Rough Annotated Corpus. Asia Pacific Journal of Corpus Research, 2021, 2(2), 31-41.

[11]胡昊天,张逸勤,邓三鸿,王东波,冯敏萱,刘浏,李斌.面向数字人文的《四库全书》子部自动分类研究——以Siku BERT和Siku RoBERTa预训练模型为例[J/OL].图书馆论坛:1-16[2021-12-04].

[12]刘畅,王东波,胡昊天,张逸勤,李斌.面向数字人文的融合外部特征的典籍自动分词研究——以sikuBERT预训练模型为例[J/OL].图书馆论坛:1-13[2021-12-04].

[13]张琪;江川;纪有书;冯敏萱;李斌.面向多领域先秦典籍的分词词性一体化自动标注模型构建.数据分析与知识发现. 2021-03-25 .

[14]王倩;王东波;李斌;许超.面向海量典籍文本的深度学习自动断句与标点平台构建研究.数据分析与知识发现. 2021-03-25.

[15]杜悦;王东波;江川;徐润华;李斌.数字人文下的典籍深度学习实体自动识别模型构建及应用研究,图书情报工作. 2021-03-08.

[16]侯文惠;曲维光;魏庭新;李斌;顾彦慧.面向中文AMR标注体系的兼语语料库构建及兼语结构识别.清华大学学报(自然科学版) , 2021-01-08

[17]Bin Li , Yaxin Li , Qian Yang, Yaqi Wang and Rui Chen. From History Book to Digital Humanities Database: The Basic Annals of the Shiji. Journal of Chinese History, 2020, 4(2), 528-536. doi:10.1017/jch.2020.24

[18]李斌,王璐,陈小荷,王东波.数字人文视域下的古文献文本标注与可视化研究——以《左传》知识库为例.大学图书馆学报,2020(5).

[19]闫培艺,李斌,黄彤,霍凯蕊,陈瑾,曲维光.基于抽象语义表示的汉语疑问句的标注与分析,CCL2020已录用.

[20]戴玉玲,李斌,戴茹冰,冯敏萱,曲维光.基于关系对齐的汉语虚词抽象语义表示与分析,中文信息学报,2020(4)

[21]程宁,李斌,葛四嘉,郝星月,冯敏萱.基于BiLSTM-CRF的古汉语自动断句与词法分析一体化研究,中文信息学报,2020(4)

[22]霍凯蕊,李斌,冯敏萱,曲维光.基于认知属性的词语褒贬度计算,The 20th Chinese Lexical Semantics Workshop (CLSW2020),2020(5).

[23]Li Song, Yuan Wen, Sijia Ge, Bin Li and Weiguang Qu. An Easier and Efficient Framework to Annotate Semantic Roles: Evidence from the Chinese AMR Corpus. J.-F. Hong et al. (Eds.): Proceedings of the 20th Chinese Lexical Semantics Workshop(CLSW 2019), LNAI 11831, pp. 474–485, 2020.

[24]Xingyue Hao, Sijia Ge, Yang Zhang, Yuling Dai, Peiyi Yan, and Bin Li. The Construction and Analysis of Annotated Imagery Corpus of Three Hundred Tang Poems. J.-F. Hong et al. (Eds.):Proceedings of the 20th Chinese Lexical Semantics Workshop(CLSW 2019), LNAI 11831, pp. 517–524, 2020.

[25]Li Song, Yuling Dai, Yihuan Liu, Bin Li, Weiguang Qu. Construct a Sense-Frame Aligned Predicate Lexicon for Chinese AMR Corpus. Proceedings of the 12th Conference on Language Resources and Evaluation (LREC 2020), pages 2955–2962, Marseille, 11–16 May 2020.

[26]CHENG Ning, LI Bin, XIAO Liming, XU Changwei, GE Sijia, HAO Xingyue, FENG Minxuan . Integration of Automatic Sentence Segmentation and Lexical Analysis of Ancient Chinese based on BiLSTM-CRF Mode. 1st Workshop on Language Technologies for Historical and Ancient Languages, (LT4HALA 2020), pp 52-58. Marseille, 11–16 May 2020.

[27]Bin Li, Yuan Wen, Li Song, Weiguang Qu, Nianwen Xue. Building a Chinese AMR Bank with Concept and Relation Alignments. Linguistic issues in Language Technology, Vol.18, 2019.

[28]吴泰中,顾敏,周俊生,曲维光,李斌,顾彦慧.基于转移神经网络的中文AMR解析.中文信息学报,2019(4).

[29]李斌,刘雪扬.基于《汉语大词典》的汉语词汇历时演变计量研究,南京师大学报(社会科学版),2018年第5期.(C刊)

[30]李斌,闻媛,宋丽,卜丽君,曲维光,薛念文.融合概念对齐信息的中文AMR语料库的构建,中文信息学报,2017(6).

[31]李斌,陈静.基于《日本语源大辞典》的汉源日词历时分析,企鹅电竞竞猜学报,2017年第3期.

[32]Bin Li, Lu Wang, Yuan Wen, Xiaohe Chen, Yanhui Gu. Discover social relations and activities from ancient Chinese history book Zuo Zhuan. International Conference on Behavioral, Economic, Socio-cultural Computing (BESC). Krakow, Poland,16-18 Oct. 2017.

[33]Bin Li, Yuan Wen, Lijun Bu,Weiguang Qu, Nianwen Xue. Annotating the Little Prince with Chinese AMRs. Proceedings of LAW X-The 10th Linguistic Annotation Workshop(LAW-2016), Aug 11, 2016, Berlin, Germany:7-15.

[34]李斌,闻媛,卜丽君,薛念文.英汉《小王子》AMR语义图结构的对比分析,中文信息学报, 2017(1).

[35]李斌,宋丽,银思琪,王萌.基于认知属性库的原型范畴研究,中文信息学报, 2016(6),2016.

[36]Yingjie Zhang,Bin Li,Xinyu Dai,Shujian Huang,Jiajun Chen. PQAC-WN: Constructing a WordNet for Pre-Qin Ancient Chinese. Language Resources and Evaluation(SCIE).2016.

[37]Bin Li, YuanWen, Cuijuan Xing,Yichu Zhou,Dekuan Xu. Building a Chinese Dependency GraphBank.2016 IEEE/WIC/ACM International Conference on Web Intelligence Workshops(EI), 2016.

[38]Bin Li, Xiaopeng Bai, Siqi Yin, Jie Xu. Chinese CogBank: Where to See the Cognitive Features of Chinese Words. Proceedings of the Third Workshop on Metaphor in NLP, pages 77–86, Denver, Colorado, June 5, 2015.

[39]Xiaopeng Bai, Bin Li. Comparing Argument Structure in Chinese Verb Taxonomy and Chinese Propbank. 2015 IEEE/WICI ACM International Conference on Web Intelligence (WI'15).pages188-190, Singapore on December 6-9, 2015.

[40]李斌.语言知识库“知网”的概念义原系统.语言研究集刊(第八辑).江苏凤凰教育出版社. 2015.(PDF)

[41]Yingjie Zhang, Bin Li, Xiaoyu Wang, Xueyang Liu, Jiajun Chen. Mapping Word Senses of Middle Ancient Chinese to WordNet. NLPOE, Warsaw, Poland, 2014.

[42]Bin Li,Minxuan Feng, Xiaohe Chen. Corpus Based Lexical Statistics of Pre-Qin Chinese. Lecture Notes in Computer Science Volume 7717, 2013, pp 145-153.

[43]Liu Liu,Bin Li,Lijun Bu,Tian-tian Zhang,Xiaohe Chen.Automatic Acquisition of Chinese Words’ Property of Times. Lecture Notes in Computer Science Volume 7717, 2013, pp 154-165.

[44]Tian-tian Zhang,Bin Li,Liu Liu. Research of Contemporary Use of the Cultural Revolution Vocabulary. Lecture Notes in Computer Science Volume 7717, 2013, pp 696-707.

[45]刘浏,李斌,曲维光,陈小荷.先秦词汇的时代特征自动获取及文献时代的自动判定,中文信息学报,2013年第5期.

[46]李斌.上古汉语的动力学模型——音节合并与声调的产生,第七届官话方言国际学术讨论会,2013年11月.

[47]Bin Li, Jiajun Chen and Yingjie Zhang. Web Based Collection and Comparison of Cognitive Properties in English and Chinese. NAACL-HLT 2012 Joint Workshop on Automatic Knowledge Base Construction and Web-scale Knowledge Extraction (AKBC-WEKEX), June 7-8, 2012, Montreal, Canada.

[48]Bin Li, Haibo Kuang, Yingjie Zhang, Jiajun Chen, Xuri Tang. Using Similes to Extract Basic Sentiments across Languages. The 2012 International Conference on Web Information Systems and Mining (WISM'12), Lecture Notes in Computer Science(LNCS), Springer,2012.

[49]李斌,陈家骏,陈小荷.基于互联网的汉语认知属性获取及分析.语言文字应用,2012年第3期:134-143. (人大复印资料·语言文字学,2012年第12期全文转载:111-117)(中国社会科学网转载)

[50]Yingjie Zhang, Bin Li, Xinyu Dai and Jiajun Chen. MIXCD_System Description for Evaluating Chinese Word Similarity at SemEval-2012. The First Joint Conference on Lexical and Computational Semantics(*SEM). June 7-8, 2012, Montreal, Canada.

[51]Guangchao Tang, Bin Li, Shuaishuai Xu, Xinyu Dai and Jiajun Chen. NJU-Parser: Achievements on Semantic Dependency Parsing. The First Joint Conference on Lexical and Computational Semantics(*SEM). June 7-8, 2012, Montreal, Canada.

[52]Haibo Kuang, Bin Li, Chen Chen, PENG JIN, Xiaohe Chen. Computation Of Bilingual Word Similarities By Metaphorical Properties. Proceedings of the International Conference of Machine Learning and Cybernetics (ICMLC) 2012.

[53]Ning Xi, Bin Li, Guangchao Tang, Shujian Huang, Yinggong Zhao, Hao Zhou, Xinyu Dai, Jiajun Chen. Adapting Conventional ChineseWord Segmenter for Segmenting Micro-blog Text: Combining Rule-based and Statistic-based Approaches. SIGHAN2012 Workshop, 2012.

[54]高磊,李斌,戴新宇,黄书剑,陈家骏.基于依存分析和褒贬指向的微博情感对象抽取方法,NLP&CC 2012,北京,2012年10月31日~11月5日

[55]刘友强,李斌,奚宁,陈家骏.基于双语平行语料的中文缩略语提取方法,中文信息学报,2012(2).

[56]张颖杰,李斌,陈家骏,陈小荷.基于词典信息的先秦汉语全文词义标注方法研究,中文信息学报,2012(3) .

[57]Bin Li, Jiajun Chen, Xiaohe Chen, Xuri Tang, Weiguang Qu.Sentiment Direction Analysis: A Framework and Resource Construction Method for Chinese Sentiment Computation. International Journal of Knowledge and Language Processing. Vol.2, No.1, 2011.

[58]Bin Li, Haibo Kuang, Xiaohe Chen, Xuri Tang, Chen Chen. Construction of a Bilingual Cognitive Property Knowledgebase. International Conference on Computational Intelligence and Security (CIS), Sanya, China, 2011.12.

[59]Peng Jin, Bin Li, Yingjie Zhang, Using Clustering Engine and Selectional Preference to Generate Targets in Conceptual Metonymies. ISII2011, Qingdao, China, 2011.

[60]Bin Li, Xiaohe Chen,Xuri Tang.An Investigation of Chinese Selectional Preference Based on HowNet. IEEE:ICGEC-2010, Shenzhen, China.

[61]石民,李斌,陈小荷.基于CRF的先秦汉语分词标注一体化研究,中文信息学报,2010年第2期.

[62]Wang Meng,Huang Chu-ren,Yu Shiwen,Li Bin. Chinese Noun Compound Interpretation Based on Paraphrasing Verbs.In Journal of Chinese Information Processing. 2010(6). (pdf)

[63]Tang Xuri,Chen Xiaohe,Xu Chao,Li Bin.Discourse-Based Chinese Location Name Recognition.In Journal of Chinese Information Processing. 2010(2). (pdf)

[64]李斌,陈小荷.汉语褒贬词语的褒贬指向问题,语言文字应用,2009年第3期:136-143.人大复印资料、中国社会科学网转载

[65]李斌,于丽丽,石民,曲维光.“像”的明喻计算.中文信息学报. 2008(6).

[66]Xiaohe Chen; Bin Li; Junzhi Lu; Hongdong Nian; Xuri Tang Nanjing Normal University Segmenter for the Fourth SIGHAN Bakeoff. Proceedings of the Third International Joint Conference on Natural Language Processing 2008.

[67]李斌,陈小荷.面向中文陌生文本的人机交互式分词方法,中文信息学报. 2007(3).

[68]李斌.中介语语料库的语言错误标注方法,暨南大学华企鹅电竞竞猜学报. 2007(3).

[69]李斌,卢俊之,章成志,陈小荷.基于聚类引擎的话题褒贬度计算,第九届全国计算语言学学术会议. 2007.5.

[70]李斌,陈小荷,方芳,徐艳华.基于语料库的高频最大交集型歧义字段问题研究,中文信息学报. 2006(1).

5.专利

一种古汉语文本的一体化自动词法分析方法及系统.国家版权局2020.2.18

6.国际数据库著作权

[1] Bin Li, Liming Xiao, Yihuan Liu, Yuan Wen, Li Song, Jayeol Chun, Minxuan Feng, Junsheng Zhou, Weiguang Qu, Nianwen Xue. Chinese Abstract Meaning Representation 2.0 LDC2021T13. (ISBN:1-58563-970-2) Philadelphia: Linguistic Data Consortium, July, 15, 2021.

[2] Bin Li, Siqi Yin, Jie Xu, Li Song, Minxuan Feng.Chinese CogBank. LDC2020T01. Philadelphia: Linguistic Data Consortium, 2020(2).

[3] Bin Li, Wen Yuan, Song Li, Dai Rubing, Qu Weiguang, Xue Nianwen, Chinese Abstract Meaning Representation 1.0. (ISBN 1-58563-880-3), LDC2019T07, Philadelphia: Linguistic Data Consortium, 2019.

[4] Xiaohe Chen, Bin Li, Minxuan Feng, Chao Xu, Runhua Xu, Min Shi, Lili Yu, Lei Xiao, Qingqing Wang. Ancient Chinese Corpus LDC2017T14, (ISBN1-58563-816-1). Philadelphia: Linguistic Data Consortium, 2017.

7.数据库著作权(国家版权局)

词语认知属性库2018.11.16

《左传》历史人文数据库2017.9.6

8.软件著作权(国家版权局)

《史记》人文检索平台2018.4.8

中古汉语语料库加工平台2017.8.10

中文AMR人工标注平台2017.8.10

人机交互式分词处理平台2017.7.10

汉语历时词库检索系统2017.7.10

CAMR非投影结构抽取及形式转换系统2018.6.25

古汉语一体化词法分析平台2019.6.19

《诗经》数字人文检索平台2019.11.12

《资治通鉴》数字人文知识检索系统2021.6.16

中文抽象语义表示解析评测平台2021.8.3

版权所有:企鹅电竞竞猜 学院地址:江苏省南京市宁海路122号中大楼 邮编:210097
联系电话:(025)83598452 电子邮箱:03363@njnu.edu.cn