企鹅电竞竞猜

当前位置: 首页 >> 学术科研 >> 学术成果 >> 正文

跨越千年的古代语言遇见智能计算技术——海内外学者共研古代语言处理

作者:时间:2023-09-15点击数:

北京时间2023年9月8日,第一届古代语言处理研讨会(Ancient Language Processing,ALP 2023)在保加利亚瓦尔纳成功举行。作为自然语言处理的最新进展RANLP 2023(https://ranlp.org/ranlp2023/)的子会议,本届会议旨在推进世界各种古代语言处理的研究,增进全世界古文研究者的交流,推动古代语言自然语言处理技术的发展。计算语言学家香港理工大学黄居仁教授、威尼斯大学Thea Sommerschield博士和希伯来大学Gabriel Stanovsky博士应邀做主旨报告,三十多位学者线上参会,来自美国、德国、以色列等地的二十多位学者线下参会。

研讨会由UC Berkeley的Adam Anderson博士、以色列阿里尔大学的Shai Gordin博士、南京师范大学的李斌博士、美国西华盛顿大学的Yudong Liu教授、以色列特拉维夫大学Stav Klein、意大利圣心大学Marco Passarotti教授共同组织。国内的协办单位有企鹅电竞竞猜、南京师范大学语言大数据与计算人文研究中心、中国人工智能学会语言智能专委会、中国中文信息学会青年工作委员会、江苏省人工智能学会自然语言处理专委会。

会议特色

● ALP2023是第一届专注于1000年以前的古代语言信息处理的专题研讨会,研讨的古代语言超过十种。

● 不同于研究古代语言的语言学和古典学会议侧重语言的语音、字词、语法研究,ALP更注重古代语言的语言学知识在计算模型中的应用。

● 不同于自然语言处理和计算语言学会议侧重模型本身的优化和应用,ALP更注重如何使用计算技术来解决古代语言资源稀缺和计量分析问题。

本次研讨会收到了三十六份投稿,涵盖多种古代语言,包括古汉语、古藏语、古希腊语、拉丁语、伊特鲁里亚语、阿卡德语、苏美尔语、古叙利亚语、古希伯来语、古典阿拉伯语、麦罗伊语、中古高地德语 、巴利文和梵文,是国内外专注于古代语言语种最多的自然语言处理会议。其中,拉丁语、希腊语、古汉语和苏美尔语的研究最为突出。最终录用了16篇口头报告论文和9篇海报论文。这些报告的主题涵盖了形态分析、词性标记、词形还原、解析、文本注释、语料库构建、分布语义模型、情感识别、机器翻译、损坏文本纠正、手写文本识别、互文识别、文体分析、命名实体识别、输入法等。

香港理工大学黄居仁教授,作了题为“Processing of a ‘living’ ancient language: Issues and Insights from Chinese(‘活的’古代语言处理:来自汉语的问题和见解)”的主旨报告。黄居仁教授是著名计算语言学家,香港理工大学中文及双语学系讲座教授。1987年美国康奈尔大学语言学博士,国际计算语言学委员会(International Committee of Computational Linguistics, ICCL)的19名终身会士之一,也是首位华人会士。他曾任香港理工大学人企鹅电竞竞猜院长,亚洲辞典学学会会长,及多个国际或区域性理论与计算语言学相关学术组织的理事长,召集人,理事等,是国际计算语言学,语料库语言学及汉语语言学领域的领军人物。黄居仁教授以其几十年学术经历,从语言传承与发展的视角,讨论了现存古代语言成分给古代语言研究带来的挑战和机遇,尤其展开了中文特有的挑战。

意大利威尼斯大学Thea Sommerschield博士,作了题为“When the past meets the future at Odessus 在奥德赛(奥德索斯)过去遇见未来”的主旨报告。Thea Sommerschield博士是英国罗马大学的拉莱·拉德福德罗马奖学金获得者,哈佛大学的希腊研究学者和谷歌云计算的研究创新者。她参与领导了Pythia(EMNLP,2019)和Ithaca(Nature,2022)项目,并广泛研究西西里的铭文学。她结合自己的经验,介绍了古达语言机器学习多方面的一些主要任务和趋势,并讨论了未来的发展方向。

以色列希伯来大学的Gabriel Stanovsky博士,作了题为“Harnessing Multilingual Models for Ancient Language Processing(利用多语言模型进行古代语言处理)”的主旨报告。Gabriel Stanovsky博士是耶路撒冷希伯来大学计算机科学与工程学院的高级讲师(助理教授)、艾伦人工智能研究所的研究科学家。他主要从事自然语言处理模型开发,应用模型处理文本以回答考古学、法律、医学等领域的多学科研究问题。他的成果曾在ACL、NAACL和CoNLL等顶级会议获奖,并在《科学》、《新科学家》和《纽约时报》等杂志上获得认可。在报告中,Gabriel Stanovsky博士提出了将现代语言数据与古代语言数据相结合的方法来解决古代语言数据规模较小的问题。另外他还提出一个支持多语言的大语言模型,并讨论了其在未来古代语言处理中的应用。

这是第一届专注于1000年以前的古代语言信息处理的国际专题研讨会,超过十种古老语言的研究者汇聚一堂,对表音文字、表音文字的处理都有了新的认识。很多跨语言的共性与个性问题,特别是东西方文字之间也有着诸多相通的处理机制。参会学者也纷纷表示会议的收获很大,不同于古典学、语言学和计算语言学的会议,ALP让研究古代语言的NLP学者有一种很强的归宿感,形成了一个新的学术圈,并非常期待下一届会议的召开。最后,线上线下的参会人员合影留念。

版权所有:企鹅电竞竞猜 学院地址:江苏省南京市宁海路122号中大楼 邮编:210097
联系电话:(025)83598452 电子邮箱:03363@njnu.edu.cn