据北大语言学实验室主任、北大中文系教授孔江平介绍,北大语言学实验室是集科研、教学、社会服务于一体的多学科交叉平台,其前身是1925年成立的北大语音乐律实验室。2021年12月,北大语言学实验室获批为教育部哲学社会科学实验室。在教育部经费的支持下,2022年春北大语言学实验室启动了“中华民族语言文字接触交融大数据模型建设”项目。该项目组织国内12所大学和科研机构的约20名专家的研究团队,近200名博士生和硕士生,对中华民族语言文字接触交融情况进行了大规模的田野调查,历经四年,初步完成了基础的调查工作和大型数据库建设。
此次发布的中华民族语言文字接触交融大数据模型,涉及中华民族语言文字接触交融大数据模型数据库的结构;语言活力的基础模型和算法——主要讨论语言活力的基本要素和分类方法;文字活力的基础模型和算法——主要讨论语言活力的基本要素和分类方法;中华民族语言文字接触交融大数据模型的内容和形式——主要讨论数据库的形式;中华民族语言文字接触交融通用语言词汇模型与算法——主要讨论词汇的语意结构、相关的基本算法和分类的方法;中华民族语言文字接触交融音位系统相似度模型与算法——主要讨论利用音位系统相似性来对语言进行分类。该大模型的建设,有助于让沉睡在田野中的即将消亡的声音活起来、传承下去。
网友评论更多
718申屠飘姣t
乐刻创始人韩伟:中国人比欧美人健身频率更高
2025/12/18 推荐
6452骆凤宇512
金立群的十年:海面从未平静
2025/12/17 推荐
377张融洁nd
参考消息:卢卡申科说任何人都无法遏制中国
2025/12/16 不推荐