北大:“复活”百年声音
新浪教育
在北京大学古朴的校园里,一场穿越百年的“声音复活计划”正在上演。当语音多模态技术遇见非物质文化遗产,当人工智能唤醒濒临失传的戏曲吟诵,一座能够看见声音、触摸历史的有声博物馆即将诞生……
近日,北京大学宣布启动有声博物馆建设,并发布语言文字大数据模型、大型语料库等重大成果。未来,这些成果将入藏博物馆,让声音“看得见”。
⬆ 语音学实验语料收集
作为有声博物馆建设主体的北京大学语言学实验室,其发展史本身就是一部“活态展品”。该实验室创立于1925年,其诞生标志着中国现代语音学研究的正式开端。百年间,实验室在人类语言涌现和演化研究、语言障碍与教育公平研究、基于人工智能的语言应用研究等方向取得了多项重大成果。
比如:实验室聚焦听力障碍等群体的语言问题,开发了科学评估与康复训练体系;揭示了语言与大脑神经系统的互动机制,解析语言演化对人类思维的塑造过程。
⬆ 上图分别为脑电仪、眼动仪、电子语图仪、浪纹计
据了解,很多有趣的“声音”将成为博物馆的亮点。实验室利用语音多模态技术,系统记录了戏曲、民歌、吟诵等非物质文化遗产的数字化采集。通过建设大型语料库,融合人工智能技术,采集普通话、方言及少数民族语言的数据,构建语言资源平台。
⬆ 在广西三江调查侗语和侗族大歌的音律
实验室主任孔江平介绍,2022年,实验室组织国内12所大学和科研机构的师生团队,对中华民族语言文字开展大规模田野调查。历经近4年,初步完成了调查工作和大型数据库建设。
孔江平表示,一些语言及民间口传文化濒临灭绝,仅靠录音很难复原文化原貌,因其产生的整体机制被忽视了。而语言学实验室不但采集声音,也记录发音人的生理信号,如呼吸信号、声带振动信号和唇、舌等部位的运动方式,既保存、保护现有的声音,也可原汁原味地复原出有声文化。
⬆ 实验室博士生在苗族地区做苗语语言和音律的脑电实验
从1925年北京大学语音乐律实验室的创立,到如今启动有声博物馆的建设,北大语言学实验室走过了整整一个世纪的探索之路。相信在不久的将来,我们在博物馆里会“看见”文化遗产的“原貌复原”,它们也不再沉睡,而是在技术赋能下绽放出历久弥新的光华。
附:北京大学语言学实验室部分发展时间线
1921年11月
刘复先生向蔡元培先生正式提交了一份《提议创设中国语音学实验室计划书》(《北京大学日刊》1921年11月16日),提出“为鉴于研究中国语音,并解决中国语言中一切与语音有关系之问题,非纯用科学的实验方法不可”
1925年9月
“语音乐律实验室”正式成立
1934年
罗常培继任实验室主任,抗战时期南迁至西南联大
1978年
实验室重建并列为北京大学重点文科实验室
1996年
实验室更名为北京大学中文系语言学实验室,成为国家“211”工程子项目
2003年
孔江平教授主持工作,获“985工程”重点支持,成为北京大学“985”工程子项目
2021年
入选教育部首批哲学社会科学实验室(试点)
2025年
启动有声博物馆建设,发布语言大数据模型、大型语料
来源:首都教育(ID:bjedunews)