
王帅,南京大学智能科学与技术学院准聘副教授,博士生导师,CCF语音对话及听觉专业委员会执行委员。专注于智能音频信号处理研究,涵盖语音、音频事件及音乐等多模态声学信号。2014年本科毕业于西北工业大学,2020年于上海交通大学获博士学位。曾任深圳市大数据研究院副研究员、香港中文大学(深圳)客座助理教授及腾讯光子工作室高级研究员(2020年入选腾讯技术大咖-T10),带领团队进行面向游戏场景的语音技术的研发与应用。以第一作者或通讯作者在ICASSP、Interspeech、AAAI、NeurIPS、T-ASLP、J-STSP等顶级会议期刊发表论文五十余篇,获授权专利十余项。荣获VoxSRC2019、DIHARD2019等国际竞赛冠军及ISCSLP2024最佳论文、最佳学生论文奖。发起开源工具WeSpeaker与WeSep,提供的预训练模型在HuggingFace平台下载量月均超千万次,在学术界与工业界获得广泛应用。目前主持国家自然科学基金青年项目、长三角科技创新共同体联合攻关项目子课题、人工智能教育部重点实验室开放课题及CCF-网易雷火创新基金等多项科研项目。曾获小米青年学者-科技创新奖,与国内外知名企业及科研院所保持密切合作与交流。指导的学生赴腾讯、字节跳动、网易、Meta FAIR等业界头部企业实习,部分学生成功入选腾讯犀牛鸟、腾讯青云计划、字节跳动TopSeed等精英人才计划。
个人主页:https://shuaiwang-nju.github.io/

王帅,南京大学智能科学与技术学院准聘副教授,博士生导师,CCF语音对话及听觉专业委员会执行委员。专注于智能音频信号处理研究,涵盖语音、音频事件及音乐等多模态声学信号。2014年本科毕业于西北工业大学,2020年于上海交通大学获博士学位。曾任深圳市大数据研究院副研究员、香港中文大学(深圳)客座助理教授及腾讯光子工作室高级研究员(2020年入选腾讯技术大咖-T10),带领团队进行面向游戏场景的语音技术的研发与应用。以第一作者或通讯作者在ICASSP、Interspeech、AAAI、NeurIPS、T-ASLP、J-STSP等顶级会议期刊发表论文五十余篇,获授权专利十余项。荣获VoxSRC2019、DIHARD2019等国际竞赛冠军及ISCSLP2024最佳论文、最佳学生论文奖。发起开源工具WeSpeaker与WeSep,提供的预训练模型在HuggingFace平台下载量月均超千万次,在学术界与工业界获得广泛应用。目前主持国家自然科学基金青年项目、长三角科技创新共同体联合攻关项目子课题、人工智能教育部重点实验室开放课题及CCF-网易雷火创新基金等多项科研项目。曾获小米青年学者-科技创新奖,与国内外知名企业及科研院所保持密切合作与交流。指导的学生赴腾讯、字节跳动、网易、Meta FAIR等业界头部企业实习,部分学生成功入选腾讯犀牛鸟、腾讯青云计划、字节跳动TopSeed等精英人才计划。
个人主页:https://shuaiwang-nju.github.io/