信息与机电工程学院

部门：信息与机电工程学院

聘任技术职务：教授

学位：工学博士学位

学历：博士研究生毕业

毕业院校：中国科学技术大学

联系电话：

电子邮箱：yanhua@shnu.edu.cn

办公地点：上海师范大学信息与机电工程学院

通讯地址：上海市徐汇区桂林路100号

研究方向

龙艳花，现任上海师范大学信息与通信工程系教授，云知声-上师大自然人机交互联合实验室负责人，上海市院士专家工作站专家，上海市”东方学者“特聘教授。国家自然科学基金、上海市首届青年英才扬帆计划获得者。现为IEEE、ISCA会员，有15年以上从事智能语音及语言处理、人机交互和深度学习研究和产业化工作经验。

研究兴趣

语音信息处理：语音识别，目标语音提取，个性化语音增强，语音合成，多模态语音处理及通用语音大模型等
声音事件检测：家居场景声音事件检测，目标定位，少样本声音事件检测等

招生信息：

信息与通信工程、通信工程、计算机科学与技术，人工智能学硕、专硕

学习及工作经历：

2013/06-至今，上海师范大学，教授
2011/10-2013/04，英国剑桥大学，工程系，博士后
2009/09-2010/02，微软亚洲研究院，语音组，Intern
2008/07-2009/02，新加坡南洋理工大学及I2R研究院，HLT部门，交流学生
2006/09–2011/06，中国科学技术大学，科大讯飞语音实验室，博士，导师：戴礼荣

国际科研合作：

与新加坡国立大学（NUS），南洋理工大学（NTU）等教授合作，联合培养在读研究生

2019-2021年：研究生周心远到新加坡国立大学Prof. Haizhou Li 实验室联合培养，主要从事基于深度学习的中英文混合语音识别声学建模的研究
2023-2024年：研究生王雪菲到香港中文大学深圳大数据研究院实验室联合培养，主要从事目标语音提取的算法研究
2024年：研究生李黎到新加坡南洋理工大学Prof. Chng Eng Siong实验室联合培养，主要从事基于语音大模型的低资源ASR声学建模算法研究

科研获奖及学术评测：

1. 2023年11月，特殊声学时间检测算法研究, “上海产学研合作优秀项目奖”三等奖；
2. 2023年8月，自然人机交互联合实验室与云知声合作，首次提出了Consistency Measure Factor（CMF）算法，
在VoxSRC 2023 国际说话人识别竞赛中，团队夺得Track1第一名、Track2第二名；
3. 2021年，少样本生物事件检测国际评测“DCASE2021 Task5-Few-shot Bioacoustic Event Detection（IEEE AASP
Challenge）”，实验室研究生“唐甜甜，梁芸浩”同学提交的SHNU系统性能排名国际第二，详见官方结果；
4. 2021年，家居场景下的声音事件检测和分离国际评测“DCASE2021 Task4-Sound Event Detection and Separationin
Domestic Environments”, 实验室研究生“梁芸浩，唐甜甜”同学提交SHNU系统，teams-rangking 10/22, system-ranking 20/68, 详见官网结果；
5. 2020年，Blizzard Challenge国际语音合成评测，云知声-上师大自然人机交互联合实验室
提交的SHNU系统，首次参加评测获中文普通话，上海话多项关键指标排名第一。如中文普
通话合成自然度，段落合成所有指标（Overrall impression\pleasantness\speech
pauses\stress\intonation\emotion\listeningeffort），普通话相似度、上海话可懂度
等指标位列第一，详情见具体报道；
6. 2020年，声学场景分类领域的国际评测“DCASE2020 Task 1A（IEEE AASP Challenge）”，基于研究生刘悦同学
的研究成果，实验室提交的SHNU系统获得排名26/93, 见官方结果：http://dcase.community/challenge2020/task-
acoustic-scene-classification-results-a#Liu2020；
7. 2020年，第二十二届中国国际工业博览会，云知声-上师大联合实验室合作成果“智能语音电子病例”
系统获高校展区“优秀展品奖”；
8. 2018年，“上海产学研合作优秀项目奖”二等奖；
9. 2016年，国际“中英文混合语音识别竞赛(OC16 Chinese-English MixASR Challenge)”，提交的“SHNU”中英文
混合语音识别系统取得国际第2名；
10. 2018年7-8月，第5届国际多通道语音分离和识别评测(The 5th CHiME Speech Separation and Recognition Challenge,
CHiME-5),提交的“SHNU系统”成绩排在国际第9名；
11. 2019年1-2月，国际“防攻击声纹识别评测(Automatic Speaker Verification Spoofing and CountermeasuresChallenge,
ASVspoof2019)”, 提交的“SHNU系统”成绩排在国际第13/156名；
12. 2019年9月，联合实验室学生参加 “多通道远场文本相关声纹识别-AISHELL Speaker Verification Challenge2019”，
获得第4名/50；
13. 2008 NIST Speaker Recognition Evaluation (SRE)，在核心测试任务中，作为关键技术人员及组长带领的团队获得 EER、
minDCF两项国际第一名，DCF第三名，综合成绩国际第一，该成果被国家自然科学基金委，中国科学院网站等
100多家媒体报；
14. 2009 NIST Language Recognition Evaluation，团队在通用语种测试中各项指标综合排名国际第二；同时，在更具挑战
性的 8组方言对测试中，有 6组方言对测试性能均远远超过了其他参赛单位，综合排名国际第一；
15. 2010 NIST Speaker Recognition Evaluation，作为关键技术人员及组长带领的团队获得 EER, minDCF， DCF指标综合成绩
国际第二名。

主持的科研项目：

1.国家自然科学基金面上项目，低资源条件下的重口音鲁棒性声学建模关键技术研究，2021-2024.
2. 国家自然科学基金青年项目，中英文混合语音识别中声学建模关键技术研究， 2017-2020.
3. 上海市青年科技英才扬帆计划，基于深度学习的声纹识别方法研究, 2014-2017.
4. 联盟计划项目，多语种混合语音识别开发, 已结题.

Publications（*指研究生一作，导师通信作者）：

===============================================================================

详情见：Google scholar

2025年度：

[1] Yuxiang Mei, Yuang Zheng, Dongxing Xu, Yanhua Long*. SHNU Multilingual Conversational Speech Recognition System for

INTERSPEECH2025 MLC-SLM Challenge, in Proc. INTERSPEECH 2025.

[2] Yu Liao, Haixin Guan, Shuang Wei, Yanhua Long*, Leveraging Out-of-Domain Noise for Unsupervised Domain Adaptation

in Speech Enhancement, in Proc. ICASSP2025.

[3] Ziling Huang, Haixin Guan, Haoran Wei, Yanhua Long*. SEF-PNet: Speaker Encoder-Free Personalized Speech

Enhancement with Local and Global Contexts Aggregation，In Proc. ICASSP 2025.

[4] Haoran Wei, Shiling Wang, Yanhua Long*. Personalized Speech Enhancement without User Enrollment for Real-World

Audio Replay Scenarios., in Proc. ICASSP 2025.

[5] Yu Liao, Li Li, Haixin Guan, Yanhua Long*, Exploring Using Contrastive Learning for Improving BSRNN-based Speech

Enhancement, Circuits, Systems, and Signal Processing (CSSP)，2025.

[6] Li Li, Yijie Li, Dongxing Xu, Yanhua Long*. Unsupervised End-to-End Accented Speech Recognition Under Low-resource

Conditions, IEEE Transactions on Audio, Speech and Language Processing, 2025(33): 1616-1627. 2025.

[7] Renchang Dong, Jie Chen, Yanhua Long*, Yijie Li, Dongxing Xu. Enhanced Cross-Modal Parallel Training for Improving

End-to-End Accented Speech Recognition, Speech Communication, 2025, 169: 103188. 2025.

[8] Hanfang Cui, Longfei Song, Li Li, Dongxing Xu, Yanhua Long*. Revisiting SSL for sound event detection: complementary

fusion and adaptive post-processing, Journal of King Saud University-Computer and Information Sciences, 2025.

[9] Haixin Guan, Shaowei Ding, Wei Dai, X Tan, Yanhua Long, Jiaen Liang. Low complexity DOA estimation based on

weighted noise component subtraction for smart-home application, Applied Acoustics, 231:110490, 2025.

学术成果

论文

[1] 龙艳花·Improving low?complexity and real?time DeepFilterNet2 for personalized speech enhancement·International Journal of Speech Technology,27
[9] 龙艳花·Short-time speaker verification with different speaking style utterances·PLOS ONE,卷: 15期: 11
[11] 龙艳花·基于贪婪稀疏优化的欠定语音盲分离方法·计算机工程与设计,2021年08期:2299-2307,9
[15] 龙艳花·Heterogeneous separation consistency training for adaptation of unsupervised speech separation·EURASIP JOURNAL ON AUDIO SPEECH AND MUSIC PROCESSING,卷: 2023期: 1
[22] 龙艳花·Pronunciation augmentation for Mandarin-English code-switching speech recognition·EURASIP JOURNAL ON AUDIO SPEECH AND MUSIC PROCESSING,卷: 2021期: 1
[23] 龙艳花·Tri-stage training with language-specific encoder and bilingual acoustic learner for code-switching speech recognition·APPLIED ACOUSTICS,218

科研项目

[1] 龙艳花.复杂场景语音识别声学建模方法研究,在研
[2] 龙艳花.面向语音识别的副语言信息标注算法研究,在研
[3] 龙艳花,陈婕,叶宏.低资源多任务声学建模技术研发,在研
[4] 龙艳花.基于深度学习的声纹识别方法研究,验收
[5] 龙艳花.鲁棒性语言声学建模算法研发,验收
[6] 龙艳花.一种基于语音转换的情感疏导系统研究,在研
[7] 龙艳花.自然人机交互关键技术研发,验收
[8] 龙艳花."口语对话"语音的声学建模技术研发,在研
[9] 龙艳花.噪声环境下中英混合的语音识别系统研发,在研
[10] 龙艳花.低资源条件下的重口音鲁棒性声学建模关键技术研究,验收
[11] 龙艳花.噪声环境下中英混合的语音识别系统研发,在研
[12] 龙艳花.目标语音提取中的鲁棒性声学自适应关键技术研究,在研
[13] 龙艳花.中英文混合语音识别中声学建模关键技术研究,验收
[14] 龙艳花.特殊声学事件检测算法研发,验收
[15] 龙艳花.多语种混合语音识别开发,验收
[16] 龙艳花.一种基于语音转换的情感疏导系统,验收

软件成果

[1] 龙艳花.基于Android平台的在线订餐软件[简称：订餐app]. 软件登记号:2017SR382726,2017-07-19
[2] 龙艳花,魏浩然.基于Matlab的双门限语音端点检测软件V1.0. 软件登记号:2016SR074008,2016-04-12
[3] 龙艳花,何人可,叶宏.噪声环境下中英文混合语音识别降噪系统V1.0. 软件登记号:2019SR0032795,2019-01-10
[4] 龙艳花,孙健腾.无监督重口音语音识别软件V1.0. 软件登记号:2023SR1746740,2023-12-25
[5] 龙艳花,张艳,叶宏.宾馆客房管理的系统软件V1.0. 软件登记号:2016SR099908,2016-05-10
[6] 龙艳花,石岩,茅红伟,叶宏.基于深度神经网络语音端点检测方法的改进的软件V1.0. 软件登记号:2018SR791079,2018-09-29
[7] 龙艳花,马志民,叶宏.防攻击声纹识别平台V1.0. 软件登记号:2019SR0032793,2019-01-10
[8] 龙艳花,叶宏,童琪琪.基于发音动作参数的说话人确认技术研究的软件V1.0. 软件登记号:2018SR1048556,2018-06-20
[9] 龙艳花.基于B/S的淘宝商城电子商务系统[简称：电子商务系统]. 软件登记号:2017SR4796095,2017-08-29
[10] 龙艳花,张艳,叶宏.基于E531模块测速仪和里程表软件. 软件登记号:2016SR073979,2016-04-12
[11] 龙艳花,马燕.无监督重口音语音识别软件V1.0. 软件登记号:SR2023174674,2023-09-26
[12] 龙艳花.AIKT智能语音莱普通软件V1.0. 软件登记号:2022SR0452236,2022-04-11
[13] 龙艳花,魏浩然.基于Matlab的能量分类语音端点检测软件V1.0. 软件登记号:2016SR074002,2016-04-12

专利成果

[1] 黄盼,梁芸浩,龙艳花. 声学事件检测方法、装置、电子设备和存储介质. 中国专利:CN 114627861 B,2025-05-16.
[2] 龙艳花,李黎,李轶杰,许东星. 无监督和有监督联合的声学模型训练方法. 中国专利:申请状态(申请号:202311585170.6).
[3] 龙艳花,李靖,许东星. 跨域语音鉴伪方法和系统. 中国专利:CN 116386648 B,2025-06-27.
[4] 龙艳花,汪世林,关海欣. 基于特征压缩和声纹信息自适应融合的语音提取方法. 中国专利:申请状态(申请号:202311501147.4).
[5] 龙艳花. 一种内置打印机的便携式多功能计算机. 中国专利:ZL201922095212.3,2020-06-12.
[6] 龙艳花,陆宇,杜如帆,张玲,袁倩,王懿. 一种基于语音转换的情感疏导系统. 中国专利:ZL201810374212.4,2020-09-29.
[7] 魏爽,彭剑,陶春贵,龙艳花,杨春夏,张巧珍,李莉. 一种密集环境中基于压缩感知的多径时延估计方法及装置. 中国专利:ZL201910640963.0,2023-06-02.
[8] 龙艳花,宋龙飞,许东星. 声音事件检测数据合成及声音事件检测模型的训练方法. 中国专利:申请状态(申请号:CN202510684973.X).
[9] 龙艳花,苏春雨,黄盼. 一种基于语义分析的情绪识别方法和设备. 中国专利:ZL202010443389.,2023-12-19.
[10] 龙艳花,刘悦,梁芸浩,魏爽. 一种声学场景分类方法. 中国专利:ZL202110653222.3,2023-11-17.
[11] 龙艳花,叶宏,魏浩然. 采用声纹和语音识别进行个性化电视语音唤醒的方法. 中国专利:申请状态(申请号:201410840544.9).
[12] 龙艳花,陈双圆,许东星. 模型训练及语音识别方法、装置、设备及介质. 中国专利:申请状态(申请号:CN202510614431.5).
[13] 龙艳花,周轶凡,许东星. 基于分组自动编码器的机器运行声学状态监测方法和系统. 中国专利:申请状态(申请号:202310399046.4).
[14] 龙艳花,董仁昌,李轶杰,许东星. 一种端到端重口音语音识别跨模态并行训练方法. 中国专利:申请状态(申请号:202311425505.8).
[15] 龙艳花,唐甜甜,李轶杰. 生物声音事件检测模型训练方法，声音事件的检测方法. 中国专利:ZL202111012585.5,2023-08-01.
[16] 龙艳花,周轶凡,李轶杰. 基于伪样本对抗训练的机器运行声学状态监测方法和系统. 中国专利:申请状态(申请号:202310402009.4).
[17] 魏浩然,龙艳花,冯志民,叶宏,茅红伟. 一种基于位置信息的语音端点检测方法. 中国专利:申请状态(申请号:201710624269.0).
[18] 龙艳花,陈双圆,李轶杰,许东星. 噪声语音识别模型训练和语音识别方法、装置及设备. 中国专利:申请状态(申请号:202510904849.X).
[19] 周雷,龙艳花,叶宏. 一种文件夹加密方法. 中国专利:申请状态(申请号:201410784456.1).
[20] 龙艳花,宋龙飞,许东星,李轶杰. 轻量化声音检测模型训练及声音事件检测方法、装置及设备. 中国专利:申请状态(申请号:CN202510244635.4).
[21] 魏爽,杨璟安,徐朋,龙艳花,杨春夏,张巧珍. 一种欠定语音盲源分离方法及装置. 中国专利:申请状态(申请号:201910763771.9).
[22] 龙艳花,李靖,许东星. 跨域语音鉴伪方法和系统. 中国专利:申请状态(申请号:202310594301.0).
[23] 龙艳花,梁芸浩,李轶杰. 基于聚焦损失函数的指导型声学事件检测模型训练方法. 中国专利:申请状态(申请号:202110974110.8).
[24] 龙艳花,唐甜甜,李轶杰. 声音事件的检测方法，装置，存储介质及电子装置. 中国专利:ZL202111015206.8,2023-07-25.
[25] 龙艳花,黄紫玲,关海欣. 基于双任务的模型训练及语音增强方法、装置及设备. 中国专利:申请状态(申请号:02510614432.X).
[26] 龙艳花,梁芸浩,李轶杰. 基于特征分解分类器与自适应后处理的声学事件检测系统. 中国专利:ZL202110974087.2,2023-12-19.
[27] 龙艳花,李靖,李轶杰. 基于时频域掩蔽效应的跨域语音鉴伪方法和系统. 中国专利:申请状态(申请号:2023105943792).

教学工作

教职工课程信息
开课学年	开课学期	课程名称
2019-2020	1	线性代数
2023-2024	2	数字语音处理
2025-2026	2	数字语音处理
2018-2019	1	线性代数
2017-2018	2	数字语音处理
2021-2022	1	线性代数
2023-2024	1	科技文献检索与写作
2024-2025	2	数字语音处理
2020-2021	2	数字语音处理
2023-2024	2	数字语音处理
2025-2026	2	数字语音处理
2018-2019	1	线性代数
2021-2022	2	线性代数
2024-2025	2	数字语音处理
2019-2020	1	线性代数
2021-2022	1	线性代数
2021-2022	2	数字语音处理
2020-2021	1	线性代数
2021-2022	2	数字语音处理
2025-2026	2	数字语音处理
2022-2023	2	数字语音处理
2021-2022	2	线性代数
2019-2020	2	数字语音处理
2020-2021	2	数字语音处理
2025-2026	1	科技文献检索与写作
2024-2025	2	数字语音处理
2019-2020	1	线性代数
2022-2023	2	数字语音处理
2019-2020	1	数字语音处理
2018-2019	1	线性代数
2016-2017	1	线性代数
2022-2023	2	数字语音处理
2020-2021	2	数字语音处理
2020-2021	1	线性代数
2018-2019	2	数字语音处理
2018-2019	2	数字语音处理
2024-2025	1	科技文献检索与写作
2017-2018	2	模式识别

荣誉奖励

2015-2016 年度上海师范大学三八红旗手

2017年，获上海师范大学“第八届优秀青年学术骨干”荣誉称号

社会兼职

国家自然科学基金通讯评审专家

国家教育部学位中心论文评审专家

上海市科学技术委员会入库专家

国际高水平学术期刊及语音领域顶级国际会议审稿专家，

包括 IEEE TASLP, Speech Communication, CSL, ICASSP, INTERSPEECH等