龙艳花,现任上海师范大学信息与通信工程系教授,云知声-上师大 自然人机交互联合实验室负责人,上海市院士专家工作站专家,上海市”东方学者“特聘教授。国家自然科学基金、上海市首届青年英才扬帆计划获得者。现为IEEE、ISCA会员,有15年以上从事智能语音及语言处理、人机交互和深度学习研究和产业化工作经验。
研究兴趣
招生信息:
学习及工作经历:
2013/06-至今, 上海师范大学,教授
2011/10-2013/04, 英国剑桥大学,工程系,博士后
2009/09-2010/02,微软亚洲研究院,语音组,Intern
2008/07-2009/02,新加坡南洋理工大学及I2R研究院,HLT部门,交流学生
2006/09–2011/06, 中国科学技术大学,科大讯飞语音实验室, 博士, 导师:戴礼荣
国际科研合作:
与新加坡国立大学(NUS),南洋理工大学(NTU)等教授合作,联合培养在读研究生
2019-2021年:研究生周心远到新加坡国立大学Prof. Haizhou Li 实验室联合培养,主要从事基于深度学习的中英文混合语音识别声学建模的研究
2023-2024年:研究生王雪菲到香港中文大学深圳大数据研究院实验室联合培养,主要从事目标语音提取的算法研究
2024年:研究生李黎到新加坡南洋理工大学Prof. Chng Eng Siong实验室联合培养,主要从事基于语音大模型的低资源ASR声学建模算法研究
科研获奖及学术评测:
1. 2023年11月,特殊声学时间检测算法研究, “上海产学研合作优秀项目奖”三等奖;
2. 2023年8月,自然人机交互联合实验室与云知声合作,首次提出了Consistency Measure Factor(CMF) 算法,
在VoxSRC 2023 国际说话人识别竞赛中,团队夺得Track1第一名、Track2第二名;
3. 2021年,少样本生物事件检测国际评测“DCASE2021 Task5-Few-shot Bioacoustic Event Detection(IEEE AASP
Challenge)”,实验室研究生“唐甜甜,梁芸浩”同学提交的SHNU系统性能排名国际第二,详见官方结果;
4. 2021年,家居场景下的声音事件检测和分离国际评测“DCASE2021 Task4-Sound Event Detection and Separationin
Domestic Environments”, 实验室研究生“梁芸浩,唐甜甜”同学提交SHNU系统,teams-rangking 10/22, system-ranking 20/68, 详见官网结果;
5. 2020年,Blizzard Challenge国际语音合成评测,云知声-上师大自然人机交互联合实验室
提交的SHNU系统,首次参加评测获中文普通话,上海话多项关键指标排名第一。如中文普
通话合成自然度,段落合成所有指标(Overrall impression\pleasantness\speech
pauses\stress\intonation\emotion\listeningeffort),普通话相似度、上海话可懂度
等指标位列第一,详情见具体报道;
6. 2020年,声学场景分类领域的国际评测“DCASE2020 Task 1A(IEEE AASP Challenge)”,基于研究生刘悦同学
的研究成果,实验室提交的SHNU系统获得排名26/93, 见官方结果:http://dcase.community/challenge2020/task-
acoustic-scene-classification-results-a#Liu2020;
7. 2020年,第二十二届中国国际工业博览会,云知声-上师大联合实验室合作成果“智能语音电子病例”
系统获高校展区“优秀展品奖”;
8. 2018年,“上海产学研合作优秀项目奖”二等奖 ;
9. 2016年,国际“中英文混合语音识别竞赛(OC16 Chinese-English MixASR Challenge)”,提交的“SHNU”中英文
混合语音识别系统取得国际第2名;
10. 2018年7-8月,第5届国际多通道语音分离和识别评测(The 5th CHiME Speech Separation and Recognition Challenge,
CHiME-5),提交的“SHNU系统”成绩排在国际第9名;
11. 2019年1-2月,国际“防攻击声纹识别评测(Automatic Speaker Verification Spoofing and CountermeasuresChallenge,
ASVspoof2019)”, 提交的“SHNU系统”成绩排在国际第13/156名;
12. 2019年9月,联合实验室学生参加 “多通道远场文本相关声纹识别-AISHELL Speaker Verification Challenge2019”,
获得第4名/50;
13. 2008 NIST Speaker Recognition Evaluation (SRE),在核心测试任务中,作为关键技术人员及组长带领的团队获得 EER、
minDCF两项国际第一名,DCF第三名,综合成绩国际第一,该成果被国家自然科学基金委,中国科学院网站等
100多家媒体报;
14. 2009 NIST Language Recognition Evaluation,团队在通用语种测试中各项指标综合排名国际第二;同时,在更具挑战
性的 8组方言对测试中,有 6组方言对测试性能均远远超过了其他参赛单位,综合排名国际第一;
15. 2010 NIST Speaker Recognition Evaluation,作为关键技术人员及组长带领的团队获得 EER, minDCF, DCF指标综合成绩
国际第二名。
主持的科研项目:
1.国家自然科学基金面上项目,低资源条件下的重口音鲁棒性声学建模关键技术研究,2021-2024.
2. 国家自然科学基金青年项目,中英文混合语音识别中声学建模关键技术研究, 2017-2020.
3. 上海市青年科技英才扬帆计划, 基于深度学习的声纹识别方法研究, 2014-2017.
4. 联盟计划项目,多语种混合语音识别开发, 已结题.
Publications(*指研究生一作,导师通信作者):
===============================================================================
详情见:Google scholar
2025年度:
[1] Yuxiang Mei, Yuang Zheng, Dongxing Xu, Yanhua Long*. SHNU Multilingual Conversational Speech Recognition System for
INTERSPEECH2025 MLC-SLM Challenge, in Proc. INTERSPEECH 2025.
[2] Yu Liao, Haixin Guan, Shuang Wei, Yanhua Long*, Leveraging Out-of-Domain Noise for Unsupervised Domain Adaptation
in Speech Enhancement, in Proc. ICASSP2025.
[3] Ziling Huang, Haixin Guan, Haoran Wei, Yanhua Long*. SEF-PNet: Speaker Encoder-Free Personalized Speech
Enhancement with Local and Global Contexts Aggregation,In Proc. ICASSP 2025.
[4] Haoran Wei, Shiling Wang, Yanhua Long*. Personalized Speech Enhancement without User Enrollment for Real-World
Audio Replay Scenarios., in Proc. ICASSP 2025.
[5] Yu Liao, Li Li, Haixin Guan, Yanhua Long*, Exploring Using Contrastive Learning for Improving BSRNN-based Speech
Enhancement, Circuits, Systems, and Signal Processing (CSSP),2025.
[6] Li Li, Yijie Li, Dongxing Xu, Yanhua Long*. Unsupervised End-to-End Accented Speech Recognition Under Low-resource
Conditions, IEEE Transactions on Audio, Speech and Language Processing, 2025(33): 1616-1627. 2025.
[7] Renchang Dong, Jie Chen, Yanhua Long*, Yijie Li, Dongxing Xu. Enhanced Cross-Modal Parallel Training for Improving
End-to-End Accented Speech Recognition, Speech Communication, 2025, 169: 103188. 2025.
[8] Hanfang Cui, Longfei Song, Li Li, Dongxing Xu, Yanhua Long*. Revisiting SSL for sound event detection: complementary
fusion and adaptive post-processing, Journal of King Saud University-Computer and Information Sciences, 2025.
[9] Haixin Guan, Shaowei Ding, Wei Dai, X Tan, Yanhua Long, Jiaen Liang. Low complexity DOA estimation based on
weighted noise component subtraction for smart-home application, Applied Acoustics, 231:110490, 2025.