部门:信息与机电工程学院
聘任技术职务:教授
学位:工学博士学位
学历:博士研究生毕业
毕业院校:中国科学技术大学
联系电话:
电子邮箱:yanhua@shnu.edu.cn
办公地点:上海师范大学信息与机电工程学院
通讯地址:上海市徐汇区桂林路100号

研究方向

龙艳花,现任上海师范大学信息与通信工程系教授,云知声-上师大 自然人机交互联合实验室负责人,上海市院士专家工作站专家,上海市”东方学者“特聘教授。国家自然科学基金、上海市首届青年英才扬帆计划获得者。现为IEEEISCA会员,有15年以上从事智能语音及语言处理、人机交互和深度学习研究和产业化工作经验。


研究兴趣

  •  语音信息处理:语音识别,目标语音提取,个性化语音增强,语音合成,多模态语音处理及通用语音大模型等

  • 声音事件检测:家居场景声音事件检测,目标定位,少样本声音事件检测等


招生信息:

  • 信息与通信工程、通信工程、计算机科学与技术,人工智能 学硕、专硕


学习及工作经历:

  • 2013/06-至今,   上海师范大学,教授

  • 2011/10-2013/04, 英国剑桥大学,工程系,博士后

  • 2009/09-2010/02,微软亚洲研究院,语音组,Intern

  • 2008/07-2009/02,新加坡南洋理工大学及I2R研究院,HLT部门,交流学生

  • 2006/09–2011/06, 中国科学技术大学,科大讯飞语音实验室, 博士, 导师:戴礼荣



国际科研合作:

  1. 与新加坡国立大学(NUS),南洋理工大学(NTU)等教授合作,联合培养在读研究生

  • 2019-2021年:研究生周心远到新加坡国立大学Prof. Haizhou Li 实验室联合培养,主要从事基于深度学习的中英文混合语音识别声学建模的研究

  • 2023-2024年:研究生王雪菲到香港中文大学深圳大数据研究院实验室联合培养,主要从事目标语音提取的算法研究

  • 2024年:研究生李黎到新加坡南洋理工大学Prof. Chng Eng Siong实验室联合培养,主要从事基于语音大模型的低资源ASR声学建模算法研究



科研获奖及学术评测:

  • 1.  202311月,特殊声学时间检测算法研究, “上海产学研合作优秀项目奖三等奖;

  • 2.   20238月,自然人机交互联合实验室与云知声合作,首次提出了Consistency Measure FactorCMF) 算法,

         在VoxSRC 2023 国际说话人识别竞赛中,团队夺得Track1第一名、Track2第二名;

  • 3.   2021年,少样本生物事件检测国际评测“DCASE2021 Task5-Few-shot Bioacoustic Event DetectionIEEE AASP

          Challenge)”,实验室研究生“唐甜甜,梁芸浩”同学提交的SHNU系统性能排名国际第二,详见官方结果

  • 4.   2021年,家居场景下的声音事件检测和分离国际评测“DCASE2021 Task4-Sound Event Detection and Separationin

          Domestic Environments, 实验室研究生“梁芸浩,唐甜甜”同学提交SHNU系统,teams-rangking 10/22, system-ranking 20/68, 详见官网结果

  • 5.   2020年,Blizzard Challenge国际语音合成评测,云知声-上师大自然人机交互联合实验室

         提交的SHNU系统,首次参加评测获中文普通话,上海话多项关键指标排名第一。如中文普

         通话合成自然度,段落合成所有指标(Overrall impression\pleasantness\speech

         pauses\stress\intonation\emotion\listeningeffort,普通话相似度、上海话可懂度

         等指标位列第一,详情见具体报道

  • 6.     2020年,声学场景分类领域的国际评测“DCASE2020 Task 1AIEEE AASP Challenge”,基于研究生刘悦同学

           的研究成果,实验室提交的SHNU系统获得排名26/93, 见官方结果:http://dcase.community/challenge2020/task-

       acoustic-scene-classification-results-a#Liu2020

  • 7.   2020年,第二十二届中国国际工业博览会,云知声-上师大联合实验室合作成果智能语音电子病例

          系统获高校展优秀展品奖

  • 8.    2018年,“上海产学研合作优秀项目奖”二等奖 ;

  • 9.    2016年,国际“中英文混合语音识别竞赛(OC16 Chinese-English MixASR Challenge)”,提交的“SHNU”中英文

           混合语音识别系统取得国际第2名;

  • 10.  20187-8月,第5届国际多通道语音分离和识别评测(The 5th CHiME Speech Separation and Recognition Challenge,

          CHiME-5),提交的“SHNU系统”成绩排在国际第9名;

  • 11.  20191-2月,国际“防攻击声纹识别评测(Automatic Speaker Verification Spoofing and CountermeasuresChallenge,

           ASVspoof2019), 提交的“SHNU系统”成绩排在国际第13/156名;

  • 12.  20199月,联合实验室学生参加 “多通道远场文本相关声纹识别-AISHELL Speaker Verification Challenge2019”,

           获得第4/50;

  • 13.  2008 NIST Speaker Recognition Evaluation (SRE),在核心测试任务中,作为关键技术人员及组长带领的团队获得 EER

           minDCF两项国际第一名,DCF第三名,综合成绩国际第一,该成果被国家自然科学基金委,中国科学院网站等

           100多家媒体报;

  • 14.  2009 NIST Language Recognition Evaluation,团队在通用语种测试中各项指标综合排名国际第二;同时,在更具挑战

           性的 8组方言对测试中,有 6组方言对测试性能均远远超过了其他参赛单位,综合排名国际第一;

  • 15.  2010 NIST Speaker Recognition Evaluation,作为关键技术人员及组长带领的团队获得 EER, minDCF DCF指标综合成绩

           国际第二名。

     


主持的科研项目:


  1. 1.国家自然科学基金面上项目,低资源条件下的重口音鲁棒性声学建模关键技术研究,2021-2024.

  2. 2. 国家自然科学基金青年项目中英文混合语音识别中声学建模关键技术研究, 2017-2020.

  3. 3. 上海市青年科技英才扬帆计划, 基于深度学习的声纹识别方法研究,  2014-2017.

  4. 4. 联盟计划项目,多语种混合语音识别开发,  已结题.



Publications(*指研究生一作,导师通信作者): 

===============================================================================

详情见:Google scholar


2025年度:

[1]    Yuxiang Mei, Yuang Zheng, Dongxing Xu, Yanhua Long*. SHNU Multilingual Conversational Speech Recognition System for

         INTERSPEECH2025 MLC-SLM Challenge, in Proc. INTERSPEECH 2025.      

[2]    Yu Liao, Haixin Guan, Shuang Wei, Yanhua Long*, Leveraging Out-of-Domain Noise for Unsupervised Domain Adaptation 

         in Speech Enhancement, in Proc. ICASSP2025.

[3]    Ziling Huang, Haixin Guan, Haoran Wei, Yanhua Long*. SEF-PNet: Speaker Encoder-Free Personalized Speech 

         Enhancement  with Local and Global Contexts Aggregation,In Proc. ICASSP 2025.

[4]    Haoran Wei, Shiling Wang, Yanhua Long*. Personalized Speech Enhancement without User Enrollment for Real-World 

         Audio Replay Scenarios., in Proc. ICASSP 2025.

[5]     Yu Liao, Li Li, Haixin Guan, Yanhua Long*, Exploring Using Contrastive Learning for Improving BSRNN-based Speech 

         Enhancement,  Circuits, Systems, and Signal Processing (CSSP),2025. 

[6]     Li Li, Yijie Li, Dongxing Xu, Yanhua Long*. Unsupervised End-to-End Accented Speech Recognition Under Low-resource 

         Conditions,  IEEE Transactions on Audio, Speech and Language Processing, 2025(33): 1616-1627. 2025. 

[7]     Renchang Dong, Jie Chen, Yanhua Long*, Yijie Li, Dongxing Xu. Enhanced Cross-Modal Parallel Training for Improving 

          End-to-End Accented Speech Recognition, Speech Communication, 2025, 169: 103188. 2025.  

[8]     Hanfang Cui, Longfei Song, Li Li, Dongxing Xu, Yanhua Long*. Revisiting SSL for sound event detection: complementary 

          fusion  and adaptive post-processing, Journal of King Saud University-Computer and Information Sciences, 2025. 

[9]     Haixin Guan, Shaowei Ding, Wei Dai, X Tan, Yanhua Long, Jiaen Liang. Low complexity DOA estimation based on 

          weighted noise component subtraction for smart-home application, Applied Acoustics, 231:110490, 2025. 


学术成果

论文
  • [1] 龙艳花·Improving low?complexity and real?time DeepFilterNet2 for personalized speech enhancement·International Journal of Speech Technology,27
  • [9] 龙艳花·Short-time speaker verification with different speaking style utterances·PLOS ONE,卷: 15期: 11
  • [11] 龙艳花·基于贪婪稀疏优化的欠定语音盲分离方法·计算机工程与设计,2021年08期:2299-2307,9
  • [15] 龙艳花·Heterogeneous separation consistency training for adaptation of unsupervised speech separation·EURASIP JOURNAL ON AUDIO SPEECH AND MUSIC PROCESSING,卷: 2023期: 1
  • [22] 龙艳花·Pronunciation augmentation for Mandarin-English code-switching speech recognition·EURASIP JOURNAL ON AUDIO SPEECH AND MUSIC PROCESSING,卷: 2021期: 1
  • [23] 龙艳花·Tri-stage training with language-specific encoder and bilingual acoustic learner for code-switching speech recognition·APPLIED ACOUSTICS,218
科研项目
  • [1] 龙艳花.复杂场景语音识别声学建模方法研究,在研
  • [2] 龙艳花.面向语音识别的副语言信息标注算法研究,在研
  • [3] 龙艳花,陈婕,叶宏.低资源多任务声学建模技术研发,在研
  • [4] 龙艳花.基于深度学习的声纹识别方法研究,验收
  • [5] 龙艳花.鲁棒性语言声学建模算法研发,验收
  • [6] 龙艳花.一种基于语音转换的情感疏导系统研究,在研
  • [7] 龙艳花.自然人机交互关键技术研发,验收
  • [8] 龙艳花."口语对话"语音的声学建模技术研发,在研
  • [9] 龙艳花.噪声环境下中英混合的语音识别系统研发,在研
  • [10] 龙艳花.低资源条件下的重口音鲁棒性声学建模关键技术研究,验收
  • [11] 龙艳花.噪声环境下中英混合的语音识别系统研发,在研
  • [12] 龙艳花.目标语音提取中的鲁棒性声学自适应关键技术研究,在研
  • [13] 龙艳花.中英文混合语音识别中声学建模关键技术研究,验收
  • [14] 龙艳花.特殊声学事件检测算法研发,验收
  • [15] 龙艳花.多语种混合语音识别开发,验收
  • [16] 龙艳花.一种基于语音转换的情感疏导系统,验收
软件成果
  • [1] 龙艳花.基于Android平台的在线订餐软件[简称:订餐app]. 软件登记号:2017SR382726,2017-07-19
  • [2] 龙艳花,魏浩然.基于Matlab的双门限语音端点检测软件V1.0. 软件登记号:2016SR074008,2016-04-12
  • [3] 龙艳花,何人可,叶宏.噪声环境下中英文混合语音识别降噪系统V1.0. 软件登记号:2019SR0032795,2019-01-10
  • [4] 龙艳花,孙健腾.无监督重口音语音识别软件V1.0. 软件登记号:2023SR1746740,2023-12-25
  • [5] 龙艳花,张艳,叶宏.宾馆客房管理的系统软件V1.0. 软件登记号:2016SR099908,2016-05-10
  • [6] 龙艳花,石岩,茅红伟,叶宏.基于深度神经网络语音端点检测方法的改进的软件V1.0. 软件登记号:2018SR791079,2018-09-29
  • [7] 龙艳花,马志民,叶宏.防攻击声纹识别平台V1.0. 软件登记号:2019SR0032793,2019-01-10
  • [8] 龙艳花,叶宏,童琪琪.基于发音动作参数的说话人确认技术研究的软件V1.0. 软件登记号:2018SR1048556,2018-06-20
  • [9] 龙艳花.基于B/S的淘宝商城电子商务系统[简称:电子商务系统]. 软件登记号:2017SR4796095,2017-08-29
  • [10] 龙艳花,张艳,叶宏.基于E531模块测速仪和里程表软件. 软件登记号:2016SR073979,2016-04-12
  • [11] 龙艳花,马燕.无监督重口音语音识别软件V1.0. 软件登记号:SR2023174674,2023-09-26
  • [12] 龙艳花.AIKT智能语音莱普通软件V1.0. 软件登记号:2022SR0452236,2022-04-11
  • [13] 龙艳花,魏浩然.基于Matlab的能量分类语音端点检测软件V1.0. 软件登记号:2016SR074002,2016-04-12
专利成果
  • [1] 黄盼,梁芸浩,龙艳花. 声学事件检测方法、装置、电子设备和存储介质. 中国专利:CN 114627861 B,2025-05-16.
  • [2] 龙艳花,李黎,李轶杰,许东星. 无监督和有监督联合的声学模型训练方法. 中国专利:申请状态(申请号:202311585170.6).
  • [3] 龙艳花,李靖,许东星. 跨域语音鉴伪方法和系统. 中国专利:CN 116386648 B,2025-06-27.
  • [4] 龙艳花,汪世林,关海欣. 基于特征压缩和声纹信息自适应融合的语音提取方法. 中国专利:申请状态(申请号:202311501147.4).
  • [5] 龙艳花. 一种内置打印机的便携式多功能计算机. 中国专利:ZL201922095212.3,2020-06-12.
  • [6] 龙艳花,陆宇,杜如帆,张玲,袁倩,王懿. 一种基于语音转换的情感疏导系统. 中国专利:ZL201810374212.4,2020-09-29.
  • [7] 魏爽,彭剑,陶春贵,龙艳花,杨春夏,张巧珍,李莉. 一种密集环境中基于压缩感知的多径时延估计方法及装置. 中国专利:ZL201910640963.0,2023-06-02.
  • [8] 龙艳花,宋龙飞,许东星. 声音事件检测数据合成及声音事件检测模型的训练方法. 中国专利:申请状态(申请号:CN202510684973.X).
  • [9] 龙艳花,苏春雨,黄盼. 一种基于语义分析的情绪识别方法和设备. 中国专利:ZL202010443389.,2023-12-19.
  • [10] 龙艳花,刘悦,梁芸浩,魏爽. 一种声学场景分类方法. 中国专利:ZL202110653222.3,2023-11-17.
  • [11] 龙艳花,叶宏,魏浩然. 采用声纹和语音识别进行个性化电视语音唤醒的方法. 中国专利:申请状态(申请号:201410840544.9).
  • [12] 龙艳花,陈双圆,许东星. 模型训练及语音识别方法、装置、设备及介质. 中国专利:申请状态(申请号:CN202510614431.5).
  • [13] 龙艳花,周轶凡,许东星. 基于分组自动编码器的机器运行声学状态监测方法和系统. 中国专利:申请状态(申请号:202310399046.4).
  • [14] 龙艳花,董仁昌,李轶杰,许东星. 一种端到端重口音语音识别跨模态并行训练方法. 中国专利:申请状态(申请号:202311425505.8).
  • [15] 龙艳花,唐甜甜,李轶杰. 生物声音事件检测模型训练方法,声音事件的检测方法. 中国专利:ZL202111012585.5,2023-08-01.
  • [16] 龙艳花,周轶凡,李轶杰. 基于伪样本对抗训练的机器运行声学状态监测方法和系统. 中国专利:申请状态(申请号:202310402009.4).
  • [17] 魏浩然,龙艳花,冯志民,叶宏,茅红伟. 一种基于位置信息的语音端点检测方法. 中国专利:申请状态(申请号:201710624269.0).
  • [18] 龙艳花,陈双圆,李轶杰,许东星. 噪声语音识别模型训练和语音识别方法、装置及设备. 中国专利:申请状态(申请号:202510904849.X).
  • [19] 周雷,龙艳花,叶宏. 一种文件夹加密方法. 中国专利:申请状态(申请号:201410784456.1).
  • [20] 龙艳花,宋龙飞,许东星,李轶杰. 轻量化声音检测模型训练及声音事件检测方法、装置及设备. 中国专利:申请状态(申请号:CN202510244635.4).
  • [21] 魏爽,杨璟安,徐朋,龙艳花,杨春夏,张巧珍. 一种欠定语音盲源分离方法及装置. 中国专利:申请状态(申请号:201910763771.9).
  • [22] 龙艳花,李靖,许东星. 跨域语音鉴伪方法和系统. 中国专利:申请状态(申请号:202310594301.0).
  • [23] 龙艳花,梁芸浩,李轶杰. 基于聚焦损失函数的指导型声学事件检测模型训练方法. 中国专利:申请状态(申请号:202110974110.8).
  • [24] 龙艳花,唐甜甜,李轶杰. 声音事件的检测方法,装置,存储介质及电子装置. 中国专利:ZL202111015206.8,2023-07-25.
  • [25] 龙艳花,黄紫玲,关海欣. 基于双任务的模型训练及语音增强方法、装置及设备. 中国专利:申请状态(申请号:02510614432.X).
  • [26] 龙艳花,梁芸浩,李轶杰. 基于特征分解分类器与自适应后处理的声学事件检测系统. 中国专利:ZL202110974087.2,2023-12-19.
  • [27] 龙艳花,李靖,李轶杰. 基于时频域掩蔽效应的跨域语音鉴伪方法和系统. 中国专利:申请状态(申请号:2023105943792).

教学工作

教职工课程信息
开课学年开课学期课程名称
2019-20201线性代数
2023-20242数字语音处理
2025-20262数字语音处理
2018-20191线性代数
2017-20182数字语音处理
2021-20221线性代数
2023-20241科技文献检索与写作
2024-20252数字语音处理
2020-20212数字语音处理
2023-20242数字语音处理
2025-20262数字语音处理
2018-20191线性代数
2021-20222线性代数
2024-20252数字语音处理
2019-20201线性代数
2021-20221线性代数
2021-20222数字语音处理
2020-20211线性代数
2021-20222数字语音处理
2025-20262数字语音处理
2022-20232数字语音处理
2021-20222线性代数
2019-20202数字语音处理
2020-20212数字语音处理
2025-20261科技文献检索与写作
2024-20252数字语音处理
2019-20201线性代数
2022-20232数字语音处理
2019-20201数字语音处理
2018-20191线性代数
2016-20171线性代数
2022-20232数字语音处理
2020-20212数字语音处理
2020-20211线性代数
2018-20192数字语音处理
2018-20192数字语音处理
2024-20251科技文献检索与写作
2017-20182模式识别

荣誉奖励

2015-2016 年度上海师范大学三八红旗手

2017年,获上海师范大学“第八届优秀青年学术骨干”荣誉称号

社会兼职

国家自然科学基金通讯评审专家

国家教育部学位中心论文评审专家

上海市科学技术委员会入库专家

国际高水平学术期刊及语音领域顶级国际会议审稿专家,

包括 IEEE TASLP, Speech Communication, CSL, ICASSP, INTERSPEECH等