| 部门:信息与机电工程学院 |
| 聘任技术职务:教授 |
| 学位:工学博士学位 |
| 学历:博士研究生毕业 |
| 毕业院校:中国科学技术大学 |
| 联系电话: |
| 电子邮箱:yanhua@shnu.edu.cn |
| 办公地点:上海师范大学信息与机电工程学院 |
| 通讯地址:上海市徐汇区桂林路100号 |
研究方向
龙艳花,现任上海师范大学信息与通信工程系教授,云知声-上师大 自然人机交互联合实验室负责人,上海市院士专家工作站专家,上海市”东方学者“特聘教授。国家自然科学基金、上海市首届青年英才扬帆计划获得者。现为IEEE、ISCA会员,有15年以上从事智能语音及语言处理、人机交互和深度学习研究和产业化工作经验。
研究兴趣
招生信息:
学习及工作经历: 2013/06-至今, 上海师范大学,教授 2011/10-2013/04, 英国剑桥大学,工程系,博士后 2009/09-2010/02,微软亚洲研究院,语音组,Intern 2008/07-2009/02,新加坡南洋理工大学及I2R研究院,HLT部门,交流学生 2006/09–2011/06, 中国科学技术大学,科大讯飞语音实验室, 博士, 导师:戴礼荣
国际科研合作: 与新加坡国立大学(NUS),南洋理工大学(NTU)等教授合作,联合培养在读研究生
2019-2021年:研究生周心远到新加坡国立大学Prof. Haizhou Li 实验室联合培养,主要从事基于深度学习的中英文混合语音识别声学建模的研究 2023-2024年:研究生王雪菲到香港中文大学深圳大数据研究院实验室联合培养,主要从事目标语音提取的算法研究 2024年:研究生李黎到新加坡南洋理工大学Prof. Chng Eng Siong实验室联合培养,主要从事基于语音大模型的低资源ASR声学建模算法研究
科研获奖及学术评测: 1. 2023年11月,特殊声学时间检测算法研究, “上海产学研合作优秀项目奖”三等奖; 2. 2023年8月,自然人机交互联合实验室与云知声合作,首次提出了Consistency Measure Factor(CMF) 算法, 在VoxSRC 2023 国际说话人识别竞赛中,团队夺得Track1第一名、Track2第二名; 3. 2021年,少样本生物事件检测国际评测“DCASE2021 Task5-Few-shot Bioacoustic Event Detection(IEEE AASP Challenge)”,实验室研究生“唐甜甜,梁芸浩”同学提交的SHNU系统性能排名国际第二,详见官方结果; 4. 2021年,家居场景下的声音事件检测和分离国际评测“DCASE2021 Task4-Sound Event Detection and Separationin Domestic Environments”, 实验室研究生“梁芸浩,唐甜甜”同学提交SHNU系统,teams-rangking 10/22, system-ranking 20/68, 详见官网结果; 5. 2020年,Blizzard Challenge国际语音合成评测,云知声-上师大自然人机交互联合实验室 提交的SHNU系统,首次参加评测获中文普通话,上海话多项关键指标排名第一。如中文普 通话合成自然度,段落合成所有指标(Overrall impression\pleasantness\speech pauses\stress\intonation\emotion\listeningeffort),普通话相似度、上海话可懂度 等指标位列第一,详情见具体报道; 6. 2020年,声学场景分类领域的国际评测“DCASE2020 Task 1A(IEEE AASP Challenge)”,基于研究生刘悦同学 的研究成果,实验室提交的SHNU系统获得排名26/93, 见官方结果:http://dcase.community/challenge2020/task- acoustic-scene-classification-results-a#Liu2020; 7. 2020年,第二十二届中国国际工业博览会,云知声-上师大联合实验室合作成果“智能语音电子病例” 系统获高校展区“优秀展品奖”; 8. 2018年,“上海产学研合作优秀项目奖”二等奖 ; 9. 2016年,国际“中英文混合语音识别竞赛(OC16 Chinese-English MixASR Challenge)”,提交的“SHNU”中英文 混合语音识别系统取得国际第2名; 10. 2018年7-8月,第5届国际多通道语音分离和识别评测(The 5th CHiME Speech Separation and Recognition Challenge, CHiME-5),提交的“SHNU系统”成绩排在国际第9名; 11. 2019年1-2月,国际“防攻击声纹识别评测(Automatic Speaker Verification Spoofing and CountermeasuresChallenge, ASVspoof2019)”, 提交的“SHNU系统”成绩排在国际第13/156名; 12. 2019年9月,联合实验室学生参加 “多通道远场文本相关声纹识别-AISHELL Speaker Verification Challenge2019”, 获得第4名/50; 13. 2008 NIST Speaker Recognition Evaluation (SRE),在核心测试任务中,作为关键技术人员及组长带领的团队获得 EER、 minDCF两项国际第一名,DCF第三名,综合成绩国际第一,该成果被国家自然科学基金委,中国科学院网站等 100多家媒体报; 14. 2009 NIST Language Recognition Evaluation,团队在通用语种测试中各项指标综合排名国际第二;同时,在更具挑战 性的 8组方言对测试中,有 6组方言对测试性能均远远超过了其他参赛单位,综合排名国际第一; 15. 2010 NIST Speaker Recognition Evaluation,作为关键技术人员及组长带领的团队获得 EER, minDCF, DCF指标综合成绩 国际第二名。
主持的科研项目:
1.国家自然科学基金面上项目,低资源条件下的重口音鲁棒性声学建模关键技术研究,2021-2024. 2. 国家自然科学基金青年项目,中英文混合语音识别中声学建模关键技术研究, 2017-2020. 3. 上海市青年科技英才扬帆计划, 基于深度学习的声纹识别方法研究, 2014-2017. 4. 联盟计划项目,多语种混合语音识别开发, 已结题.
Publications(*指研究生一作,导师通信作者):
===============================================================================
详情见:Google scholar
2025年度: [1] Yuxiang Mei, Yuang Zheng, Dongxing Xu, Yanhua Long*. SHNU Multilingual Conversational Speech Recognition System for INTERSPEECH2025 MLC-SLM Challenge, in Proc. INTERSPEECH 2025. [2] Yu Liao, Haixin Guan, Shuang Wei, Yanhua Long*, Leveraging Out-of-Domain Noise for Unsupervised Domain Adaptation in Speech Enhancement, in Proc. ICASSP2025. [3] Ziling Huang, Haixin Guan, Haoran Wei, Yanhua Long*. SEF-PNet: Speaker Encoder-Free Personalized Speech Enhancement with Local and Global Contexts Aggregation,In Proc. ICASSP 2025. [4] Haoran Wei, Shiling Wang, Yanhua Long*. Personalized Speech Enhancement without User Enrollment for Real-World Audio Replay Scenarios., in Proc. ICASSP 2025. [5] Yu Liao, Li Li, Haixin Guan, Yanhua Long*, Exploring Using Contrastive Learning for Improving BSRNN-based Speech Enhancement, Circuits, Systems, and Signal Processing (CSSP),2025. [6] Li Li, Yijie Li, Dongxing Xu, Yanhua Long*. Unsupervised End-to-End Accented Speech Recognition Under Low-resource Conditions, IEEE Transactions on Audio, Speech and Language Processing, 2025(33): 1616-1627. 2025. [7] Renchang Dong, Jie Chen, Yanhua Long*, Yijie Li, Dongxing Xu. Enhanced Cross-Modal Parallel Training for Improving End-to-End Accented Speech Recognition, Speech Communication, 2025, 169: 103188. 2025. [8] Hanfang Cui, Longfei Song, Li Li, Dongxing Xu, Yanhua Long*. Revisiting SSL for sound event detection: complementary fusion and adaptive post-processing, Journal of King Saud University-Computer and Information Sciences, 2025. [9] Haixin Guan, Shaowei Ding, Wei Dai, X Tan, Yanhua Long, Jiaen Liang. Low complexity DOA estimation based on weighted noise component subtraction for smart-home application, Applied Acoustics, 231:110490, 2025.
学术成果
论文
-
[1] 龙艳花·Improving low?complexity and real?time DeepFilterNet2 for personalized speech enhancement·International Journal of Speech Technology,27
-
[9] 龙艳花·Short-time speaker verification with different speaking style utterances·PLOS ONE,卷: 15期: 11
-
[11] 龙艳花·基于贪婪稀疏优化的欠定语音盲分离方法·计算机工程与设计,2021年08期:2299-2307,9
-
[15] 龙艳花·Heterogeneous separation consistency training for adaptation of unsupervised speech separation·EURASIP JOURNAL ON AUDIO SPEECH AND MUSIC PROCESSING,卷: 2023期: 1
-
[22] 龙艳花·Pronunciation augmentation for Mandarin-English code-switching speech recognition·EURASIP JOURNAL ON AUDIO SPEECH AND MUSIC PROCESSING,卷: 2021期: 1
-
[23] 龙艳花·Tri-stage training with language-specific encoder and bilingual acoustic learner for code-switching speech recognition·APPLIED ACOUSTICS,218
科研项目
-
[1] 龙艳花.复杂场景语音识别声学建模方法研究,在研
-
[2] 龙艳花.面向语音识别的副语言信息标注算法研究,在研
-
[3] 龙艳花,陈婕,叶宏.低资源多任务声学建模技术研发,在研
-
[4] 龙艳花.基于深度学习的声纹识别方法研究,验收
-
[5] 龙艳花.鲁棒性语言声学建模算法研发,验收
-
[6] 龙艳花.一种基于语音转换的情感疏导系统研究,在研
-
[7] 龙艳花.自然人机交互关键技术研发,验收
-
[8] 龙艳花."口语对话"语音的声学建模技术研发,在研
-
[9] 龙艳花.噪声环境下中英混合的语音识别系统研发,在研
-
[10] 龙艳花.低资源条件下的重口音鲁棒性声学建模关键技术研究,验收
-
[11] 龙艳花.噪声环境下中英混合的语音识别系统研发,在研
-
[12] 龙艳花.目标语音提取中的鲁棒性声学自适应关键技术研究,在研
-
[13] 龙艳花.中英文混合语音识别中声学建模关键技术研究,验收
-
[14] 龙艳花.特殊声学事件检测算法研发,验收
-
[15] 龙艳花.多语种混合语音识别开发,验收
-
[16] 龙艳花.一种基于语音转换的情感疏导系统,验收
软件成果
-
[1] 龙艳花.基于Android平台的在线订餐软件[简称:订餐app]. 软件登记号:2017SR382726,2017-07-19
-
[2] 龙艳花,魏浩然.基于Matlab的双门限语音端点检测软件V1.0. 软件登记号:2016SR074008,2016-04-12
-
[3] 龙艳花,何人可,叶宏.噪声环境下中英文混合语音识别降噪系统V1.0. 软件登记号:2019SR0032795,2019-01-10
-
[4] 龙艳花,孙健腾.无监督重口音语音识别软件V1.0. 软件登记号:2023SR1746740,2023-12-25
-
[5] 龙艳花,张艳,叶宏.宾馆客房管理的系统软件V1.0. 软件登记号:2016SR099908,2016-05-10
-
[6] 龙艳花,石岩,茅红伟,叶宏.基于深度神经网络语音端点检测方法的改进的软件V1.0. 软件登记号:2018SR791079,2018-09-29
-
[7] 龙艳花,马志民,叶宏.防攻击声纹识别平台V1.0. 软件登记号:2019SR0032793,2019-01-10
-
[8] 龙艳花,叶宏,童琪琪.基于发音动作参数的说话人确认技术研究的软件V1.0. 软件登记号:2018SR1048556,2018-06-20
-
[9] 龙艳花.基于B/S的淘宝商城电子商务系统[简称:电子商务系统]. 软件登记号:2017SR4796095,2017-08-29
-
[10] 龙艳花,张艳,叶宏.基于E531模块测速仪和里程表软件. 软件登记号:2016SR073979,2016-04-12
-
[11] 龙艳花,马燕.无监督重口音语音识别软件V1.0. 软件登记号:SR2023174674,2023-09-26
-
[12] 龙艳花.AIKT智能语音莱普通软件V1.0. 软件登记号:2022SR0452236,2022-04-11
-
[13] 龙艳花,魏浩然.基于Matlab的能量分类语音端点检测软件V1.0. 软件登记号:2016SR074002,2016-04-12
专利成果
-
[1] 黄盼,梁芸浩,龙艳花. 声学事件检测方法、装置、电子设备和存储介质. 中国专利:CN 114627861 B,2025-05-16.
-
[2] 龙艳花,李黎,李轶杰,许东星. 无监督和有监督联合的声学模型训练方法. 中国专利:申请状态(申请号:202311585170.6).
-
[3] 龙艳花,李靖,许东星. 跨域语音鉴伪方法和系统. 中国专利:CN 116386648 B,2025-06-27.
-
[4] 龙艳花,汪世林,关海欣. 基于特征压缩和声纹信息自适应融合的语音提取方法. 中国专利:申请状态(申请号:202311501147.4).
-
[5] 龙艳花. 一种内置打印机的便携式多功能计算机. 中国专利:ZL201922095212.3,2020-06-12.
-
[6] 龙艳花,陆宇,杜如帆,张玲,袁倩,王懿. 一种基于语音转换的情感疏导系统. 中国专利:ZL201810374212.4,2020-09-29.
-
[7] 魏爽,彭剑,陶春贵,龙艳花,杨春夏,张巧珍,李莉. 一种密集环境中基于压缩感知的多径时延估计方法及装置. 中国专利:ZL201910640963.0,2023-06-02.
-
[8] 龙艳花,宋龙飞,许东星. 声音事件检测数据合成及声音事件检测模型的训练方法. 中国专利:申请状态(申请号:CN202510684973.X).
-
[9] 龙艳花,苏春雨,黄盼. 一种基于语义分析的情绪识别方法和设备. 中国专利:ZL202010443389.,2023-12-19.
-
[10] 龙艳花,刘悦,梁芸浩,魏爽. 一种声学场景分类方法. 中国专利:ZL202110653222.3,2023-11-17.
-
[11] 龙艳花,叶宏,魏浩然. 采用声纹和语音识别进行个性化电视语音唤醒的方法. 中国专利:申请状态(申请号:201410840544.9).
-
[12] 龙艳花,陈双圆,许东星. 模型训练及语音识别方法、装置、设备及介质. 中国专利:申请状态(申请号:CN202510614431.5).
-
[13] 龙艳花,周轶凡,许东星. 基于分组自动编码器的机器运行声学状态监测方法和系统. 中国专利:申请状态(申请号:202310399046.4).
-
[14] 龙艳花,董仁昌,李轶杰,许东星. 一种端到端重口音语音识别跨模态并行训练方法. 中国专利:申请状态(申请号:202311425505.8).
-
[15] 龙艳花,唐甜甜,李轶杰. 生物声音事件检测模型训练方法,声音事件的检测方法. 中国专利:ZL202111012585.5,2023-08-01.
-
[16] 龙艳花,周轶凡,李轶杰. 基于伪样本对抗训练的机器运行声学状态监测方法和系统. 中国专利:申请状态(申请号:202310402009.4).
-
[17] 魏浩然,龙艳花,冯志民,叶宏,茅红伟. 一种基于位置信息的语音端点检测方法. 中国专利:申请状态(申请号:201710624269.0).
-
[18] 龙艳花,陈双圆,李轶杰,许东星. 噪声语音识别模型训练和语音识别方法、装置及设备. 中国专利:申请状态(申请号:202510904849.X).
-
[19] 周雷,龙艳花,叶宏. 一种文件夹加密方法. 中国专利:申请状态(申请号:201410784456.1).
-
[20] 龙艳花,宋龙飞,许东星,李轶杰. 轻量化声音检测模型训练及声音事件检测方法、装置及设备. 中国专利:申请状态(申请号:CN202510244635.4).
-
[21] 魏爽,杨璟安,徐朋,龙艳花,杨春夏,张巧珍. 一种欠定语音盲源分离方法及装置. 中国专利:申请状态(申请号:201910763771.9).
-
[22] 龙艳花,李靖,许东星. 跨域语音鉴伪方法和系统. 中国专利:申请状态(申请号:202310594301.0).
-
[23] 龙艳花,梁芸浩,李轶杰. 基于聚焦损失函数的指导型声学事件检测模型训练方法. 中国专利:申请状态(申请号:202110974110.8).
-
[24] 龙艳花,唐甜甜,李轶杰. 声音事件的检测方法,装置,存储介质及电子装置. 中国专利:ZL202111015206.8,2023-07-25.
-
[25] 龙艳花,黄紫玲,关海欣. 基于双任务的模型训练及语音增强方法、装置及设备. 中国专利:申请状态(申请号:02510614432.X).
-
[26] 龙艳花,梁芸浩,李轶杰. 基于特征分解分类器与自适应后处理的声学事件检测系统. 中国专利:ZL202110974087.2,2023-12-19.
-
[27] 龙艳花,李靖,李轶杰. 基于时频域掩蔽效应的跨域语音鉴伪方法和系统. 中国专利:申请状态(申请号:2023105943792).
教学工作
| 教职工课程信息 | | 开课学年 | 开课学期 | 课程名称 | | 2019-2020 | 1 | 线性代数 | | 2023-2024 | 2 | 数字语音处理 | | 2025-2026 | 2 | 数字语音处理 | | 2018-2019 | 1 | 线性代数 | | 2017-2018 | 2 | 数字语音处理 | | 2021-2022 | 1 | 线性代数 | | 2023-2024 | 1 | 科技文献检索与写作 | | 2024-2025 | 2 | 数字语音处理 | | 2020-2021 | 2 | 数字语音处理 | | 2023-2024 | 2 | 数字语音处理 | | 2025-2026 | 2 | 数字语音处理 | | 2018-2019 | 1 | 线性代数 | | 2021-2022 | 2 | 线性代数 | | 2024-2025 | 2 | 数字语音处理 | | 2019-2020 | 1 | 线性代数 | | 2021-2022 | 1 | 线性代数 | | 2021-2022 | 2 | 数字语音处理 | | 2020-2021 | 1 | 线性代数 | | 2021-2022 | 2 | 数字语音处理 | | 2025-2026 | 2 | 数字语音处理 | | 2022-2023 | 2 | 数字语音处理 | | 2021-2022 | 2 | 线性代数 | | 2019-2020 | 2 | 数字语音处理 | | 2020-2021 | 2 | 数字语音处理 | | 2025-2026 | 1 | 科技文献检索与写作 | | 2024-2025 | 2 | 数字语音处理 | | 2019-2020 | 1 | 线性代数 | | 2022-2023 | 2 | 数字语音处理 | | 2019-2020 | 1 | 数字语音处理 | | 2018-2019 | 1 | 线性代数 | | 2016-2017 | 1 | 线性代数 | | 2022-2023 | 2 | 数字语音处理 | | 2020-2021 | 2 | 数字语音处理 | | 2020-2021 | 1 | 线性代数 | | 2018-2019 | 2 | 数字语音处理 | | 2018-2019 | 2 | 数字语音处理 | | 2024-2025 | 1 | 科技文献检索与写作 | | 2017-2018 | 2 | 模式识别 |
荣誉奖励
2015-2016 年度上海师范大学三八红旗手 2017年,获上海师范大学“第八届优秀青年学术骨干”荣誉称号
社会兼职
国家自然科学基金通讯评审专家
国家教育部学位中心论文评审专家 上海市科学技术委员会入库专家 国际高水平学术期刊及语音领域顶级国际会议审稿专家, 包括 IEEE TASLP, Speech Communication, CSL, ICASSP, INTERSPEECH等
|