个人简介
- 谭旭是微软亚洲研究院的 高级研究经理 ,研究方向为深度学习、自然语言处理、语音、AI音乐、AI内容生成等。
- 在AI学术会议发表学术论文, 引用量5000+ ,在机器翻译、预训练、语音合成、AI音乐创作等领域的研究在学术界和工业界产生广泛的影响力。
- 多项技术(如机器翻译技术,预训练模型 MASS ,语音合成技术 FastSpeech 1 / 2 、 AdaSpeech 、 LRSpeech ,音乐生成技术 TeleMelody 、 HiFiSinger ,语音识别纠错技术 FastCorrect 1 / 2 等)应用在微软产品中(如Bing搜索,Bing广告,Azure机器翻译,Azure语音合成,Azure语音识别,微软小冰等)。
- 通过Github开源多个项目和工具包,包括 MASS ,MPNet( Huggingface ), Muzic , NeuralSpeech )等。
- 研发的机器翻译系统在中英新闻翻译上达到人类水平( 新智元 , 机器之心 , 微软AI头条 , InfoQ ),并在WMT 2019机器翻译比赛中获多项冠军( 新浪新闻 , 微软AI头条 )。
- 研发的预训练模型 MASS 是该领域最有影响力的模型之一,是ICML 2019最高引(700+)论文之一。MASS部署在微软Bing搜索广告、微软Azure翻译系统等多个产品线。
- 研发的 FastSpeech 1 / 2 (总引用量1000+)是语音合成领域最广泛使用的技术之一,成为很多语音合成、歌声合成模型的基础。在业界广泛使用, 如应用在微软Azure TTS服务以支持100多种语言的语音合成( Azure AI )。已整合到流行的语音开源项目中,如Fairseq, ESPNet,NVIDIA Nemo,TensorFlowTTS,百度PaddlePaddle Parakeet等。在 英伟达GTC大会 上作为语音合成加速案例展示。( InfoQ , 机器之心 , 微软AI头条 )
- 研发的 NaturalSpeech 在语音合成LJSpeech数据集上首次达到人类录音水平!
- 在语音合成领域的 综述论文 , 演讲 和 教程 在学术界和工业界产生广泛的影响。
- 在AI音乐领域(词曲创作、伴奏生成、编曲、歌声合成、音乐理解等)开展了系统性的研究,在全球人工智能大会上做关于 AI音乐创作 的主题报告,在ACM Multimedia 2021会议上举办 AI音乐创作教程 ,开源AI音乐研究项目 Muzic 。
- 担任Transactions on Machine Learning Research ( TMLR ) Action Editor,担任AAAI/NeurIPS/ICASSP的Meta审稿人或领域主席,IEEE member, CCF计算艺术分会 常委。
For English Bio, please go to my
homepage
.