近日,有消息称,前微软亚洲研究院首席研究经理谭旭已加入大模型创新企业月之暗面,担任端到端语音模型研发的领军人物。谭旭的加入,为月之暗面的技术研发注入了新的活力。
据悉,月之暗面自去年10月起便启动了多模态研究,目前有一个约10人的团队专注于视频模型的研发。为确保产品的独特性和竞争力,公司对外发布计划一直保持谨慎态度。
谭旭在生成式AI领域拥有深厚的研究背景,其论文引用量高达上万次。在微软任职期间,他的研究成果已广泛应用于Azure、Bing等产品与服务中。
加入月之暗面后,谭旭的主要目标是助力公司打造类似GPT-4o的语音体验。GPT-4o是OpenAI今年5月发布的多模态大模型,具备低延时、可随时打断等特性。
传统的语音方案存在响应时间长、无法随时打断等问题。而端到端语音模型则省去了中间转换过程,提高了响应速度,并改善了“幻觉”现象。
谭旭的加入和端到端语音模型的研发,无疑将为月之暗面在未来的市场竞争中增添有力筹码。