掃碼登錄
IT之家 9 月 11 日消息,微軟近日為其 Copilot 工具新增了一項(xiàng)名為“Copilot 音頻表達(dá)式”的功能。該功能基于微軟自研的 MAI-Voice-1 模型打造,目前向用戶提供三種不同的語音模式選擇。
這三種語音模式分別為:“有感染力模式(Emotional Mode)”,支持富有表現(xiàn)力的自由表達(dá),適用于傳遞情感的場(chǎng)景;“故事模式(Story Mode)”,可用于講述包含多個(gè)角色的故事,提供更具沉浸感的聽覺體驗(yàn);“腳本模式(Script Mode)”,能夠?qū)崿F(xiàn)逐字精準(zhǔn)播報(bào),尤其適合需要準(zhǔn)確傳達(dá)信息的場(chǎng)合。
此外,微軟還為每種模式配備了多種語音類型和風(fēng)格,涵蓋從經(jīng)典的莎士比亞作品朗讀風(fēng)格到充滿激情的體育解說風(fēng)格等多種選項(xiàng)。
目前,這一新功能已在 Copilot Labs(Copilot 實(shí)驗(yàn)室)中上線,用戶可前往體驗(yàn)。值得注意的是,微軟近期還推出了其首款大型語言模型 MAI-1,并與 Anthropic 達(dá)成協(xié)議,計(jì)劃將后者的模型集成至 Office 應(yīng)用中。這一系列動(dòng)作表明,微軟正積極拓展其在人工智能領(lǐng)域的技術(shù)布局,逐步降低對(duì) OpenAI 的依賴。