掃碼登錄
IT之家 9 月 11 日消息,微軟近日為其 Copilot 工具新增了一項名為“Copilot 音頻表達式”的功能。該功能基于微軟自研的 MAI-Voice-1 模型打造,目前向用戶提供三種不同的語音模式選擇。
這三種語音模式分別為:“有感染力模式(Emotional Mode)”,支持富有表現力的自由表達,適用于傳遞情感的場景;“故事模式(Story Mode)”,可用于講述包含多個角色的故事,提供更具沉浸感的聽覺體驗;“腳本模式(Script Mode)”,能夠實現逐字精準播報,尤其適合需要準確傳達信息的場合。
此外,微軟還為每種模式配備了多種語音類型和風格,涵蓋從經典的莎士比亞作品朗讀風格到充滿激情的體育解說風格等多種選項。
目前,這一新功能已在 Copilot Labs(Copilot 實驗室)中上線,用戶可前往體驗。值得注意的是,微軟近期還推出了其首款大型語言模型 MAI-1,并與 Anthropic 達成協(xié)議,計劃將后者的模型集成至 Office 應用中。這一系列動作表明,微軟正積極拓展其在人工智能領域的技術布局,逐步降低對 OpenAI 的依賴。