微軟 Copilot 新增音頻表達(dá)式功能，莎士比亞腔、體育解說都能整

2025年09月12日 17:47

行業(yè)資訊瀏覽：139

IT之家 9 月 11 日消息，微軟近日為其 Copilot 工具新增了一項(xiàng)名為“Copilot 音頻表達(dá)式”的功能。該功能基于微軟自研的 MAI-Voice-1 模型打造，目前向用戶提供三種不同的語音模式選擇。

這三種語音模式分別為：“有感染力模式（Emotional Mode）”，支持富有表現(xiàn)力的自由表達(dá)，適用于傳遞情感的場(chǎng)景；“故事模式（Story Mode）”，可用于講述包含多個(gè)角色的故事，提供更具沉浸感的聽覺體驗(yàn)；“腳本模式（Script Mode）”，能夠?qū)崿F(xiàn)逐字精準(zhǔn)播報(bào)，尤其適合需要準(zhǔn)確傳達(dá)信息的場(chǎng)合。

此外，微軟還為每種模式配備了多種語音類型和風(fēng)格，涵蓋從經(jīng)典的莎士比亞作品朗讀風(fēng)格到充滿激情的體育解說風(fēng)格等多種選項(xiàng)。

目前，這一新功能已在 Copilot Labs（Copilot 實(shí)驗(yàn)室）中上線，用戶可前往體驗(yàn)。值得注意的是，微軟近期還推出了其首款大型語言模型 MAI-1，并與 Anthropic 達(dá)成協(xié)議，計(jì)劃將后者的模型集成至 Office 應(yīng)用中。這一系列動(dòng)作表明，微軟正積極拓展其在人工智能領(lǐng)域的技術(shù)布局，逐步降低對(duì) OpenAI 的依賴。

上一篇: 繼首創(chuàng)“AI打賞”服務(wù)之后，支付寶再推國內(nèi)首個(gè)“AI付”

下一篇: 我國 2024 年數(shù)據(jù)生產(chǎn)總量達(dá) 41.06 澤字節(jié)（ZB），全球占比 26.67%

暫無評(píng)論