国产一二区在线,日本韩国欧美一级片,欧美自拍视频,欧美精品性视频,国产精品亚洲欧美在线播放,57pao国产一区二区,999精品视频在线

當(dāng)前位置: 您當(dāng)前的位置 : 科技金融網(wǎng)  ->  創(chuàng)新  -> 正文

OpenAI發(fā)布語(yǔ)音模型GPT-realtime

2025年09月01日 18:02:38 來(lái)源:科技日?qǐng)?bào) 作者:張佳欣
圖片來(lái)源:美國(guó)OpenAI官網(wǎng)

  科技日?qǐng)?bào)訊(記者 張佳欣)8月28日,美國(guó)人工智能公司OpenAI發(fā)布了其所謂“最先進(jìn)的語(yǔ)音到語(yǔ)音模型”GPT-realtime,以及配套的Realtime API(實(shí)時(shí)應(yīng)用程序接口)。

  據(jù)OpenAI公司介紹,該模型在理解復(fù)雜指令、精準(zhǔn)調(diào)用工具以及生成自然、富有表現(xiàn)力的語(yǔ)音方面表現(xiàn)突出,并在客戶服務(wù)、教育、個(gè)人助理等多種場(chǎng)景中具備廣泛應(yīng)用潛力。

  與傳統(tǒng)語(yǔ)音模型不同,GPT-realtime新增了Marin與Cedar兩種極具特色的語(yǔ)音,同時(shí)對(duì)原有8種語(yǔ)音進(jìn)行了全面升級(jí)。模型不僅能生成自然流暢的語(yǔ)音,還能夠敏銳捕捉笑聲等非語(yǔ)言信號(hào),在句子中間自如切換語(yǔ)言,并可根據(jù)場(chǎng)景需求靈活調(diào)整語(yǔ)氣,使語(yǔ)音交互更貼近真實(shí)人類溝通。

  通過(guò)Realtime API,開(kāi)發(fā)者可實(shí)現(xiàn)實(shí)時(shí)語(yǔ)音輸入輸出,不必再經(jīng)過(guò)繁瑣的多模型轉(zhuǎn)換流程。在實(shí)際應(yīng)用中,這套技術(shù)可用于客戶服務(wù)系統(tǒng),讓虛擬助手即時(shí)解答問(wèn)題,提高效率和體驗(yàn)。它還可應(yīng)用于教育領(lǐng)域,實(shí)現(xiàn)語(yǔ)音對(duì)話和口語(yǔ)練習(xí)。而在個(gè)人助理、辦公或智能家居場(chǎng)景中,用戶能通過(guò)語(yǔ)音快速完成安排或查詢信息。結(jié)合圖像或文本輸入,開(kāi)發(fā)者還能打造更智能的虛擬助手或機(jī)器人系統(tǒng)。

  OpenAI表示,GPT-realtime和Realtime API已于8月28日起面向所有付費(fèi)開(kāi)發(fā)者開(kāi)放。

[編輯: 王姝]
(本文來(lái)源:科技日?qǐng)?bào))
  • 科技金融時(shí)報(bào)
舉報(bào)電話:0571-87089618 | 地址:杭州市文一路115號(hào) | 法律顧問(wèn):北京京師(杭州)律師事務(wù)所陳佳律師
互聯(lián)網(wǎng)新聞信息服務(wù)許可證 33120240003 | 浙ICP備2024107310號(hào) | 浙公網(wǎng)安備33010602013724
Copyright © 2014 kjjrw.com.cn. All rights reserved.