12月1日,DeepSeek(深度求索公司)同時(shí)發(fā)布兩個(gè)正式版模型:DeepSeek-V3.2和DeepSeek-V3.2-Speciale。在公開(kāi)推理測(cè)試中,V3.2水平達(dá)到了開(kāi)放人工智能公司(OpenAI)今年8月推出的大模型GPT-5水平,略低于谷歌(Google)的Gemini3 Pro,國(guó)產(chǎn)大模型再一次吸引全球目光。
兩款模型各有所長(zhǎng)
“簡(jiǎn)單來(lái)說(shuō),區(qū)別于聊天機(jī)器人式大模型,DeepSeek-V3.2更像一位‘話少活好’的助手!盌CCI互聯(lián)網(wǎng)研究院院長(zhǎng)、中國(guó)社會(huì)科學(xué)院大學(xué)數(shù)字中國(guó)研究院特聘研究員劉興亮解釋道,這位助手主打高性價(jià)比與日常使用,具備更強(qiáng)的推理能力和智能體(Agent)能力,未來(lái)有望成為“數(shù)字勞動(dòng)力”,完成自動(dòng)生成報(bào)表、編寫代碼等復(fù)雜工作。
而V3.2-Speciale更像一位“偏科”的科研天才,專攻高難度數(shù)學(xué)問(wèn)題求解、學(xué)術(shù)研究邏輯驗(yàn)證、編程競(jìng)賽解題等,旨在將開(kāi)源模型推理能力推向極致。
工業(yè)和信息化部信息通信經(jīng)濟(jì)專家委員會(huì)委員盤和林表示,新模型有兩個(gè)質(zhì)的突破:引用DSA(領(lǐng)域?qū)S眉軜?gòu))和思考型工具調(diào)用技術(shù)。
盤和林用了一個(gè)形象的比喻解釋DSA技術(shù):“如果把大模型比作圖書(shū)管理員,以往舊模型在找書(shū)時(shí),每次都要從頭一本一本找,詞元消耗多且效率低。而DSA讓它只需檢索最關(guān)鍵信息,可以大幅縮小書(shū)架尋找范圍,進(jìn)而提升效率、降低消耗。”
思考型工具調(diào)用技術(shù),則瞄準(zhǔn)大模型“一思考手就!钡亩贪!按饲按竽P投嘞抻趩屋唵(wèn)答,無(wú)法像人類一樣,在解決復(fù)雜問(wèn)題時(shí)進(jìn)行多輪思考和查閱資料!北P和林說(shuō),“這項(xiàng)新技術(shù)讓模型得到指令后,能先思考再調(diào)用代碼執(zhí)行、數(shù)據(jù)庫(kù)查詢等工具接口,然后根據(jù)結(jié)果繼續(xù)思考、再次調(diào)用,如此交替反復(fù),并保留記錄供后續(xù)推理使用!
“這是DeepSeek首次將思考融入工具使用,改變了以往模型依賴人‘喂’數(shù)據(jù)的發(fā)展范式,實(shí)現(xiàn)AI的自我訓(xùn)練和進(jìn)化!北P和林說(shuō)。
開(kāi)源模型大有可為
過(guò)去一年,大語(yǔ)言模型快速發(fā)展,以Google、OpenAI等為代表的閉源社區(qū)在復(fù)雜任務(wù)中表現(xiàn)得愈發(fā)優(yōu)越,而開(kāi)源社區(qū)受制于架構(gòu)、資源分配及智能體能力等方面的關(guān)鍵缺陷,與閉源社區(qū)性能差距進(jìn)一步擴(kuò)大。
DeepSeek團(tuán)隊(duì)稱,這是他們發(fā)布新模型的根本動(dòng)力來(lái)源。
劉興亮認(rèn)為,新模型縮小了當(dāng)前開(kāi)源模型與閉源模型間的差距,證明了閉源大模型的巔峰并非不可逾越,為我國(guó)乃至全球開(kāi)源大模型的發(fā)展注入強(qiáng)心劑。
盤和林表示,從今年初發(fā)布R1大模型,以深度思考模式和超低成本預(yù)算實(shí)現(xiàn)中國(guó)人工智能發(fā)展彎道超車后,DeepSeek的發(fā)展主線始終聚焦實(shí)用性和泛化能力,讓“趕超閉源”從美好愿景變?yōu)殚]源廠商的現(xiàn)實(shí)壓力。“最重要的是,DeepSeek為全球開(kāi)發(fā)者提供了一個(gè)強(qiáng)大、可控且經(jīng)濟(jì)的模型底座,助力大語(yǔ)言模型融入千行百業(yè)、形成商業(yè)閉環(huán)!彼f(shuō)。
同時(shí),盤和林也提醒,新模型為大語(yǔ)言模型帶來(lái)了新的治理難題!靶杈韫ぞ哒{(diào)用風(fēng)險(xiǎn),以及學(xué)術(shù)造假、自動(dòng)化生成代碼漏洞、產(chǎn)業(yè)不公平競(jìng)爭(zhēng)等挑戰(zhàn),推動(dòng)開(kāi)源模型向‘少說(shuō)話多辦事更安全’躍升!
據(jù)悉,DeepSeek的官方網(wǎng)頁(yè)端、App和API(應(yīng)用程序編程接口)均已更新為正式版DeepSeek-V3.2,但Speciale版本目前僅以臨時(shí)API服務(wù)形式開(kāi)放,供社區(qū)評(píng)測(cè)與研究。
浙公網(wǎng)安備33010602013724