DeepSeek研究員在線爆料:過年都沒歇 還有大招!
大年初四Daya Guo發(fā)了一條推文,透露了春節(jié)期間讓他最興奮的事情,親眼見證了R1-Zero模型性能曲線的 “持續(xù)增長”,并且直言感受到了 強化學習(RL)的強大力量。
Daya Guo回復了網(wǎng)友有關(guān)DeepSeek R1的一些問題,以及接下來的公司的計劃,只能說DeepSeek的R1僅僅只是開始,內(nèi)部研究還在快速推進,DeepSeek的研究員過年都沒歇,一直在爆肝推進研究,接下來DeepSeek還有大招。
網(wǎng)友提問:“如果不是秘密的話:這次RL訓練跑了多久?”對此,Daya Guo表示,660B參數(shù)的R1-Zero和R1是在V3發(fā)布之后才開始跑的,訓練大約花了2-3周。
此外,他還表示在嘗試將R1應(yīng)用于形式化證明環(huán)境,希望盡快向社區(qū)發(fā)布更好的模型。聽Daya Guo的意思,他們在這方面已經(jīng)有進展,未來可能會有更重磅的模型發(fā)布!期待值拉滿!
-
DeepSeek致謝騰訊技術(shù)團隊:這是一次“巨大的加速”代碼貢獻!
DeepSeek致謝騰訊技術(shù)團隊,這是一次“巨大的加速”代碼貢獻。據(jù)新浪報道,騰訊技術(shù)團隊針對DeepSeek開源的DeepEP通信框架進行深度優(yōu)化,使其在多種網(wǎng)絡(luò)環(huán)境下均實現(xiàn)顯著性能提升。經(jīng)測試,優(yōu)
-
深度deepin 23.1正式發(fā)布!AI默認引擎切換至DeepSeek
今天,深度操作系統(tǒng)宣布,deepin 23.1版本已正式發(fā)布。此版本聚焦于解決基礎(chǔ)組件更新后的安裝效率問題,大幅提升新用戶安裝體驗,同時集成多項功能優(yōu)化與問題修復,進一步優(yōu)化系統(tǒng)使用。本次版本的重點改
-
劉慈欣談DeepSeek:完全有可能替代科幻小說作家
日前,2025中國科幻大會在北京舉辦,主題為“科學夢想 創(chuàng)造未來”。在大會論壇上,科幻作家劉慈欣談到了DeepSeek對科幻文學的驅(qū)動和發(fā)展。據(jù)央視財經(jīng)報道,對于DeepSeek未來是否有可能替代科幻
關(guān)注公眾號:拾黑(shiheibook)了解更多
友情鏈接:
關(guān)注數(shù)據(jù)與安全,洞悉企業(yè)級服務(wù)市場:https://www.ijiandao.com/
安全、綠色軟件下載就上極速下載站:https://www.yaorank.com/
- 華碩Xbox Ally掌機正式亮相:但缺少一項重大升級!
- 反擊AI爬蟲?GitHub出狠招!中文訪問或遭限制
- 字節(jié)CEO全員會反思DeepSeek影響:跟進速度不夠 今年要追求智能上限
- 84%的PC用戶不愿意為AI PC花更多錢:華而不實
- 使命召喚:黑色行動6金庫版預告:售價660元 內(nèi)容多多
- 瀏覽器就能跑虛幻引擎5!還有更多驚喜
- 韓元匯率對人民幣2023年8月20日
- 母親節(jié)2023年是幾月幾日?
- 今日油價92號汽油價格2023年6月15日
- 保時捷718上新款 157.8萬元起!真心無法抗拒
- 張大大直播間走紅:內(nèi)娛渴活人久矣
- 今年最強黑馬游戲 ?《燕云十六聲》首測全是好評

隨時掌握互聯(lián)網(wǎng)精彩