28日,DeepSeek官方宣布DeepSeek R1模型已完成小版本試升級,歡迎前往官方網頁、APP、小程序測試(打開深度思考),API 接口和使用方式保持不變。
據了解,根據DeepSeek內部優化方向和自身的感知,這次升級主要集中在以下幾個方面:
* 響應質量優化:復雜推理、多步驟計算更準確;長文理解與生成更連貫、邏輯更清晰;數學、編程等專業性輸出更可靠。
* 響應速度小幅提升:在網頁端、App、API 接口中響應更敏捷;尤其在處理超長文本輸入時,延遲有所降低(約提升 10%~20%)。
* 對話穩定性增強:上下文記憶更穩定,尤其在超長對話中(支持最多128K上下文);減少偶爾“遺忘設定”或“跑偏”的情況。
* API 和接口兼容性保持穩定:如公告所說:API 調用方式、參數、返回結構完全不變;用戶無需調整現有集成,即可無縫使用新版本。
R2沒有來,但R1升級了。這是自3月底以來,DeepSeek的一次最新動作。今年3月,DeepSeek曾對V3模型進行小版本升級,同樣是通過官方交流群率先宣布,隨后公布了具體更新內容。此前,也有許多關于R2大模型的傳聞出現,比如“參數規模被曝達到驚人的1.2萬億,相比前代R1的6710億參數幾乎翻倍等”。但截至目前,并未獲得官方證實。
這家總部位于杭州的初創公司今年1月發布了DeepSeek-R1人工智能模型,震驚了全球科技界。R1模型在多項標準化指標上的表現均優于西方競爭對手,而其成本據稱僅為數百萬美元。此舉引發了全球科技股的暴跌,投資者開始質疑,領先的公司是否仍需要投入巨資來構建人工智能服務。
據用戶反饋,DeepSeek升級后的模型,思維鏈 (CoT) 的行為似乎發生了顯著變化。
也有用戶總結了更新后的幾個亮點,其中包括:現在像Google模型一樣進行深度推理;改進寫作任務——更自然、格式更好;獨特的推理風格——不僅快速,而且深思熟慮;長時間思考——每個任務最多30-60分鐘。