Modellere Dön

DeepSeek: DeepSeek V3.2 Exp

LLMs
Bilgi Yardımı
İçerik Oluşturma

Bu deneysel yapay zeka, kaliteyi yüksek tutarken hesaplama ve maliyeti azaltan ince taneli seyrek dikkat yöntemi (DSA) ile ultra uzun girişlere odaklanmaktadır. Büyük belgeler, büyük kod tabanları ve tek bir çağrıda çok adımlı iş akışları için destek sunan bu, yaklaşık ~128K belirteç ile çalışır. "Düşünme" veya hızlı yanıt modlarını tetikleyebilir ve bu sayede mantık yürütme, kod oluşturma, araç çağrıları ve ajan görevleri için esnek hale getirilebilir. DSA, belirteçten belirteceğe fazlalığı azaltırken, uzun bağlamlar hala dikkatli bellek ve KV-önbellek planlaması gerektirir. MIT lisansı altında açık ağırlıklar ve kod, ekiplerin araştırma veya maliyet duyarlı üretim sistemleri için yerelleştirmesine ve ince ayar yapmasına olanak tanır.

DeepSeek: DeepSeek V3.2 Exp