Ce modèle axé sur la logique 14B est conçu pour résoudre des problèmes de mathématiques, de sciences et de codage avec des solutions claires et étape par étape. Entraîné avec un ajustement fin supervisé et un apprentissage par renforcement sur des données de raisonnement spécialisées, il offre une précision plus élevée et des chaînes de pensée transparentes. Avec une fenêtre contextuelle de ~32K jetons, il peut analyser des documents techniques et des instructions complexes, ce qui le rend idéal pour les questions-réponses STEM, l'extraction d'algorithmes et l'assistance de type tutoriel. Les instructions demandant de "penser étape par étape" améliorent la fiabilité. Notez que des chaînes de solutions plus longues peuvent augmenter la latence, et les performances sont meilleures en anglais. Utilisez la vérification pour les sorties de code et de logique pour garantir la correction dans les flux de production.
