Репост из: Futuris
Эмм, тут кто-то зафайнтюнил Qwen 2.5 Math 7B модельку так что она теперь рвёт по математическим и логическим тестам gpt4o🤯 и называется Eurus-2-7B-PRIME. Использовали новый подход, который улучшает обучение языковых моделей, оценивая не только конечный результат, но и каждый шаг процесса.. в общем, не вдаваясь в детали можно потестить самому ✨
https://github.com/PRIME-RL/PRIME
https://github.com/PRIME-RL/PRIME