Новости

14.10.2025

Думай прежде, чем предсказывать: RLP от NVIDIA внедряет усиленное обучение в стадию предтренировки

‘NVIDIA RLP вознаграждает «думание» перед предсказанием, давая плотный позиционный сигнал информационного прироста и улучшая результаты в задачах рассуждения при меньшем количестве данных.’

14.10.2025

DRBench: реалистичный бенчмарк ServiceNow для корпоративных deep-research агентов

‘ServiceNow Research представила DRBench — контейнеризированную среду для проверки deep-research агентов на реалистичных корпоративных сценариях, где требуется объединять данные из веба и приватных хранилищ и корректно цитировать источники.’