#компрессия07.09.2025
REFRAG от Meta: 16× больший контекст и до 31× быстрее декодирование RAG
'REFRAG сжимает извлеченные фрагменты в векторы, позволяя обрабатывать в 16 раз больший контекст и сокращая время до первого токена до 30.85× без потери точности.'