Zapraszamy na naszego bloga - dostępny jest nowy artykuł o technikach optymalizacji dużych modeli językowych.
Opisujemy kwantyzację, pruning, destylację, PEFT oraztechniki optymalizacji inferencji, takie jak batching zapytań, KV cache i dekodowanie spekulatywne.
azurro.pl/techniki-opt...
#AI #PEFT