Napisałem post, który bada wydajność treningu LLM przy różnych konfiguracjach pamięci i sieci.