Здесь собраны все материалы по запуску, оптимизации и внутреннему устройству инференса LLM на русском языке.