По данному запросу товаров пока нет. Смотреть все товары
LLM inference требует большого VRAM для загрузки весов модели. Для моделей 70B и выше нужно 48GB+ VRAM. Наши конфигурации с NVIDIA L40S 48GB обеспечивают быстрый inference без квантования для моделей до 70B параметров.
По данному запросу товаров пока нет. Смотреть все товары
Не нашёл нужную конфигурацию?
Соберём под твой бюджет и задачи — напиши нам, ответим за 15 минут