codyman4488 Comments - Answer Overflow

codyman4488

•Created by codyman4488 on 3/4/2025 in #⚡｜serverless

how to run a quantized model on server less? I'd like to run the 4/8 bit version of this model:

or do we need to set env vars to use a quantized model like this ?

5 replies

•Created by codyman4488 on 3/4/2025 in #⚡｜serverless

how to run a quantized model on server less? I'd like to run the 4/8 bit version of this model:

5 replies