ellacharlaix : You can now accelerate inference by applying quant • TwiCopy

Ella Charlaix

@ellacharlaix

+ Follow

ML Eng @huggingface

calendar_today21-07-2015 10:20:40

14 Tweets

629 Followers

225 Following

Ella Charlaix

@ellacharlaix

2 years ago

You can now accelerate inference by applying quantization to models from the Hugging Face Hub 🔥

➡️ With 🤗 Optimum, you can easily apply static and dynamic quantization on your model before exporting it to the ONNX format 🤯

Start here 👉 huggingface.co/docs/optimum/m…

account_circle