Can int8 in pre-training large model ??? #521

zhoumengbo · 2023-10-31T13:27:21Z

Hello guys! I would like to know if you have experimented with int8 precision in the pre-training of your large models. Can int8 replace fp16 and fp32 to achieve faster training speeds? Are there any relevant case studies or experiments?

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Can int8 in pre-training large model ??? #521

Can int8 in pre-training large model ??? #521

zhoumengbo commented Oct 31, 2023

Can int8 in pre-training large model ??? #521

Can int8 in pre-training large model ??? #521

Comments

zhoumengbo commented Oct 31, 2023