Finetuning with Distributed Training #34892

curious-ai-developer · 2024-11-23T10:18:39Z

Feature request

I have two PCs each with 4090 GPU. I want to finetune Paligemma by google with these two GPUs. It is a multi node distributed training. Can you guide me how is it? Which one is supported Model parallelization or Data parallelization? How is it?

Motivation

Enabling Distributed Training

Your contribution

I wrote some code using Jax but it doesn't do the job, it stops without error. I can share code.

curious-ai-developer added the Feature request Request for a new feature label Nov 23, 2024

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Finetuning with Distributed Training #34892

Finetuning with Distributed Training #34892

curious-ai-developer commented Nov 23, 2024

Finetuning with Distributed Training #34892

Finetuning with Distributed Training #34892

Comments

curious-ai-developer commented Nov 23, 2024

Feature request

Motivation

Your contribution