Tag Index

 LLM (1) MoE (1) RL (2) TP (1) datacollator (1) huggingface (11) introduction (1) scRNA (1)

 LLM (1)

scRNA_LLM

 MoE (1)

MixtralSparseMoeBlock

 RL (2)

PPO
Train Reward Model

 TP (1)

TensorParallel

 datacollator (1)

Huggingface DataCollator

 huggingface (11)

attention
compute_metrics
scRNA_LLM
attention_mask
tie_weights
self.loss_function
PPO
Train Reward Model
TensorParallel
MixtralSparseMoeBlock
Huggingface DataCollator

 introduction (1)

About Me

 scRNA (1)

scRNA_LLM