@@ -223,11 +223,12 @@ def gen_config_file(work_dir: str,
223
223
224
224
args = parser .parse_args ()
225
225
226
- gen_config_file (args .work_dir , args .ctx_tp_size , args .ctx_pp_size , args .ctx_batch_size ,
227
- args .ctx_max_num_tokens , args .ctx_max_seq_len ,
228
- args .ctx_free_gpu_memory_fraction ,
229
- args .ctx_enable_attention_dp , args .gen_tp_size , args .gen_pp_size ,
230
- args .gen_batch_size , args .gen_max_num_tokens ,
231
- args .gen_max_seq_len , args .gen_enable_attention_dp ,
232
- args .gen_gpu_memory_fraction , args .eplb_num_slots ,
233
- args .mtp_size , args .cache_transceiver_max_num_tokens )
226
+ gen_config_file (args .work_dir , args .ctx_tp_size , args .ctx_pp_size ,
227
+ args .ctx_batch_size , args .ctx_max_num_tokens ,
228
+ args .ctx_max_seq_len , args .ctx_free_gpu_memory_fraction ,
229
+ args .ctx_enable_attention_dp , args .gen_tp_size ,
230
+ args .gen_pp_size , args .gen_batch_size ,
231
+ args .gen_max_num_tokens , args .gen_max_seq_len ,
232
+ args .gen_enable_attention_dp , args .gen_gpu_memory_fraction ,
233
+ args .eplb_num_slots , args .mtp_size ,
234
+ args .cache_transceiver_max_num_tokens )
0 commit comments