关于GPT-SoVITS中v3和v4版本的不支持ref_free问题 #2330

zazachao · 2025-04-27T06:56:22Z

1、为什么v3和v4版本不支持ref_free？GPT预测的是all_phoneme对应的语义token，然后通过idx进行截断获取target_text对应的语义token，那是不是可以进行ref_free修改呢，不传入prompt_text，以及设置prompt为空，也不进行通过idx截断，GPT预测返回的就全是target_text对应的语义token。这样做也可以实现ref_free。
2、v3版本和v4版本不支持ref_free这样做的考虑是什么？如果在训练数据中，长音频数据比较少，训练出来的GPT在推理的时候是不是在ref_free的情况下更稳定呢。

XXXXRT666 · 2025-04-27T07:20:13Z

CFM

zazachao · 2025-04-27T08:38:28Z

刚刚看了一下，确实如果使用CFM进行mel生成的话，需要prompt_text。

RVC-Boss · 2025-04-28T06:39:59Z

因为发v3v4的主要原因是cfm的参考音频部分能引导后续生成的音频的音色大幅接近参考音色
如果不用ref，那v3v4发布就没有意义了，应该去用v1v2

RVC-Boss closed this as completed Apr 28, 2025

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

关于GPT-SoVITS中v3和v4版本的不支持ref_free问题 #2330

关于GPT-SoVITS中v3和v4版本的不支持ref_free问题 #2330

zazachao commented Apr 27, 2025

XXXXRT666 commented Apr 27, 2025

zazachao commented Apr 27, 2025

RVC-Boss commented Apr 28, 2025

关于GPT-SoVITS中v3和v4版本的不支持ref_free问题 #2330

关于GPT-SoVITS中v3和v4版本的不支持ref_free问题 #2330

Comments

zazachao commented Apr 27, 2025

XXXXRT666 commented Apr 27, 2025

zazachao commented Apr 27, 2025

RVC-Boss commented Apr 28, 2025