目前大多数音乐类AI都是基于互联网上的现成歌曲训练而来的,但都有经过人工筛选,训练歌曲音质质量决定训练前音频的质量,歌曲内容的质量取决于训练时人工贴标签的质量。
如果是拿分轨训练,整个模型是要重新构造,每个音乐的轨道数不一样,这也会导致训练模型的架构要做一个特别灵活的分差化处理。难度和算力是程指数增加的。基于目前的计算机算力,短时间内不会有。
回到音质上,目前所有的音频AI训练得出结果,最好的也就是原始音频质量的80%左右。如果算法没有改进,及对应的智能补偿,算出来的质感要跟真实录制的一样,是不大现实的。