录音/制作/创作 吉他 扩声技术 视频技术 作品展示 生活 信息 更多... | 音频应用专卖店
AI 制作

要是生成式AI可以加入互动

( 2 )
 
[收藏]

446
#1 25-12-10 14:47

要是生成式AI可以加入互动

现在的AI生成都是写提示词然后一次性生成,就完了。要是可以像GPT那样互动聊天就很好。
比如:

-来一段巴赫式的摇滚。
-嗯,用户希望生成带有巴赫风格的摇滚乐,我需要结合巴赫的特点,如巴洛克时期的曲风,以及象征巴赫那签名式的复调音乐,同时满足摇滚的需求。我可能会要用到失真电吉他与清音电吉他进行对位,考虑到电吉他音色的属性,这可能有点困难。用户可能还想知道这种杂糅的风格是否真能呈现或者称为一种新的风格走向。在生成时要尽可能满足用户的需求,并在关键节点处客观清晰向客户阐明难点,避免说教,以免引起用户不悦。
Baroque·s Earthquake.wav》生成中……


-你自己听听看这是个啥,吉他全部糊成一坨了!重写!
-嗯,用户对我生成的音乐表达了需求清晰明确的不满,希望吉他声部在满足用户指定风格需求的同时保持清晰感,我需要考虑在接下来的创作中减少混响与延迟,并对频段进行一定程度上的避让。是否可以通过改变音色来实现?但用户没有明说,要避免引起歧义。可引导用户进行更具体的描述,必要时甚至允许用户提供参考曲。但考虑到这是一种全新的风格融合形式,可能用户自己也没有参考曲。可以提醒用户自己进行录制动机,助手共同创作。但语气要温和,避免让用户感到自己被judge。
Baroque·s Earthquake v2.wav》生成中……


-听不懂人话就回炉重造!就你这智商也好意思出来混AI作曲?回去再练100年吧!
-靠!用户怒了!TA并不是真的希望我重新修炼100年之后再来提供服务,只是单纯发泄对生成的作品的不满情绪。需要引导用户……(啊我编不下去了)


反正就是,很多文生图的AI,哪怕是个豆包,都有类似的功能。可以通过互动的方式对已生成的内容进行具体的调整。希望未来AI作曲也能拥有同样的功能。我不是否定现在的形式,SUNO当然也很优秀,但确实可以做到更亲民一些,让创作变成一场好玩的游戏,而非严肃的工作。
观众反应

2039
#2 25-12-10 22:37
这种运算是非常庞大的数据,这样玩算力要多少才够

140
#3 25-12-11 00:19
搞音频AI的开发者远没有搞图像AI的多,图像以及视频出现了超多厉害的开源模型,开源模型又推动闭源模型发展。月月有更新,年年有革命。
音频AI开源项目的都和屎一样,闭源基本就靠suno一家来支撑,音频产业太小了,大公司都看不上
您需要登录后才可以回帖 登录 | 注册

本版积分规则

搜索