录音/制作/创作 吉他 扩声技术 视频技术 作品展示 生活 信息 更多... | 音频应用专卖店
AI 制作

[新闻] 钢琴转录 GUI - 音频文件转MIDI

( 10 )
 
[收藏]
#1 25-9-12 20:09

钢琴转录 GUI - 音频文件转MIDI


6002


今天练个新项目,比以前用的pianotrans功能多,可调参数,支持拖放文件到路径输入框。
鼠标悬浮参数输入框,可以看到参数讲解。
基于 ByteDance 开源训练项目与 piano_transcription_inference 推理库的中文 GUI。


参数说明:
- 设备:auto/cuda/cpu(auto 自动判断 CUDA 可用性)
- 采样率:越高细节越多但更慢(建议 16000~44100)
- 起音/离音/帧阈值:控制击键判定、结束判定与连音稳定性(一般≈0.5)
- 力度比例:整体放大/缩小音符力度(1 为原始)
- 踏板:是否识别延音踏板按下/抬起
- 批大小、分段秒数:控制分段与并行,影响速度与内存占用

下载下载

通过网盘分享的文件:PianoTranscriptionGUI-GPU-fixed2.7z等2个文件
链接: https://pan.baidu.com/s/1xfMV0x0KdL8JUCFbKOCPMg?pwd=6666 提取码: 6666


GPU版因为打包了GPU torch环境,所以比CPU大很多,但是GPU推理比CPU快很多,可能只有N卡用户能用GPU版吧,我也不懂。





本帖最后由 martjay 于 25-9-13 06:38 编辑

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x

6002
#2 25-9-12 21:18
可选固定采样率(常用且安全):
16000(推荐,模型默认/常用)
22050
32000
44100
48000最好不要改,我也没玩懂。
本帖最后由 martjay 于 25-9-12 05:46 编辑

126
#3 25-9-13 10:31
经过测试,总是失败,不知其原因。各种格式的钢琴音频都试过了,gpu和cpu的版本也都试过了。

报告为:


[10:41:32] 参数: {'device': 'auto', 'sample_rate': 16000, 'batch_size': 8, 'segment_seconds': 10.0, 'onset_threshold': 0.5, 'offset_threshold': 0.5, 'frame_threshold': 0.5, 'velocity_scale': 1.0, 'enable_pedal': True}
[10:41:32] Checkpoint path: E:\setup\PianoTranscriptionGUI-CPU\PianoTranscriptionGUI\model\note_F1=0.9677_pedal_F1=0.9186.pth
[10:41:32]
[10:41:32] Using cpu for inference.
[10:41:32]
[10:41:34] Using CPU.
[10:41:34]
[10:41:34] 转录失败:
Traceback (most recent call last):
  File "app.py", line 465, in _run_transcription
  File "piano_transcription_inference\utilities.py", line 508, in load_audio
  File "audioread\__init__.py", line 132, in audio_open
audioread.exceptions.NoBackendError


pianotrans倒是一直用着没有什么问题。

您看看怎么修改脚本。
谢谢。

6002
#4 25-9-13 19:43
funkyman 发表于 25-9-12 18:31
经过测试,总是失败,不知其原因。各种格式的钢琴音频都试过了,gpu和cpu的版本也都试过了。

报告为:

你试试这个,应该是缺少什么依赖打包进去了,有点复杂需要调试,先弄CPU版本看看好了再弄GPU版本。

通过网盘分享的文件:PianoTranscriptionGUI-CPU-fixed1.7z
链接: https://pan.baidu.com/s/19M_5zhYQhTzqMpI2LDchZg?pwd=6666 提取码: 6666

126
#5 25-9-13 20:11
依旧失败。报告如下:

[20:21:18] 参数: {'device': 'auto', 'sample_rate': 16000, 'batch_size': 8, 'segment_seconds': 10.0, 'onset_threshold': 0.5, 'offset_threshold': 0.5, 'frame_threshold': 0.5, 'velocity_scale': 1.0, 'enable_pedal': True}
[20:21:58] Checkpoint path: E:\setup\PianoTranscriptionGUI-CPU-fixed1\PianoTranscriptionGUI\model\note_F1=0.9677_pedal_F1=0.9186.pth
[20:21:58]
[20:21:58] Using cpu for inference.
[20:21:58]
[20:22:00] Using CPU.
[20:22:00]
[20:22:00] 转录失败:
Traceback (most recent call last):
  File "app.py", line 467, in _run_transcription
  File "piano_transcription_inference\utilities.py", line 508, in load_audio
  File "audioread\__init__.py", line 132, in audio_open
audioread.exceptions.NoBackendError


你可能得用另一台没有配置依赖库的电脑或者虚拟机来测试才行。

6002
#6 25-9-13 20:48
funkyman 发表于 25-9-13 04:11
依旧失败。报告如下:

[20:21:18] 参数: {'device': 'auto', 'sample_rate': 16000, 'batch_size': 8, ' ...

通过网盘分享的文件:PianoTranscriptionGUI-CPU-fixed2.7z
链接: https://pan.baidu.com/s/1LwUj8hqHsLPfXuCCZfczMA?pwd=6666 提取码: 6666

我本地测试了没报错,这个应该可以了

126
#7 25-9-13 21:40
martjay 发表于 25-9-13 20:48
通过网盘分享的文件:PianoTranscriptionGUI-CPU-fixed2.7z
链接: https://pan.baidu.com/s/1LwUj8hqHsL ...

目测没问题了

6002
#8 25-9-13 22:38

479
#9 25-9-14 09:18
mac可以用吗

6002
#10 25-9-14 10:55

mac不是也能打开exe吗?你自己想办法吧

343
#11 25-9-14 23:28
martjay 发表于 25-9-13 20:48
通过网盘分享的文件:PianoTranscriptionGUI-CPU-fixed2.7z
链接: https://pan.baidu.com/s/1LwUj8hqHsL ...

下来试过了,好用。
您需要登录后才可以回帖 登录 | 注册

本版积分规则

搜索