钢琴转录 GUI - 音频文件转MIDI

[新闻] 钢琴转录 GUI - 音频文件转MIDI

( 10 )

#1 25-9-12 20:09 …

钢琴转录 GUI - 音频文件转MIDI

martjay

6002

今天练个新项目，比以前用的pianotrans功能多，可调参数，支持拖放文件到路径输入框。
鼠标悬浮参数输入框，可以看到参数讲解。
基于 ByteDance 开源训练项目与 piano_transcription_inference 推理库的中文 GUI。

参数说明：
- 设备：auto/cuda/cpu（auto 自动判断 CUDA 可用性）
- 采样率：越高细节越多但更慢（建议 16000～44100）
- 起音/离音/帧阈值：控制击键判定、结束判定与连音稳定性（一般≈0.5）
- 力度比例：整体放大/缩小音符力度（1 为原始）
- 踏板：是否识别延音踏板按下/抬起
- 批大小、分段秒数：控制分段与并行，影响速度与内存占用

下载

下载

通过网盘分享的文件：PianoTranscriptionGUI-GPU-fixed2.7z等2个文件
链接: https://pan.baidu.com/s/1xfMV0x0KdL8JUCFbKOCPMg?pwd=6666 提取码: 6666

GPU版因为打包了GPU torch环境，所以比CPU大很多，但是GPU推理比CPU快很多，可能只有N卡用户能用GPU版吧，我也不懂。

本帖最后由 martjay 于 25-9-13 06:38 编辑

本帖子中包含更多资源

您需要登录才可以下载或查看，没有帐号？注册

观众反应

buryer

乐海浮沉

鲜桃仁

回复此帖报告

martjay

6002

#2 25-9-12 21:18 …

可选固定采样率（常用且安全）：
16000（推荐，模型默认/常用）
22050
32000
44100
48000最好不要改，我也没玩懂。
本帖最后由 martjay 于 25-9-12 05:46 编辑

回复此帖报告

funkyman

126

#3 25-9-13 10:31 …

经过测试，总是失败，不知其原因。各种格式的钢琴音频都试过了，gpu和cpu的版本也都试过了。

报告为：

[10:41:32] 参数: {'device': 'auto', 'sample_rate': 16000, 'batch_size': 8, 'segment_seconds': 10.0, 'onset_threshold': 0.5, 'offset_threshold': 0.5, 'frame_threshold': 0.5, 'velocity_scale': 1.0, 'enable_pedal': True}
[10:41:32] Checkpoint path: E:\setup\PianoTranscriptionGUI-CPU\PianoTranscriptionGUI\model\note_F1=0.9677_pedal_F1=0.9186.pth
[10:41:32]
[10:41:32] Using cpu for inference.
[10:41:32]
[10:41:34] Using CPU.
[10:41:34]
[10:41:34] 转录失败：
Traceback (most recent call last):
  File "app.py", line 465, in _run_transcription
  File "piano_transcription_inference\utilities.py", line 508, in load_audio
  File "audioread\__init__.py", line 132, in audio_open
audioread.exceptions.NoBackendError

pianotrans倒是一直用着没有什么问题。

您看看怎么修改脚本。
谢谢。

回复此帖报告

martjay

6002

#4 25-9-13 19:43 …

funkyman 发表于 25-9-12 18:31
经过测试，总是失败，不知其原因。各种格式的钢琴音频都试过了，gpu和cpu的版本也都试过了。

报告为：

你试试这个，应该是缺少什么依赖打包进去了，有点复杂需要调试，先弄CPU版本看看好了再弄GPU版本。

通过网盘分享的文件：PianoTranscriptionGUI-CPU-fixed1.7z
链接: https://pan.baidu.com/s/19M_5zhYQhTzqMpI2LDchZg?pwd=6666 提取码: 6666

回复此帖报告

funkyman

126

#5 25-9-13 20:11 …

依旧失败。报告如下：

[20:21:18] 参数: {'device': 'auto', 'sample_rate': 16000, 'batch_size': 8, 'segment_seconds': 10.0, 'onset_threshold': 0.5, 'offset_threshold': 0.5, 'frame_threshold': 0.5, 'velocity_scale': 1.0, 'enable_pedal': True}
[20:21:58] Checkpoint path: E:\setup\PianoTranscriptionGUI-CPU-fixed1\PianoTranscriptionGUI\model\note_F1=0.9677_pedal_F1=0.9186.pth
[20:21:58]
[20:21:58] Using cpu for inference.
[20:21:58]
[20:22:00] Using CPU.
[20:22:00]
[20:22:00] 转录失败：
Traceback (most recent call last):
  File "app.py", line 467, in _run_transcription
  File "piano_transcription_inference\utilities.py", line 508, in load_audio
  File "audioread\__init__.py", line 132, in audio_open
audioread.exceptions.NoBackendError

你可能得用另一台没有配置依赖库的电脑或者虚拟机来测试才行。

回复此帖报告

martjay

6002

#6 25-9-13 20:48 …

funkyman 发表于 25-9-13 04:11
依旧失败。报告如下：

[20:21:18] 参数: {'device': 'auto', 'sample_rate': 16000, 'batch_size': 8, ' ...

通过网盘分享的文件：PianoTranscriptionGUI-CPU-fixed2.7z
链接: https://pan.baidu.com/s/1LwUj8hqHsLPfXuCCZfczMA?pwd=6666 提取码: 6666

我本地测试了没报错，这个应该可以了

回复此帖报告

funkyman

126

#7 25-9-13 21:40 …

martjay 发表于 25-9-13 20:48
通过网盘分享的文件：PianoTranscriptionGUI-CPU-fixed2.7z
链接: https://pan.baidu.com/s/1LwUj8hqHsL ...

目测没问题了

回复此帖报告

martjay

6002

#8 25-9-13 22:38 …

funkyman 发表于 25-9-13 05:40
目测没问题了

https://pan.baidu.com/s/1xfMV0x0KdL8JUCFbKOCPMg?pwd=6666

回复此帖报告

jayyy

479

#9 25-9-14 09:18 …

mac可以用吗

回复此帖报告

martjay

6002

#10 25-9-14 10:55 …

jayyy 发表于 25-9-13 17:18
mac可以用吗

mac不是也能打开exe吗？你自己想办法吧

回复此帖报告

tflsse

343

#11 25-9-14 23:28 …

martjay 发表于 25-9-13 20:48
通过网盘分享的文件：PianoTranscriptionGUI-CPU-fixed2.7z
链接: https://pan.baidu.com/s/1LwUj8hqHsL ...

下来试过了，好用。

回复此帖报告

返回列表

AI 制作

[新闻] 钢琴转录 GUI - 音频文件转MIDI

钢琴转录 GUI - 音频文件转MIDI

本帖子中包含更多资源