科学家设计AI系统从无声钢琴演奏视频中再现演奏声音
2021-02-13 07:44:35爱云资讯阅读量:965
据外媒New Atlas报道,想象一个计算机程序能够直观地识别出在无声的钢琴演奏视频中演奏的是哪首乐曲,或许并不夸张。然而, 一个新的人工智能系统却更进一步,以数字方式逼真地再现了钢琴演奏的声音。
这项技术被称为Audeo,由华盛顿大学 的一个团队设计。研究人员使用钢琴家保罗·巴顿的YouTube视频对系统进行了培训和测试。培训包括约17.2万巴顿演奏巴赫和莫扎特等著名古典作曲家音乐的视频帧。
在分析一段无声视频时,所产生的系统首先会观察哪些键被按下的顺序,确定各个音符及其排列方式。也就是说,它还能感知到每个键被击打的力度和被按住的时间--这让它能计算出每个音符的强度,以及它在随后弹奏的音符下面持续的时间长度。它还考虑到了钢琴独特的声学特性。然后,这些数据被转换为一种可以被现有的数字合成器理解的格式。据报道,当该合成器回放音乐文件时,它听起来非常像原始的钢琴音乐。
在对Audeo的测试中,它的任务是根据巴顿演奏的静音视频重现钢琴音乐,而不是系统所训练的音乐作品。当SoundHound等音乐识别应用分析这些再现时,它们能够以大约86%的准确率识别出乐曲。相比之下,当这些应用分析相同视频中的原始钢琴音频时,其识别准确率攀升至93%。随着技术的进一步发展,这种差距应该会缩小。
“我们希望我们的研究能够实现与音乐互动的新方法,”该研究的高级作者Eli Shlizerman副教授说。“例如,未来的一个应用是,Audeo可以扩展到虚拟钢琴,摄像头只记录一个人的手。此外,通过将摄像头放在真实的钢琴之上,Audeo有可能协助教学生如何演奏的新方法。”
相关文章
- AI赋能 智创未来 2024中国(黄石)工业互联网创新发展大会成功举办
- 高通李俨展望6G技术的标准发展:AI将成为6G终端的重要特性,或将改变终端和通信系统的设计方式
- GET大会 | 猿编程创始人李翊:揭秘AI时代科技少年成长之路
- 声网钟声:分布式端边云结合将成为实时 AI 基础设施的
- AI领航,智造跃升,格创东智与您相约2024中国5G+工业互联网大会
- 火山引擎AI for Science研讨会与Bio-OS大赛收官,“四驱飞轮”助力科研提效
- 苹果计划进军XR智能眼镜市场,微美全息发挥AI拓展能力促AR市场爆发
- 移动AI时代,天线数字化是网络智能化演进的必然选择
- 马化腾再次表态投入AI 腾讯Q3研发投入同比增9%达179亿
- 融入字节豆包AI,“I系搭子” FIIL首款实用型 AI耳机GS Links即将上市
- OpenAI计划于2025年1月推出新型智能体Operator
- 《The Power of Datafication》作者郭为:以AI为特征的数字化时代已经到来
- 李彦宏:智能体是AI应用的最主流形态,即将迎来爆发点
- 英特尔® 酷睿™ Ultra 处理器显著增强边缘 AI 和图形处理性能
- 钉钉上线工单等六大场景AI助理,AI继续深入到业务中
- 荣获国家级备案!深演智能AI技术发展迈入新阶段