和弦与音符是音乐的基本组成元素。来源:《国际艺术与技术杂志》(2025)。DOI:10.1504/ijart.2025.150181
抛开伦理与艺术争议,研究能够生成音乐的人工智能系统具有充分价值。《国际艺术与技术杂志》描述的新系统已显著提升低成本计算机生成音乐的质量与连贯性,专用于音乐治疗和心理健康支持领域。
该创新方法融合了两种核心机器学习技术:长短期记忆网络(LSTM)和多尺度注意力机制。此组合使系统能有效克服传统算法作曲的缺陷,避免结构紊乱、消除旋律重复问题,并大幅扩展情感表达范围。
LSTM作为一类循环神经网络,专为长序列信息保留而设计,使其特别适合处理音乐等时间序列数据建模。本研究采用带残差连接的多层LSTM架构,该技术通过允许信息在必要时绕过特定网络层来稳定学习过程。同时,多尺度注意力机制使模型能根据不同时间跨度动态聚焦关键音乐特征。
注意力机制在自然语言处理中应用广泛,其核心功能是帮助AI系统权衡不同输入的重要性。当应用于音乐创作时,该机制能同步考量局部主题、长期和声运动及节奏发展等多维度要素。
新方法的测试结果显示,生成的音乐具备高度连贯性、更优的风格控制能力及丰富的音乐多样性。这些特性此前对生成式模型而言难以平衡,而该突破意味着通过适当提示词,生成式AI可精准创作符合特定治疗需求的定制化音乐。
尽管部分人士哀叹AI音乐在流媒体平台的普及损害了词曲作者与音乐家权益(此观点或有其合理性),但研究团队指出,该系统在青少年音乐辅助治疗场景中具有实用价值。初步结果表明,AI作曲可针对性开发改善睡眠质量、缓解压力的治疗性音乐。
研究团队强调,模型编码情感细微差别的能力使其在临床健康场景中极具潜力。在传统录音音乐难以精确匹配医疗需求,或可能为资金紧张的医疗机构增加音乐许可成本的情况下,该技术解决方案尤为重要。
更多信息: 李平等,《基于LSTM和多尺度注意力的音乐智能创作方法》,《国际艺术与技术杂志》(2025)。DOI:10.1504/ijart.2025.150181
【全文结束】

