面向Scratch平台的音乐智能处理系统的研究与实现

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:hnazlz
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机技术快速发展,人工智能技术已经在各行各业中应用。在信息科学教育领域,基于块的编程语言受到了越来越多学生和老师的关注。Scratch是一种基于块的可视化在线编程语言,用类似儿童积木来形象地表示代码模块,其低门槛和易于上手的特性使得其受到越来越多学生和老师的欢迎。Scratch工具中的音乐模块使得Scratch作品更加多元化,且具有艺术性。作品中音乐可以很好地表达出作者的情感。但是目前的Scratch平台上,没有提供一个能够识别音乐情感的工具,使用者无法了解自己制作的Scratch音乐的情感;同时,Scratch平台也没有提供音乐库,供用户根据自己的需求检索相关音乐为其作品配乐。因此在Scratch平台中,利用人工智能技术进行音乐智能处理系统的设计与实现,不仅可以让学生创作更加丰富的作品,还可以直观体验和理解人工智能技术。面向Scratch平台研究和实现音乐智能处理系统,需要对音乐情感识别和音乐生成等问题展开研究,构建Scratch音乐情感识别模型和Scratch音乐生成模型。在Scratch音乐情感识别模型中,通过分析Scratch音乐与传统音乐的差异性,构造了 Scratch音乐情感识别数据集,进而从Scratch音乐的音频底层特征和时序特征两个方面学习其与情感概念之间的联系,并引入注意力机制提高识别率。在Scratch音乐生成模型中,通过基于情感、时间结构的生成式对抗网络,构造了能够生成Pianoroll格式音乐的Scratch音乐生成模型,并且在生成器和判别器中使用卷积神经网络提升训练速度。两个算法模型通过多组对比实验和算法有效性实验,验证了模型的有效性和实用性。最后,设计并实现了面向Scratch平台的音乐智能处理系统。通过将Scratch音乐情感识别模型和Scratch音乐生成模型融入系统中,实现了 Scratch音乐情感识别和Scratch音乐检索等相关功能。丰富了Scratch平台中与音乐相关的模块,提高了平台的趣味性,帮助用户更好地创作作品学习编程,让青少年在使用Scratch平台的音乐相关功能时能够对人工智能有一个亲身体验,将会提高青少年学习编程的兴趣。
其他文献
基于图像的自由视点合成,是指通过计算机视觉技术,利用预先拍摄的一组真实世界图片在未拍摄的新视点合成场景视图,从而实现交互式的三维游览效果,因此也被称为基于图像的绘制(Image-based Rendering,IBR)。相比于传统的几何建模方法,IBR方法不需要复杂的手工调整和模拟计算,便可以生成高质量的新视图。IBR方法根据是否依赖几何先验可以分为两类。依赖几何先验的方法一般需要先使用多视图立体
碳纳米管以其独特的结构和电子特性成为后摩尔时代最有潜力代替硅成为场效应晶体管半导体沟道材料的候选者。要获得高性能、低功耗的高质量纳米电子器件,首要条件是制备出高纯度的半导体型单壁碳纳米管密排薄膜。目前已经有研究表明溶液法实现了高纯度半导体型碳纳米管的制备,并且可以形成高均一性的碳纳米管薄膜,但是制备出的碳纳米管薄膜表面残留有大量的有机聚合物,这会增加器件的接触电阻。而随着器件尺寸的不断减小,碳纳米
超快光纤激光器由于其具有的低热效应、高脉冲能量和优秀的时空分辨率等优点吸引了众多科研人员的关注,到目前为止,基于光纤.激光器的超短脉冲技术不仅在材料加工、飞秒时间光谱、纳米级成像等领域具有重要地位,而且还极大地推动了相关学科的创新发展。目前,已提出了基于可饱和吸收体、非线性偏振旋转、八字形腔等多种实现超短脉冲输出的方法,在其中,可饱和吸收体(SA)是被认为产生从皮秒到飞秒范围超短脉冲经济有效的方法
随着无线电技术和网络技术的飞速发展,对通信能力的要求越来越高,通信系统呈现多频带、多模式、自适应的发展趋势,功率放大器作为射频前端核心的器件之一,迫切需要适应这种变化。频率可重构技术在实现多频带、多模式应用中,以其电路设计灵活、多频带工作可靠等优点成为了近年来的研究热点。在此应用背景下,本文设计了两款频率可重构功率放大器,通过引入射频开关改变匹配网络参数,使其匹配到不同频率下的最优阻抗,从而实现功
基于回音壁模式(WGM)的光学微腔平台,我们可以传输并调控光信息。其中,以模式分裂以及线宽展宽进行分析的纳米粒子传感是回音壁模式光学微腔平台的热点研究方向之一。本文以具有回音壁模式的微球腔为模型,研究了回音壁模式的微球腔耦合理论,并对倏逝场中存在纳米粒子的回音壁模式微球腔的模式控制以及奇异点(EPs)相关方面进行研究,取得了以下成果:一、在回音壁模式微腔传感方面,对光学模式的控制是实现基于回音壁模
目前GPGPU编程技术在人工智能、深度学习等领域取得了广泛的应用,以NVIDIA公司推出的CUDA框架为代表的GPGPU编程框架可将GPU强大的并行运算能力应用于非图形任务,而GPU逐渐开放的计算能力在众多领域中的应用也随之带来了相关安全隐患,但业界目前仍主要关注如何挖掘GPU潜在安全问题,对已知问题的防护研究较少。本文提出了一种针对GPU端PTX指令代码死循环结构的检测评估方法,并编程实现了方法
属性基加密方案利用基于双线性配对的密码学以及表示特定访问策略的秘密分享机制对数据进行加密,使数据仅能被拥有相应属性集合对应密钥的用户解密,广泛应用于共享存储的访问控制中。多授权中心的属性基加密方案有多个属性授权中心,增加属性来源并分散机构主密钥,提升访问策略多样性和加密安全性;属性基代理重加密允许用户将数据共享的计算安全外包给第三方,减少本地计算负担并增加访问控制灵活性。多授权中心属性基代理重加密
互联网时代的飞速发展,使人们的社交方式发生了重大变化,出现了基于活动的异构社交网络(H-EB SN,Heterogeneous Event-based Social Network),用户可以通过线上和线下的方式进行活动的交流与举办,由此也带来了信息的快速增长,导致信息过载,即找到感兴趣的活动正在变得越来越困难。个性化推荐是解决这一问题的一种有效方式。但是在现有推荐系统中,大多是以个体推荐的方式,
帕金森病(Parkinson’s disease,PD)的产生主要与黑质中的多巴胺能神经元的变性死亡有关,其发病区域主要在基底神经节(Basal Ganglia,BG)。帕金森震颤是帕金森病的主要症状之一,影响70%的帕金森病患者,主要为静止性震颤。基底神经节中的异常同步和低频振荡活动(3-9 Hz)是帕金森震颤的关键,但是这些异常同步振荡活动的机制和来源尚不清楚。本文主要利用Hodgkin-Hu
信贷业务中贷后的风险监控是长期困扰我国银行信贷业务的工作难题,这其中的原因可能包括银行在信贷等工作中监控体系建设不完善、防控风险设置不完备、风险控制不严格等,当然也存在一些人为风险因素,这些都说明了银行信贷业务中贷后监控风险控制的复杂性和艰难性。本文针对金融行业客户贷后业务管理难题,借助计算机技术,结合成熟的大数据技术,设计并实现贷后监控系统,将信贷业务的数据统一管理归档,统一调阅审核,丰富项目管