计算机毕业设计Python+Django+LSTM情感分析 音乐数据分析 音乐爬虫可视化 大数据
一、选题背景介绍
随着互联网的发展,人们使用的数字、图片、视频、音频、文字等数据,形成一个大而杂的数据池,这些海量数据中获取有价值的信息是大数据分析意义。数据分析发展的过程中,传统的数据分析,是通过统计分析思路以机器学习为辅组工具对量较小的数据进行分析,实现少量抽样数据来对真实世界进行推测,大数据分析更深层次的运用机器学习对各种类型的全量数据进行算法分析,为产品未来发展的预期提供依据。大数据分析从现实生活海量数据中提取有用信息,刨取商业价值,运用的领域宽、深度广,推动社会数字化的发展。
随着人们生活的衣食住行等物质文化与大数据紧密联系,音乐数字化在不断发展的过程中,对于不同年龄阶段的人对音乐的需求,使得音乐平台市场变得多元化,如网易云音乐的摇滚、抒情、电音、说唱、民谣版块的设置等,同时在传统的音乐模块上也融合了电台和音乐商城,满足了用户的多元化的需求。网易云音乐作为2021年音乐市场占比较大的国内音乐平台,其平台数据对第三方的唱片公司有举足轻重的意义,唱片公司主要是销售实体和数字音乐,同时享有歌曲版权,唱片公司的歌曲的发行,以数字音乐为例,首先必须了解网络音乐市场需求,例如受众群体对音乐类型的喜好,不同语种的音乐所占市场比例,数字音乐的售卖情况,听众的情感分析,这些分析数据通过网易云音乐平台的不同歌单的播放量,不同语种如韩语、粤语、日语等的歌单播放量,乐商城模块中的数字专辑的购买量,听众对音乐的评论四个方面来获取,从歌单、语种、数字专辑、用听众评论的维度进行市场研究。获取网易云音乐数据信息,可以确定唱片公司的发行歌曲类型,市场主要倾向于的语种类型,数字专辑的盈利可为与歌手建立合作作参考指标,加之听众情感需求,实现高质量的歌曲发行。
网易云可视化分析系统给唱片公司的歌曲和专辑发行的市场研究提供数据分析依据,具体表现为歌单的喜好程度可确定歌曲发行方向,发行公司根据不同语种音乐播量,听众的情感需求,发行更贴合听众喜好的音乐,参考数字专辑购买量,对数字专辑的主体歌手是否建立合作进行考量。
二、应用现状
1.国外应用现状
如今,国外的很多唱片发行公司都在积极走向数字化,“索尼精选Hi-Res音乐”早在2014年10月就已开启高解析度数字音乐并开启付费下载业务,用音乐的高质量需求来驱动用户对正版音乐的付费下载,对此索尼精选也为广大发烧友和爱乐人提供FLAC格式Hi-Res音频,以及DSD等更高音质的正版专辑和单曲。硬件设备的迭代以及5G网络的迅猛发展,使得用户们的听歌场景日趋丰富,而当代人对于碎片化时间的利用率也越来越高,为满足消费者多样化的品鉴需求,索尼精选也不断完善流媒体内容池,丰富平台音乐类型。索尼精选凭借在Hi-Res音乐领域的专业度和权威性,以及广爱乐人的喜爱,成为了“最佳数字音乐平台”的奖项得主。
索尼精选的成功在于深度掌握了市场需求,高质量地满足了喜爱音乐人群的需求,并结合数据分析将用索尼精选的数字化推向了另一个高度。对此而言中国音乐无疑是索尼音乐可开拓的市场,无论是硬件还是数字音乐的收听,还是这些需求拉动的付费行为,丰富平台的音乐类型和音乐商城的发展,在引进世界各地合作伙伴的好音乐的同时,平台也基于数据挖掘不断推出更符合中国爱乐人审美的音乐内容,不断发展扩大市场范围。
2.国内应用现状
国内有对网易云音乐平台的音乐推荐系统实现,这个推荐系统包括了用户的app端、用户的前台网页端、可视化大屏统计、后台管理四个层次的设计与实现,在这样的推荐平台中使用到pyhton爬虫技术,机器学习深度算法将数据写入数据库进行存储,在用户端使用推荐算法对音乐进行个性化推荐,用户注册使用到短信接口、支付宝沙箱支付、百度AI接口实现用户身份证上传自动识别,管理员系统独立于爬虫端录入数据,这样即使爬虫无法操作时仍然能继续进行数据分析,最后实现一个前端加后端的完整系统。
目前国外内有对音乐数据分析主要是集中于个性化音乐推荐的实现,常使用KNN算法、协同过滤算法等进行个性化推荐,最后实现大屏可视化的展示,与音乐可视化分析系统相比较为全面,而且实现了与大数据的紧密结合,以音乐平台的数据为基础实现的可视化分析系统在唱片公司的决策过程中运用较少。
三、研究目的、意义及方法
1.研究目的
通过对音乐平台歌曲、情感需求、数字专辑的售卖等的信息获取,从不同歌单播放,听众的评论,数字专辑购买三个维度,最后现实对歌单播放量关联分析、数字专辑购买、文字化的情感需求三个方面可视化分析。
(1)实现歌单的播放的关联分析。通过对华语、粤语、欧美等模块播放量统计,以及在这些模块下的不同风格的音乐播放量统计,用Apriori算法实现它们之间的关联分析。
(2)实现基于线性回归数字专辑购买分析。通过数字专辑的购买量获取,对比每日、每周、每年、总榜的购买数据,研究总榜与每日、周、年榜之间的线性关系,得出的线性关系可对后期数据进行预测。
(3)实现听众评论的情感分析。通过流行、摇滚、民谣、电子、说唱等不同风格的评论内容的获取,对文本内容进行标注整理后用朴素贝叶斯进行情感分析,获取客户的情感需求。
2.研究意义
精准把握市场需求,实时化掌握行业动态。随着多样化音乐的发展,听众有了更多的选择,但有的歌曲或歌手只是昙花一现,很快就淹没新潮音乐的大军中,把握歌曲发行市场需求,进行高质量唱片发行,要适应听众的音乐需求,同时不能一味大众化,通过数据分析挖掘出有才能有影响力的唱作人进行合作,实现企业利益最大化。
(1)精准掌握市场需求,合理调整资源。对网易云音乐的音乐模块进行点播量的统计,展示对不同模块类型的喜好,对不同语种音乐的接受程度,从而了解该发行什么类型和语言的歌曲。
(2)文字化情感分析的展现,获取听众的情感需求。通过对听众评论内容的获取进行情感分析,展示听众对音乐的情感倾向,在语种和类型适合市场的情况下,加入情感需求去提高发行歌曲与市场的贴合度。
(3)找到有价值的歌手进行合作,获取企业利益。对于歌曲和专辑的发行,不仅要推出好的作品,是否能创造利益也是需要公司进行考虑的问题,所以对于歌手的影响力也尤为重要,需要对合作对象的自身条件来的确定合定位。符合爱乐人需求的基础上,在歌的词和曲上进行创作,不拘泥于大众化的词曲,要推陈出新实现有内涵深度的歌曲,实现长期化的发展。
(4)优化资源投放。根据听众的喜好来确定歌曲发行方向的侧重,以歌手的数据为参考进行宣传资源配置,同时在线下进行的歌曲和专辑发行活动的投入资源进行分配。
3.研究方法
网易云音乐可视化系统设计与实现共采用了案件分析法、文献调查法、数据研究法、功能分析法四种方法来实现对系统的设计和实现。
(1)案例分析法。通过互联网上的数据可视化分析案例,了解对于可视化分析可进行的方向,通过与网易云可视化系统的设计对比,弥补系统存在的技术缺陷。
(2)文献调查法。通过知网和百度学术,目前存在的系统分析技术进行了解,其次对音乐的数字化发展建立一定认知,最后了解唱片发行的运营模式。
(3)数据研究法。对于本次数据采集的网易云音乐进行数据了解,通过对歌曲播放情况模板设置以及电台模块播放量的研究,对音乐商城中的售卖数据的观察,最后确定了分析的目标数据。
(4)功能分析法。首先考虑了系统的功能,通过数据抓取、整理和储存最后实现数据可视化,系统能为唱片发行公司的市场需求、利益发展、资源分配等方面即将开展的计划提供分析依据。
四、撰写提纲
摘 要
Abstract
第1章 绪 论
1.1 研究背景
1.2 研究目的和意义
1.2.1研究目的
1.2.2研究意义
1.3 应用现状
1.4 研究方法
第2章 理论基础及相关技术
2.1 理论基础
2.1.1大数据分析的理论基础
2.1.2可视化的理论基础
2.2 相关技术
2.2.1 python爬虫
2.2.2 MySQL数据存储
2.2.3 python可视化分析
2.2.4 python系统封装
第3章数据分析需求与数据准备
3.1需求分析
3.2数据采集
3.2.1 数据来源
3.2.2 数据获取
3.3数据整理
3.3.1整理工具
3.3.2 整理过程
3.3.2.1歌单的播放量统计整理
3.3.2.2数字专辑购买量统计整理
3.3.2.3评论内容整理
第4章 数据挖掘
4.1基于Apriori算法的歌单播放关联分析
4.2 基于线性回归数字专辑购买分析
4.3基于朴素贝叶斯算法的情感分析
第5章 网易云音乐数据分析可视化系统的实现
5.1开发环境及运行环境
5.2系统部署
5.3数据采集功能实现
5.4数据整理功能实现
5.5数据挖掘和可视化实现
5.5.1歌单播放量可视化功能实现
5.5.2数字专辑购买情况可视化功能实现
5.5.3评论内容情感分析可视化功能实现
5.6 系统测试
结束语
致 谢


