欢迎光临散文网 会员登陆 & 注册

鸟类声音识别比赛数据集

2022-02-24 00:06 作者:跨象乘云  | 我要投稿

作为 世界灭绝之都,夏威夷已经失去了 68% 的鸟类物种,其后果可能会损害整个食物链。研究人员使用人口监测来了解本地鸟类如何对环境和保护工作的变化做出反应。但是岛上剩下的许多鸟类都被隔离在难以进入的高海拔栖息地。由于物理监测困难,科学家们转向了录音。这种被称为生物声学监测的方法可以为研究濒危鸟类种群提供一种被动、低劳动力和具有成本效益的策略。

当前处理大型生物声学数据集的方法涉及对每个记录进行手动注释。这需要专门的培训和大量的时间。值得庆幸的是,机器学习的最新进展使得通过充足的训练数据自动识别常见物种的鸟鸣成为可能。然而,为稀有和濒危物种(例如:夏威夷的物种)开发此类工具仍然具有挑战性。

康奈尔大学鸟类学实验室的 K. Lisa Yang 保护生物声学中心 (KLY-CCB) 开发并应用跨多个生态尺度的创新保护技术,以激发和告知野生动物和栖息地的保护。 KLY-CCB 通过收集和解释自然界的声音来做到这一点,他们与 Google Bioacoustics Group、LifeCLEF、夏威夷大学希洛分校夏威夷生态系统听力观测站 (LOHE) 生物声学实验室和 Xeno-Canto 合作这场比赛。

在本次比赛中,参赛者将使用机器学习技能通过声音识别鸟类 —— 通过开发一个模型,可以处理连续的音频数据,然后通过声学识别物种。最好的条目将能够用有限的训练数据训练可靠的分类器。从而,帮助推进生物声学科学并支持正在进行的研究以保护濒临灭绝的夏威夷鸟类(包括封面视频中的 北极燕鸥)。研究人员和保护从业者将更容易准确地调查鸟类繁殖趋势。他们将能够定期、更有效地评估威胁并调整他们的保护行动。数据描述文件包括 ——

train_metadata.csv - 为训练数据提供了广泛的元数据,最直接相关的字段包括 ——

  • primary_label:鸟类代码

  • secondary_labels:由记录员注释的背景物种。空列表并不意味着听不到背景鸟声

  • author:提供录音的 eBird 用户

  • filename:相关的音频文件

  • rating:浮动值介于 0.0 和 5.0 之间,作为 Xeno-canto 质量等级和背景物种数量的指标,其中 5.0 最高,1.0 最低。 0.0 表示此录音还没有用户评分

train_audio - 训练数据,大部分由 xenocanto.org 用户上传的个别鸟叫的简短录音组成。这些文件已被下采样到 32 kHz,以匹配测试集音频并转换为 ogg 格式

test_soundscapes - 测试集文件夹

test.csv - 测试集的元数据

sample_submission.csv - 一个有效的提交样本

eBird_Taxonomy_v2021.csv - 不同物种之间关系的数据

数据集下载链接:  https://www.kaggle.com/c/birdclef-2022

欢迎微信搜索【跨象乘云AI补习社】或扫描下方小程序码了解更多人工智能实验资源。跨象乘云™ 原创实验演示视频内全部代码、数据集仅授权予个人用户学习与实验使用。禁止用于二次销售、分发传播、课堂教学及培训用途。校企用户采购请通过【跨象乘云】公众号(kxcy_ai)菜单【了解我们】->【商务合作】联系。

跨象乘云AI补习社


鸟类声音识别比赛数据集的评论 (共 条)

分享到微博请遵守国家法律