比賽名稱:BirdCLEF 2023
識別音景中的鳥叫聲
比賽鏈接:https://www.kaggle.com/competitions/birdclef-2023
比賽類型:語音識別
比賽背景
鳥類是生物多樣性變化的極好指標,因為(wei) 它們(men) 具有高度流動性並且具有多樣化的棲息地要求。因此物種組合和鳥類數量的變化可以表明恢複項目的成功或失敗。然而經常對大麵積進行傳(chuan) 統的基於(yu) 觀察者的鳥類生物多樣性調查是昂貴的,而且在後勤方麵具有挑戰性。
相比之下,被動聲學監測 (PAM) 與(yu) 基於(yu) 機器學習(xi) 的新分析工具相結合,使保護主義(yi) 者能夠以更高的時間分辨率對更大的空間尺度進行采樣,並深入探索恢複幹預與(yu) 生物多樣性之間的關(guan) 係。
比賽任務
對於(yu) 本次比賽,您將使用您的機器學習(xi) 技能通過聲音識別東(dong) 非鳥類。具體(ti) 來說,您將開發計算解決(jue) 方案來處理連續的音頻數據並通過它們(men) 的叫聲識別物種。
評價指標
本次比賽的評估指標是 padded cmAP,它是 scikit-learn 實現的宏觀平均平均精度分數的衍生物。
對於(yu) 每個(ge) row_id,您應該預測給定鳥類存在的概率。每種鳥類都有一列,因此您需要每行提供 264 個(ge) 預測。
數據描述
-
train_audio/訓練數據,由 xenocanto.org 用戶上傳(chuan) 的個(ge) 別鳥類叫聲的簡短錄音組成。
-
test_soundscapes/當您提交筆記本時test_soundscapes 目錄將填充大約 200 條用於(yu) 評分的錄音。它們(men) 時長 10 分鍾,采用 ogg 音頻格式。
-
train_metadata.csv訓練數據的元數據
-
sample_submission.csv提交樣例
比賽賽程
- 2023年5月17日:組隊截止日期。
- 2023年5月24日:最終提交截止日期。
賽題獎金
- 第一名:15,000 美元
- 第二名:10,000 美元
- 第三名:8,000 美元
- 第四名:7,000 美元
- 第五名:5,000 美元
解題思路
賽題是一個(ge) 典型的語音識別的多標簽多分類任務,在Kaggle上也可以找到往年題目。
常見的解題思路是提取音頻的MFCC特征 + CNN或VIT進行分類,上分點主要是網絡結構和數據增強方法。需要注意提交要求是通過Notebook提交,且必須要在120分鍾中完成預測。
評論已經被關(guan) 閉。