私たちのバイオアコースティック基礎モデルであるパーチは、主に鳥のような陸上動物を対象に訓練されました。しかしPerch 2.0は水中音響で驚異的な性能を示しています。 これが海洋生態系🧵の声を聞き理解するのにどのように役立っているかをご紹介します
海は神秘の「サウンドスケープ」です。水中生物を保護するためには、大規模に識別する必要があります。 最近、Perch 2.0をリリースしました。これは水中音声が訓練されていないにもかかわらず、海洋検証タスクに優れています。
Perch 2.0の水中音響識別能力を拡張するために、私たちは転移学習を活用しました。 事前学習済みモデルはすでに音を理解できるため、新しいパラメータを学習させるのはプロセスの最終段階で、新しい種に適用することです。
パーチ2.0は、さまざまなヒゲクジラ種やシャチの亜集団の識別など、さまざまなクジラの鳴き声課題で評価されました。 事前学習済みモデルと比較しても、各データセットとサンプルサイズで一貫して上位または2番目に優れたモデルにランクインしました。
パーチ2.0が鳥のデータを水中音に転送するのにこれほど成功しているのは、その能力が以下の通りだと考えています: 一般化すると、訓練に含まれていない音を巧みに分類できます。 似た音を分類する:詳細な音響的特徴を学習することを強いられます。 多様性を認識する:鳴き声を進化させつつも構造的特徴を共有している種の多様性を特定します。
103