ビジネスと技術の狭間で

データを活用して生きていく

Rで音声データを扱う

音声データの扱いに関してTask View的なものがないか調べていたところ
以下の本のAppendixにまとめられていたので簡単にメモしておきます。

Sound Analysis and Synthesis with R
目次を見る限り、この本は音声データの扱いに関して
基本的なところから丁寧に説明してある雰囲気で良さげです。

Appendixで紹介されていたのは以下の9つのパッケージでした。
使用頻度が高そうな順に記載します。

tuneR

https://cran.r-project.org/web/packages/tuneR/tuneR.pdf
音の入出力周りが充実したパッケージ。
MIDIやMP3のファイルも読み込めるらしい。

seewave

https://cran.r-project.org/web/packages/seewave/seewave.pdf
http://rug.mnhn.fr/seewave/
音の振幅や周波数を扱う関数や各指標を算出できる
かなり汎用的なパッケージ。
vignetteも充実しているし
著者のページで様々な可視化の例も見られる。

signal

https://cran.r-project.org/web/packages/signal/signal.pdf
MatlabOctave)互換な関数が集められた信号処理パッケージ。
フィルタ系の関数が充実している印象。
2015年で開発が止まっている。

soundgen

https://cran.r-project.org/web/packages/soundgen/soundgen.pdf
http://cogsci.se/soundgen.html
音声生成周りが充実したパッケージ。
shinyでインタラクティブに音を生成できる。すごい。

warbleR

https://cran.r-project.org/web/packages/warbleR/warbleR.pdf
動物の音声の分析をスマートに行うためのパッケージ。
一部seewaveの関数をベースにしたものがあったりするが
使い勝手がどのくらい違うのかは不明。

phonTools

https://cran.r-project.org/web/packages/phonTools/phonTools.pdf
http://www.santiagobarreda.com/rscripts.html
フォルマントの抽出や、その遷移の可視化など
音声解析用の関数が充実したパッケージ。
2015年で開発が止まっている。

soundecology

https://cran.r-project.org/web/packages/soundecology/soundecology.pdf
音環境、サウンドスケープ研究のための様々な指標を計算するパッケージ。
ややマニアック。

monitoR

https://cran.r-project.org/web/packages/monitoR/monitoR.pdf
音声データ同士のテンプレートマッチングができるパッケージらしい。
(動作未確認)

audio

https://cran.r-project.org/web/packages/audio/audio.pdf
今のところ特化した関数があるわけでもなく、使いどころはなさそう。


おまけ。
”Sound Analysis and Synthesis with R”に
辿り着くまでに見つけたものもまとめておきます。

SoX

http://sox.sourceforge.net/
音声処理の界隈ではよく使われているらしいソフトウェア。
seewaveのsox関数から呼び出すことができる。

openSMILE

https://www.audeering.com/opensmile/
音声データから諸々の特徴量を作成するソフトウェア。
C++で書かれているので速い。
Rからは直接system関数で呼ぶしかなさそうで
作成されたarff形式のファイルを読み込む形で使う。
商業利用は要相談らしい。https://en.wikipedia.org/wiki/OpenSMILE