Hiroshi TAKEMOTO (take@pwv.co.jp)

Waveデータの内積の例

Sageを使って音声データのLとRの信号の内積を取りたいとのご質問がありましたので、ここで説明します。

必要なインポート

音声データの処理は、Sageがpythonベースなので、pythonのscikits.audiolabを使って Wavファイルから取り出します。

必要なインポート文は、以下の通りです。

# 必要なインポート from scikits.audiolab import wavread, wavwrite from numpy import abs, max

/usr/local/sage-6.0/local/lib/python2.7/site-packages/scikits.audiolab-0\
.11.0-py2.7-linux-x86_64.egg/scikits/audiolab/soundio/play.py:48:
UserWarning: Could not import alsa backend; most probably, you did not
have alsa headers when building audiolab
  warnings.warn("Could not import alsa backend; most probably, "

/usr/local/sage-6.0/local/lib/python2.7/site-packages/scikits.audiolab-0.11.0-py2.7-linux-x86_64.egg/scikits/audiolab/soundio/play.py:48: UserWarning: Could not import alsa backend; most probably, you did not have alsa headers when building audiolab
  warnings.warn("Could not import alsa backend; most probably, "

オーディオファイルの読み込み

WAVファイルの読み込み関数wavreadを使ってオーディオファイルの音源を 2個の配列に取り込みます。

# 2つの信号を混合したWavファイルを読み込む recording, fs, enc = wavread(DATA + 'mixed.wav')

Wavファイル（mixed.wav）がrecording変数にセットされますので、これを使ってRとLの信号のvectorを作ります。

最初にrecordingのサイズと型を調べます。

len(recording)

type(recording)

<type 'numpy.ndarray'>

<type 'numpy.ndarray'>

recordingがnumpyの配列であることがわかりましたので、次数を求めます。

recording.shape

(882000, 2)

(882000, 2)

内積を求める

Pythnのnumpyの88200 x 2の配列であることが分かりましたので、この値からSageのvectorを生成して、内積を求めます。

# numpyの配列からRとLのvectorを生成 l_vec = vector(recording[: , 0]) r_vec = vector(recording[: , 1])

# 内積 LdotR = l_vec.dot_product(r_vec) print LdotR

27933.0420707

27933.0420707

Q_and_A_1

3478 days ago by takepwave

Waveデータの内積の例

必要なインポート

オーディオファイルの読み込み

内積を求める