【AviUtl】動画から音声を抽出(分離)する方法【wav・mp3・wma】

AviUtlを使用して、動画から音声(.mp3、.wav等)を抽出する方法について紹介します。

最初に注意ですが、AviUtlでは音声ファイルの出力形式として、「.wav」形式しか選択出来ません。(.mp3とかでは出力出来ません)

ですが、オーディオのコーデックとしてはmp3/wma/mp2/aacなども選択可能です。(⇒音声コーデックの違い

これがどういう事かというと、例えば「mp3コーデックには対応してるけどwav形式には対応していないウォークマン」などでは、再生出来ない可能性が(稀に)有ります。(ほとんどないけど)

まぁ要は「コーデックは色々と変えれるけど、コンテナはwav固定だよ」って事です。(⇒コンテナとは

スポンサードリンク

最初に(前知識)

音声を抽出する前に、「サンプリングレート」「量子化ビット数」などの最低限の専門用語についてある程度知っておかないと、この記事の内容があまり理解出来ないと思うので(時間があれば)以下の記事とかを参考にしてみてください。

CBR(固定)とVBR(可変)とABR(平均)の違い【ビットレート】

ビットレート・サンプリングレート・量子化ビットなどの違いについて

音声を抽出する方法

フレームレートを落としたい動画をAviUtlに読み込みます。(図1)

※読み込むのは、「拡張編集」のタイムラインからでも、AviUtlの本体ウィンドウからでもどちらでも構いません(エンコードするだけなのでどっちでも良い)

DD
図1

読み込んだら、メニューの「ファイル」→「WAV出力」を選択します。(図2)

wav出力
図2

「オーディオ圧縮」を選択します。(図3)

wav出力_オーディオ圧縮
図3

この画面では、音声ファイルの「形式」と、エンコードモードやサンプリングレート、量子化ビット数(ビット深度)などの「属性」を選ぶことが出来ます。(図4)

オーディオ圧縮画面
図4

形式の種類

形式(コーデック)の種類について簡単にザっと紹介します。

  • CCITT-A-Law:固定電話に使われてるコーデック(欧州その他で使用)
  • CCITT-u-Law:固定電話に使われてるコーデック(北米・日本で使用)
  • GSM 6.1:携帯の3g電話に使われてるコーデック
  • IMA ADPCM:ADPCMのIMA版(PCMを若干圧縮したバージョン)
  • Microsoft ADPCM:ADPCMのMicrosoft 版(PCMを若干圧縮したバージョン)
  • MPEG Layer-3:ご存知mp3コーデック
  • MP2:mp2コーデック(MPEG-1動画に使われてるヤツです)
  • Windows Media Audio V1:wmaコーデック(ロスレスではない)
  • Windows Media Audio V2:wmaコーデック(ロスレスではない)
  • PCM:非圧縮

※使用しているPCによっては表示されていないものもあると思います

正直、「MPEG Layer-3」と「PCM」と「WMA」以外は使う価値が無いと思います。

LPCMとして出力する場合

オーディオ圧縮画面

■形式

※LPCM:無圧縮のこと(音声の劣化なし)

LPCMとして出力したい場合は「PCM」「IMA ADPCM」「Microsoft ADPCM」を選択します。

純粋に「無圧縮」で出力したいなら「PCM」を選択します。

「ADPCM」は「PCM」の圧縮形式なので、サイズは小さくできますが音質は落ちます。

■属性

「サンプリングレート」と「量子化ビット数(ビット深度)」と「ステレオ・モノラル」の組み合わせを選択する事が出来ます。

サンプリングレート 48000~8000hz
量子化ビット数(ビット深度) 8~16bit
サウンド種類 ステレオ or モノラル
サイズ 187~7KB/秒

mp3として出力する場合

mp3形式属性

※mp3として出力するには事前にmp3エンコーダーをパソコンにインストールしておく必要があります。(詳しくは以下の記事を参照して下さい)
MP3コーデックをパソコンにインストールする方法【Windows】

■形式

mp3として出力したい場合は「MPEG Layer-3」を選択します。

先述した通り、拡張子は「.wav」として出力されますが、中身のデータはmp3です。(※後述するwma、mp2も同じです)

■属性

属性mp3

それぞれのパラメータの組み合わせを選ぶことが出来ます。

サンプリングレート 48000~8000hz
エンコードモード CBR or ABR
量子化ビット数(ビット深度) 320~16kbps
サウンド種類 ステレオ or モノラル
サイズ 39~1KB/秒

※bitとhzとbpsの関係は「hz × bit × 2(ステレオの場合)=bps」です。

wmaとして出力する場合

wma画面

■形式

wmaとして出力したい場合は「Windows Media Audio V1」か「Windows Media Audio V2」を選択します。

V1・V2で出力出来るwmaのバージョンは1・2となります。wmaは最新バージョンでは9.2までリリースされており、音質を気にするならこの方法での出力はオススメしません。

■属性

サンプリングレート 48000~8000hz
量子化ビット数(ビット深度) 128~0kbps
サウンド種類 ステレオ or モノラル
サイズ 19~1KB/秒

mp2として出力する場合

mp2画面

形式

mp2として出力したい場合は「MP2」を選択します。

MP2は、MPEG1形式の動画データに使われる音声形式で、同じビットレート数ならMP3の方が音質が上です。

■属性

サンプリングレート 48000~16000hz
サウンド種類 ステレオ or モノラル
サイズ 468~0KB/秒

設定が終わったら、OKを押し前画面に戻り、「保存」を押せば出力出来ます。

wav出力保存