サンプリングレートとフレームレートとビットレート
音楽や動画の品質を測る単位にサンプリングレートとフレームレート、或いはビットレートといふ単語がある。これらの違ひがよくわからなかったので、簡単に調べてみた。
サンプリングレート(Sampling rate)
「サンプリング周波数」「サンプルレート」とも言ふ。Windowsのプロパティでは「サンプルレート」と表示されてゐる。単位はHz(ヘルツ)
Wikipediaによると、音声等のアナログ波形を、デジタルデータにするために必要な処理である標本化(サンプリング)で、単位時間あたりに標本を採る頻度。
*1と説明されてゐる。
標本化とは、時間的に連続した信号を一定の間隔をおいて測定することにより、離散的な(連続でない)データとして収集することである。
*2と説明されてゐる。
ごく簡単に例へると、ここにアルコール温度計がある。この温度計の表示は当然刻一刻と変化してゐる。この時点では、温度計の表示はアナログデータである。
ここで、私が1分ごとに温度計の数値を読み取って記録を付けていったとする。すると、記録された温度の情報はデジタルデータとして扱ふことが出来る(表計算ソフトにそのまま打ち込める)。この作業が標本化であり、記録を付ける間隔こそがサンプリングレートといふことらしい。当然、細かく記録を取ればその分精密で正確なデータといえる。
標本化の対象が音の場合、音は波であるため、少なくとも波の『最も大きな箇所』と『最も小さな箇所』を記録できなければ、そのデータは正しく記録されたことにならない*3 そのため、音の標本化は対象となる音の周波数の二倍(高低)以上の記録頻度が必要である。
当然、音以外でも、アナログデータを時間単位でデジタル化したものには、全てサンプリングレートが存在する。
異なるサンプリングレート同士は、基本的に互換性を持たない。「3分ごとに記録されたデータ」を、「7分ごとに記録されたデータ」に直接変換することは出来ない。この場合、データは最小公倍数である「21分ごとに記録したデータ」まで劣化することになる。
現在一般的なCD/MDのサンプリングレートは「44.1kHz」*4であり、DVDやケーブルTVのサンプリングレートは「48kHz」で統一されてゐる。これは、DVDやケーブルTVの音楽をそのままCDに録音されるのを防ぐためらしい*5。
量子化ビット数
サンプリングレートに関連するものとしてビット深度(量子化ビット数とも)といふ概念がある。これは、先の温度計の例へで言へば「下何桁まで測るか」といふものに等しい。
つまり、アナログデータを1回当り何bitでデジタルデータ化するかといふもの。当然だが、この数字が高くなればなるほどデータ量が大きくなる。通信用語の基礎知識によるとオーディオでは16ビット以上、電話音声などでは8ビット、ビデオ信号では8〜10ビットがよく使われる。
*6らしい
チャンネル数
音データの場合、ステレオのやうに異なる音データを同時に出力する場合もある。同時に出力する音情報の数をチャンネル数といひ、単位はchで表す。ステレオの場合2chである。
フレームレート(Frame rate)
同じくWikipediaでは単位時間あたり何度画面が更新されるかを表す指標である。
*7と説明されてゐる。単位はfps(Frame Par Second)だが、文脈によって様々な意味で使用されるらしい。
- 映像編集などの場において、1秒間に何度画面を書き換えた動画を作るか
- コンピュータソフトにおいて、リアルタイムで映像を作る場合に、CPU等の性能や処理の軽重等の事情から、結果として1秒間に何度画面を書き換えられたか
- テレビなどのディスプレイ装置の性能として、1秒間に何度画面を書き換えることができるか
- テレビ放送などの映像規格において、1秒間に完成映像を何回書き換えるか
一番目の意味では、アニメのコマ数が有名だらう。1秒辺りに何枚のコマを作るかによって、動きの滑らかさに差が生じる。細かく作り込むほどパラパラ漫画が滑らかになるのと同じ話である。
映画などのムービーフィルムは一般に24コマ/秒の早さで流れるため、24fpsで作成されたアニメが最も滑らかに表現されてゐると言へる。この様なアニメを日本では「フルアニメ」と言ひ、これに対して24fps以下のコマ数で作成されたアニメを「リミテッドアニメ」と言ふ。
二番目や三番目の意味では、単純に装置の性能の話と考へて良い。より正確には「リフレッシュレート」といふ別の単位(Hz)で表す。
四番目の意味は、TVの歴史と密接な関係がある。TV放送を始める当時の受像機は、ブラウン管による走査型のものであった*8。この関係*9で、送信可能なフレームレートは30fps程度であった。しかし、人間が動画を滑らかと認識するためにはおよそ60fps必要とされる。
そこでTV放送では映像を半分に分割して送信する(正確には走査線を1本ずつ飛ばして送信する)ことで、違和感を持ちづらくする方式を採用した*10 これをインターレース(飛越し走査)方式といふ。対して、そのまま走査線を送る方式をプログレッシブ(順次走査)方式といふ。
インターレース方式の利点は、映像の変化の激しい場合の滲みや違和感が抑へられる点である。何故なら、一回の走査に必要な走査線数が半分であるため、1秒辺りの走査数が約2倍になるからである。
プログレッシブ方式の利点は、映像の変化の少ない場合のちらつきを抑へられる点である。また、1フレームごとに完全な映像が作られるため、静止画にしても画質が劣化しないといふ面もある(インターレース形式の場合、垂直解像度が半分に低下する。TVで一時停止を押すと画質が劣化するのもこのため)
両者の特徴を見てもわかる通り、インターレース方式はTVやゲームのような常に変化する映像、プログレッシブ方式はPCのディスプレイのように静止画が多い映像に向いてゐる。
現在はTV・ディスプレイの性能も向上したため、DVDやゲームにおいてもプログレッシブ方式に対応しつつある。
フレームレートと品質
単純に考へれば、映像作製時〜視聴時まで全ての装置のフレームレートが同じであれば、無劣化でその映像を鑑賞してゐることになる。先述の通り、TVのfpsは約60fps(30fps × 2)なので、映像を処理するコンピュータの処理能力、映像を出力する装置の出力能力も60fps程度であれば良いことになる。
しかし、静止画をちらつきなく見続けるためにはより高いレート値が望ましいため、コンピュータ用ディスプレイでは70Hz以上で表示するのが一般的となってゐる。
このため、TV映像を出力するためには「60fpsの映像が完成するまで出力の更新を見送る」(垂直同期待ちといふ)か、「そのまま70Hzで60fpsの映像を出力する」かの二択となる。前者の場合実質的なフレームレートは45fpsとなり、ちらつきが生じる。後者の場合は同期が取れないため滲みが生じる。
対策としては、ディスプレイ側のリフレッシュレートを落とすか、2倍の120Hzに設定するしかないと思はれる。使用感を考えれば、120Hz対応のディスプレイを購入するのが理論上一番良いと思ふが、確証はない。
ビットレート(Bit Rate)
例によってWikipediaでは1秒間にデータ転送路上の仮想の、または物理的な地点を通過した(すなわち転送された)ビットの個数
*14と説明されてゐる。特に秒である必要はないらしいが、一般的に秒で表す。単位はbps(Bit Par Second)
要するに、1秒間に何bitの情報を出力するのか、といふ単位である。言ひ換へれば、1秒間に何bitの情報が詰め込まれてゐるかを表してゐる。
動画や音声の場合、標本化した情報をそのまま無圧縮で保存するのは現実的でない。一般的なCD音質(44.1kHz,16Bit,2ch)で無圧縮の場合、ビットレートは1411.2kbpsであり、そのまま60分録音すると5,080,320,000(5.1GB)のデータ量になってしまふ。動画の場合更に映像情報が加はるため、データ量は天文学的数字になる。
そのため、人間が認知しにくいやうに上手くデータを削ることで、現実的なデータ量に落とし込むわけである。削った情報は復元出来ないため、非可逆圧縮に区分される*15。そしてこの時、ビットレートはどの程度まで情報量を削ったのかを表す指標となる。
単純に考へれば、ビットレートが半分になれば品質は半分に低下するのだが、人間の知覚の性質を利用することで「感覚的に」劣化が少ないままデータを圧縮してゐる*16。それがマルチメディア圧縮技術であり、mp3やmpegなど数多くの規格がしのぎを削ってゐる。
品質に影響する要素
さて、実は本記事はこれを考へるために調査したものだった。とは言へ、既に答へは出たやうなものである。
結論として、サンプリングレート(フレームレート)やビット深度は、ほとんど数値が規格化されてゐるため、弄ると互換性を失いかねない。また既に非可逆圧縮を施してゐる場合、サンプリング時のデータは復元出来ないため、下手に変更すると著しく品質を劣化させるものと思はれる。
つまり、変更できるのは精々ビットレートくらゐなのである。それでも、10000bpsを5000bpsに落とした後で1000bpsに落とすのは、直接10000bpsから落としたときより品質が劣化する*17
このやうにメディアデータは後から品質を弄ることは難しいため、録画・録音する際のビットレートは計画的に決めたいものである。
*3:一日の最高気温と最低気温を測るのに、半日しか記録していないやうなものである
*4:この数字に決められたのには色々と背景があるが、詳しくはサンプリング周波数 - Wikipediaの記述を参照されたい
*5:明確な根拠は見あたらない、推測である。まあ、昨今の業界の主張を見れば、さもありなんとも思ふ
*8:今でもブラウン管TVが主流だと思ふが
*9:詳しくは走査 - Wikipediaを参照されたい
*10:なほ、その後色々技術的な事情があり、現在TV放送の映像は29.97fpsとなってゐる。
*11:特にシミュレーションゲームでの処理落ちは拷問に近い
*15:これに対してZIPやLZHなどのテキストデータは、情報が削られてしまふと困るので可逆圧縮を用ゐる
*16:そのため1411.2kbpsの音楽を160kbps辺りのmp3に圧縮してもあまり劣化を感じない。規格上最高品質の320kbpsであれば余程注意深く聞いてゐない限り違ひはわからない。聞き比べれば「まあさう言へばさうかな」といふ程度
*17:もっと言へば、10000bps→10000bpsで再圧縮を行っただけでも品質は若干劣化する