Tech と Culture

テクノロジーとカルチャー

データパスのビット長(1)

データパスのビット長を決定しなければなりません。
インターフェース誌の記事を参考に、同じような考察をYCC-RGB変換モジュールのデータパスに対して行ってみます。
datapath.png
ソフトウェアであれば、INT型、DOUBLE型と演算のビット幅は決められたものから最適なものを選びます。しかし、ハードウェアではその幅は自由に決めることができます。その代わり、データパス部分はハードウェアのリソースをたくさん使いますので、ソフトウェアがINT型で乗算をしているからといって、32ビットx32ビット演算等を使うと面積的に厳しいことになりますし、データパス部分のクリティカルパスが長くなってしまい、その部分が全体の周波数を押し下げることにもなりかねません。
よってできる限り少ないビット長で演算を行うのが得策ですが、あまりにもビット長を小さくすると、今度は誤差の問題が出てきます。このバランスをとらねばなりません。
今回のデータパスにおいては、Cbと-128の入力から真ん中の6ビット出力の部分がもっとも誤差に対して厳しいパスと考えられます。
理由)
1. データパスの演算の段数が一番多い。何も考えずに出力ビットすべてを保持していくと出力ビット数は非常に大きくなり無駄になる。
2. 16ビットカラーでは、RGB全てを同じビット数にできないため、どれかのビット数を大きくしている。
人間の目はGREENに対して敏感であるため、Gだけ6ビットとなる。
IJGのJPEG LIBRARYは32ビットカラーでR,G,Bすべて8ビット出力だが、今回16ビットカラーにする際に下位ビットを切り捨てる。R,Bは3ビット切り捨てるが、Gは2ビット切り捨てることになる。
よって、R,BよりもGの方がデータパスのハードウェア演算で許容される誤差が厳しい。

という訳で、図中の真ん中のパスを考察してみます。
まず、入力部分と出力部分で、前後のつながりからビット幅が確定する部分があります。
?Cbは8ビットで入力されますが、これは符号無しの8ビットで0〜255の大きさをとります。最初に符号付の加算があるために、1ビット拡張して9ビットの符号付きの値に変換します。
?も符号付の9ビットで表現して加算します。出力は10ビットとなりますが、値は-128〜127になりますので、上位2ビットは切り捨てて良いことになります。捨てた部分に関しての加算器の最適化は論理合成ツールにまかせます。これで?は符号付き8ビットとなります。

次に出力部分ですが、図中のRange limitという演算は0以下なら0に固定、255以上なら255に固定という演算です。この値が符号無し8ビットであらわされて、その後下位2ビットを切り捨てて6ビット出力となります。よって?の加算器の出力は、2^3-1(-3〜3)まで誤差があってもまったく影響がないことになります(下位2ビットまでは誤差があっても同じ値になる)。

ここまでが入出力の値の範囲から決定される部分です。この条件の下、乗算のビット数とその後の二つの加算のビット数を決定します。

?を出力として持つ加算器の一方の入力は1ビット符号拡張した9ビットの整数定数であり、誤差は含まれません。よって?の誤差がそのまま?の誤差になりますので、?に許される誤差も2^3-1(-3〜3)となります。
?に許される誤差は加算器の二つの入力誤差の和が出力誤差になりますので、?に許される誤差の二分の一となり、2~2-1(-1〜1)です。
これで?の入力を2進数で小数点以下を何ビットで表現するべきかが決まります。
すでに?は符号付8ビット(-128〜127)で誤差がない状態に確定しています。
?を小数点以下6ビット持てば、誤差は2^(-7)以下となり、-128〜127の間の数値を乗算しても誤差が-1〜1の間に収まります。整数部分に1ビット、符号部分に1ビット必要ですので、?は符号付8ビット(うち6ビットが少数点以下)に確定しました。これにより乗算器も符号付8ビット2入力に確定です。

符号付8ビット乗算器の出力は16ビットになります。そのうち6ビットが少数点以下を表します。整数部分は符号付の10ビットです。ここで先ほど考察した許容誤差を考えると少数点以下の6ビットの出力は捨ててしまって問題ないことが分かります。整数部分の最下位1ビットも捨ててしまい、0に固定します。このようにして乗算器の最適化を論理合成ツールに任せます。乗算器と言っても一方の入力は固定値ですので、通常の符号付8ビット2入力の乗算器よりもかなり小さくなると予想しています。

乗算器の出力の最大値、最小値を考えて見ます。
実は二つの乗算器に入力される定数の絶対値が1以下ですので、可変する側の符号付8ビット入力変数よりも整数部分の絶対値は必ず小さくなります。よって乗算器の整数部分出力ビットも8ビットでよいことになり、2の補数で表しているため上位2ビットも捨ててしまってかまいません。
(ただし、他の二つの乗算器は与えられた定数が1以上2以下ですので、上位1ビットしか捨てることはできません。この二つの乗算器の出力は符号付9ビットを有効にします。)

?が符号付8ビットに切り捨てられましたので、次段の加算器は符号付8ビット2入力となり、出力は符号付9ビットです。そして次の加算器は符号付9ビット2入力となり、出力は符号付10ビットです。
その後range limitによって情報を削ります。

とりあえず、データパスのビット幅が確定しました。
これであっているかなー???
datapath-bit60.png
次にこれであっているかソフトウェアで検証するつもりです。
(しかし、この文章じゃ、全然意味が通じない気がします。後でもっとうまく書き直したい。)


後記:
ここまでやっておいて、両方が変数になっている乗算器がひとつもないことに気が付きました。
もしかしたら、最後のRangeLimitのところでビットを捨てて、あとは論理合成ツールにまかせてもほとんど変わらない面積で収まるのではないかということを感じつつあります。。。。。。。
まあ、勉強になったから良いか。

後記2:
ちょっと基本的な考え方を誤解していたみたいです。後で検討しなおします。