作るサウンドエレクトロニクス

1 サウンドエレクトロニクス・システムの解析


●「サウンド」の基本

サウンド、すなわち「音」を電気信号として扱う場合の基本は、 図1.1 の ような「音の3要素」がもっとも基本的なスタートラインとなります。 ここでは高校の物理の復習として、まずはこの「音の3要素」の検討から 始めて、20世紀初頭のサウンドエレクトロニクスの原点を確認して いきましょう。

まず最初に、 図1.2 の回路図を見てみましょう。これは、秋葉原の「秋月 電子」というショップのオリジナルキットによるオシレータ回路の例です。 そして、 図1.3 は、この出力をオシロスコープで見ている様子です。ここ では回路の二つの半固定抵抗を調整して、鳴っている音が「なるべく丸い 音色」(フルートのような柔らかい音色)になるように調整したところ です。画面右側の「オシロスコープ」画面の信号波形は、高校の数学で 出てくる「サイン波(正弦波)」そのものです。等速で回転する円盤上の1点 (中心を除く)の時間的移動を、円盤と同一平面上の無限遠点から見た「単 振動」を縦軸にとり、横軸を時間軸とした波形です。回転する発電器から 生み出される商用交流電源(AC)の波形も、同じものです。

このような周期的な信号変化の繰り返しを発生するのがオシレータ回路 で、この変化はそのままアンプで相似形として拡大されて、スピーカを 駆動し、それが空気振動として私たちの鼓膜を振動させます。鼓膜の振動 はさらに聴覚神経を刺激して脳に伝わり、最終的に「音」として知覚され ます。つまり、ここで見ている信号は、私たちの脳に伝わり知覚される 「音」の情報とほとんど変わらないものなのです。そこで、 この図 の ような計測結果を電気信号として分析するだけで、慣れてくると、その音は 人間にどう聞こえるか、という事を的確に予測することも可能です。

図1.3 のグラフの縦軸は、「音量」、つまり信号の大きさ(レベル)を表して います。このレベルの変化が、アンプやスピーカを経て、「音」という 空気振動の強さになります。サウンドエレクトロニクスの場合には、この 要素はアンプ回路のゲインとして制御することなります。もちろん、 オーディオアンプのパネルにある「ボリューム」のような静的な設定 だけでなく、時間的に変化する「エンベロープ」とか「トレモロ」と いった音量変化も重要な要素であり、単純に再生するだけのプレーヤ とは違うタイプの電子回路技術が活躍することになります。

そして、 図1.3 の横軸は時間をあらわす軸です。この図の例では、およそ 2.5msから3.0msぐらいの時間で2周期の変化をしていますから、「1周期 の時間は約1.25ms」となります。「周期」という物理量(時間 : 単位は「秒」) は、「信号の繰り返しをしている1回分に相当する時間」です。そして、 この周期の逆数が、音の高さ(ピッチ)に相当する「周波数」です。この例 では、1周期が1.25ms、すなわち0.00125秒なので、この逆数をとって (1÷0.00125)、この信号の周波数はおよそ800ヘルツ(Hz)です。この意味 は、1秒間に800回の振動を繰り返している、という事で、ピッチの高い 音は周波数が高い、という関係にあります。周波数が決まれば、時間(周期)は その逆数で対応しているので、この両者は同じ現象を二つの方法で表現して いるだけです。

人間の聴覚としては、一般に数十Hzから15KHz(脚注)程度が聞こえる、と 言われています。「サンプリング定理」によって、f(Hz)までの周波数成分 を表現するためには少なくとも2f(Hz)のサンプリングクロックが必要な ために、CDでは44.1KHz、DATでは48KHzのサンプリングとなっています。 これは、人間の可聴帯域の2倍以上にする、という音楽音響学的な学説に 対応したものですが、最近では「もっと高い周波数を聞くと、意識しない のに脳内が活性化される」などという学説も登場して、学会では議論に なっているところです。

[(脚注)周波数や時間の単位に添えられている指数表示の記号は、以下の
ようになります。
   T(テラ)  1000000000000倍
   G(ギガ)  1000000000倍
   M(メガ)  1000000倍
   K(キロ)  1000倍
   m(ミリ)  1000分の1
   μ(マイクロ)  1000000分の1
   n(ナノ)  1000000000分の1
   p(ピコ)  1000000000000分の1
]

さて、 図1.3 の右側のグラフがサイン波の信号であり、ここから約800Hzの ピッチ(周波数)である、というところまで読めた上で、左側のグラフを見て みましょう。これは「スペクトルアナライザ」で、信号に含まれる高次の 周波数成分の強さを示したものです。といっても、この波形はサイン波なの で、だいたい800Hzのところに一つだけピークがあるだけです。横軸は 周波数成分のピッチ、縦軸はその成分の強度です。

さて、 図1.2 の回路図の半固定抵抗をちょっと回してみた結果が 図1.4 のグラフ です。まず右側の信号波形を見ると、サイン波よりも少しだけ上下の対称性が 崩れていること、少しだけ周期が長くなって、およそ700Hzあたりのピッチ であること、等がわかります。そして、左側のスペクトルのグラフを見ると、 数本のピークが、等間隔に登場しています。これは、いちばん左側でレベル が最大の「基本波」に対して、2倍、3倍、4倍...という整数倍の周波数成分の サイン波も出てきた、ということを意味しています。そのつもりでこの サウンドをアンプから実際に音にして聞いてみると、確かに基本波のピッチは 下がっているのに、どこかキンキンと高い成分の音が聞こえてきます。

これが、「音量」「ピッチ(周波数)」と並んで音の3要素となる「音色」 の正体です。つまりこのグラフは、サウンドエレクトロニクスのもっとも 基本的な「信号波形とスペクトル成分と音色」という、音響学でも歴史の 長い基本的概念を視覚化したものなのです。ここではオシレータ回路からの 右側の波形を分析した結果が左側のグラフなのですが、音を生成する時には、 左側のような成分を合成した結果として、右側のような波形を得る、という 関係となります。本書では、その重点を「分析」でなく「生成」に置くこと になりますから、基本的には左側のグラフを起点としたアプローチをする のですが、随所で「分析」による逆向きの検討をすることになもなります。

●通信カラオケ装置

さて、それでは現代のサウンドエレクトロニクス・システムの一つの典型 例として、「通信カラオケ装置」を考えてみることにしましょう。ちょっと 昔までは、カラオケ装置といえば、カートリッジテープやレーザーディスク やCD-ROMの膨大なライブラリを持っていて、選曲はその中からいちいち 選ぶ(手元に持たない曲は演奏できない)というものでした。しかし現在では、 カラオケ装置はローカルに再生データを持たず、通信回線やインターネット から再生データをダウンロードしてくるようになりました。本書では、この 通信回路部分にあまり深入りすることはありませんが、「演奏データは 手元に全部を置かないで必要なものをダウンロードする」という発想の 転換には注目しておきましょう。

図1.5 は、もっとも標準的な「通信カラオケ装置」のシステムブロック図 です。特定のメーカの特定の機種の実例ということではありませんが、 ほとんど全ての通信カラオケ装置はほぼ同様の構成となっています。

図1.5 では、全てのブロックが「システムバス」に接続されています。その 上側にある、「CPU(マイクロプロセッサ)」「ROM(読み出し専用メモリ)」 「RAM(読み書き可能メモリ)」というのは、どんなマイコンシステムにも ある、コンピュータシステムとして必須の構成要素であり、カラオケ装置 とかに限ったものではありません。この部分は、ビデオのリモコンでも、 自動車に何十個と使われて分散処理している制御マイコンでも、あらゆる パソコンの内部でも、全て共通の構成要素です。

また、 図1.5 の下側のうち、左側に「インターフェース回路」としてまと めたのが、一般にコンピュータシステムで「I/O」と呼ばれるブロックで、 ここでは「通信回線」「映像/字幕制御」「パネル/リモコン」と代表 してあります。およその機能はそのネーミングから想像できると思い ますが、本書ではこの部分はメインテーマではありませんので、最小限 しか触れません。それぞれの機能については後述します。

そして、 図1.5 の下側の右側にある「音源回路」というのが、本書の メインテーマとなるブロックになります。カラオケ装置の場合には、 通信回線からダウンロードした音楽演奏データを自動再生するための 「SMF(スタンダードMIDIファイル)シーケンサ」という機能が重要 になりますが、この機能は上側のマイコンシステムのソフトウェア として実現されるので、このブロック図には現れてきません。

それでは、 図1.5 のシステムが通信カラオケ装置として動作する時の いくつかの様子を調べてみましょう。 図1.6 は、モデムを経由した電話 回線や専用回線、インターネットなどの通信回線を経由して、カラオケ 伴奏のための音楽演奏データをダウンロードしている動作の部分です。 全体の制御を行うCPUのプログラムはROMに格納されていて、命令の 実行のたびにCPUに読み出されます。そしてインターフェース回路の 中の通信回路から取り込まれたデータは、RAM内のデータ格納エリア に置かれます。なお、著作権を保護するためのデータの暗号処理に ついては、本書では省略しておきましょう。

図1.7 は、今度は実際にカラオケ伴奏を「自動演奏」している時の動作 です。ここでも全体の制御はCPUが行い、今度はRAMに格納された データをCPUが読み込んで解釈し、リアルタイムに音楽演奏データと して再生する「シーケンサ」と呼ばれる処理を実行します。そして、 シーケンサから刻々と生成される情報に従って、「音源回路」と 呼ばれるブロックに必要な情報を与えることで、サウンドが生成 されていきます。つまり、パソコンのサウンド機能では、あらかじめ メモリやハードディスクに記憶されているサウンドの情報をそのまま 「読み出し(再生)」しているのに対して、ここではサウンドの情報が 刻々と「生成」されている、という決定的な違いがあります。この点 は本書では一貫して重要な意味を持ちますので注目しておきましょう。

自動伴奏のカラオケなら、パソコンのサウンドプレーヤのように固定 された演奏データを再生しても同じではないか、と考える読者もいる かもしれませんが、そうはいきません。カラオケでは、演奏中にキー を変えたりテンポを変えたりすることも必要ですし、画面の映像や 歌詞の文字データと同期するためには、演奏のその場で演奏情報を 獲得して処理し、対応したサウンドを生成していく必要があるのです。 なお、「音源回路」の具体的な内容については、本書でみっちりと検討 していくことになります。コンピュータシステムという視点から言えば、 このようにサウンドをリアルタイムに生成するシステムというのは、 かなり高度な情報処理システム、ということになります。

●電子ピアノ

サウンドエレクトロニクスの次の典型的な実例として、ここでは電子 楽器の中の一つ、「電子ピアノ」について考えてみることにしましょう。 最近では家庭用ピアノも騒音問題などのために、電子ピアノで済ますこと が多くなってきています。しかし、街の楽器屋さんで試しに弾いてみると 判りますが、最近の電子ピアノのサウンドはまさにグランドピアノ そっくり、さらに音楽大学の学生でも満足できるぐらい、鍵盤演奏の タッチ(強弱の表現に対応したサウンドの変化)が豊かになっています。 ある意味では、コンピュータの世界で最近になって話題になっている 「ヒューマンインターフェース」が昔から本質的な要求だったシビアな 装置なわけで、電子ピアノには多くのノウハウが満載されています。

さて、そこで典型的な電子ピアノのシステムブロック図を示したのが、 図1.8 です。特定のメーカの特定の機種の実例ということではありません が、ほとんど全ての電子ピアノが、ほぼ同様の構成となっています。 実は電子ピアノだけでなく、電子オルガン、電子サックス、電子ドラム、 電子キーボード、などほとんど全ての電子楽器が、現在ではこれと同じ システムです。つまり、ケースとか人間との接点となる演奏機構の部分 が外見的に異なるだけで、電子的にはほぼ同一構成で、CPUのプログラム によって機能を変えている、という状況となっています。それぞれの 楽器の「音色」は、音源回路が基礎データとして持っている楽音データ メモリ(大容量ROM)の中身によって決定されます。

図1.9 は、この電子ピアノを演奏している典型的な動作状態の様子です。 インターフェース回路からは、刻々と演奏される鍵盤やペダルの情報が 入力されます。これらは単純なON/OFFではなく、個々の鍵盤を弾く 「打鍵速度」や、「ペダルの沈み込み量」という連続量として検出され ています。CPUはROMのプログラムを読み出して一連の処理を実行して いき、RAMには「現在押されている鍵盤」(ペダル操作の処理に必要) などのリアルタイム処理のデータが一時的に格納されています。 最近の電子ピアノは、ピアノとしての演奏と同時にフルオーケストラ の「自動伴奏」も行うことができますが、この機能はカラオケ装置と 同様の「シーケンサ」をCPUで並列処理して実現しています。

ところでこのブロック図ですが、 図1.5 の通信カラオケ装置とほとんど 同じであることに驚きます。実際に、違っているのは通信回路の部分が ネットワークであるかMIDI(Musical Instruments Digital Interface) であるか、あるいは鍵盤なのか操作リモコンなのか、といった、本書の 主眼であるサウンドエレクトロニクス以外の部分だけなのです。逆に 言えば、現在では、カラオケ装置と電子ピアノとは、技術的にはまったく 同一のテクノロジーで重複していることになります。本書の最大の目的 はこのポイントにあり、両者に共通したサウンドエレクトロニクス技術を 体験的に理解することにあります。

なお一つだけ指摘しておけば、システムブロック図としてはほぼ同等の カラオケ装置と電子ピアノですが、両者には決定的に違うところが あります。それは、「演奏すべきデータが決まっているかどうか」と いうところです。未知のカラオケ演奏データをダウンロードしてきた 場合には似たようなことになりますが、電子ピアノの場合には、どの ように鍵盤を演奏するかは予測できません。10匹の猫が鍵盤の上で 暴れたり、前衛的ピアニストが両肘と両足で弾いたり、長さ1メートル の定規で数十個の鍵盤を同時に弾く、というケースもあります。音源 回路では「同時発音数」という機能的な制限があるために、CPUの ソフトウェアとして、このような状況での「あふれ」に対応した処理が 必要となってきます。この点について(「アサイナ」機能)は後述します。

●本書の構成と方針

さて、本章ではサウンドエレクトロニクスの基礎を確認し、通信カラオケ 装置と電子ピアノ、という二つの実例から、その現状がほぼ同一構成の コンピュータシステムになっている、という概要を眺めてきました。 そこで、ここでは本書のこれからの展開について紹介しておきましょう。

第2章「 アナログ的サウンドエレクトロニクス 」では、いわゆるアナログ シンセサイザやアナログ技術による電気楽器/電子楽器の歴史を確認 しつつ、現代でも通用する基本的なサウンドエレクトロニクスの要素技術 を簡単に整理していきます。ディジタル全盛の時代ですが、まだまだ多く の局面ではアナログ技術は健在であり、一部ではアナログならではの 「潤いのあるサウンド」に回帰している人もあります。本書では後半で ディジタル的な展開をしていきますが、その基本として、いい意味での ブラックボックスとしてのアナログ技術を整理していきます。具体的な キーワードとしては、「アンプ」「オシレータ」「フィルタ」 「エンベロープとモジュレーション」というような内容となります。

第3章「 MIDIとマイコン制御 」では、現代のサウンドエレクトロニクス には基盤技術として必須となった、音楽演奏情報の国際標準規格MIDIと マイコン制御について、きちんとしたプラットフォームを構築します。 この部分を明確に理解し、標準化されたブラックボックスとして自在に 活用できる「環境」を用意しておくことは、本書のその後の部分に効いて くるだけでなく、読者の皆さんがオリジナルのマシンを創造・製作して いくためにとてね重要な資産となります。本書では、秋葉原の秋月電子 から提供されている、32ビットカードマイコン「AKI-H8」を標準環境 として、サウンドエレクトロニクスのシステム中核部分への利用方法と、 その開発環境について詳細に検討していきます。また、AKI-H8のため のオリジナル・サービスライブラリ、AKI-H8を使ったディジタル オシレータ、MIDIオルゴール、さらに「ピッチ抽出マシン」についても 製作例を紹介します。
ちなみに筆者はMacintosh PowerBookでAKI-H8システムを開発 していますが、Macの中にWindows環境を走らせているので、当然 ながらWindowsの人も問題なく活用できます。

第4章「 ハイブリッドシンセサイザ 」では、もはや古典的となった 「ディジタル(CPU)制御のアナログ方式電子楽器」というスタイルの 音源システムを実際に製作しながら検討します。メニューとしては、 まず最初に「MIDI遅れの迷信と真実」というテーマで、誤解の多い MIDIにまつわる遅延について実験的に検証し、パソコンのソフトシンセ の本質的な限界と、ハードとして音源を実現する意義を理解します。 そして、古典的な「アナログシンセサイザ」「トップオクターブ方式」 「サンプリングメモリ方式」などについて紹介し、「ポリフォニックと アサイナ」という重要なテーマを検討した上で、AKI-H8をモジュールと して活用したハイブリッドシンセサイザ、という具体的なシステムの 製作実験に挑戦していきます。
なお、かつては電子楽器の世界で「定番」とされた専用ICや専用LSI が、現在では製造中止で入手困難となっているものも少なくあり ません。そこで、本書では基本的には「入手の容易なパーツで実現 する」という方針をとり、ある部分では簡易型のシステムで留まって いることもありますが、この点は御了承下さい。時代はディジタルに 移っているので、消えた半導体の回路を完全に再現することはとても 困難なのです。

第5章「 ディジタルシンセサイザ 」では、電子楽器メーカなどでは 専用LSI(ASIC)や信号処理専用のDSPチップで実現している、本格的 なディジタル音源システムに迫ってみることにします。ある程度の 実用的な電子音源をフルディジタルで実現するには、たとえば5万 トランジスタ程度の回路規模が必要になります。また、専用LSIの 代わりにPALやLCAやFPGAを使うことも一般的ですが、本書の方針と しては「普通のデバイスだけを使う」という方針をとり、これら 「プログラマブル・ロジックLSI」を使用しません。そこで、システム としては基本的な構成要素を押さえていますが、機能としてはだいぶ 制限されたシステムになりますので、この点は御了承下さい。ここで のキーワードとしては、「時分割パイプラインDSPシステム」「位相 累算ダイレクトシンセサイザ」「PCM波形処理とタイムバリアント」 「ディジタルエンベロープジェネレータ」「乗算累算処理とサウンド 出力系」と、かなりハードな項目が並びます。技術的には、電子工学 系の大学院程度のレベルとなります。

また、本書には 付録CDROM が付属していますが、これはISO9660形式の ミックスCDROMとなっています。つまり、Macintosh、Windows、Unixの いずれのプラットフォームでも利用することができます。第一トラック はデータトラックとなっていて、本書で紹介される全てのリスト等が テキストファイル形式で格納されています。そして第二トラック以降 は、通常のCDと同じサウンドトラックとなっています。ここでは、 本書の記事で実際に制作したサウンドのサンプル等が入っていて、 「百読は一聴にしかず」の実例となっています。(なお、CDプレーヤー 等で先頭の第一トラックをサウンドとして再生できてしまうタイプの 機器がありますが、これは聴覚器官を傷めたり音響機器を破損させる 恐れがありますので、「第一トラックは絶対に再生しない」という 点にくれぐれも注意して下さい。それから、このCDROM自体の著作権、 収録されている全てのデータやサウンドの著作権は全て、 筆者にあります。利用は本書の読者が個人的に楽しむことに限られ、 著作権者の許諾を得ずに改変・転載・配布などを行うことは認められて いませんので御注意下さい。)

さて、かなり長い道のりとなりますが、少しずつトライして、 サウンドエレクトロニクスの豊かな世界に挑戦していきましょう。


トップに戻る