日本時間学会第2回大会発表のための覚え書き(2010.04.06)

コンピュータ音楽における「時間」

長嶋洋一(SUAC/ASL)

本稿は、2010年6月5-6日に山口大学で開催される、日本時間学会第2回大会に発表応募した後に執筆したものである。当日プログラムとして配布されるのは1ページA4の「要旨」なので、紙面の制約がない状態で本稿を執筆し、そこから抜粋して要旨原稿を提出した。

はじめに

筆者はこれまで20年余り、コンピュータ音楽の領域で、関連した研究とともに創作・公演活動を行ってきた[1]。この発表では、本質的に時間芸術である「音楽」において、コンピュータサイエンスによってその「時間」の概念が、再確認され、あるいは拡張されてきた事例を紹介し、より広範な領域における時間学研究と交流することで、さらに「時間」研究の可能性を発展させていきたいと考えている。
研究領域としての"Computer Music"には60年以上の歴史(=ほぼコンピュータそのものの歴史)がある。その対象は音楽に関わる全てであり、聴覚領域の知覚・認知や五感の拡張、感情・認識・創成のモデル、音響の生成・変調、さらに地球規模の音楽情報検索などその領域は広い。本稿では"Computer Music"の解説は省略するので、参考資料[1-4]を参照されたい。

音楽と時間

もともと哲学的にも歴史的にも音楽は映画などと並び「時間芸術」であり、要素というよりも「時間」はその本質である。Gustav Mahlerの第2交響曲「復活」の長大な第1楽章の終止の部分のスコアには作曲者自身により「少なくとも5分間以上の休みを置くこと」と書かれている。John Cageの代表作「4分33秒」において、時にはストップウォッチを持った演奏家(オーケストラも可)が「何もしない」3つの楽章を演奏するが[5-9]、実はその長さは自由である。同じくJohn Cageの作品「オルガン/ASLSP」はドイツ・ハルバーシュタットの教会跡で電気と機械仕掛けによる演奏が2001年から始められ、終了予定は2640年である[10]。いずれも、作曲家だけでなく演奏家も聴衆も「時間」を深く考えずに対峙することはできない。

音楽における3つの時間

音楽における「時間」にもいろいろな種類がある。サウンドは空気振動として人間の鼓膜の振動から最終的には脳によって知覚されるが、そのピッチや音色の音響学的な指標の定義には、宇宙に共通の「物理的時間」が基礎となっている[11-12]。音楽情報科学ではおよそ10の20乗ほどのスケールの「時間」を扱う。人間のビッチ識別能力や音色感覚は優秀であるが、少しだけ時間スケールの大きな変化を加えると、簡単に人間を錯覚させるサウンドを作ることができる(無限に上昇/下降する音[13-14])。

個々のサウンド(楽音)の組み合わせは音楽を形成するが、例えば一定周期で繰り返されるビートやそのテンポについては、物理的な時間とともに聴取する側の人間の「生理的時間」が大きく関わる[15]。クラシック音楽でもっとも標準的な「アンダンテ」(歩くような速さで)のテンポは、人間の心拍と深く関係し、そのごくわずかな変化がアゴーギク(速度による音楽的表現)の原動力となる。音楽的フレーズ(まとまり)の長さは、人間の呼吸のペースと深く関係しているので、楽器演奏経験のない打込み音楽の初心者が作曲したDTMフレーズは息苦しさを与える。音楽家同士、あるいは聴衆との生理的時間の共鳴は音楽的グルーヴ(ノリ)を生み出す。

最終的に脳で音楽を聞く人間には、物理的でも生理的でもない、知覚認知された音楽に対する「心理的時間」も存在する。音楽理論(楽典、対位法、管弦楽法など)の一つ、和声法における歴史的経験則の基礎にあるのは、直前の和音から現在の和音への推移を知覚した結果としての情動を生む「短期記憶」だけでなく、もう少し長い(数秒-十数秒程度)過去の和声進行との照合から事後的な解釈・解決を知覚した結果としての情動を生む「中期記憶」も関与する。さらにこの両者は将来の和声進行を無意識下に予想・期待させ、実際にその通りに推移した安堵感や裏切られた違和感がさらに高度な音楽的情感を生み出す。そして音楽に関する後天的知識との照合・追加には「長期記憶」も関与する。認知心理学/人工知能の研究により定説となった時間的な記憶の階層構造は、感性工学において「感情を持つコンピュータ」のためのモデルとなっている。

時間の逆転と停止

音楽は聴取する時間とともに流れ、記憶から消え去り行く。時間は可逆でないからこそ音楽が成立するが、楽譜の音符を最後から最初に向かって演奏する「逆行カノン」(BachやMozart作と言われる)以来、アナログ的なテープの逆回しからディジタル的なサンブリングデータの反転読出しまで、音楽において時間を逆転させようとする試みの歴史は長い。

単純な時間反転(ビデオの逆回しと同じ)は聴覚的に違和感が(敢えてその効果を狙う場合も)あるが、グラニュラサンブリング[16]の手法により聴覚的に知覚できない粒度に音響信号を細分化し、その時間的配置分布をライブ制御することにより、「瞬間瞬間のサウンドは時間方向に流れている」のに「音楽は時間的に逆行している」と感じられる音楽音響を生成することも可能になった。この技術を使えば、例えば「さしすせそ」と普通に喋っている「し」の音響だけが永遠に鳴り続く「静止状態なのに音響が持続」(あるいはピッチがそのままでの音響スローモーション)も簡単に実現できる。

コンピュータ音楽の世界でここ10年ほどのトレンドは、歴史に培われた音響個性と表現力を持った伝統楽器(クラシック楽器や民族楽器)が演奏家によってライブ演奏され、その音響をリアルタイムにコンピュータに取り込んで信号処理し、その空間的音響出力と楽器演奏家とで競演・共演する、という形態である。もっとも単純にはエコーやリバーブや各種エフェクトを付加するが、リアルタイムにハーモナイズ(自分の単音演奏の音響を和音化)したり、フレーズサンプリングされた「自分のちょっとだけ過去の演奏」との即興ライブセッションは、コンピュータによって拡張された時間体験(タイムマシン)という新しい音楽の可能性を示している[17]。

時間の散在と同時性

音楽において、時間とは単一の時間が粛々と流れているとは限らない。ポリフォニー音楽では異なったメロディー(異なった起点を持つ)が時間的に共存して絡み合い、さらにポリリズムの音楽では異なったリズム/ビートが共存する。巨大スタジアムのフィールドでの祝典ブラスバンドのマーチング演奏では、指揮者に届く音響は音速の限界によって音楽的に破綻するほど遅延による「ずれ」が生じるため、「主指揮者を見てそのブロックを指揮する副指揮者」がフィールドの各所に立つ必要がある。

インターネットの時代となり、地球上の各地に散在する複数の演奏家がネットワークを経由して音楽セッションを行う時代となり、1秒間に地球を7回り半しか出来ない電気信号の速度(光速)という物理的限界が表面化した。人間は衛星中継の映像と音声のずれを脳の働きで「ほぼ同時」に修正できるが、相手の演奏音響が届くまで相手のやっている事が分からない(反応できない)ネットワークセッションにおいては、「同時性」がまったく担保されない。音楽的に許容できないレイテンシ(遅延)がある事を正面から受けて、常に「相手の足跡を見て」「相手に自分の足跡を渡す」ことでセッションするという、音楽そのものの概念を変更するアイデアも生まれた[17]。  

コンピュータの動作そのものが、基本的にシーケンシャルな処理の時間的連結であり、いかに並列化しようが高速化しようが、本質的には必ず遅延が存在する。そのコンピュータ音楽において、モデルとしての「予測(期待)」と、音楽演奏における生体情報(筋電情報)が注目されている。この両者に共通するのは「ちょっと先の時間」の追求である。音楽即興セッションシステム内の予測モデルは、現在の音楽演奏が未来にどう進展するかを刻々と確率付きで推測し、人間の演奏家のアクションに反応して予測状況を変化させていく。演奏者が働きかける各種のセンサ情報(パッド、加速度、ジャイロ、画像認識、鍵盤など)を受け取ってから発音する電子楽器システムにレイテンシは不可避だが、アクションを引き起こす筋肉への脳神経からの指令(筋電信号)は、必ず数十ミリ秒ほど筋肉の収縮に先行するので、これをセンシングする筋電楽器には、「アクションが起きる前に(予測して)反応できる楽器」という可能性がある[19-20]。オーケストラの指揮者とのアイコンタクトにより、未来に同時に音響が鳴るのに先駆けてそれぞれの演奏者は「ちょっと前に」動きを開始しているのと同じことである。

音楽の時間学

ここまで筆者が実際に触れてきた範囲で、コンピュータ音楽の視点から「時間」をキーワードにいくつかのトピックを紹介した。哲学的あるいは生物学的な時間学研究に比べて、音楽感性や心理学の領域を避けた物理学的な範囲でも、音楽の時間学というのはいろいろな研究ターゲットがまだまだ手つかず、という印象がある。そして「感性→認識→哲学」という繋がり、あるいは「知覚→生理学→生物学」という繋がりを考えてみると、相互に役立つ時間の本質がどこかに潜んでいるようにも思える。今後もいろいろと考えていきたい。

References