セッティング情報>オーディオ>音と音楽のページ-音と音楽、オーディオ機器の関係について考える-

音と音楽のページ-音と音楽、オーディオ機器の関係について考える-

ステップ(2)感性について考える

自然な音を目指そう

私達が聞いている音

私達が感じている「現実」とは、「五感」と呼ばれる五つの感覚器官から送られてきた情報を脳が再構成して作りだした「イメージ」だということをご存じでしょうか?
 感覚器官が捉えた情報は、すべて電気信号(インパルス)に変換され神経を通じ脳に送られています。そのインパルスを様々な方法で処理し、脳が作りだす「イメージ」こそ私達の感じている「現実」なのです。
 私達が聞いている音もまったく同じで、耳に届いた物理的な空気の振動から脳が作りだした「音というイメージ」を「音」として感じています。例えば、夢の中でも「音」が聞こえることがありますが、それこそ私達の感じている音が「脳が作りだしているイメージ」だという証拠なのです。
 夢で聞く音は、鼓膜が受けた音波とはまったく無関係に作りだされていました。目覚めているときには、当然「鼓膜が捉えた音波」から「音」は作りだされているのですが、体調やその他の要因で、まったく同一の音が常に同じ音として作りだされるとは限らないのです。またその「聞こえている音」の個人差も非常に大きいですから、友人と「音談義」に花を咲かせるときには、この点をくれぐれも忘れないでください。「あなたが聞いている音」と「友人が聞いている音」は同じではないのです。それを知らずに「同じ音波は誰にでも同じに聞こえているはず」と誤解すると、聞こえる、聞こえないの押し問答がいつしか言い争い発展するかもしれません。
 また、「音を聞くときに自分の記憶や望む音」にどれだけ近いかと身構えて聞くのも、音を素直に聞けなくする大きな原因(心因)となりますから御注意ください。もしかすると、頭の中の音がいつも現実の音よりもいい音に聞こえるのは、無意識に自分の好みに美化されているからかもしれません。これから「音」について考えるときには、「物理的な音波」と私達が聞いている「音」が違っていることを忘れないでください。

私達はすべての音を聴いているのではない

「鼓膜に届いた音波」と「脳が生み出す音」が違っているといっても、もちろんでたらめにまったく違う音を作りだしているのではありません。当然、五感から送られてくる情報は、イメージを作りだすために重要です。しかし、私達の五感から送られてくる情報は莫大すぎて、瞬時に処理するためには脳の生体反応のスピードが追いつきません。そこで、脳はその中から必要な情報だけを取り出して利用しているのです。
 もし、送られる情報の一部だけを利用しているだけなら、私達の「聞いている音」と「鼓膜に届いている音波」の間に大きな違いが生じることは考えられません、しかし、脳は情報を選択すると同時に、イメージを作りだすために欠落している情報を他の感覚器官からの信号を利用して補ったり、それまでの経験(記憶)から補ったりしています。そのため、その複雑な生体プロセスの過程で音が変化してしまうのです。
 私達の脳は、生存競争に勝ち残るため、「感覚器官からの情報」の中から、「自分が生き延びるために必要な部分」を最短かつ最優先に取り出せるように進化しています。
  実際に、「私達が生存」するために欠かせない情報である、家族や、親しい友達、大好きな異性の声は、他の音よりも遙かに優先的に聞こえることが医学的にも証明されています。
 もちろん、それ以外の「食糧の確保」・「自己防衛」・「繁殖」など、やはり生存に最優先な「情報」を即座に取り出せるように、私達の「耳」は実に巧みに、そして抜群の精度と速度で「必要な音」を選び出しているのです。
 「耳の感度」は、レンズのズームやフォーカスを合わすように、常に調整されています。そして、その「対象」は、その「耳」が置かれている、「その時の環境=物理的要因」や「それまでの経験など=心理的要因」により、大きく左右されているのです。これらの、様々な事柄より、「私達に聞こえる音=私達の耳」には、大きな個人差(個体差)が生じます。
  同じ異性でも「その時に興味がある異性の声が優先的に聞こえる」という経験は、思春期を経た大人ならだいたい誰でも思い当たるはずです。つまり、聞き手が同一人物であってもその時に何を求めているかで、聞こえる音が変わってしまうのです。極端な話、空腹時と満腹時でも音の聞こえ方は変わってしまうかも知れませんし、センチメンタルな気分の時と、快活な気分の時では、明らかに聞こえることは変わってしまうでしょう。
 つまり、音波が鼓膜に届いてから「必要な情報=必要な音」を選ぶ段階で、どのような取捨選択がなされるかにより聞こえる音が変わるのです。
 このように、物理的あるいは心因的な要因によって、私達に「聞き取れる音=聞こえる音」は、刻一刻と変化しているということを忘れないでください。私達の「耳」は、脳がその「フォーカス」を絞ることで、測定器が捉えられない些細な音の変化を関知することもできる反面、実に自己中心的で曖昧な聞き方しかできないこともまた事実なのです。

パターン認識に注目しよう

では、「耳の感度」を調整するための「音の取捨選択」はいったいどのようにおこなわれているのでしょう?脳内で音を分析する時に、最も重要なのは「速度」と「精度」の向上です。もし、どんなに音を細かく聞き分けることができても、その分析に数秒もかかるようでは、私達の生命はたちまち危険にさらされるはずですし、時間がかかりすぎるようでは、音によって獲物の距離や方向を知りそれを捕らえることができないでしょう。
 高速で音やその他の感覚器官から送られてくる情報の分析をおこなうためには、何らかの方法で「情報を減じ=取捨選択」しなければ、速度が追いつかないのは先程述べたとおりです。しかし、重要な情報を減らしてしまえば、精度が下がってしまいます。この難しい問題を両立させるために、私達の脳は次のような素晴らしいシステムを獲得しました。
 人間の脳細胞は、ちょうど世界中に張り巡らされたインターネットのように、複数の神経細胞が関連を持ちながら網の目のように繋がっています。感覚器官からのインパルスを受けると、脳はその「インパルスの特徴を鍵」に、インターネットのサーチ・エンジンのように、非常に高速な曖昧検索を行って「一致するインパルスの情報」あるいは「類似するインパルスの情報」を引き出します。
 この働きは「パターン認識」と呼ばれていますが、この人間の認識システムがコンピューターよりも遙かに優れているため、単純計算ではコンピューターに及ぶべくもない脳の演算能力でも、動的な分析能力、あるいは曖昧検索能力などは、逆にコンピューターが遙かに及ばない速度と精度を達成しているのです。
 この「パターンによる認識」を行う場合には、まず刺激(情報)の一部を取り出して比較しやすいような形に「簡略化=パターン化」を行う必要があります。
 この「簡略化」の方法が上手く、効率的であればあるほど「少ない情報から、正確で高速な認識」を行うことが可能となります。また、この「簡略化」の方法は、脳の限られた能力を考えると五感それぞれにまったく違うプロセスを用意するのではなく、「単純ないくつかのプロセスが共通されている」と考える方が理にかなっています。さらに、五感から得られるインパルスをそれぞれ個別に利用するのではなく、相互の情報を関連付けることで分析精度と速度は飛躍的に高まるはずなのです。
 もちろん、聴覚による音の分析も、このパターン認識システムによっておこなわれていると考えられます。私達は、左右の鼓膜に届く音波を「簡略化=パターン化」し、比較、補完、修正しながら、「音のイメージ」を組み立てているに違いありません。そうでないと、あれほど色々な音が複雑に入り交じった自然の音の中から、瞬時に特定の楽器の音やその位置などを把握する説明がつきません。
 この、聴覚による「音波のパターン化」の方法を探り、私達が必要とする「音波の特徴」を知ることができれば、オーディオ再生に「必要な音」と「不必要な音」を把握でき、これを逆利用することで無駄なく私達の「耳」を騙し、オーディオの再生音を生演奏のように聞かせてやることができるはずなのです。

自然界の音はクォリティーが低い

話は少し変わりますが、自然界に存在する「音」とは、オーディオ的にみれば「色々な音が混じり合った非常に純度が低い音」です。例えば、駅の雑踏で家族や恋人と会話をするときの、S/N比(聴きたい音と雑音の比率)たるや考えるまでもなく、非常にひどいものです。
 コンサート会場で聴く音楽も例外ではなく、観客が立てる物音などのノイズが多く、スタジオ録音された演奏とは比べものにならないくらい楽音自体の純度は低いのです。
 そういう純度の低い音をいつも聞いている私達は「音の純度が低い」ことを「不自然」だとは感じません。逆に、「音の純度が高い音」こそ不自然(特別な音)と感じているのです。
   「定位」や「音の純度」を極端に気にするオーディオマニアの音の聞き方は、「不自然を追究している」という意味で非常に偏っています。そういう聞き方では、「音楽の善し悪し」は判定できないと断言しても良いほどです。
 音楽を収録する場合にも音の純度を上げようとして「ひとつの楽器にひとつのマイク」というようにマイクの数を増やしても、不自然さが増すだけで良い音楽は録音できません。なぜなら、直接音はクリアーになっても、再生時にいくつものマイクの音像が重なって、反射音(間接音)は逆に濁り音場が損なわれてしまうからです。
 一番大切なのは「元あった音の関係=私達が必要とする音波のパターン」を損なわないことです。そうすれば、一見楽器の音が入り交じり、濁っているように聞こえても、その濁りの中から私達は「真実(特徴的な音波のパターン)」を見いだすことができるのです。そう、まさに「雑踏」の中から「恋人の声だけを聴きとれる」のと同じように。

ヒントは人間の生体反応

では、「元あった音の関係(特徴的な音波のパターン)を損なわない」ためには、どのようにすればよいのでしょう?そのためには、先ほどお話しした脳がおこなっている「パターン化の鍵がどのようなものなのか?」を知ることが大切です。
 つまり、聴覚がどのような音の特徴を「鍵」として音波を簡略化し「認識しやすいパターンに変換」しているのかを調べ、そこから逆にいったいどのような「音の改変が必要な音のパターンを損ねるのか?」を探ればよいのです。
 しっかり「人間の生体反応」から学び、「生体反応に沿った音(人間にとって無理のない自然な音)」を設計(発生)してやるのが、人間にとっての良い音を出す一番の近道のはずなのです。
 極論を述べるなら、ステレオから再現される音は、必ずしも「測定データ的に完全(フラット)」であったり「純度が高かったり」する必要はありません。その「音の特徴=パターン」さえ「近似に保存」されていれば、あなたの優秀な脳が、「欠落したパターン=不足する情報」は補ってくれるのです。
 「だまし絵」などを見ると、私達は思いこみから「無いものがそこに存在する」ような錯覚をおこしますが、「耳」も同じように、「存在しない音が聞こえる」錯聴を起こすことが知られています。ステレオの音が、錯聴を起こすほど上手く私達の耳をだませたなら、「聞こえない音」は脳が作りだし欠落した情報は補われ、リスニングルームはライブコンサートホールへと変貌するのです。そして、録音の古いソフトからも、音の悪さを意識させずにとても豊かな音楽を取り出すことができるのです。

音の純度の向上よりも、不自然な音を出さないことが大切

逆に、音質のクォリティーがどれほど高くても、僅かな違和感が見いだされるだけで、脳は瞬時に「音のパターンが不自然=偽物」と判断し、音が電気的(人工的)に聞こえたり、硬く感じられたりして、リスナーは音楽的快感にのめり込むことができなくなってしまうのです。
 圧倒的な音質クォリティーを持つSACDやCDソフトの音楽性が、未だにレコードに敵わないといわれることがあるのは、それを証明する一つの良い例ではないかと思うのです。  つまり、再現されるすべての音が適切なバランスで、不適切な強調感さえなければ、クォリティーは殺がれていても、人間は十分に音楽を楽しむことができるのです。
 音楽を楽しむなら、音の悪いラジカセでも十分だと断言する音楽家がいるくらいなのです。それは例え音が悪くても、「音や演奏の特徴」さえつかめれば、「演奏者の気配」を十分に感じとることができるからだと思います。
 音質の劣化が問題なのではなくて、「音の特徴(パターン)の劣化(改変)」が問題なのです。人間にとって不自然ではない音質クォリティーの劣化は、音楽に決定的なダメージを与えません。良い音楽を楽しもうとするなら、音の純度を向上させることよりも、音を不自然に強調(改変)しないことを心がけてください。

クォリティー信仰に潜む危険性

ステレオの音に関して鷹揚な音楽家が数多いのに対し、ほとんどのオーディオマニアは、逆に、「音を良くすること=それまでに聞き取れなかった細かい音でも再現できること」が音楽的に良いシステムだと考えています。しかし、実はこのクォリティー信仰こそ、「いつまで経っても満足(安心)して音楽を聴くことができない」という、オーディオマニアが抱えている問題の根本的な大原因なのです。
 例えば、オーディオの音質を「地面」に例えてみましょう。土や砂の粒子の細かさが音の細やかさ、地面のでこぼこが音の歪みと考えてください。つまり、まったく問題のない完全な音質とは、「目に見えないほど細かい粒子で構成された鏡のように平らな地面」だということになります。この最高のクォリティーを目指し、あなたは荒野を開拓します。まず、音を自然にするために、でこぼこをならし、異物(問題点)である大きな石ころを拾うことにしましょう。まったく手の加えられていない最初の地面と比べれば、ずいぶんと整地された綺麗な地面になるはずです。
 大きな石ころ(大きな問題)が無くなったことで、大きな石(大きな問題点)を取り除くまでは気づかなかった小さな石(小さな問題点)が、平面性を損ねる問題として気になり始めます。そこで、さらに小さな問題を取り除き一段と整地を進めましょう。そうすると、地面はだんだん最初の目的である「鏡のように綺麗で平らな地面」になって行くはずです。
 気の遠くなるような努力を重ねて、音質が向上した結果、システムの問題点は完全に無くなり、あなたの土地はガラスのようにピカピカに磨き上げられた状態になりました。もし、そこに、「小さな砂粒」がすこし落ちていたらどうでしょう?その状態では「どんなに小さなでこぼこでさえ即座に発見」できるはずです。つまり、最初は、まったく問題にならなかったほどの小さなでこぼこ(小さな問題点)が、音質が向上すると遙かに大きな問題になってしまうのです。
 さらに困ったことに私達の身勝手な「耳」は、小さな砂粒が落ちている(すこしの不調和で音が不自然に聞こえる)ことを見つけるのはとても上手なのに、その「砂粒がどこに落ちているのか?」を見つけるのがとても下手なのです。
 もうおわかりでしょう。音質を向上させれば向上させるほど、音は些細なことが原因ですぐにバランスを崩し、不自然になってしまう反面、原因が些細になればなるほどその原因が見つかりにくくなるのです。このパラドックスに気づかないと、一生懸命音質を向上させているつもりでも、音楽性はちっとも向上しないばかりか、お金をかければかけるほど、安心して音楽を楽しむことのできない、神経質なシステムになってしまうのです。
 「豊かな音楽を感じさせてくれる良い音」とは、細かい音が沢山聞こえることでも、楽器の音が生々しく聞こえることでも、ヴォーカルの唇が濡れて感じられることでもありません。それらはすべて結果であって、目的ではないのです。クォリティー信仰にとらわれて、本末転倒をおこせばあなたのステレオは、音楽性の欠片もない、ただの玩具になってしまいます。音質がある程度のクォリティーに達したら、そこからは音質よりもバランスの向上を目指すことが「良質な音楽を楽しむ」ための秘訣なのです。


視覚と聴覚の関連

聴覚モデルを視覚モデルに変換できないか?

聴覚は音波の「特徴」を見いだし、「パターンに変換」して聞いているという説明をしてきました。また、それぞれの感覚器官の「パターン確定のプロセス」には、なんらかの共通点があるのではないかと推測しました。  そこで、感覚器官の数(目も耳も二つ)や波動を捉えるという性質が似ている「聴覚」と「視覚」には、パターン確定(情報処理)のプロセスに何らかの類似点があるのではないだろうかと考えました。もし、同じようなやり方で「情報の特徴」を捉えているなら、聴覚の「認識の癖」を、「画像の見え方の癖」と対比させることができるかも知れません。では、まず最初にそのパターンを抽出するための「鍵」から探りましょう。

大きさという「鍵」

     

耳も目も片方を塞ぐことで立体感が損なわれることから、立体感(前後感)を得るためには「左右の器官の情報」を「比較」するプロセスが必要であることは容易に理解できます。しかし、上の二つの画像をご覧下さい。左の画像では、自転車が寄りかかっている木は近く、背後の林の木は遠くに見え、自転車はこちらを向いています。右の画像では、鉛筆は左側に行くほど奥まって見えます。もちろん、この画像は平面ですから片目で見ても両目で見ても「立体感のイメージ」に大きな変化はありません。
 つまり、私達は「平面」の「写真」も「擬似的な立体」として見ることができるわけです。
 擬似的な立体視が可能なのは、「失われた遠近の情報を補うための補完プロセス」が存在するからです。この画像の場合には、自転車の前輪と後輪、手前の木と林の木、手前の鉛筆と後ろの鉛筆の「大きさ」を「鍵」として利用することで失われた「前後感=立体イメージ」を補っていると考えられます。その「鍵」は、「遠くなるほど物は小さく見える」という過去の経験(蓄積された記憶)から引き出されたに違いありません。

明瞭度という「鍵」

     

もう一度、適当な画像を例にあげ、今度は「輪郭の明瞭度」と「遠近感」の関係を探りましょう。
 左の絵は平面に見えますが、右のように外側の線をぼかすと前後感が生じ、ハッキリしているものが手前に、ぼんやりしているものが後ろに見え「立体的」に感じるようになります。この画像から、「明瞭度」も「遠近感」の「鍵」として使われていることがわかります。

視覚と聴覚、共通の鍵

この二つの例から視覚では、「大きさ」と「明瞭度」が「遠近感を補うための鍵」として使われていることがわかりました。では、視覚と聴覚の間でこれらの「鍵」に共通性はないのでしょうか?
 説明するまでもなく音の距離を判断するときに「音量」は大切な「鍵」のひとつとして使われています。そこで、ちょっと目を閉じて、回りの音に耳を凝らしてください。目を閉じるのは、そうすることで「視覚」の影響が遮断され、より音による「距離の判定」の比重が高くなるからです。どうでしょう?ハッキリした音が近くに感じられませんか?
 CDのソフトでは、交響曲のトライアングルやJAZZのシンバルなどが近く感じられるはずです。レコーディング時にも、2・4・8KHz付近をイコライザーで持ち上げれば、ボーカルやベースの音などが前に出てくるように変化します。
 自然の音では、コオロギの鳴き声などのような、「ハッキリした音」が、他の音より「近く」に聞こえたり「大きく感じられたり」するのはよくあることです。このように、視覚と聴覚の遠近感を補助するプロセスには、「大きさ」と「明瞭度」という「鍵」が共通に用いられていることがわかりました。

輪郭の明瞭度が遠近感に与える影響

     

今度はもう少し複雑な画像を使って、「明瞭度」が「遠近感」に与える影響を調べてみましょう。  左の写真の輪郭の明瞭度を強調すると右のようになります。自転車の後ろの新聞の文字が、ひとつひとつハッキリと見える反面、「奥行き感」が損なわれています。さらに細かく左右の絵を見比べれば、一見ハッキリ見える右の画像が左の画像よりも「不自然」に感じられ、注視すると目に違和感や疲れを覚えます。つまり、細かい部分がよく見えるようになるからと、輪郭の明瞭度(ハッキリ感)を強調しすぎると、全体のバランスが崩れかえって不自然になってしまうのです。
 遠近感を補うための「鍵」が共通しているのですから、音にも同じことが当てはまるかどうかを考えましょう。では、画像の見え方と音の聞こえ方を対比させましょう。自転車をヴォーカル、新聞を伴奏のベースだと想像してください。もし、4/8KHz付近の高音を持ち上げて「倍音の隈取り感=明瞭度」を強調すれば、新聞の文字がクッキリするように、ベースの音が前に出てハッキリと聞き取りやすくなる反面、自転車との自然な前後関係(前後方向の広がり)に乱れが生じ、ヴォーカルとベースのハーモニー感や一体感が損なわれるのは、視覚のモデルと同様なのです。
 それを画像に置き換えてみると瞬時に理解できるはずです。少し、強引な比喩に感じられるかも知れませんが、画像を見たときに感じるのと同じことが、音の場合にもほとんどそのまま当てはまるのを、経験を積めば徐々に理解できるようになるはずです。  JAZZは会話とよく言われます。例えは良くないかも知れませんが、漫才には必ず「ボケ役」と「ツッコミ役」がいて、二人は「噛まない」ように気をつけながら漫談をすすめてゆくことをご存じでしょう。
 しかし、もし2人が「間」を取らずに、同時に同じ調子でしゃべり出したら?とても会話など成立せず、二人の言葉が別個に聞こえて、ただうるさくなるだけでしょう。テンポが良くお洒落な会話は、話し手と聞き手、つまり、「ボケ役」と「ツッコミ役」が、交互にキャッチボールをするように言葉を投げ合って、タイミング良く会話を進めることで成立しているのです。
 JAZZの演奏でも、各々の楽器奏者が楽音でキャッチボールをするように、パートを入れ替えながらテンポ良く演奏を進めてゆくことで、躍動感やスピード感、リズム感が生まれています。「ツッコミ役」は楽音のアタックを明確にして自分の存在をしっかりと主張し、「ボケ役」に回った奏者は、「ツッコミ役=主役」を邪魔しないように音量やアタックを控えめにして「ボケ役=脇役」に徹するのです。もしこの「ボケ役」の音が、ハッキリしすぎていると、主役の音と「噛んで」しまい、音楽のスムースな流れや、運動(躍動感)が乱れてしまうのです。
 JAZZをもっぱらステレオで聴くのが好きな人が起こしがちな失敗が、上の画像を強調しすぎた時の感じととまったく同じなのです。すべての楽器をハッキリ聞きたい、あるいは特定の楽器の音がハッキリ聞こえる音が良いと判断するのは間違いです。
 JAZZ向きと珍重されるスピーカーで、このような輪郭の強調(色付け)がなされている場合が多く、強調効果で録音されたときよりも音が前に出るようにハッキリと聞こえる反面、細かいニュアンスが消えたり、演奏が雑に感じられてしまという問題が生じます。演奏における良質なスピード感もスポーツのそれと同じで、激ければ激しいほどその中心は静かに醒めているものです。決して、やたら騒々しい酒席のどんちゃん騒ぎのような音楽ではありません。

すべての「鍵」は、自然界にある

聴覚のパターン認識システムに話を戻しましょう。雷鳴は近いと「バリバリ」とハッキリした音で聞こえますが、遠ざかると、「ゴロゴロ」と鈍い音に変わってゆきます。これは、音が空気中を伝わるときに、空気の弾力性などの影響で高音の鋭さや音量が距離に応じて失われるのに対し、低音は高音ほど減衰しないため、音源から離れれば離れるほど、高域のエネルギーが先に減少し、音が低く鈍くなるためです。この自然の物理法則は、「ハッキリした音が近く、鈍い音は遠くに聞こえる」という、私達の感覚と実に良くマッチします。
 このように私達は、実に巧みに「自然界の物理現象」の中から「有効な鍵」を見いだし、それを利用することで「失われた情報を補完」し、不完全な情報をより完全な情報へと修正しているのです。私達の感覚は「トレーニングする」ことで鋭敏になることがよく知られていますが、それはトレーニングという経験を積み重ねることによって、「自然法則から導き出された鍵」の数が増え判断のスピードと精度が向上するからなのです。
 しかし、この判断や修正が誤っておこなわれると、私達はいとも簡単に「錯覚」をおこしてしまいます。例えば、ステレオ再生で音が左右だけでなく、上下に広がって聞こえるのは、明らかな錯聴のひとつです。耳を凝らしてみてください。低い音が連続しながら高い音に変わると、音が下から上に上がって行くように聞こえるはずです。決して、「低い音が上から下がってくる」ように聞こえたりはしません。これは、私達が「低い音は下」に「高い音は上」から聞こえると、無意識に思いこんだ結果、移動していない音が上下に移動して聞こえる「錯覚」だったのです。このような「自然に私達が錯覚を起こすような音」こそ、音楽を聴くために「良い音」であることに間違いありません。

輪郭の明瞭度と情報の判別

画像の輪郭を強調する実験から、輪郭は大切な「鍵のひとつ」として、遠近感の補助に使われていることがわかりました。しかし、今度は逆に「ひとつの鍵」が複数の情報の補助に使われていないか考えてみましょう。
 先ほどの、「楕円と三角と直線」の組合せを思い出してください。何のことかわかりますか?明瞭度の鍵のところで使った「顔の絵」のことです。この「顔の絵」には、輪郭以外の情報はほとんど含まれていないにもかかわらず、私達はその線の集まりを「顔」と認識していたのです。
 これは、私達が情報の識別に輪郭を重要な鍵として使っているためなのです。ものを識別するとき私達は、まず輪郭を抽出して簡単なパターンに変換し、一致する情報を探すというプロセスを主体とした認識を行っています。輪郭の情報しか持たない新聞の4コマ漫画などが、きちんとした現実感を伴って感じられるのが良い例です。
 抽出された輪郭だけから、私達は容易に「それが何であるか」を識別します。もし、視覚と同じように聴覚も「音の輪郭情報」を「音の認識の重要な鍵」として用いているとすればどうでしょう?きっと音の輪郭の鮮度が損なわれれば、音のきめ細やかさ(識別感)も大きく損なわれるのではないでしょうか?
 そこで、先ほどお話しした画像の見え方と音の聞こえ方に共通性が成立するものとして、輪郭を2重にしたり、ダブらせたり、ぼかしたりと、様々に変化させて私達は何をどのように感じるのか調べてみましょう。

左上の画像の情報を乱したのが、他の3枚の画像です。前後関係の認識に重要な輪郭の明瞭度が損なわれるため、立体感が欠如するのは今までの説明で理解できます。
 まず、右上の画像から調べてみましょう。「輪郭をぼやけさせる」と画像が識別しづらくなり、前後感も曖昧になりますが、自転車と新聞らしいことや自転車と新聞の前後関係は、概ね損なわれずに感じられます。つまり、「明瞭度が平均(分散)して低下」する場合は、画像の識別には致命的な影響は与えないと考えて良いと思います。
 逆に明瞭度が低下(ソフトフォーカス化)したことによって、画像に「ある種の艶」が演出されているようにも感じられます。これは情報が欠落したことによって、「脳が補完する情報の割合」が増え、「見えない部分がより実物より理想的に(美しく)補われた結果である」と考えられるのではないでしょうか?
 はっきりと描かれたヌードより、部分的にぼかされたヌードの方がより色っぽく見えるのと、ハッキリ聞こえる音よりも、やや曖昧さを持った音の方が音楽的には色っぽく(艶っぽく)聞こえるのは同じ理由によると思われます。具体的な例としては、クラシック向きと呼ばれるスピーカーや真空管アンプにこのような傾向が見られ、その音の曖昧さが嫌な音が出ない、音が艶っぽいなどの理由で好まれることがあるのだと思います。
 続いて下段の2枚の画像を分析してみましょう。左下の画像では、自転車と新聞の識別はかろうじて可能ですが、右下の画像では、識別が危うくなっています。もちろん、どちらの画像も「輪郭情報」が損なわれたので、識別に支障をきたすのは当然なのですが、その損なわれかた(支障のきたし方)が左右の画像で違っています。
 左下の画像は、輪郭が多重になることによって輪郭情報が乱されています。この乱れを音に当てはめると「スピーカーからリスナーに音が届くときに、スピーカーの至近距離で強い反射音が生じその影響を受けている」時に相当します。つまりスピーカーの直近に大きな平面の反射物を置くと、このような状態が引き起こされます。スピーカーの近くの大きな平面とは、「床」・「天井」・「壁」「オーディオラック」・「テレビのブラウン管」などが当てはまります。後述しますが、これらの「平面に吸音処置」を講じると、それらの悪影響が低減され、音は再び左上の画像のように明瞭かつ自然な奥行き感を持って再現されるようになるのです。
 最後に、右下の画像ですが、これは輪郭が文字通りバラバラになることで情報が乱れています。この乱れをスピーカーから出る音に当てはめると、出た音が反射して生じる問題よりも「外来のノイズの影響」の影響で音が濁っている状況が相当すると考えられます。例えば「蛍光灯」・「パソコンやエアコンのファンノイズ」・「薄い壁や床の分割共振によって発生する高次の倍音」などの、鋭いパルス性のノイズを発生するものがスピーカーのそばにあるとこのような問題が生じるのです。ステレオを聞くときには、蛍光灯やエアコンのスイッチを切ってみてください。あなたが考えるよりもずっと、音質は大きく改善されるはずです。
 少し強引なこじつけに感じられる部分があったかも知れませんが、このように「画像モデル」を「音の聞こえ方」に当てはめて考えることで、見えないはずの音を目で見るようにシミュレーションすることができるはずです。もし、スピーカーやオーディオルームの環境を見渡して、音を悪くするような原因が「見えた」なら、改善を試みてください。きっと、上手く行くと思います。

音の輪郭とは?

では、音の距離感や解像度(聞き取りやすさ)に大きな影響を与えている「音の輪郭」とは、いったいどのようなものなのでしょう?ウェーバー・フェフィナーの法則をご存じでしょうか?私達の感じる刺激の強さは、刺激量の対数に比例するのです。
 つまり、私達には緩やかに大きくなる刺激よりも、急激に大きくなる刺激がより強く感じられるので、鼓膜を緩やかに動かす「振幅の大きな音波」よりも、瞬時に鼓膜を鋭く動かす「パルス性の鋭い音波」がより強い刺激と感じられるはずですから、この「強い刺激を与える音波」が「音の輪郭」だと考えて間違いはないでしょう。
 しかし、一般的には鼓膜に瞬間的な強い刺激を与える音波とは「高い周波数の音波である」と誤解されがちです。それは正しいようで実は少し違うのです。聴覚器官は、決して音を連続に捉えているのではありません。私達の聴覚は、約1/1000秒程度の間隔で、鼓膜の受けた音波を周波数別の圧力として電気信号(インパルス)に変換しています。
 つまり、高い周波数の音が連続して繰り返されるよりも、むしろ周波数が低くても瞬間的に音が大きくなる、つまり圧力の高い音波(鋭い音)が、神経により強いインパルスを発生させ、「一瞬で圧力が上がる音波=パルス性の音波」を音の輪郭成分と感じるはずなのです。
 この考えが正しいとすれば、聴覚が音波を分析するために必要な「音波のパターンを保持する」ためには、「高い周波数を連続して発生できる」ということよりも、「瞬時に圧力の高い音波を発生できる」という仕組みが大切であることがわかります。
 重要なのは、鼓膜に音波が届くタイミングと圧力の関係を損なわないことなのです。しかし、従来のスピーカーの高音発生装置(ツィーター)は薄い膜が使われているため瞬時に空気を強く圧縮できず、音の鋭さ(空気の圧力)を損なったり、音が遅れたりしています。それが、「音の生々しさを失う」大きな原因となっているはずなのです。

楽器から高音が発生する仕組み

ここで、楽器から高い音が出る仕組みと、スピーカーから高い音が出る仕組みを比較してみたいと思います。まず、トライアングルを例にあげましょう。
 トライアングルは金属が高速で振動していますが、この振動はスピーカーのユニットのような「ピストン運動」ではなくて表面が波打つように震える「分割振動」という運動を行います。この高速で波打つ金属の表面に接している空気は急激に圧縮され、とても圧力の高い音波(パルス波)が発生します。
 対して、現在主流のスピーカーではどうでしょう?オーディオ技術者は、彼らが考える「音の鋭さ=周波数の高さ」を再現するために、「薄い膜をピストン運動させる方式のツィーター」を採用しています。しかし、この方法では振動体の強度と速度が不足し、楽器のような「パルス性を帯びた圧力の高い音波」を発生させることは物理的に不可能です。トライアングルを始めとしてバイオリンなど「高音を発する楽器」に薄い膜はないのです。
 従来のツィーターで音の輪郭が損なわれる(アタックが弱まり、音が緩くなってしまう)現象の確認は、楽器などで耳を良くトレーニングした後に、通常のスピーカーで再生される楽音を聞けばすぐにわかります。スピーカーから再生される楽音は、人間が聴いてだいたい4KHzないしは8KHz近辺に感じられる倍音の鋭さがすでに失われていることに気づくはずです。
 これは、4KHzないしは8KHz近辺の音波そのものが損なわれたのではなく、その音波に伴って発生していた「楽音の隈取り(アタック)」が失われてしまったからです。
 それは100KHzまでを再現できるという高性能なツィーターを付け加えても、根本的に改善されることがないばかりか、ツィーターを付け足すことによる「高域の強調感」が裏目に出て、逆に音質のバランスを損い、音が不自然になるだけなのです。
 結局、薄い膜をピストン運動させて音を出す従来型のツィーターでは、再生周波数の上限をいくら向上させても「圧力の高いパルス波」が必要なタイミングと圧力できちんと再現されないため、音質は一向に向上しません。逆に、ツィーターの膜を薄くすればするほど「パルス性を帯びた高い圧力の音波」を発生することが難しくなるのです。
 従来からあるツィーターで唯一可能性があるのは、高性能ホーン型ツィーターですが、取り扱いの難しさ、価格の高さ、そして何よりも指向性が強すぎるという大きな問題があり、汎用性が低く普及するには至りませんでした。

波動ツィーターの発明

これを補正すべく生み出されたのが[AIRBOW・CLT-1]です。このツィーターの仕組みを簡単に説明すると、バイオリンやシンバル、あるいはトライアングルから高音が発生する時と同じように、剛性の高い振動体(カーボンパネル)を高速で波打つように振動させ、従来の方式では再現できなかった「圧力の高い音波=音の輪郭情報」を発生し、ステレオの音を大幅に生の音に近づけることを可能とした画期的な製品で、僅か2年で400セットを完売するという大成功を収めました。
 この製品はその後改良を加えられ、[CLT-2]にモデルチェンジ、音質もさらに向上して販売がおこなわれています。2001年6月には、この波動ツィーターのAV用モデル[CLT-シアター]が発売されました。
 最近、もう一つこの高い圧力を生み出す可能性のある製品として村田製作所からセラミックを振動板に利用したツィーターが発売されました。しかし、音と人間の聴覚の関わりを科学的に考えて確実な理論と明確な目的に基づいて設計され、ツィーターの固有音を感じさせないように振動体に「カーボン」を採用している「CLT-2」や「CLT-シアター」と、セラミックに電気を流すと音が出ることをヒントにESセラミックの一つの使い道として、実験的に作られた「ES103」では、設計思想が根本的に違い音質にも大きな差があるようです。なぜなら、波動ツィーターの開発時に、セラミックの振動板は人間に不愉快な固有音を発生するという理由で、初期の段階で不採用になっていたのです。

CLT-2よりもさらに効果の高いツィーターが、空気を直接振動させることのできる、振動膜のない唯一のスピーカー、イオンツィータ「TS-5A」ですが、高価なことと、取り扱いがCLT-2よりも難しいことなどから、より上級者向きの製品として位置づけられています。
 この2機種以外のスーパーツィーターを使った場合に、「高域が伸びない」、あるいは「高域の音が変わってしまった」と感じられるケースが多いのは、「音波の圧力」と「周波数の高さ」を混同して設計されたことが原因だと思います。