2020年8月6日木曜日

人間音声の非音声学的要素

音声学 (phonetics) は基本的に言語学 (linguistics) と同カテゴリの学問である。
以下のような人間音声(肺、呼吸器、唇などを通すもの)を国際音声記号の記号化対象にする態度は無い:

・グロウル(デスグロウル death growl, いわゆるデスボイス)
・叫び声(シャウト以外の何か)
・唸り(うなり)声

その理由は、その特性から言語音声として弁別する言語は存在しないためである(2020年までに確認できる限り)。
しかし、これらの質の声で発生された音声に既存の言語の音素 (phoneme) の弁別的特徴が聴覚的に知覚される限りは、音響的にも力学的にも考察される。

今回、これらを音声学知識を混ぜながら、音響学の方面で考察してみたいと思う。



グロウル

グロウルは、私にとって歌唱という音楽的利用が主な場面として自明の理である。
まず、肺臓気流の音であり、肺や横隔膜の運動は根幹としてありえるであろう。

次に、声帯の振動を伴っていない無声音 (unvoiced) ではなかろうか。
無声で声門や咽頭や口蓋垂を摩擦音またはふるえ音として鳴らして感じてもらう。
声帯よりも口にかけての先にある声門や咽頭や口蓋垂のあたりが言語音声一般に見られない振動を伴っていると思う。
母音色のある(舌などによって母音の条件の満たされている)強い無声ふるえ音であろうか。
「ガテラル」(guttural) の系統についても、同様であると思う。

しかし、2017年10月投稿動画の説明文で私は有声音と推定していた:
喉の上方で「咽頭ふるえ音"Pharyngeal trill (Epiglottal trill)"」、喉の下方で「声門ふるえ音"Glottal trill"」を出すことが可能かもしれないので、いわゆるデスボイスのガテラル"Guttural (カナ表記はグットゥラル、ガタラル、ガタローなど)"は、調音器官に2種類があると言える。
更に言えば、この2種類は有声音"Voiced..."に属するかもしれない。
—『咽頭ふるえ音"Pharyngeal trill" かもしれないガテラルボイス "Guttural" グロウル"Growl"』on YouTube. 2017-10-27.

また、無声母音といえば、囁く声などでイメージしやすいものであるが、その方法で叫ぶように大声を出すことも試すとよい。
囁く無声母音と、叫ぶ無声母音とでは、後述のように声色が異なっている。
それはそうとして、これら無声母音は、いわゆる声道の長さ=発生する個人差によって基本ピッチから最高ピッチが変わるくらいで、声質に関しては認知的な性差に乏しい。
同じようにグロウルは、声質に関する認知的な性差に乏しいので、無声母音を発していると考えることができる。
ただし、有声音と無声音という認知的二項関係ではなく、音響的、力学的な微細な程度の差を見る方が説明しやすいかもしれない。
グロウル母音には、声の大きさ=入力の強さ(これも曖昧だが筋肉や肺の気流いずれにも関連するか)に随って声帯の振動が部分的にありうる。
肺臓気流が伴う限りは、0を欠いた対数的で声帯の振動の物理量が伴う。
音響的な計測をしない推論ではある。
グロウルであっても、子音は有声音と無声音の弁別がしやすい。
これは私が実演した音声データを配布したほうがよいかもしれない。

以上のように、実験の方法を尽くしていないので断定的な結論を持ってはいないが、私の想像の中ではグロウルの特徴が確固なものととなりつつある。
要約:母音として見る場合、無声音に近いが、歌唱において強く発せられやすいグロウルは有声音に似た響きが感じられ、実際に肺臓気流というものは言語的無声音も対数的に0ではない声帯の振動が伴うことで、僅かにでも有声音と知覚される可能性があるし、グロウルは一般的な声よりもその因子が強く存在しているようである、という仮説だけを立てて音声学の実験方法についてはここで行わない。

参考のスペクトログラム(グロウル、ガテラル)

備考:口笛 (whistling, mouth whistle) はグロウルの反対の特徴とでも考えたい。"if you…" (イフ・ユー [/ɪf.juː/] →イフュー [/ɪˈfjuː/]) という英語のフレーズは f /f/ が唇歯摩擦音 [f] で実現されるが、これを少し悪い方法で発音すると、口笛のような実現もありうる。口笛もグロウルも既存の言語音声に近い存在として考えることができる。



叫び声

叫び声は、通常その声量が大きいであろうが、たとえ他者にとって小さく聴こえる結果(録音したデータを小さく再生すること、または小さい音になるような遠くからの声)でも、聴いた人に危機感や警戒心を誘発する作用があることは、その音響的な声質に見出すことができる。
ある程度までの力や気流の量では通常、聴きとれるほどの音量を伴う振動が無い部分もいくらか振動するため、通常の聴きなれた言語音声の声色と異なったものになる、と私は仮定する。
つまり、同時に聴きとれるほどの音量で鳴らなくてよい部分が、それほどに鳴るということである。
いくらかそれが混ざったような音ではないか、ということである。
または、必ずしも優勢でない部分が主要な部分に近似する程度で大きく鳴っているという見解も私は持つ。
20世紀前半(物理学の予測がそうであるような時代で音声学も同様にまだ実験に有用な技術開発が進んでいないころ)並みの推論になるが、そう感じる。
なお、あまり正確さを離れるので、音楽でいう不協和音に譬えることを私は辞した。
参考のスペクトログラム(叫び声、女声、悲鳴、有名かつ著作者不明)



唸り声

唸り声は、任意の叫び声のような声量の大きさもとい「力や気流の量」が伴わないでも、別の仕組みで、同時に聴きとれるほどの音量で鳴らなくてよい部分が鳴り、いくらかそれが混ざったような音ではないか、と考えられる。
または、必ずしも優勢でない部分が主要な部分に近似する程度で大きく鳴っているという見解も私は持つ。
単純に言語的に弁別可能な母音の中に、日本人にとって唸り声らしく知覚される母音が含まれるので、日本語話者がその母音に近い声で唸り声の役割を与えるような言語音声生態系があるとも考えられる;任意の言語の母音で、唸り声らしい発音の母音が用いられていると記憶するので。
猫の喧嘩前/中の鳴き声も、唸り声らしさがあり、同じような音響的特質による知覚を私は持つ。
反対の思考、材料としては、ポルタメント (portamento/glissando) のような音高の連続的移動 (pitch bend/bending) の特徴を持つ唸り声および猫の喧嘩前/中の鳴き声もあるため、その特徴によって不吉さや不気味さを知覚する側面も言えなくはない。



音響的な特質を解明し、これらは任意の地域・時代での相対性の中で認知的に「異常だ」と感じられるだけの特徴を持つか、私は判断を可能にしたい。






起草日:2020年7月29日

あまり新規に執筆する話題に欠いていたので、思い付きで起草した。
事前に知っているような文献を欠いている話題で、記事の質がいまいちになろう、と思いながらも、執筆した。

付録として「グロウル+ガテラル、叫び声」2つの音声のスペクトログラムを画像を載せた。
ソフトウェアは praat (version 6.0.56) である。
「唸り声」の画像を載せる予定は無い。
これらの元の音声を公開する予定は無い。

「音楽」といえば、広いメタルやパンク系が想定されるが、これらの音楽の特徴で気になる考察もある。
半音7つ(CとG、またはFとC)の音程にあるパワーコード(完全5度の和音)や、半音6つ(CとF♯)の音程にある三全音コード(これらは古典的にコード–和音でないがコード–和音とも呼びうる)を鳴らした管理楽曲465のギター・リフ (guitar riff) を、それぞれ日本語シラブル/モーラ「ギャ [ɡʲä]」と「ギェ [ɡʲe](この母音は日本語「え」音よりやや狭い)」で口ずさむと、その特徴が再現しやすいと私は感じている。
三全音コードの「ギェ [ɡʲe]」に関して私の再現想定音は、やや r-colored を伴う [ɡʲe˞] である。
私にとってパワーコードは、「完全5度…数学的に言うと構成する2つの音の周波数の関係が整数比 2:3 (音名の音とそれよりも完全5度高い音程 一例はド Cとソ Gの音程), 3:2 (一例はソ Gとド Cの音程) = 0.75, 1.5 に近似するために音波の振動 振れ幅のピークがどの和音よりも高頻度で重なり(高い音の周波数の振動3回に2度重なる)やすい特徴がある [...] 渋みが少なく、分かりやすい音の組み合わせ」と、2020-05-24音楽動画で記したように知られる。
私にとって三全音コードは、「『音楽の悪魔 (the Devil in music, 新ラテン語 diabolus in musica)』と評されるような音程」(この場合、それを含んだコード)「純正律で定まっていないようで、もし定めても独特な印象は続くし、この呼称自体はどちらかというと印象よりも整数比の前項–後項(いわゆるC major ハ長調における F♯とG♭の相違性とを指す;前の記事のヘルムホルツさんの説を参照)や数値単純化に関する問題を指していそうである (e.g., 7制限純正律で7:5, 10:7; ピタゴラス音律で729:512, 1024:729)」「それのみであると『暗い、不吉な印象が強い』減七和音や減三和音にも含まれる音程」と、2020-07-12記事で記したように知られる。
三全音コードは、「それのみであると暗い、不吉」の意義から、やや r-colored を伴う母音(日本語で通常用いられないもの)に楽音部分を再現させることを私は重要視している。
これはフォルマント (formant) を示唆する場合、「楽語共調理論」に類似するが、そこでは語られないF3の存在も加味されよう。

2020年8月5日にこのための肉声とサンプリング音源ギターリフとを録音をしてスペクトログラムを参照するなどしたが、翌日、パワーコードの「ギャ [ɡʲä]」は「ギャ [ɡʲɐ], [ɡʲɜ](高さ height が加えられて比較的狭い母音にされる)」の方がよいような気がした。
「元の音声を公開する予定は無い」 とおりで申し訳なく思うが、念のために言うとこの肉声の音域は成人の普通の言語音声の肉声の音域(自然には約80–110 Hz)に相当し、このサンプリング音源ギターリフC3C–B = 130.81–246.94 Hz 以上とで1オクターブほど異なる。
ところが、praat でのピッチ測定は、後者リフのうち:パワーコード部が100 Hz未満であったり、三全音コード部が164.5 Hzであったり、三全音コード後半部分で半分の数値に下がったり、考察対象にしないとする部分で鳴っている音のピッチは計測されきられなかったり、…と不確定な数値を見せている。
"voicing threshold"だとかの数値を変更してみてどうにかなる問題でもなかった。

参考のスペクトログラム(肉声による再現とサンプリング音源の原曲)




2020-03-11記事に当記事と似たような、ただし文脈の異なる話題が見える:
イの発音を材料に、知覚の実験をしてみよう。
イの実際の音声 [i] は、非円唇前舌狭母音 close front unrounded vowel は先の記事でもフォルマントの一研究"Catford, J. C. (1988)"に示された標準値が F1 = 240 Hz, F2 = 2400 Hz (差異 2160 Hz) である。
私にとり、これは楽器音声だと任意のシンセサイザーによる鋸歯状波 sawtooth wave(のこぎり波・鋸波)に似ると思う。
「似ると思う」という印象によれば、正弦波 sine wave は円唇後舌狭母音 [u] ... F1 = 250 Hz, F2 = 595 Hz (差異 345 Hz) となる。


三角波 (twiangle wave) は母音でないが歯茎鼻音を響音 (sonorant) として発することに近似する、と私は思う。
再三、言うが、スペトログラムや音声などの準備が十分でないことを、申し訳なく思う。
さしずめ子音だけの無声歯茎破擦音 [ts] ([t͡s]) がクローズ・ハイハット (closed hi-hat) にしか聴こえないこと(オノマトペ、擬音語ではチキチキとか chick などと歯茎硬口蓋や後部歯茎にされやすい)などを好むボイスパーカッションのための基礎研究か、と思われそうである。

2020年8月3日月曜日

2020年7月中の日記メモ

(前月に続き)本文をコメントアウトで公開します。ソースからご覧ください。ご不便をおかけします。

●口上
日記メモにはその便宜のために定型的な表現と語句を含んでいるが、それらは広く「日記メモの用語と解説」ページに説明がされている。
2019年9月29日における携帯電話の画面に光が入らなくなる故障から、非パソコンでの簡易なメモ(強い必要性があるものに限り紙・ペン)と自室での時刻確認ができない状況にある。
同じ事由で、写真は多くの場合にその場でのプレビュー参照ができずに撮影・保存・公開の段階に入ることになっているので、ぼやけ(加えてレタッチのシャープなどはデジタル画像処理の観点で「写真に対する使用はごまかし」なので別の理由が無い限り用いない)や被写体の位置が枠を外れる程度についてのご寛恕を願う。

●私感
n

メモ記入日の一覧 (日付をクリックして移動)
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31
中途作業・・・
画像s1600→s0 アットマーク