2音節足と3音節足の長さの分析。 「子音×母音混合刺激」の同定(a.英語話者、b.日本語話者)。
結論と今後の展望
h(a) と h(i) も A の / h / 側に表示され、単独で聞こえますが、_u が続くと非常に大きくなります。また、上記以外にも興味深い結果が得られました。日本語話者には、h(u) の後に _a または _i が続く場合、/ f / が聞こえます (図 3、右下)。 h(u)も根母音の / u / の音色を持ち、その後に _a または _i が続くと [ɸa]~[ɸa] または [ɸi]~[ɸ i となります。 ]、/fa/ または /fi/ として聞いたことがあるかもしれません。これは、/f/ の日本語版の特性が影響している可能性があります (2.1 を参照)。音の変化は同じように聞こえますが、英語話者 (h(i)_a を /fa/ として聞く) と日本語話者 (h(u)_i を /fi/ として聞く) では理解が異なります。違うことがわかります。 。
Some lexical factors
Method
The lowest vertical position (maximum displacement) of the jaw relative to the bite plane was located for each target utterance syllable using a velocity-based measure. Since the size of the jaw movement is not a little affected by the height of the vowel (Kawahara et al. 2014, Menezes and Erickson 2013), all vowels in the stimulus sentences were [a].
Results
- L1 and L2 patterns of jaw displacement and F1 for aka kasa da
- L1 and L2 patterns of jaw displacement and F1 for aka pajama da
For this sentence type, the syllable size patterns for the L2 speakers (in Figure 3) are strikingly similar to those of the L1 speakers of Figure 2, again showing the utterance's initial and final increased sizes. Looking at the syllable size patterns for the L1 speakers in Figure 4, we again see large jaw displacement for initial and final syllables. Like the akagasada sentence, no strong correlations between jaw displacement and F1 were found for the L1 speakers.
In Figure 5, the F1 patterns match the syllable size patterns, with an increased F1 on the middle syllable.
Conclusion
One L2 speaker, A08, appears to show almost equal amounts of syllable magnitude as well as F1 values on the three syllables in pyjamas, thus trying to avoid the L1 pattern of increased power on the middle syllable. The relationship between the jaw and F1 is a subject for further investigation (see e.g. Huang and Erickson 2019 for a discussion of jaw-tongue interaction for the articulation of prosody).
Acknowledgements
実験 1 複数名同時発声の物理的評価
これらの音声を用いて同時発声実験を行い(2.2.2)、録音された音声を分析して音響物理パラメータを明らかにした(2.2.3) 音響室内のヘッドフォン(MDR-CD900ST、SONY)。全体的に約発音率は、一人で話すよりも複数人が同時に話す環境の方が高かった。
サンプルの約 70% で、複数の人が同時に話したときに音量が増加する効果が観察されました。変化の少ない話者は、単語の意味・発音ともに「確かである」と回答した被験者である。
実験 2 複数名同時発声音声の心理的評価
これです。英語の発音における音量変化に対する同時発声効果は、ロンバート効果と同様に多くの人に見られますが、個人の自信にも関連している可能性があります。ペアワイズ比較による聞き取り実験により音声の違いを調べた結果、以下のことが分かりました。 英語スピーキング教育におけるTTS合成音声の利用とその問題点。
自然な話者が話す、さまざまな交渉場面での英語でのプレゼンテーションや仮説的な質疑応答のモデルとなる英語音声を提供できれば、非常に役立ちます。 。
ネイティブスピーカーにモデル音声の録音を依頼する際のコストと問題点
英語教育におけるTTS合成音声の活用シーン。英語教育においてTTS合成音声を利用する場合、以下のようなシナリオが考えられます。画像プレーヤーを再生すると、4 種類の音声 (1 ~ 4) が再生され、プレーヤーは画像を説明するために正しいものを選択するように求められます。さらに、TTS で合成されたサウンドの新たな用途としては、ビデオのナレーションや吹き替えなどが考えられます。ビデオの録画は音声の録画よりも時間がかかります。
また、後からミスが発覚した場合でも、写真を引き継ぐことは非常に困難です。このような場合に備えて、発言者を映す必要のないシーンや、静止画を次々に映し背景にナレーションを加えるシーンなど、合成音だけで十分な演出が可能です。 TTS 合成音声の使用は、キャラクターが日本語で話しているときに英語の音声を吹き替える必要がある場合にも役立ちます。 。
Amazon Polly の利用について
日本語の発話リズム異常について。話すスピードが速い。音と言葉が繰り返されます。 (例:「たびびとの」、「ふきたて」) 子音は不明瞭です。分割されていないモーラがあります。話す速度が遅い。それぞれの音符がバラバラで繋がりません。走らないんです。 (例:「たい・ようが」、「しまし・た」、「はじめ・まさし」)。
話す速度はやや遅いです。 「マシタ」は速すぎる。ポーズもたくさんあります。一つの音は繋がらない。 (例:「か・ち・と」「はじめ・まさ」)。
結果と考察
そもそもそのような値は健常者の判断には現れないが、患者の判断に現れると必ず外れ値となる。したがって、隣接する 2 つのモーラ間の物理的なモーラ長の差は約 100 モーラになります。また、物理的なモーラ長が急に長くなったとしても、それが声部間の「間」となってしまうこともあります。
リズムのずれの印象は、<ポーズ> による誤ったグループ化によって引き起こされると考えられています。
研究の背景
母音、破裂音、鼻音、破擦音、摩擦音、横音、半母音 そこで、Praat上で音をセグメントに分割し、その波形とスペクトログラムを観察してみました。今回は、聴覚障害者にとって知覚や発声が困難になりやすい摩擦音に焦点を当てます。 「キノコ」//の初期音。
「zoo」という単語の場合、ID1 では、// は異なる分節音で事前に生成され、// は事後生成されました。