Superscriptは外国語入力を専門とするアプリショップです

2024/04/29

タイ語の発音変換機能

 このページでは、最初に私どもの採用した発音記号とカナに関して最初に述べます。

 次に発音変換機能を、どのような考えでプログラム化したかを述べ、変換結果をどう判断するか理解を深めて頂きたいと思っております。

■私どもの採用したタイ語の発音の表記

 タイ語の発音を表すのに日本では発音記号すなわちIPA(the International Phonetic Alphabet)を用いるのが一般的です。ですがその表記方法は統一されているわけではありません。KakiThaiでは、タイ語を教える人たちがどの表記法でも使えるように、オプションで表記を選べるようにしています。

 またカナに関しては、否定的な意見もありますが、タイ語を習い始めた初心者にとっても中級の人でもあると助かるのも事実だと思います。ただカナで声調をあらわす際、発音記号のような記号は使いにくい。それで私どもでは独自に、声調曲線の実体に近い以下のような矢印や横棒線を、音節の後ろに付加する形にしました。(故冨田竹二郎先生のタイ日辞典にもこのようなタイ語の声調を表す直観符号が紹介されています)

  1. 来る ・・・มา ・・・ maa ・・・ マー ・・・平声
  2. 浸す ・・・หม่า ・・・ màa ・・・ マー_ ・・・低声
  3. 美しい・・・หม้า ・・・ mâa ・・・ マー↘ ・・・下声
  4. 馬  ・・・ม้า ・・・ máa ・・・ マー¯ ・・・高声
  5. 犬  ・・・หมา ・・・ mǎa ・・・ マー↗ ・・・上声

 ただ発音記号とカナの両方を表示できるなら、声調は発音記号で、ザックリ読めメールやSNSでのタイ語発音表記としてカナを使うという分担もありだと思い、発音変換オプションの初期値ではカナに声調を表す矢印を付けないようにしました。

■実際のタイ語の文章はどんな構成か?

 タイ語テキストに出て来るタイ語の文章は、タイ語単語と数字があるくらいの文章ですが、生のタイ語はもう少し違います。どうちがうでしょうか?

  • 英文字や、!や?などのASCII記号が使われる
  • ピリオドを付けたタイ語の略語が使われる
  • 感情などを表すため文末に同じ文字を連続する

■タイ語の特徴

 ではタイ語自体は、どのような特徴があるでしょうか

  • 頭子音、母音符号、末子音、声調記号などで母音ベースの定型の単語が基本
  • 特殊な綴りをする単語がある(自然など)
  • 特殊な読みをする単語がある(一字再読など)
  • タイ数字が使われる
  • タイ語は単語単位で半角スペースで区切る分かち書きはされない
  • しかし意味上の区切りなど明確化したい場合に、分かち書きをする
  • 基本的な単語の組合せで、別の物やことを表現することが多い
  • 日本のカタカナ外来語のようにタイ文字を使った外来語表現が多い
  • 外来語などは綴りが複数あるものもある
  • 外来語は黙音記号が使われるものが多い

■発音変換エンジン「茜(あかね)」について

 タイ語の基本的な発音を決める2つの大きな規則があります。この規則をプログラム化したのが、茜PADという私どもが2018年まで開発していたたアプリです。(その後、YomiThaiというアプリに引き継がれました。)

  1. 頭子音、母音記号、末子音、声調記号、マイタイクーの組合せで決まる母音構成
  2. 頭子音の属性、音節(促音節/平音節:長/短)、声調記号で決まる声調決定規則

[茜の機能]

 入力文字列に対して、最初に1の規則から、文字数の多いパターンから順にマッチングするか判断します。マッチングした文字列(音節)があった場合、2の規則をあてはめ、実際の声調を判断します。最後にカナと発音記号で表現します。

■発音変換機能の構成

アイテムマッチングで存在する語をチェック
パターンマッチングでパーツ構成をチェック

■変換の実際

 単語登録画面で日本語とタイ語だけ入れ、単語編集画面で発音変換させた状況です。F7キーで変換させ、判定インジケーターがブルーになっているのを確認。発音カナ欄には声調を表す矢印や横棒が付いていますが、オプションでこれらを省くこともできます。

単語編集画面での発音変換


■変換過程を知りたい場合:

 どんなふうに変換されたのか過程を調べるためにLabo画面があります。主画面でF8キーを叩いて下さい。私も開発をしながら何度もF8キーを叩いて、アイテムマッチングなのかパターンマッチングなのか。アイテムマッチングならどの内部ファイルを参照して変換したのか、調べながら検討しています。

発音変換 Labo画面


 この上図のケースの場合、すべてアイテムマッチングで変換されたことが分かります。パターン番号を見れば、全部で6つのファイルを参照していることが分かります。

 もしこのパターン番号の内容を知りたい場合、番号を白黒反転させ、右端にある「参照」ボタンを押して下さい。

 例えば、上の632番のパターンを参照すると下の図のように「イディオム」(idiomYDT.txt)ファイルに「お酒を飲む」が含まれていることが分かります。Yはコーカイ表のヨーヤック、Tは頭子音が[t]の子音の意味です。

パターン番号を参照したところ アイテムマッチング

■発音変換オプション画面

 変更できる発音変換オプションを見るには、メニューで「設定」「発音変換オプション」を選んで下さい。基本的に発音記号とカナで別になっています。

 ここで注意して欲しいのは、変換モードです。

  • 標準モード・・・アイテムマッチングとパターンマッチングの両方を行います。
  • チェックモード・・・パターンマッチングのみで判断します。

 なぜ2つのモードがあるかというと、標準モードでは、内部データから単語の切り出しをしますが、間違える場合があるからです。例えば、途中まで同じ構成で、末子音のない語と末子音のある語の両方が内部データにあった時、末子音のない語が優先され、末子音のある単語の途中で切ってしまう可能性があります。

 そのような場合、変換モードをチェックモードにして、正しい単語の区切り位置に半角スペースを挿入し再変換させると正しい変換をする可能性が高いです。私もよく使います。

発音変換オプション



 主画面で発音がちっと変だな、末子音があるのに切れている、などという場合、発音オプション画面に行くのが面倒なとき、以下の方法で変換モードをチェックモードに切り替えられます。

主画面で変換モードを変える方法



 Labo画面で、この例文をチェックモードで変換した時の画面を見てみましょう。基本的にすべて単音節に分解されます。



 ここで「お酒」の意味のタイ語เหล้าについてどんなパターンか見てみます。パターン番号欄の後ろから3つ目の67番が該当するので、この数字を選択状態にし「参照」ボタンを押してみます。

 すると二重子音を持ち、母音が「アウ」のタイプで、さらに声調記号の付いたパターンであることが分かります。これで母音が分かりました。次に声調規則ですが、の付いた高子音型の平音節、第2声調記号が付いた場合の声調規則にしたがい、下声であることを判断しました。発音記号は[lâw]になります。


 これが標準モードだと、ดื่มเหล้า が内部データから「酒を飲む」というイディオムと判断され、発音記号データ[dɯ̀ɯm lâw]が転記のような形で出力されます。ですので、単音節に分解して母音や声調を知りたい場合は、チェックモードを用いると素直に発音を得ることができます。ただ、形は長母音なのに短母音で発音される語など特殊な読みの語はチェックモードでは間違えます。

■辞書順の36種類の母音

 辞書の順番を決める36種類の母音の形について、例を示すためタイ文字欄には頭子音に水牛の「ค」(コー・クワーイ)、末子音にはネズミの「น」(ノー・ヌー)を用いいました。母音欄は末子音をとる形の発音記号を示していますが、末子音がない場合も含まれます。なお子音の属性で変わる母音欄の声調はここでは省いています。

 No  タイ文字  母音  No  タイ文字  母音
 1  คน  [-o-]  19  เคย  [-əəy]
 2  ควน  [-uːa-]  20  เคอ  [-əə]
 3  คอ  [-ɔɔ-]  21  เคอะ  [-əʔ]
 4  คะ  [-aʔ]  22  เคะ  [-eʔ]
 5  คัน  [-a-]  23  เคา  [-aw]
 6  คัว  [-uːa]  24  เคาะ  [-ɔʔ]
 7  คัวะ  [-uaʔ]  25  เคิน  [-əə-]
 8  คา  [-aa-]  26  เคีย  [-iːa]
 9  คำ  [-am]  27  เคียะ  [-iːaʔ]
 10  คิน  [-i-]  28  เคือ  [-ɯːa]
 11  คีน  [-ii-]  29  เคือะ  [-ɯaʔ]
 12  คึน  [-ɯ-]  30  แคน  [-ɛɛ-]
 13  คืน  [-ɯɯ-]  31  แค็น  [-ɛ-]
 14  คือ  [-ɯɯ]  32  แคะ  [-ɛʔ]
 15  คุน  [-u-]  33  โคน  [-oo-]
 16  คูน  [-uu-]  34  โคะ  [-oʔ]
 17  เคน  [-ee-]  35  ใค  [-ay]
 18  เค็น  [-e-]  36  ไค  [-ay]

アプリの紹介

ショップ情報

Superscript

北海道札幌市豊平区
→事業者概要