2024/11/17
タイ語の単語は、頭子音+母音記号+末子音など定型的なパターンであれば、どう読むか分かりますが、子音の連続など変則的な文字構成の単語も多く、辞書を引かないと発音が分からないものも多いです。
また定型的なパターンの単語でも声調を決める規則が複雑なので、規則を基に一つ一つの単語の声調を求めるのは時間がかかりますし、ましてや単語がいくつもある文章では、声調は横に置かざるを得ないのがタイ語学習者の現状だと思います。
YomiThaiはタイ語の文章を入力し、ボタン一つで声調を含む読みを、発音記号とカナで得られるようにしたツールです。
Vectorライブラリでも公開しています -> こちら
●作者から直接購入の場合:(銀行振り込み)
●Vectorから購入の場合:(クレジットカード払い)
◆購入方法は作者からの直接購入の場合に限ります
※対象者:茜PAD、KakiThai(Ver10以降)の購入者
※補 足:優待価格ご利用の場合は、送金前にお名前と茜PADやKakiThaiの購入年月を作者に送り、対象ソフトユーザーであることを確認して下さい。
タイ語には子音文字と母音記号があり、その組み合わせでおよその読みが分かりますが、子音が連続している場合など、どこに単語の区切りがあるわ分からない、どのような発音したらいいか分からない場合もあると思います。
タイ文字を入力してF7キーを押すだけ
発音記号とカナを見れば、読みが分かります
※訳:普通、彼は午前7時に家を出ます。
アイテムマッチングで存在する語をチェック
パターンマッチングでパーツ構成をチェック
発音変換オプション画面は発音記号とカナをどの文字や記号を用いて表記するかを定める画面です。現在、タイ語の辞書でも教本でも、表記方法は統一されていません。デフォルトの表記を変えたい場合、ここで指定して下さい。
なお、Ver4.2で表記重視の設定ボタンを設けました。このアプリは基本的に発音を重視した記号やカナの選択をしていましたが、タイの旅行ガイドや会話本のタイ語表記は今までの表記の踏襲などもあり発音重視と若干違います。例えば以下のような違いがあります。
発音重視と表記重視の違い(例)
発音変換オプション (発音重視の設定)
発音変換オプション画面(表記重視の設定)
※上の2つの補足についてはオプションではなく、常に適応されるルールです。
発音変換の過程を調べられるLabo画面があります。主画面でF8キーを押すと切替わります。その見方を、変換モードを変えた時を例にご説明したいと思います。下の図は上のCDエクスプレスタイ語 12課の例文をF8キーを押してLabo画面で開き、更にF7キーで変換した時の画像です。
この画面を見ると新たに「変換区切り」欄があり、タイ語文をどのように単語やイディオムに区切ったかが分かります。
またその下の下に「パターン番号」という欄があります。これは、変換の判断の根拠がなんであったかを表します。例を示します。「パターン番号」欄で、数字530を白黒反転させ選択状態にしたままで、右端の「参照」ボタンを押します。するとパターンの説明画面が出ます「子音1文字に母音を補って発音する単語」と出ました。つまり、530番に対応する単語、วิศวะは、子音[s]の後ろに短母音の[a]を補って発音する単語で、工学の簡略した読みですが、これが"overTwo.txt"に含まれる単語であることを表しています。(パターン番号の詳細は次のセクションでご説明します)
Labo画面
パターン説明画面
上のLabo画面の中にパターン番号という欄があります。これはタイ語の文章を変換区切り単位でどう扱ったかを表すものです。番号が500番台と600番台は内部データからマッチングで得た単語かイディオムです。1桁から200番未満は、文字と記号の構成から発音変換エンジンがパターンで判断した音節か単語です。
上の標準モードで変換画面のタイ語แพงขึ้นは、「高くなる」という意味ですが、パターン番号633番でした。これを参照ボタンで調べるとイディオムファイル(idiomMBPF.txt)に含まれたイディオムであることが分かります。※idiomNBPF.txtとは頭子音がน,บ,ป,ผ,พ,ภ,ฝ,ฟ,のいずれかで始まるイディオムであることを意味します。
これはタイの方に日本語の発音を伝える目的で作ったツールです。面白いかなと思い作りました。ひらがなで文章を入力し、順に変換するとタイ語の音節の組合せが出力される仕組みです。
例えば日本人が、旅行で来たタイ人の友人と魚売り場併設の食堂に来た状況を考えて下さい。新鮮でうまそうな魚を見て、食べたく思ったタイ人。「この魚を焼いてもらえますか?」と自分で言ってみたい。日本の友人はこのツールにひらがなで日本語入れて変換しタイ文字になった文をタイ人の友人に見せて、こう発音してみて?という状況です。検証はGoogle翻訳の読み上げ機能で確認してみて下さい。
ひらがなタイ文字変換。
※補足:
ローマ字欄で$で囲われた文字は固有名詞や、疑問文の末尾の声調を反映したタイ文字で、定型のタイ文字化された語句になります。ダイレクト変換します。
例えば「焼いて」の「て」を口を横に引く「て」にする場合、発音記号欄のteをtEとeを大文字にしてから変換します。短母音を長母音にするにはeをeeにすると長母音になります。また、tやkやpを有気音にするにはthやkhやphにすると、有気音になります。
声調に関しては、最後のタイ文字欄にカーソルを入れるとAutoIMEボックスにチェックを入れているとタイ語キーボードになるので、子音字に声調記号を付加して調整します。
変換の調整方法の一例
■最新バージョン: Ver 4.5 (2024.11.14)
公開日 | バージョン | 主な変更点 |
---|---|---|
2020/04/12 | Ver 1 | 初版公開 (茜PADの変換機能を向上させました) |
2020/04/19 | Ver 1.2 | Windowsのディスプレー設定に応じて、画面サイズと文字の大きさを可変にしました。(文字サイズが125%のとき大きくなります) |
2020/06/10 | Ver 1.3 | (1)外部ファイルを、1万語以上の単語でチェックし改良しました。 (2)日本語のタイ文字変換ツールを組み込みました。 |
2020/07/15 | Ver 1.4 | (1)会話文を中心に三修社「タイ語スピーキング」吉田英人著で検証し、間違った箇所は改良しました。 (2)小さな改良をしました。 |
2020/08/5 | Ver 2.0 | (1)三修社「タイ語スピーキング」吉田英人著の全例文で検証し、間違った箇所は改良しました。 (2)バグフィックスをしました。 |
2022/11/17 | Ver 3 | (1)画面構成を変更しました。 (2)変換精度の向上を図りました。 *白水社、馬場陽子著「タイ語で暮らしたい」の例文で検証しました。 |
2023/8/31 | Ver 4 | (1)主画面を拡大できるようにしました。 (2)単語とイディオムの意味をログで出力するようにしました。 (3)内部データを11,700個に充実させたことで、変換精度向上させました。 |
2023/11/17 | Ver 4.1 | (1)主画面のタイ語、発音記号、カナの文字サイズを変更できるようにしました。 (2)母音で終わる単語の変換方式を改良しました。 (3)内部データを13,600個に充実させたことで、変換精度向上させました。 |
2024/03/30 | Ver 4.2 | (1)発音変換で用いる内部データを13,600個から15,600個に増やしました。 (2)発音変換に表記重視設定を加えました。 |
2024/05/06 | Ver 4.3 | (1)発音変換速度を向上させました。 (2)発音変換で用いる内部データを15,600個から15,800個に増やしました。 |
2024/08/07 | Ver 4.4 | (1)ログに英数字も表示するようにしました。 (2)タイ数字を桁入りで発音変換できるようにしました。(百万の桁まで) (3)発音変換で用いる内部データを15,800個から16,986個に増やしました。 |
2024/11/14 | Ver 4.5 | (1)内部データすべてを見直し、特に発音カナを読みやすくしました。 (2)発音変換精度向上(内部データを16,986個から17,794個に増やしました) |
■謝辞:
タイ語の発音記号やカナの表記は本によって様々ですが、実績のある以下の本を主に参考にして開発しました。また、発音変換機能の検証においてタイ語の長年の愛好者である奥野敏宏さんに数十回にわたりレポートのご協力を頂きました。心より感謝申し上げます。