Superscriptは外国語入力を専門とするアプリショップです

2024/11/17

タイ語の読みを得るアプリ YomiThai Ver4.5 11/14公開

 タイ語の単語は、頭子音+母音記号+末子音など定型的なパターンであれば、どう読むか分かりますが、子音の連続など変則的な文字構成の単語も多く、辞書を引かないと発音が分からないものも多いです。
 また定型的なパターンの単語でも声調を決める規則が複雑なので、規則を基に一つ一つの単語の声調を求めるのは時間がかかりますし、ましてや単語がいくつもある文章では、声調は横に置かざるを得ないのがタイ語学習者の現状だと思います。
 YomiThaiはタイ語の文章を入力し、ボタン一つで声調を含む読みを、発音記号とカナで得られるようにしたツールです。 

 Vectorライブラリでも公開しています -> こちら

■What's New in Ver 4.5

  1. 内部データすべてを見直し、特に発音カナを読みやすくしました。
  2. 発音変換精度向上(内部データを16,986個から17,794個に増やしました)
  3. 小さなバグフィックスをしました。

■使用条件と試用制限

  • 対応OS: Windows11,10
  • インストールフォルダ: CドライブのProgram Files(x96)の下
  • 試用制限は、変換可能文字数35文字です。

■使用するフォント

  • タイ語フォント:   "Leelawadee UI"
  • 発音記号フォント:  "Segoe UI"
  • 日本語フォント:  "Yu Gothic UI"

■価格:

●作者から直接購入の場合:(銀行振り込み)

  • 価格: 税込み1,100円(1000円+100円)・・・振込手数料がかかります

●Vectorから購入の場合:(クレジットカード払い)

  • 価格: 税込み1,210円(1000円+100円+110円)・・・110円はVector手数料

■優待価格:

◆購入方法は作者からの直接購入の場合に限ります

  • 優待価格:  税込み550円(500円+50円)・・・振込手数料がかかります

※対象者:茜PAD、KakiThai(Ver10以降)の購入者
※補 足:優待価格ご利用の場合は、送金前にお名前と茜PADやKakiThaiの購入年月を作者に送り、対象ソフトユーザーであることを確認して下さい。

特徴

  1. タイ語文を単語やイディオムに区切り、その読みを発音記号とカナで出力します。
  2. 変換は内部データから求めるアイテムマッチングと、動的に定型パターンから発音を求めるパターンマッチングで構成されます。
  3. 内部データは、固有名詞、イディオム、基本単語で構成され17,794個のアイテムを持ちます。
  4. 定型パターンは約200個。パターンは頭子音、母音記号、声調記号、末子音、マイタイクーで構成されます。
  5. アイテムマッチングでヒットした固有名詞やイディオムは、その意味を日本語でログ出力します。
  6. 発音記号やカナの多彩なオプション指定が可能です。
  7. 変換過程を調べたり、単語の区切り位置を訂正したりできるLabo画面があります。

■固有名詞の変換例

■主画面: 発音変換の例

 タイ語には子音文字と母音記号があり、その組み合わせでおよその読みが分かりますが、子音が連続している場合など、どこに単語の区切りがあるわ分からない、どのような発音したらいいか分からない場合もあると思います。

タイ文字を入力してF7キーを押すだけ
発音記号とカナを見れば、読みが分かります

   ※訳:普通、彼は午前7時に家を出ます。

■発音変換の仕組み

 

アイテムマッチングで存在する語をチェック
パターンマッチングでパーツ構成をチェック

■発音変換オプション

 発音変換オプション画面は発音記号とカナをどの文字や記号を用いて表記するかを定める画面です。現在、タイ語の辞書でも教本でも、表記方法は統一されていません。デフォルトの表記を変えたい場合、ここで指定して下さい。

 なお、Ver4.2で表記重視の設定ボタンを設けました。このアプリは基本的に発音を重視した記号やカナの選択をしていましたが、タイの旅行ガイドや会話本のタイ語表記は今までの表記の踏襲などもあり発音重視と若干違います。例えば以下のような違いがあります。

発音重視と表記重視の違い(例)

  • イーア、ウーアといった二重母音は、長母音と短母音もあるので、長母音には長音記号[ː]を用いるが、ガイド本では用いない。
  • 発音記号で[si]は、発音では「スィ」だが「シ」で表記されるものが多い。日本語の「シ」は発音記号だと[ʃi]である。
  • 発音記号で末子音の[ŋ]は[n]と区別するために「ング」と表記されるが、ガイド本では「ン」で表記されるものが多い。
  • お皿の「ヂャーン」が頭子音の場合、発音記号で[c]で表記されるが、カナでは象の「チャーング」と区別するため「ヂ」や「ジ」で表記されことが多いが、ガイド本は「チ」が中心。
 独学用の単語帳で、発音記号やカナを変換させる際は、「発音重視の設定」を選んだうえで、個別に記号やカナの選択をされるのがいいと思います。もし、地名や駅名などの単語帳を作る場合は表記重視設定を選ばれてもいいかと思います。


発音変換オプション (発音重視の設定)



発音変換オプション画面(表記重視の設定)


■発音変換オプションの詳細

変換モード
標準モードは、特異な読みの単語などの内部データをアイテムマッチングし、それ以外は定型パターンのマッチングから発音を求めるモードです。チェックモードは内部データを一切参照せず、定型パターンと声調規則から発音を求めるモードす。標準モードで単語の区切りを間違えた場合は、変換モードをチェックモードにして、単語の区切りに半角スペースを入れて再変換すると、声調を含め正しい変換をすると思います。
文字間スペースの扱い
原文の中の半角スペースを、発音記号や発音カナの中で強調し見やすくするため、標準では、[半角スペース]+[ǁ]+[半角スペース]に置換しています。この強調をしないオプションが「そのまま」です。
発音記号のオプション
二重母音に長音符[ː]を用いる:二重母音には長音と短音があるので、私たちは、例えばด้วยを[dûːay]のようにIPAの長音符を用いています。ですが多くの教本では用いていないので、この長音符を使わなくすることもできます。
音節区切り[·]を付ける:山はタイ語でภูเขาで、[phuu·khǎw]と発音記号で表記しています。このように複音節の語は、音節区切りに[·]を用いていますが、この区切りを用いないオプションも設けました。[phuukhǎw]となります。ただ、これだと[phuuk]と[hǎw]とも読めるので、私はあった方がいいと思います。
口を横に引くウの音:例えばタイ語の「船」はเรือ「ルーア」ですが、これを発音記号で[rɯːa]と書くか[rʉːa]と書くかということです。
末子音のウの音:例えばタイ語の「私たち」はเรา「ラォ」ですが、これを発音記号で[raw]と書くか[rao]と書くかということです。
末子音のイの音:例えばタイ語の「得る」は、ได้「ダイ」ですが、これを発音記号で[dây]と書くか[dâi]と書くかということです。
カナのオプション
二重母音に長音記号「ー」を用いる:例えば、タイ語の「~だけ」は、เดียวですが、Google翻訳で読み上げると「ディーアウ」ですが、会話の中では「ディアウ」になったりするので、好みで指定して下さい。
音節区切り「・」をつける:内部データではカナでも音節区切りに・(中点)を付けていますが、出力時、あると邪魔な感じを受けることもあるかと思います。標準では付けないようにしています。
声調矢印を付ける:当初カナにも、音節ごとに矢印や横線で声調を表すようにしていましたが、あると煩雑感が出ると感じ、標準では声調矢印は付けないようにしています。
鶏のกが頭子音の時:多くの場合、有気音[kh]のと区別するため、ガ行で扱われますが、旅行ガイドではカ行で表記される場合もあるので切り替えられるようにしました。
蛇งが頭子音の時:例えば、タイ語の「仕事」はงานですが、これを「ンガーン」とするか「ガーン」とするかということです。以前は「ガーン」を初期値としていましたが、「ンガーン」に変更しました。理由は頻出するการの「ガーン」とは明らかに違う音だからです。
蛇งが末子音の時:例えば、タイ語の「学校」はโรงเรียนですが、これを「ローング リーアン」とするか「ローン リーアン」とするかです。末子音nと区別する意味で、「~ング」とする書籍が多いので、標準でも「ング」になっています。
お皿のจが頭子音の時:例えば、タイ語で場所の起点を表す「~から」はจากですが、これを「ヂャーク」とするか「ジャーク」とするかということです。*このは「チ」と表記する書籍もあるので、将来、オプションは増やすかもしれません。
補足1:タイ語で「文書」は、เอกสารですが、発音記号で書くと[ʔèek·ka·sǎan]になります。そのままカナにすると「エークガサーン」になり、くどい。そこで次の音節の音価が同じ場合、長母音の後の末子音は、カナを省略しています。すると「エーガサーン」になり、実際聞いた感じと近くなります。
補足2:タイ語で「政府」は、รัฐบาลですが、発音記号で書くと[rát·tha·baan]になります。そのままカナにすると「ラットタバーン」になり、くどい。そこで次の音節の音価が同じ場合、短母音の後ろの末子音は、短母音促音節を表す「ッ」のみ残し省略しています。すると「ラッタバーン」になり、実際聞いた感じと近くなります。

※上の2つの補足についてはオプションではなく、常に適応されるルールです。

■変換過程を調べられるLabo画面

 発音変換の過程を調べられるLabo画面があります。主画面でF8キーを押すと切替わります。その見方を、変換モードを変えた時を例にご説明したいと思います。下の図は上のCDエクスプレスタイ語 12課の例文をF8キーを押してLabo画面で開き、更にF7キーで変換した時の画像です。

 この画面を見ると新たに「変換区切り」欄があり、タイ語文をどのように単語やイディオムに区切ったかが分かります。

 またその下の下に「パターン番号」という欄があります。これは、変換の判断の根拠がなんであったかを表します。例を示します。「パターン番号」欄で、数字530を白黒反転させ選択状態にしたままで、右端の「参照」ボタンを押します。するとパターンの説明画面が出ます「子音1文字に母音を補って発音する単語」と出ました。つまり、530番に対応する単語、วิศวะは、子音[s]の後ろに短母音の[a]を補って発音する単語で、工学の簡略した読みですが、これが"overTwo.txt"に含まれる単語であることを表しています。(パターン番号の詳細は次のセクションでご説明します)

Labo画面



パターン説明画面



■パターン番号の詳細

 上のLabo画面の中にパターン番号という欄があります。これはタイ語の文章を変換区切り単位でどう扱ったかを表すものです。番号が500番台と600番台は内部データからマッチングで得た単語かイディオムです。1桁から200番未満は、文字と記号の構成から発音変換エンジンがパターンで判断した音節か単語です。

 上の標準モードで変換画面のタイ語แพงขึ้นは、「高くなる」という意味ですが、パターン番号633番でした。これを参照ボタンで調べるとイディオムファイル(idiomMBPF.txt)に含まれたイディオムであることが分かります。

※idiomNBPF.txtとは頭子音がน,บ,ป,ผ,พ,ภ,ฝ,ฟ,のいずれかで始まるイディオムであることを意味します。


 下のチェックモードで変換画面のタイ語ขึ้นは、「高くなる」の「なる」という意味ですが、パターン番号104番でした。これを参照ボタンで調べると下のような頭子音、母音記号、声調記号、末子音で構成される音節であることが分かります。このようにファイル名とひとつの音節の文字や記号の構成パターンを調べたい場合にパターンを参照します。

■日本語のタイ文字変換ツールはどう使うの?

 これはタイの方に日本語の発音を伝える目的で作ったツールです。面白いかなと思い作りました。ひらがなで文章を入力し、順に変換するとタイ語の音節の組合せが出力される仕組みです。

 例えば日本人が、旅行で来たタイ人の友人と魚売り場併設の食堂に来た状況を考えて下さい。新鮮でうまそうな魚を見て、食べたく思ったタイ人。「この魚を焼いてもらえますか?」と自分で言ってみたい。日本の友人はこのツールにひらがなで日本語入れて変換しタイ文字になった文をタイ人の友人に見せて、こう発音してみて?という状況です。検証はGoogle翻訳の読み上げ機能で確認してみて下さい。

ひらがなタイ文字変換。


※補足:
 ローマ字欄で$で囲われた文字は固有名詞や、疑問文の末尾の声調を反映したタイ文字で、定型のタイ文字化された語句になります。ダイレクト変換します。



 例えば「焼いて」の「て」を口を横に引く「て」にする場合、発音記号欄のteをtEとeを大文字にしてから変換します。短母音を長母音にするにはeをeeにすると長母音になります。また、tやkやpを有気音にするにはthやkhやphにすると、有気音になります。

 声調に関しては、最後のタイ文字欄にカーソルを入れるとAutoIMEボックスにチェックを入れているとタイ語キーボードになるので、子音字に声調記号を付加して調整します。

変換の調整方法の一例

■改版履歴

■最新バージョン: Ver 4.5     (2024.11.14)

公開日バージョン主な変更点
2020/04/12Ver 1初版公開
(茜PADの変換機能を向上させました)
2020/04/19 Ver 1.2 Windowsのディスプレー設定に応じて、画面サイズと文字の大きさを可変にしました。(文字サイズが125%のとき大きくなります)
2020/06/10 Ver 1.3 (1)外部ファイルを、1万語以上の単語でチェックし改良しました。
(2)日本語のタイ文字変換ツールを組み込みました。
2020/07/15 Ver 1.4 (1)会話文を中心に三修社「タイ語スピーキング」吉田英人著で検証し、間違った箇所は改良しました。
(2)小さな改良をしました。
2020/08/5 Ver 2.0 (1)三修社「タイ語スピーキング」吉田英人著の全例文で検証し、間違った箇所は改良しました。
(2)バグフィックスをしました。
2022/11/17 Ver 3 (1)画面構成を変更しました。
(2)変換精度の向上を図りました。
*白水社、馬場陽子著「タイ語で暮らしたい」の例文で検証しました。
2023/8/31 Ver 4 (1)主画面を拡大できるようにしました。
(2)単語とイディオムの意味をログで出力するようにしました。
(3)内部データを11,700個に充実させたことで、変換精度向上させました。
2023/11/17 Ver 4.1 (1)主画面のタイ語、発音記号、カナの文字サイズを変更できるようにしました。
(2)母音で終わる単語の変換方式を改良しました。
(3)内部データを13,600個に充実させたことで、変換精度向上させました。
2024/03/30 Ver 4.2 (1)発音変換で用いる内部データを13,600個から15,600個に増やしました。
(2)発音変換に表記重視設定を加えました。
2024/05/06 Ver 4.3 (1)発音変換速度を向上させました。
(2)発音変換で用いる内部データを15,600個から15,800個に増やしました。
2024/08/07 Ver 4.4 (1)ログに英数字も表示するようにしました。
(2)タイ数字を桁入りで発音変換できるようにしました。(百万の桁まで)
(3)発音変換で用いる内部データを15,800個から16,986個に増やしました。
2024/11/14 Ver 4.5 (1)内部データすべてを見直し、特に発音カナを読みやすくしました。
(2)発音変換精度向上(内部データを16,986個から17,794個に増やしました)

■参考文献

■謝辞:
 タイ語の発音記号やカナの表記は本によって様々ですが、実績のある以下の本を主に参考にして開発しました。また、発音変換機能の検証においてタイ語の長年の愛好者である奥野敏宏さんに数十回にわたりレポートのご協力を頂きました。心より感謝申し上げます。

  1. タイ日辞典(岡 滋訓 著)Voice・・・単語やイディオムの出典
  2. タイ日辞典(冨田竹二郎 著)養徳社・・・単語やイディオムの出典
  3. タイ語辞典(松山 納 著)大学書林・・・単語やイディオムの出典
  4. 暮らしのタイ語単語7000 語研・・・カナの使い方の参考にさせて頂きました。
  5. パッと使えるタイ語の日常単語帳4500 中経出版・・・単語やイディオムの出典
  6. 日常タイ語会話ネイティブ表現 語研・・・単語やイディオムの出典
  7. タイ語の手紙の書き方・・・手紙定型文の参考
  8. タイ語の基礎(三上 直光 著)白水社
  9. タイ語の基本(吉田 英人 著)三修社
  10. タイ語スピーキング(吉田 英人 著)三修社
  11. CDエクスプレス タイ語(水野 潔/鈴木 玲子著)白水社
  12. タイ語で暮らしたい(馬場陽子著)白水社

アプリの紹介

ショップ情報

Superscript

北海道札幌市豊平区
→事業者概要