Superscriptは外国語入力を専門とするアプリショップです

2024/04/20

タイ語の読みを得るアプリ YomiThai Ver4.2 3/30公開

 タイ語の初歩を学んだ後、はじめてカナも発音記号もないタイ語文を目にした時、どのように感じたでしょうか?私の場合、子音字がいくつも連続で並んでいて、どこが単語の切れ目か分からない。単語の切れ目が分かっても声調が分からない。どうせなら全例文に発音記号を付けてくれたらいいのにと何度も思いました。

 タイ語には単語の基本となる子音字と母音記号の組合せの定型パターンがあります。また、いくつもの要素から判断される声調規則もあります。私はこの2つをプログラム化できないかと試作した所、なんとかできました。その結果、タイ語文の読みを得るばかりでなく、例えば付いているある単語の声調記号を変えた時にどう声調が変わるかなど調べられるようになり便利でした。

 実際は、タイ語には特殊な読みをする単語も多いので、そういった単語やイディオムは内部にデータに持ち、マッチングで先に発音を得る処理を組み合わせる必要もありました。

 目標はSNSでタイ人の発信する生のタイ語文の読みを得ることです。しかし、固有名詞や専門用語も多く、難敵です。まずは学習用として利用して頂けたら幸いです。

 Vectorライブラリでも公開しています -> こちら

■What's New in Ver 4.2

  1. 発音変換で用いる内部データを13,600個から15,600個に増やしました。 (BTSやMRTなどの全駅名や主要観光地名などを含む)
  2. 発音変換に表記重視設定を設けました。 (旅行ガイドの表記に近くなる設定)
  3. いくつかの小さな改良をしました。

■使用条件と試用制限

  • 対応OS: Windows11,10
  • インストールフォルダ: CドライブのProgram Files(x96)の下
  • 試用制限は、変換可能文字数35文字です。

■使用するフォント

  • タイ語フォント:   "Leelawadee UI"
  • 発音記号フォント:  "Segoe UI"
  • 日本語フォント:  "Yu Gothic UI"

■価格:作者から直接購入時の価格

  • 定価:   1,100円(税込み)

■優待価格:

  • 優待価格:  550円(税込み)・・・茜PAD、KakiThaiの購入者

※補足1:優待価格ご利用の場合は、送金前にお名前と茜PADやKakiThaiの購入年月を作者に送り、対象ソフトユーザーであることを確認して下さい。
※補足2:優待対象のKakiThaiはVer10以降に限ります。

特徴

  1. タイ語文を単語やイディオムに区切り、その読みを発音記号とカナで出力します。
  2. 文中でヒットした固有名詞やイディオムは、その意味を日本語でログ出力します。
  3. 内部には基本単語、固有名詞やイディオムなど約15,600個のアイテムを持ちます。
  4. 定型パターンは約200個。パターンは頭子音、母音記号、声調記号、末子音、マイタイクー(短音化記号)で構成されます。
  5. 変換モードをチェックモードにすると声調記号を変えた時の発音も得られます。
  6. 発音記号やカナの多彩なオプション指定が可能です。
  7. 変換過程を調べられるLabo画面で、変換過程を調べられます。

■固有名詞の変換例

■主画面: 発音変換の例

 私が最初に買ったタイ語のテキストは白水社の「CDエクスプレスタイ語」(水野潔/鈴木玲子著)でした。イラストが可愛くてタイ文字の書き順も載っていて大好きです。ですがこのテキストの20課の例文のうち、10課まではカタカナの読みが振ってあるのですが、11課以降はカタカナも発音記号もありません。タイ文字にまだあまり慣れていないときだったので、海に放り込まれた感じがしました。(大袈裟)

 この本の12課の例文をYomiThaiにかけてみましょう。私は自作のタイ語入力アプリKakiThaiで入力し、F9キーでYomiThaiに転送しました。そしてYomiThaiで変換ボタンであるF7キーを押します。すると以下のような画面になります。この本の訳は「ソムさん、工学を勉強するのは難しいですか?」です。ウィサワッで単語は切れるのですね。それと、それ以外の部分は単語の区切りは何とか分かりますが、声調は全部分からなかった。今も声調は、タイ語だけでは不安ですけど。(笑)

CDエクスプレスタイ語 12課

 もう一つ例をあげます。少しタイ語ができるようになって文法も知りたいなと思い白水社の「タイ語の基礎」(三上直光著)を読み始めました。この本、今でも私のバイブルですが、54課あるうち18課までは例文に発音記号が振ってあるのですが、19課以降はありません。文の内容もCDエクスプレスより複雑になっているので、一人、インド人の中に放り込まれた観光客の気分でした。(これはほんと)

 単語の切れ目が分かりにくいしイディオムが含まれていそうなので。ともかく、YomiThaiで19課の例文を変換してみました。この例文の本の訳は「従業員は助け合って店頭の飾り付けをした」です。「従業員」「助け合う」「店頭」「飾り付けをする」などイディオムですね。覚えておいて損はなさそうです。

 YomiThaiはこんな形で、発音記号やカナのないタイ語の読みを手っ取り早く得るツールになります。

イディオムの意味がログの形式で出る

■発音変換の仕組み

 

アイテムマッチングで存在する語をチェック
パターンマッチングでパーツ構成をチェック

■発音変換オプション

 発音変換オプション画面は発音記号とカナをどの文字や記号を用いて表記するかを定める画面です。現在、タイ語の辞書でも教本でも、表記方法は統一されていません。デフォルトの表記を変えたい場合、ここで指定して下さい。

 なお、Ver4.2で表記重視の設定ボタンを設けました。このアプリは基本的に発音を重視した記号やカナの選択をしていましたが、タイの旅行ガイドや会話本のタイ語表記は今までの表記の踏襲などもあり発音重視と若干違います。例えば以下のような違いがあります。

発音重視と表記重視の違い(例)

  • イーア、ウーアといった二重母音は、長母音と短母音もあるので、長母音には長音記号[ː]を用いるが、ガイド本では用いない。
  • 発音記号で[si]は、発音では「スィ」だが「シ」で表記されるものが多い。日本語の「シ」は発音記号だと[ʃi]である。
  • 発音記号で末子音の[ŋ]は[n]と区別するために「ング」と表記されるが、ガイド本では「ン」で表記されるものが多い。
  • お皿の「ヂャーン」が頭子音の場合、発音記号で[c]で表記されるが、カナでは象の「チャーング」と区別するため「ヂ」や「ジ」で表記されことが多いが、ガイド本は「チ」が中心。
 独学用の単語帳で、発音記号やカナを変換させる際は、「発音重視の設定」を選んだうえで、個別に記号やカナの選択をされるのがいいと思います。もし、地名や駅名などの単語帳を作る場合は表記重視設定を選ばれてもいいかと思います。


発音変換オプション (発音重視の設定)



発音変換オプション画面(表記重視の設定)




■発音変換オプションの詳細

変換モード
標準モードは、特異な読みの単語などの内部データをアイテムマッチングし、それ以外は定型パターンのマッチングから発音を求めるモードです。チェックモードは内部データを一切参照せず、定型パターンと声調規則から発音を求めるモードす。標準モードで単語の区切りを間違えた場合は、変換モードをチェックモードにして、単語の区切りに半角スペースを入れて再変換すると、声調を含め正しい変換をすると思います。
文字間スペースの扱い
原文の中の半角スペースを、発音記号や発音カナの中で強調し見やすくするため、標準では、[半角スペース]+[ǁ]+[半角スペース]に置換しています。この強調をしないオプションが「そのまま」です。
発音記号のオプション
二重母音に長音符[ː]を用いる:二重母音には長音と短音があるので、私たちは、例えばด้วยを[dûːay]のようにIPAの長音符を用いています。ですが多くの教本では用いていないので、この長音符を使わなくすることもできます。
音節区切り[·]を付ける:山はタイ語でภูเขาで、[phuu·khǎw]と発音記号で表記しています。このように複音節の語は、音節区切りに[·]を用いていますが、この区切りを用いないオプションも設けました。[phuukhǎw]となります。ただ、これだと[phuuk]と[hǎw]とも読めるので、私はあった方がいいと思います。
口を横に引くウの音:例えばタイ語の「船」はเรือ「ルーア」ですが、これを発音記号で[rɯːa]と書くか[rʉːa]と書くかということです。
末子音のウの音:例えばタイ語の「私たち」はเรา「ラォ」ですが、これを発音記号で[raw]と書くか[rao]と書くかということです。
末子音のイの音:例えばタイ語の「得る」は、ได้「ダイ」ですが、これを発音記号で[dây]と書くか[dâi]と書くかということです。
カナのオプション
二重母音に長音記号「ー」を用いる:例えば、タイ語の「~だけ」は、เดียวですが、Google翻訳で読み上げると「ディーアウ」ですが、会話の中では「ディアウ」になったりするので、好みで指定して下さい。
音節区切り「・」をつける:内部データではカナでも音節区切りに・(中点)を付けていますが、出力時、あると邪魔な感じを受けることもあるかと思います。標準では付けないようにしています。
声調矢印を付ける:当初カナにも、音節ごとに矢印や横線で声調を表すようにしていましたが、あると煩雑感が出ると感じ、標準では声調矢印は付けないようにしています。
鶏のกが頭子音の時:多くの場合、有気音[kh]のと区別するため、ガ行で扱われますが、旅行ガイドではカ行で表記される場合もあるので切り替えられるようにしました。
蛇งが頭子音の時:例えば、タイ語の「仕事」はงานですが、これを「ンガーン」とするか「ガーン」とするかということです。正確には頭子音k音と区別する意味で「ン」を付けた方がいいのかもしれませんが、くどい感じもするので初期値は「ン」を付けてません。
蛇งが末子音の時:例えば、タイ語の「学校」はโรงเรียนですが、これを「ローング リーアン」とするか「ローン リーアン」とするかです。末子音nと区別する意味で、「~ング」とする書籍が多いので、標準でも「ング」になっています。
お皿のจが頭子音の時:例えば、タイ語で場所の起点を表す「~から」はจากですが、これを「ヂャーク」とするか「ジャーク」とするかということです。*このは「チ」と表記する書籍もあるので、将来、オプションは増やすかもしれません。
補足1:タイ語で「文書」は、เอกสารですが、発音記号で書くと[ʔèek·ka·sǎan]になります。そのままカナにすると「エークガサーン」になり、くどい。そこで次の音節の音価が同じ場合、長母音の後の末子音は、カナを省略しています。すると「エーガサーン」になり、実際聞いた感じと近くなります。
補足2:タイ語で「政府」は、รัฐบาลですが、発音記号で書くと[rát·tha·baan]になります。そのままカナにすると「ラットタバーン」になり、くどい。そこで次の音節の音価が同じ場合、短母音の後ろの末子音は、短母音促音節を表す「ッ」のみ残し省略しています。すると「ラッタバーン」になり、実際聞いた感じと近くなります。

※上の2つの補足についてはオプションではなく、常に適応されるルールです。

■変換過程を調べられるLabo画面

 発音変換の過程を調べられるLabo画面があります。主画面でF8キーを押すと切替わります。その見方を、変換モードを変えた時を例にご説明したいと思います。下の図は上のCDエクスプレスタイ語 12課の例文をF8キーを押してLabo画面で開き、更にF7キーで変換した時の画像です。

 この画面を見ると新たに「変換区切り」欄があり、タイ語文をどのように単語やイディオムに区切ったかが分かります。

 またその下の下に「パターン番号」という欄があります。これは、変換の判断の根拠がなんであったかを表します。例を示します。「パターン番号」欄で、数字530を白黒反転させ選択状態にしたままで、右端の「参照」ボタンを押します。するとパターンの説明画面が出ます「子音1文字に母音を補って発音する単語」と出ました。つまり、530番に対応する単語、วิศวะは、子音[s]の後ろに短母音の[a]を補って発音する単語で、工学の簡略した読みですが、これが"overTwo.txt"に含まれる単語であることを表しています。(パターン番号の詳細は次のセクションでご説明します)

Labo画面



パターン説明画面



■パターン番号の詳細

 上のLabo画面の中にパターン番号という欄があります。これはタイ語の文章を変換区切り単位でどう扱ったかを表すものです。番号が500番台と600番台は内部データからマッチングで得た単語かイディオムです。1桁から200番未満は、文字と記号の構成から発音変換エンジンがパターンで判断した音節か単語です。

 上の標準モードで変換画面のタイ語แพงขึ้นは、「高くなる」という意味ですが、パターン番号633番でした。これを参照ボタンで調べるとイディオムファイル(idiomMBPF.txt)に含まれたイディオムであることが分かります。

※idiomNBPF.txtとは頭子音がน,บ,ป,ผ,พ,ภ,ฝ,ฟ,のいずれかで始まるイディオムであることを意味します。


 下のチェックモードで変換画面のタイ語ขึ้นは、「高くなる」の「なる」という意味ですが、パターン番号104番でした。これを参照ボタンで調べると下のような頭子音、母音記号、声調記号、末子音で構成される音節であることが分かります。このようにファイル名とひとつの音節の文字や記号の構成パターンを調べたい場合にパターンを参照します。

■日本語のタイ文字変換ツールはどう使うの?

 これはタイの方に日本語の発音を伝える目的で作ったツールです。面白いかなと思い作りました。ひらがなで文章を入力し、順に変換するとタイ語の音節の組合せが出力される仕組みです。

 例えば日本人が、旅行で来たタイ人の友人と魚売り場併設の食堂に来た状況を考えて下さい。新鮮でうまそうな魚を見て、食べたく思ったタイ人。「この魚を焼いてもらえますか?」と自分で言ってみたい。日本の友人はこのツールにひらがなで日本語入れて変換しタイ文字になった文をタイ人の友人に見せて、こう発音してみて?という状況です。検証はGoogle翻訳の読み上げ機能で確認してみて下さい。

ひらがなタイ文字変換。


※補足:
 ローマ字欄で$で囲われた文字は固有名詞や、疑問文の末尾の声調を反映したタイ文字で、定型のタイ文字化された語句になります。ダイレクト変換します。



 例えば「焼いて」の「て」を口を横に引く「て」にする場合、発音記号欄のteをtEとeを大文字にしてから変換します。短母音を長母音にするにはeをeeにすると長母音になります。また、tやkやpを有気音にするにはthやkhやphにすると、有気音になります。

 声調に関しては、最後のタイ文字欄にカーソルを入れるとAutoIMEボックスにチェックを入れているとタイ語キーボードになるので、子音字に声調記号を付加して調整します。

変換の調整方法の一例

■改版履歴

■最新バージョン: Ver 4.2

公開日バージョン主な変更点
2020/04/12Ver 1初版公開
(茜PADの変換機能を向上させました)
2020/04/19 Ver 1.2 Windowsのディスプレー設定に応じて、画面サイズと文字の大きさを可変にしました。(文字サイズが125%のとき大きくなります)
2020/06/10 Ver 1.3 (1)外部ファイルを、1万語以上の単語でチェックし改良しました。
(2)日本語のタイ文字変換ツールを組み込みました。
2020/07/15 Ver 1.4 (1)会話文を中心に三修社「タイ語スピーキング」吉田英人著で検証し、間違った箇所は改良しました。
(2)小さな改良をしました。
2020/08/5 Ver 2.0 (1)三修社「タイ語スピーキング」吉田英人著の全例文で検証し、間違った箇所は改良しました。
(2)バグフィックスをしました。
2022/11/17 Ver 3 (1)画面構成を変更しました。
(2)変換精度の向上を図りました。
*白水社、馬場陽子著「タイ語で暮らしたい」の例文で検証しました。
2023/8/31 Ver 4 (1)主画面を拡大できるようにしました。
(2)単語とイディオムの意味をログで出力するようにしました。
(3)内部データを11,700個に充実させたことで、変換精度向上させました。
2023/11/17 Ver 4.1 (1)主画面のタイ語、発音記号、カナの文字サイズを変更できるようにしました。
(2)母音で終わる単語の変換方式を改良しました。
(3)内部データを13,600個に充実させたことで、変換精度向上させました。
2024/03/30 Ver 4.2 (1)発音変換で用いる内部データを13,600個から15,600個に増やしました。
(2)発音変換に表記重視設定を加えました。

■参考文献

■謝辞:
 タイ語の発音記号やカナの表記は本によって様々ですが、実績のある以下の本を主に参考にして開発しました。また、発音変換機能の検証においてタイ語の長年の愛好者である奥野敏宏さんに数十回にわたりレポートのご協力を頂きました。心より感謝申し上げます。

  1. タイ日辞典(岡 滋訓 著)Voice・・・単語やイディオムの出典
  2. タイ日辞典(冨田竹二郎 著)養徳社・・・単語やイディオムの出典
  3. タイ語辞典(松山 納 著)大学書林・・・単語やイディオムの出典
  4. 暮らしのタイ語単語7000 語研・・・カナの使い方の参考にさせて頂きました。
  5. パッと使えるタイ語の日常単語帳4500 中経出版・・・単語やイディオムの出典
  6. 日常タイ語会話ネイティブ表現 語研・・・単語やイディオムの出典
  7. タイ語の手紙の書き方・・・手紙定型文の参考
  8. タイ語の基礎(三上 直光 著)白水社
  9. タイ語の基本(吉田 英人 著)三修社
  10. タイ語スピーキング(吉田 英人 著)三修社
  11. CDエクスプレス タイ語(水野 潔/鈴木 玲子著)白水社
  12. タイ語で暮らしたい(馬場陽子著)白水社

アプリの紹介

ショップ情報

Superscript

北海道札幌市豊平区
→事業者概要