Superscriptは外国語入力を専門とするソフトウエアショップです

2015/7/16

茜PAD Ver4.0の改良点

 茜PAD中には、二重子音の判断や、促音節の長短母音、前子音1文字の音節の場合の全体の声調変化など一般的なタイ語テキストに記載されている「母音記号表」以上の発音を判断するルールが組み込まれています。しかし、子音1文字に母音アを補って発音するなどの様々なケース、例えば、เผอิญはパウーンと発音し、意味は「偶然に」の意味です。これらはルール化は難しいので、特異例データとしてファイルから発音表記を読み込みます。

 特異例データは、意外と量が多いので、事前にタイ語辞書からすべてを抽出するのは現実的ではありません。私どもでは、日常生活でよく使いそうな単語を優先するため、市販されたタイ語テキストを利用しています。つまりタイ語テキストの中で評判の良い物から、現状の茜PADでは正しく判断できない単語を選び、その単語はもちろん、その単語に子音母音の構成が似ている単語で、日常使いそうな単語も加えるなどして改良しています。

 今回は、語研の「3パターンで決める日常タイ語会話ネイティブ表現」を用いました。この本は、CDも含めいいと思います。普通に話すスピードの掛け合いなので、何度も聞かないと聞き取れませんが、テキストをちょっと予習してから聞くと理解が進みそうです。

概要

 今回の改良は、特異例データの追加が中心ですが、わずかですがプログラムルールの追加も行っています。タイ語の子音のアルファベット42文字にも含まれず、母音記号15個にも含まれていないのに、タイ語の日常用語に使われる文字すなわち、ฤ(ル)です。

 プログラムのルール改良は2点。得異例の追加は24点の追加です。なお、マイ(木)と水(ナム)が、複音節語の前にある場合は短母音化し、後ろで長母音化することに関しては、この追加した24個に含めていません。結構ありました。

 なお、下の得異例の改良点に記載されている(S.57)の意味は、上記タイ語テキストの該当会話(例となる会話が収められているセクションの番号)を指します。ページではありませんのでご注意下さい。

プログラムの改良点(2個のルールを追加しました)

  1. ルール番号199…ฤๅで[rɯɯ]と読む。例:ฤๅษี(ルーシー:仙人)
  2. ルール番号242…ฤ1文字でを[rɯ́ʔ](ル:高声)と読む。…例:ฤดู(ルドゥー:季節)

得異例の改良点(少なくとも24個を得異例ファイルに追加しました)

  1. ข้อสงสัย(コー・ソンサイ:質問があります)を正しく区切れるように、สงสัยを切り出すようにした。(S.77)
  2. ข้อกล่าวหา(コー・グラオハー:申し立てる)を正しく区切れるように、กล่าวを切り出すようにした。
  3. ข้อขอด(コー・コォート:要点)を特異例に加える。
  4. ข้อตกลง(コー・トックロング:同意、決議)を正しく区切れるように、ตกลงを切り出すようにした。
  5. ข้อประเด็น(コー・プラデン:議題、主題)を正しく区切れるように、ประเด็นを切り出すようにした。
  6. สารสนเทศ(サーラ・ソンテート:IT技術)を正しく発音表記できるように、สารสนを特異例に加える。(S.135)
  7. พุทธศาสนิกชน(プッタ・サーッサニッカチョン:仏教徒)を特異例ファイルに加える。(S.157)
  8. น่าชมเชย(ナー・チョムチューイ:称賛すべき)を正しく区切れるように、ชมเชยを切り出すようにした。(S.195)
  9. น่าสนใจ(ナー・ソンジャイ:面白そう)を正しく区切れるように、สนใจを切り出すようにした。(S.199)
  10. น่า+形容詞(~らしい)など、よく使う表現を正しく区切れるように、特異例ファイルにน่าน、น่าย、น่าの3語を特異例に加える。長母音で終わる語は、次に続く子音を末子音と間違えやすいための対策。
  11. ปลาคาร์ป(プラー・カープ:鯉)を正しく区切れるように、คาร์ปとคาร์ฟを特異例に加える。後者はGoogleで正式とされる綴り。(S.214)
  12. นิตยา(ニッタヤー:対人の名前)、子音の連続をニットヤーにしないため特異例に加えた。(S.220)
  13. พรรณนา(パンナナー:表現する、描写する)を特異例に加える。(S.273)
  14. พอสมควร(ポー・ソムクワン:適度な、然るべき)を正しく区切れるように、สมควรを特異例に加える。(S.286)
  15. เผอิญ(パウーン:偶然)を特異例に加える。
  16. เผอิจ(パウーン:驚く、あわてる)を特異例に加える。
  17. สระว่ายน้ำ(サ・ワーイナーム:プール)の声調が間違っていたのを訂正。(S.389)
  18. สารคดี(サーラカディー:ドキュメンタリー)の声調をタイ語辞典(松山納)形式だったのを、この本の表記に変更した。より現代に近いので。(S.400)
  19. ปฏิกรณ์(パティ・ゴーォーン:原子炉の炉)を特異例に加える。(S.411)
  20. ไม่เวิร์ค(マイ・ワーク:動作しない)のワークすなわち英語のworkをどの声調で発音するかについて、今まで下声だったのを高声に変更した。(S.425)
  21. น้ำพุร้อน(ナム・プロォーン:温泉)を特異例に加える。もともと水はナームと長音で表記しているが、2音節の前に来た時は短音になるので、これを特異例に入れた。(S.426)
  22. สมน้ำหน้า(当然の報い)を特異例に加えた。(S.429)
  23. ห้างเซ็นทรัล(ハーン・セントラーン:セントラルデパート)の発音記号表記が若干違っていた点を訂正。 (S445)
  24. อุบลราชธานี(ウボン・ラーチャターニー:タイの県名)が正しく表記できるように、อุบล(ウボン)とราชธานี(ラーチャターニー)を別々で、特異例に加えた。(S.480)

ソフトウエアの紹介

ショップ情報

Superscript

北海道札幌市豊平区
→事業者概要