Superscriptは外国語入力を専門とするソフトウエアショップです

2020/2/5

ハングルの読みを得るアプリ YomiHan Ver 2

 このたびハングルの文章からカタカナと発音記号で読みを得るアプリを作りました。

 最近はツイッターやFacebookなどで自分の興味のある分野の適度な長さのハングル文を得られるようになり韓国語を学ぶ者にとって嬉しいです。ただそれらを読むとき、正しく読んでいるか不安な部分に出くわすことがあります。もし手軽に正しい読みを得られれば便利ですし、どんな発音変化規則でそう読むのか分かれば今後の学習にもつながります。そこでツイッターを最大限生かすアプリを作ってみました。

 精度ですが、バージョン1ですので教本などで触れられる連音化や濃音化など大きな枠組みはすべて入れましたが、分かち書きを挟んでも起こる濃音化、有声音化などの発音変化は主要なものが入っているレベル、数字の読みなどは未取り組みです。今後バージョンアップの中で改良していく予定です。

 YomiHanはシェアウエア(800円)です。今回は多くの方に使ってみて頂きたいと思ってい、試用段階での変換可能文字数35文字と緩くしました。N挿入や特殊な濃音化など、付加した方がいい単語や語句がありましたらご連絡頂けたら、追加していき、より対応力の広いアプリにしてゆきたいと考えています。

 YomiHan(読みハン)のベクターのライブラリーページはこちらからです。

What's New in Ver2

  1. 発音変化規則の適用順序を変え激音化の検出漏れを改善しました。
  2. 発音変化規則に固有数詞と助数詞を加えました。
  3. N挿入データを追加しました。

画面1

【基本操作】

  1. ツイッターからハングル文章をコピーします。
  2. YomiHanで1行タグを選び、F3キーを押すか、貼り付けボタンを押します。・・・すると貼り付けされます。
  3. 韓国語の原文エリアにカーソルがあるときは、エンターキーを押すと変換されます。変換ボタン(F5)でも同じです。
  4. 分かち書きを省くと有声音化されたり鼻音化されるケースがあります。分かち書き調整でスペースを省いてみて下さい。分かち書きを省いたことで、助詞や語尾の判断が正しくされない場合は、ギリシア語の大文字Φ(ファイ)をスペースに置換して下さい。27種の連音化の判断してから分かち書きを省きます。
  5. 発音カナの文字が小さい場合、上部のトラックバーでフォントサイズを調整します。

[1行]タグ

※訳:新年の最初の太陽を見るために江原東海岸に数多くの日の出客たちが集まりました。

画面2

 長文や途中に改行のある文を変換する場合、[複数行]タグを選びます。

[複数行]タグ

訳:今日朝の空気が濁っています。済州と全南を除く全国のPM2.5濃度が平素より2倍くらい高く出ている中、来週の初めまで大気の状態がよくありません。PM10に備え、呼吸器管理をしっかりなさり、楽しい週末になさって下さい。

画面3

 発音変化規則が原文に対し、どのように適用されたか経過を見たい場合は発音変化ボタンを押すか、F10キーを押して下さい。ブラウザが起動され下のような画面で確認できます。

 各発音規則の内容を知りたい場合、各ルール名の右の--->参照の部分をクリックします。

[発音変化]

画面4

 38のルールは14のグループに分かれて表示されます。

 例えば「27種の連音化」というルールは参照リンクで以下のように表示されます。

[ルール]

変換の仕組み

 韓国語で「国民」を表すハングルは국민ですが、ハングルそのままを読むと「クッㇰミン」ですが、実際は「クンミン」になります。これは韓国語の鼻音化という発音変化規則によって変わるからです。

 この鼻音化規則を一般化して言うと、前の語の終声が[k][t][p]音で、次に[n][m]音の初声が続いたとき、終声がそれぞれ[ŋ][n][m]に変化するというものです。

 この鼻音化規則を、音から文字、すなわち終声からパッチム(字母)に具体化し、最初の「国民」の例にプログラム化できる文字列変換規則にすると

   ㄱパッチム+ㅁ初声=>ㅇパッチム+ㅁ初声

 と文字列変換規則として表現できます。発音変化規則は前の字母との関係で後ろが変わるというものが多く、そういった規則はこの字母分解した文字列置換で表現可能です。

 また、このような規則を記述する場合、初声のㄱとパッチムのㄱは別物として扱わないといけません。私どもは必要に応じ、一般的に使われているハングルをハングル字母で分解して扱う処理をします。つまりハングル1文字を2文字ないしは3文字で表現します。

 このような字母間の規則の他に、例えば特定の意味の接尾辞的な語のみ濃音化するといった語単位の規則もあります。そういったものはハングルを分解せず、そのまま読みを表すハングルに置換して規則をプログラム化します。

 このようにして原文となるハングル文に発音規則を順に適用させ、読みを表すハングルに変換し、それをもとに発音記号、さらにカナに変換します。

機能と特徴

 ハングル文章を発音記号にするのに2つの段階があります。ひとつは以下のような発音規則を適用して読みハングルを得る段階。もう一つは読みハングルから発音記号と発音カナを得る段階です。有声音化は読みハングルでは表現できないので、2段目で判断します。

[特徴1]・・・39の発音規則を適用

  1. 特殊な読み対応
  2. 間違えやすい語の一時保護
  3. 分かち書き調整
  4. 固有数詞+助数詞・・・新
  5. N挿入
  6. 流音化しないㄴパッチム+ㄹ初声
  7. 固有語合成語の濃音化
  8. 接尾辞合成語の濃音化
  9. ㄹパッチム漢字語の濃音化
  10. 未来連体形の濃音化 その1 名詞重視
  11. 未来連体形の濃音化 その2 用言重視
  12. 27種の連音化 その2 語中の母音
  13. 의の3変化
  14. ㅎ初声の無音化
  15. 口蓋音化 その1 ㄷパッチム+이
  16. 口蓋音化 その2 ㅌパッチム+이、여、였
  17. 口蓋音化 その3 ㄷパッチム+히、혀、혔
  18. 口蓋音化 その4 ㄾパッチム+이、여、였
  19. ㅎパッチムの無音化 その1 ㅎパッチム単独
  20. ㅎパッチムの無音化 その2 ㅎを含む二重パッチム
  21. 27種の連音化 その1 助詞・語尾
  22. [n][m]音の終声語幹の濃音化
  23. ㄼ、ㄾパッチム語幹の濃音化
  24. 流音化 その1 ㄹパッチム+ㄴ初声
  25. 流音化 その2 ㄹを含む二重パッチム+ㄴ初声
  26. 流音化 その3 ㄴパッチム+ㄹ初声
  27. 7つの終声への集約 ㄺパッチムを含む語
  28. 7種の連音化 母音で始まる単語
  29. 連音化 締め
  30. ㅖの2変化
  31. メインの濃音化 [k][t][p]音終声+ㄱ、ㄷ、ㅂ、ㅅ、ㅈ初声
  32. ㄹ初声の鼻音化 その1 [m][ŋ]音の終声+ㄹ初声
  33. ㄹ初声の鼻音化 その2 [k][p]音の終声+ㄹ初声 2段階鼻音化
  34. メインの鼻音化 [k][t][p]音の終声+ㄴ、ㅁ初声
  35. ㅎパッチムの激音化
  36. ㅎを含む二重パッチムの激音化
  37. ㅎ初声の激音化
  38. 7つの終声への集約
  39. 有声音化

[補足]・・・取り組んでいない項目

  • 長音と短音の区別(눈:長音で雪、短音で目)
  • 分かち書きを挟んでも起こる濃音化、有声音化など
  • 同じつづりでも意味により異なって発音される語(지적:知的は後ろが濃音化、指摘は有声音化)
  • 数字、数詞、固有名詞の読み

■試用制限について:

  • 機能制限:変換可能文字数は最大35文字です。それ以上の文字は「-」になります。
  • 使用制限:試用中の出力結果(発音カナなど)を公に利用してはいけません。具体的にはSNSに投稿する、Webサイトで表示する、メールで自分以外の人に送る、会社や学校、官公庁での文書などに掲載するなどです。もちろん商用利用はすべて含みます。お試し期間という認識でお願いします。

■使用条件:

  • 対応OS: Windows10, Windows8(8.1), Windows7
  • 画面の文字サイズ(DPI):100%~125%
  • インストール先: CドライブのProgram Files(x86)フォルダ...(Windows 10)

■必要なフォント:

  • 日本語フォント:  游ゴシック(Windows8以降には入っています)
  • (Windows 7には游ゴシックは入っていませんが、無料でマイクロソフトのサイトから入手できます。)
  • 韓国語フォント:  Malgun Gothic

■インストールとアンインストール

  • 最新版のダウンロードは、こちらのダウンロードページからできます。
  • ダウンロードするのはzipファイルです。
  • zipファイルには、インストーラーとReadme.txt、韓国語の発音規則.txtという3つのファイルが入っています。
  • "yomihan1.exe"という名のインストーラーをダブルクリックするとインストールされます。(インストール先は変更しないで下さい)
  • アンインストールは、コントロールパネルの「プログラムのアンインストール」から可能です。
  • 関連ファイルも完全にアンインストールしたい場合は以下のフォルダ
       C:\Users\[ユーザー名]\AppData\Roaming\Gianluca\YomiHan
    を削除して下さい。

今回の変更点

■バージョン: Ver 2

公開日バージョン主な変更点
2020/1/15Ver1公開開始
2020/1/28 Ver2 ・発音変化規則の適用順序の改善
・固有数詞+助数詞の発音変化規則を追加。
・N挿入データを追加。

オプション

[オプションは3種類]

  1. 激音に上付きhを加える・・・カ行やタ行は平音と濃音と激音が同じ表記になりやすいです。激音の場合カナに上付きのhを加えられます。。
  2. カナを口語調にする・・・大丈夫ですという場合、標準モードでは発音記号に近いクェンチャナヨで、口語調だとケンチャナヨ、そのような違いです。
  3. ㅎ初声の無音化を強くする・・・標準モードより強く無音化させます。

ソフトウエアの紹介

ショップ情報

Superscript

北海道札幌市豊平区
→事業者概要