2020/10/14
ハングルの読みを得るアプリ YomiHan Ver 3.2
韓国語を学習中、発音に迷うことはないでしょうか?2つあるパッチムの場合どちらを読むのか。パッチムの後ろに母音が来た場合N挿入して読むのか、連音化するのか。○○的という語、的(チョク)を濁って読むのか詰まって読むのか、等。
これらは字母と字母の間の関係に基づく規則と、いちいち単語や語句を覚えなくてはならない規則により決まりますが、なかなか細部まで覚えるのは大変です。
このアプリは韓国語の発音変化規則をプログラム化し、ボタン一つで正しい読みを出力するようにしたものです。正しい読みを得るだけではなく、どの部分にどのような発音変化規則が適用されてそう発音するか、チェックできるようにしています。
是非、試してみてください。
なおYomiHanはシェアウエア(800円)です。今回は多くの方に使ってみて頂きたいと思い、試用段階での変換可能文字数35文字と緩くしました。是非使ってみて下さい。
YomiHan(読みハン)のベクターのライブラリーページはこちらからです。
What's New in Ver 3.2
- 金裕鴻著「しっかり身につく韓国語会話」ベレ出版の全例文と問題文で、発音変換精度の検証を行い、28カ所の改良を行いました。
[具体的な改良点]
- 몇이세요(何名でいらっしゃいますか)の読みを며디세요と出力した。母音で始まる助詞語尾に「이세요」を追加し、正しく며치세요ト主力するようにした。
- 아홉 시(9時)は、아홉씨と濃音化するが、머리가 아홉 달린(頭が9つ下がっている)の달린は濃音化しないようにする。数詞+시を、時刻と時間として発音変化するようにした。
- 옮겨드릴 수 있다(移して差し上げる)の수が쑤と濃音化しなかった。調べると드리다の未来連体形として、直前に分かち書きがあるものしか登録されてなかったため。分かち書きのない動詞複合タイプ○○드리다も対応できるようにした。
- 土産物店「순물가게」の가が濃音化した。原因は濃音化する물가(物価)が文字列として含まれていたため。순물가게の순물と가게の間に、発音変化が起こらないようにするためProtect記号[
| ]を入れた。(以降、これを「プロテクトする」ということの意味とします)
- 大家族「대가족」の가が濃音化した。原因は濃音化する대가(代価)が含まれていたため。このケースの場合、よく使われる頭を意味する대가리も대가を含む。意味の判断は難しいので、대가を接尾辞濃音化データから省いた。
- 갈 수 있을지(いけるかどうか)の있을지が있들찌と7種の連音化になってしまった。未来連体形の濃音化の後に27種の連音化の判断があるので、을찌も母音で始まる助詞語尾にないと7種の連音化になってしまった。을찌を母音で始まる助詞語尾に加えた。
- 「日本の仙台の気温」という意味で、일본 센다이의 기온という文があるが、~のと言う助詞があるので、読みは센다이에となるべきところが센다이이となってしまった。原因は「意義」「異議」を表す이의(이이と発音される)が、文章に含まれたため。対策として이이と発音される이의の場合、前に分かち書きを含む場合のみにした。
- 7と同様、「日本の」の意味の일본의が、「本意」の意味の본의を含んでいるため본이と出力されたのを本意は前に分かち書きがある場合に制限したことで、正しく일보네と出力するようになった。
- 「主義の」の意味の주의의について、「意義」を表す의의が含まれるので、의이と出力されたが、意義について分かち書きを条件に加えることで、正しく주이에と出力されるようになった。
- 「会社の」の意味の회사의について、「謝意」を表す사의が含まれるので、회사이と出力されたが、謝意について分かち書きを条件に加えることで、正しく회사에と出力するようになった。
- 「学校の」の意味の학교의について、「教義」を表す교의が含まれるので、학교이と出力されたが、教義について分かち書きを条件に加えることで、正しく학꾜에と出力されるようになった。
- 장미빛(バラ色)の빛は固有語合成語で濃音化するが、しなかったので、固有語合成語の濃音化データに加えた。
- 「取っ手を回して」の意味の손잡이를 돌려の돌려が濃音化していた。原因は이를を이르다(着くという動詞、早いという形容詞)の未来連体形と判断し、それに続くㄷを濃音化したため。対策として、이르다の未来連体形に続く濃音化は、前に分かち書きがあることを条件に追加した。
- 「生の唐辛子」の意味の날 고추の고が濃音化した。原因は날を나다(出る)の未来連体形と判断したため。対策として「生の○○」という語を濃音化しないようにプロテクトした。
- 「歴史的」を意味にする역사적の적が濃音化した。原因は「私的」が사쩍と発音する接尾辞濃音化語なため。対策として私的が사쩍と発音する条件に、前に分かち書きがあることを加えた。
- 「作られたものでしょう?」の意味を表す、생긴 것이죠?という文で、거디죠と7種の連音化になってしまった。対策として母音で始まる助詞語尾に이죠と이지を加えた。
- 「しかし、歩いて行くところは」という意味の하지만 걸어다니는 데において、만と걸어の間の分かち書きが省かれた。りゆうは動詞の過去連体形+名詞と判断し、分かち書きを省いてしまったため。対策として副詞、하지만は発音変化の影響を受けないようにした。
- 「明日も(症状が)おさまらなければ」を意味する내일도 가라앉지 면という部分で、가라앉지の最後の文字を有声音化で出力した。正しくは[n][m]語幹の動詞に続く지は찌と濃音化するので、[n][m]語幹の語に가라앉다を追加した。ちなみに座るの앉다も同じで지が続くと濃音化する。
- 「薬を2錠お飲みください」の意味の약을 두 알 드세요において、두が濃音化した。原因は약을を약다(賢い)の未来連体形と判断したため。対策として약을を未来連体形データから省いた。残念ながら。약을が2億3000万件もGoogle検索でヒットし、ほとんどが「薬を」の意味だったので。
- 「息ができません」の意味を表す숨을 쉴 수가 없습니다と言う文において、쉴が濃音化してしまった。原因は、숨을を숨다(隠れる)の未来連体形と判断したため。この場合숨다は頻出動詞なので省けないので、숨을を「息を」の意味で使う句をリストアップし、濃音化しないようにプロテクトした。なお動詞を含む句なのでその活用形もプロテクトした。(例:息を引き取る、息が詰まる、息を抜く、息をする、息を殺す、息絶えない、しおれる、息絶える)
- 「皮膚がかゆくて寝られません」の意味を表す文、피부가 가려워서 잠을 잘 수가 없습니다.において、眠るの未来連体形、잘の後ろの수を濃音化しなかった。原因は、잘を副詞の「よく」と判断したため。対策としてKRSpecial(特異データ)に、
잘 수, 잘 수가の수を濃音化するようにデータを加えた。
- 「冷え性」の意味の냉증の증を有声音化して出力した。韓国語で「冷症」で濃音化するので、接尾辞濃音化に加えた。
- 「塩をちょっと取ってください。手が届かないので」の意味を表す소금 좀 집어 주세요. 손이 안 땋아서 그래요.と言う文で、届くの意味の動詞について原形は땋다であるが、激音化で따타と出力した。小学館の朝鮮語辞典では딷타と発音すると書いてある。白帝社韓国語発音ガイド(秋美鎬著)の81Pでは따타のような判断で良いとのこと。そのままにした。
- 「持っていたら貸してくれませんか」の意味の가지고 있거든 빌려 주시겠어요において、거든を動詞の連体形と判断し、続く分かち書きを省いてしまった。거든は語尾なので、分かち書きを省かないようプロテクトとした。
- 「お母さんと一緒に来ても大丈夫かと聞いてました」の意味を表す、어머니하고 같이 와도 괜찮겠느냬요において、最後の部分をカナで「ヌネヨ」として出力した。正しくは「ヌニェヨ」なので、訂正した。
- 「寺も」の意味を表す절도であるが、절또と濃音化してしまった。原因は「窃盗」「節度」「絶倒」が、절도と書いて절또と発音するため。対策として、濃音化する場合を、助詞や他の名詞、接尾辞など加えることで絞り込み、基本は「절도」と有声音化で発音するものとした。(補足:窃盗を、窃盗犯、節度ある。抱腹絶倒などで濃音化条件を絞った)
- 「他の人たちがよければ、私も気にしないです」の意味を表す、다들 좋다면 나도 상관없어요.という文で、좋が쫗と濃音化して出力した。原因はその直前の語の一部들を들다の未来連体形と判断したため。対策として들다の未来連体形は直前に分かち書きを含むという条件を加え、~達(複数の意味)の意味の語、〇들が、全般で未来連体形にならないようにした。
- 「そう言えばよかったのに」の意味を表す그럴 걸 그랬다において、그랬다の最初の文字を濃音化してしまった。理由は걸を걸다(掛かる)の未来連体形と判断したため。対策として、걸
그랬を含む句において그が濃音化しないようプロテクトとした。
特徴
- 連音化、濃音化、鼻音化など15の発音規則、41ルールが組み込まれています。
- ハングル文を入力またはコピペしてボタンを押すだけで正しい読みをカナと発音記号で出力します。
- 変換後F10キーを押すことで、どこにどのような発音変化が起きたかチェックできます。
- 単文をじっくり検討するには1行タグ、SNSなどからの改行を含む文を調べるには複数行タグを用います。
- カナ表記に関してはいくつかのオプションがあり、好みの表記が選べます。
- 平音と激音の区別は、カナに付加されている上付きのhで区別できます。(有気音を表す)
- 平音と濃音の違いは、途中の過程で出力される読みを表すハングルで判断できます。 (詳細は、zipに含まれる「韓国語の発音変化規則.txt」をご覧ください)
[補足]・・・このアプリの守備範囲
- 長音と短音の区別はしていません。(눈:長音で雪、短音で目)
- つづりりが同じでも意味の違いで異なって発音される語(지적:知的は後ろが濃音化、指摘は有声音化)
- 形は同じでも品詞が違う語:(名詞+助詞が、動詞や形容詞の未来連体形と同じになる場合)
■試用制限について:
- 機能制限:変換可能文字数は最大35文字です。
- 使用制限:試用中の出力結果(発音カナなど)を公に利用してはいけません。具体的にはSNSに投稿する、Webサイトで表示する、メールで自分以外の人に送る、会社や学校、官公庁での文書などに掲載するなどです。もちろん商用利用はすべて含みます。お試し期間という認識でお願いします。
■使用条件:
- 対応OS: Windows10, Windows8(8.1), Windows7
- 画面の文字サイズ(DPI):100%か125%
- インストール先: CドライブのProgram Files(x86)フォルダ...(Windows 10)
■必要なフォント:
- 日本語フォント: 游ゴシック(Windows8以降には入っています)
- (Windows 7には游ゴシックは入っていませんが、無料でマイクロソフトのサイトから入手できます。)
- 韓国語フォント: Malgun Gothic
■インストールとアンインストール
- 最新版のダウンロードは、こちらのダウンロードページからできます。
- ダウンロードするのはzipファイルです。
- zipファイルには、インストーラーとReadme.txt、韓国語の発音規則.txtという3つのファイルが入っています。
- "yomihan1.exe"という名のインストーラーをダブルクリックするとインストールされます。(インストール先は変更しないで下さい)
- アンインストールは、コントロールパネルの「プログラムのアンインストール」から可能です。
- 関連ファイルも完全にアンインストールしたい場合は以下のフォルダ
C:\Users\[ユーザー名]\AppData\Roaming\Gianluca\YomiHan
を削除して下さい。
■画面 1行タグで調べる
【基本操作】
- YomiHanで1行タグを選び、ハングル文を入力するか、コピペで貼り付けます。
- 韓国語の原文エリアにカーソルがあるときは、エンターキーを押すと変換されます。変換ボタン(F5)でも同じです。
- 分かち書きを省くと有声音化されたり鼻音化されるケースがあります。分かち書き調整でスペースを省いてみて下さい。分かち書きを省いたことで、助詞や語尾の判断が正しくされない場合は、ギリシア語の大文字Φ(ファイ)をスペースに置換して下さい。27種の連音化の判断してから分かち書きを省きます。
- なお発音カナの文字が小さい場合、上部のカナ拡大バーで調整して下さい。
[1行]タグ
■画面 何でそんな発音になるか知りたいときは
例えば、上の例でなぜ最後が「モッテ」となるのか、疑問に思った場合はF10キーを押します。ブラウザが起動し、発音変化の詳細を表示します。ブラウザを起動しますが、外部のサイトに接続するわけではありませんのでご安心を。これを見るとㅅパッチムのと했のㅎ初声との間で激音化が起こり、ㅅが[t]」音に変わり「モッテ」となることが分かります。
F10キーで詳細を知る
画面 発音変化規則も参照できます。
39のルールは14のグループに分かれて表示されます。
例えば「27種の連音化」というルールは参照リンクで以下のように表示されます。
[ルール]
■画面 複数行
発音変化規則も確かに必要だろうけど、私はツイッターの複数行の意味を知りたいんです。会話文の発音を一目で確認したい。ただ間違って読むのは避けたい。。。という方もおられると思います。
下の図は、韓国語のテキストの会話文をAさんとBさんの複数行文にしたものを変換しています。Bさんが、最後に使った「シキルッケヨ」の「ケ」は「ㄹ게요」という「ある行動をする意思を表明するとともに相手に約束する意」(小学館の朝鮮語辞典)を表す終結語尾なので、濃音化することなどが分かります。
[複数行]タグ
■オプション画面
Ver3.0でオプションを個別に指定できるようにしました。
- 激音のカナ表記・・・平音と分けるために有気音を表すhを加えられます。
- ㅎ初声の無音化・・・ㄴのみならずㅁㄹㅇの有声子音と母音の後ろのㅎ初声も無音化します。但し必ずh音を残す대학(大学)や오후(午後)など特定の語はこのオプションに左右されない形になっています。)
- ㅈの有声音のカナ表記・・・音声学的には「ヂ」だと思いますが、「ジ」の教本も多いので選択可能です。
- 二重母音の口調・・・ドゥエをデにしたり、ボアをバにしたりします。
- 語頭の濃音・・・平音と分けるため語頭の濃音にツを加えられます。
オプションボタンを押したとき表示される画面
変換の仕組み
ハングル文章を発音記号にするのに2つの段階があります。ひとつは以下のような発音規則を適用して読みハングルを得る段階。もう一つは読みハングルから発音記号と発音カナを得る段階です。有声音化は読みハングルでは表現できないので、2段目で判断します。
韓国語で「国民」を表すハングルは국민ですが、ハングルそのままを読むと「クッㇰミン」ですが、実際は「クンミン」になります。これは韓国語の鼻音化という発音変化規則によって変わるからです。
この鼻音化規則を一般化して言うと、前の語の終声が[k][t][p]音で、次に[n][m]音の初声が続いたとき、終声がそれぞれ[ŋ][n][m]に変化するというものです。
この鼻音化規則を、音から文字、すなわち終声からパッチム(字母)に具体化し、最初の「国民」の例にプログラム化できる文字列変換規則にすると
ㄱパッチム+ㅁ初声=>ㅇパッチム+ㅁ初声
と文字列変換規則として表現できます。発音変化規則は前の字母との関係で後ろが変わるというものが多く、そういった規則はこの字母分解した文字列置換で表現可能です。
また、このような規則を記述する場合、初声のㄱとパッチムのㄱは別物として扱わないといけません。私どもは必要に応じ、一般的に使われているハングルをハングル字母で分解して扱う処理をします。つまりハングル1文字を2文字ないしは3文字で表現します。
このような字母間の規則の他に、例えば特定の意味の接尾辞的な語のみ濃音化するといった語単位の規則もあります。そういったものはハングルを分解せず、そのまま読みを表すハングルに置換して規則をプログラム化します。
このようにして原文となるハングル文に発音規則を順に適用させ、読みを表すハングルに変換し、それをもとに発音記号、さらにカナに変換します。
今回の変更点
公開日 | バージョン | 主な変更点 |
2020/1/15 | Ver 1 | 公開開始 |
2020/1/28 |
Ver 2.0 |
・発音変化規則の適用順序の改善
・固有数詞+助数詞の発音変化規則を追加。
・N挿入データを追加。 |
2020/4/20 |
Ver 2.2 |
・Windowsのディスプレー設定に応じて、画面サイズと文字の大きさを可変にしました。(文字サイズが125%のとき大きくなります) |
2020/6/30 |
Ver 2.3 |
・発音規則適用順序を1つ変更しました。
・N挿入や固有語合成濃音化など個別規則を増やしました。 |
2020/8/5 |
Ver 3.0 |
・分かち書きのない未来連体形の濃音化が多くかかる間違いを改良しました。
・初声の無音化の実装を分かりやすくしました。
・そのほか、バグフィックスと改良をしました。
※金裕鴻著「しっかり学ぶ韓国語」ベレ出版の全例文、練習問題で検証と改良を行いました。 |
2020/8/26 |
Ver 3.1 |
・金裕鴻さんの「しっかり身につく韓国語会話」ベレ出版の第1章から第3章10課で、検証および改良をしました。
・規則を39から41にしました。 |
2020/10/14 |
Ver 3.2 |
・金裕鴻さんの「しっかり身につく韓国語会話」ベレ出版の全例文と問題文で検証し、28箇所の改良をしました。 |