MS-IME97徹底研究

この項は、リコーの太田純さんがThe WINDOWS誌に書いた「MS-IME97徹底研究」の再録です。MS-IME97でAI変換が採用され、ちょうど「用例変換」「AI変換」の詳しい解説になっています。太田さんのご厚意により、このページに掲載しています。

目次

MS-IME97徹底研究

MicrosoftはWindows NT4.0のリリースと同時に標準添付の日本語入力IMEであるMS-IMEをバージョンアップし、MS-IME97とした。AI変換を搭載したこのMS-IME97はWindows 95の次期バージョンにも標準添付されると思われるが、現行のWindows 95に対してもアップグレードパッケージとして3,800円という低価格で提供されている。ここではこのMS-IME97に対し、MS-IME95から追加・変更された新機能について、競合他社製品と比較しながらレビューを行うことにしよう。

最小コスト法から用例変換、AI変換へと進化したMS-IME

MicrosoftはWindows 3.1から独自の日本語入力IMEの提供を開始した。これがMS IMEである。MS IMEがエー・アイ・ソフトのWX2-WinのOEM(相手先ブランド製品)であることは公然の秘密だったが、Microsoftはその後このMSIMEに対して独自の改良を続けてきた(表1)。Office 4に添付されたMS-IME2では細部の改良にとどまったが、Windows 95のMS-IME95では32ビットIMEへの進化、用例変換の搭載、ユーザーインタフェースの改良など、さまざまな面で見違えるほどの変貌を遂げている。今回リリースされたMS-IME97では、さらにAI変換を搭載し、サードパーティ製品と互角といえる機能・性能を実現した。

表1: MS-IMEの各バージョンと変換方式
Windows バージョン 変換方式
Windows 3.1 MS IME 最小コスト法
Office 4 MS-IME2 最小コスト法
Windows 95 MS-IME95 最小コスト法+用例変換
Windows 97? MS-IME97 最小コスト法+AI変換

ここで用例変換、AI変換という用語の意味を説明しておこう。

かな漢字変換システムでは通常、べた書きで入力されたかなの列から辞書単語とのマッチングを行いながら文節を切り出し、それぞれの文節を適切な漢字かな交じり列に変換する。この文節を切り出す作業は「形態素解析」と呼ばれ、使われる技術としてはn文節最長一致法や最小コスト法などが一般的だ。MS-IMEでは最小コスト法が用いられている。

用例変換では、文節を切り出したあとで同音語候補の選択の際に、単語間の係り受けの関係を考慮して第1候補を決定する。このため、用例変換では「地面が乾き、喉が渇く」といったような同音語が連続する文章でも正しい変換結果が得られるというわけだ(図1)。

図1: 形態素解析のみの場合と用例変換の違い
形態素解析のみ 用例変換
入力かな列 じめんがかわき、
のどがかわく
じめんがかわき、
のどがかわく
形態素解析 じめんが/かわき、/
のどが/かわく
じめんが/かわき、/
のどが/かわく
変換結果 地面が乾き、喉が乾く 地面が乾き、喉が渇く

これに対してAI変換では、形態素解析だけで文節区切りを決定するのではなく、意味解析を行った結果をフィードバックして決定を行う。したがって、複数の文節区切りが考えられる場合でも、より適切な変換結果を提示できることになる(図2)。

図2: 用例変換とAI変換の違い
用例変換 AI変換
入力かな列 ここではきものをきる ここではきものをきる
形態素解析 ここで/はきものを/きる
or
ここでは/きものを/きる
ここで/はきものを/きる
or
ここでは/きものを/きる
文節の決定 ここで/はきものを/きる
意味解析 ここで/履き物を/着る
or
ここでは/着物を/着る
文節の決定 ここでは/着物を/着る
変換結果 ここで履き物を着る ここでは着物を着る

とはいうものの、用例変換とAI変換の境界はあいまいなものだ。実際、用例変換を搭載するMS-IME95でも、用例の構文的変形を許容するためにある程度の意味解析は行われているし、AI変換を搭載する日本語入力IMEでも、意味解析の結果を文節区切りの決定にフィードバックしていないものが過去にはあった。この文章における用例変換とAI変換の違いはあくまで、MS-IME95とMS-IME97を比較するためのものであると考えていただきたい。

変換精度は業界トップクラスだが、学習とのバランスに課題も残る

さて、それでは気になるMS-IME97の変換精度を見てみよう。MS-IME97のAI辞書はよくできている。初期状態もよく、用例もそれなりに整備されているという印象だ。小説や随筆からの抜粋、電子メール、技術文書などの文章を1万字程度入力・変換してみたところでは、ATOK10、VJE-Delta 2.0などの競合製品と比較しても遜色のない結果が得られた。この程度のデータでは定量的な比較まではできないが、業界トップクラスの変換精度を持つといって間違いではないだろう。

ただ、用例にヒットしなかったときの変換結果にはやや弱さが見られた。たとえば「ぎじゅつをまなび、みにつけ、おうようする」という文章を変換すると「技術を学び、未煮付け、応用する」などという変換結果を出してくる。全体に動詞や形容詞などの活用語よりも名詞や固有名詞プラス助詞の形の候補が優先される傾向があるようだ。いずれにしても、この手の誤変換はいったん変換結果を修正して学習させれば次からは正しい変換結果を出してくるので、それほど問題にはならない。

口語体の変換については、ATOK10、VJE-Delta、WXGなどの競合製品と比較して一長一短といったところだろうか。各社とも努力はしているのだろうが、短い言い切りや語尾の母音伸ばしなどの解析で破綻をきたすように感じた。また、うまく変換できなかったときにめちゃくちゃな結果になることも多い。そのことも含めて、口語体の処理はまだまだ研究途上というところだろう。

MS-IME97では処理の複雑化にともなって変換にかかる時間も増大した。筆者の計測によればMS-IME95のおよそ5割増しというところだ。AI変換を搭載する製品の中では、WXGを除いてもっとも遅い。高速なCPUを搭載していないPCではちょっとつらいかもしれない。

さて、日本語入力IMEは使い込むことによって個人の癖を覚え込み、いっそう使いやすくなるものだ。そのためには学習という機能が必須である。しかし、MS-IME97ではAI変換と学習のバランスがまだうまくとれていないように見受けられる。

たとえば、「さいそくされなければかこうとしない」と入力して「催促されなければ加工としない」と変換されたとしよう。これを「催促されなければ書こうとしない」と修正して確定しても、意味的な関係がうまく学習されない。次に「さいそくされたらかこうとする」と入力して変換すると、「催促されたら加工とする」となってしまうのだ(図3)。同じAI変換の競合製品、ATOK10やVJE-Delta 2.0、EGBRIDGE 7.3、Wnn95 R2.0ではいずれも正しく学習が行われ、「催促されたら書こうとする」が最初の候補として提示される。

図3: MS-IME97のAI変換にある未完成な部分
MS-IME97 一般のAI変換 非AI変換
入力 催促されなければ
加工としない
↓(修正)
催促されなければ
書こうとしない
催促されなければ
加工としない
↓(修正)
催促されなければ
書こうとしない
催促されなければ
加工としない
↓(修正)
催促されなければ
書こうとしない
入力 催促されたら
加工とする
(AI学習していない)
催促されたら
書こうとする
(AI学習した)
催促されたら
書こうとする
(単語学習した)
入力 字を書こうととする
(擾乱要因)
字を加工とする
(擾乱要因)
字を加工とする
(擾乱要因)
入力 催促されたら
加工とする
(影響されない)
催促されたら
書こうとする
(影響されない)
催促されたら
加工とする
(影響される)

この例に限れば、AI変換を搭載していないかな漢字変換システム、たとえばMS-IME95でも「催促されたら書こうとする」が第一候補となるが、これは単に「書く」が単語として学習されているだけのことだ。これを確かめるには、たとえば「字を加工とする」というような変換を途中に入れてみればよい。AI変換を持つシステムではこうしても「催促されたら書こうとする」という変換結果は影響を受けないが、MS-IME95では「催促されたら加工とする」となってしまう。

ところで、MS-IME97ではユーザー辞書に用例を登録することが可能だ。用例登録とは、係り受け両方の単語とそれらの関係を示す助詞を組み合わせて登録するもので、ユーザー登録単語でも意味解析による精度の高い変換が期待できる。AI変換を搭載する日本語入力IMEで用例登録を持つのは他にはATOK10だけだ註1。あとはWXGが登録単語に意味情報を付加できるが、その他の製品は単語登録の機能しか持っていない。このことはMS-IME97の大きなメリットといえるだろう。

しかし、MS-IME97で用例登録を行ってしまうと、それらの単語間の接続がどうも強力になりすぎるきらいがある。たとえば係り側を「催促する」、受け側を「書く」、関係を「と」「から」で用例登録すると、「催促すると書こうとする」が最初の候補として表示されるようになるが、これを「催促すると加工とする」と修正して確定しても次回はまた「催促すると書こうとする」が最初の候補になってしまう。これは必ずしもユーザーが期待することではないはずだ。全体に、MS-IME97のAI変換と学習のバランスはまだ完成していない。将来に課題を残すと ころだ。

とはいえ、AI変換と学習のバランスが完全といえるような製品は現状では見当たらない。実際、ユーザーが入力した変換結果からAI学習を行うのは大変なことなのだ。AI変換のシステム辞書には、単語や用例の構文的・意味的なデータが大量に含まれている。これと同じデータを入力された文章から推定して作り出すのは難しい。今後のAI変換は、各社とも学習とのバランスという面で改良されてゆくだろう。

複数文節を並行して変更する新しいインタフェース

操作面から見たときに、MS-IME97のAI変換で特徴的なのは、ある文節で同音語候補の選択を行ったとき、単語間の関係を考慮して着目文節以外の候補も並行して変更されるという点だ。

図4を見てほしい。「じをかこうとする」と入力して変 換を行ったとき、「地を囲うとする」という結果が表示されたとしよう。ここで次候補操作を行って「地を」を「字を」と変更すると、第2文節の「囲うとする」も同時に「書こうとする」に変更されるのだ。

図4: 非着目文節も変更されるMS-IME97の同音語選択
入力 「じをかこうとする」
変換 「地を/囲うとする」
第1文節を変更 「字を/書こうとする」
(第2文節も変更された)

これは他社製品に見られないまったく新しいインタフェースだが、AI変換が単語間の最適な関係を選ぶことによって成立していることを考えると、きわめて自然で納得のいくものだ。今後は他社製品にもこのインタフェースが取り入れられていくだろう。

ところで、MS-IME97の単語登録・用例登録はMS-IME95から操作方法が変更された。MS-IME95では、活用語は活用語尾まで入力することになっており、入力すると品詞も自動的に推定されていた。しかしMS-IME97では、活用語は語幹のみを入力しなければならず、品詞推定も行われない。

また、利用できる品詞にも大きな違いがある(表2)。具体的には、品詞が整理されて種類が少なくなった。その結果、たとえば次のような活用品詞をユーザーが登録できなくなっている。

このあたりはMS-IME95と比べて退化した点だろう。もっとも、AI変換の導入自体、ユーザーが辞書に手を入れることを拒否する方向での進化といえるので、今後はそうした製品が増えていくのかもしれない。

表2: MS-IME97とMS-IME95の単語登録品詞の違い
MS-IME97MS-IME95
名詞 名詞/名詞非接尾
形容詞形容詞/形容詞ガル/形容詞ュウ
形容動詞形容動詞/形容動詞ノ/形容動詞タル
副詞副詞
連体詞連体詞
接続詞接続詞
感動詞感動詞
接頭語 接頭語
接尾語接尾語
その他自立語数量/代名詞
さ変動詞さ変名詞/さ変名詞非接尾/さ変動詞
ざ変動詞ざ変名詞/ざ変動詞
人名(→固有名詞)
地名その他国/支庁/県/郡/区/市/町/村/駅/地名その他
固有名詞固有名詞/社名
あわ行五段あわ行五段
か行五段か行五段
が行五段が行五段
さ行五段さ行五段
た行五段た行五段
な行五段な行五段
ば行五段ば行五段
ま行五段ま行五段
ら行五段ら行五段
一段動詞一段動詞
(対応なし)う音便/は行四段/か変動詞/か行促音便
姓名/地名/固有接頭語 (→接頭語)
冠数詞冠数詞
姓名/地名/固有接尾語(→接尾語)
助数詞助数詞
慣用句慣用句
独立語単漢字

ユーザーインタフェースの改良あれこれ

画面表示に関するユーザーインタフェースの改良としては、ツールバーをタスクトレイに置いたり(画面2=略)、ドッキングさせたりできるようになったのが目新しい。ツールバーをタスクトレイに入れておけば、ツールバーを表示せずに入力モードを確認できるし、ここからマウスでモードを変更したり、ユーティリティを起動したりすることが可能だ。ドッキングというのは日本語入力ツールバーをタスクバーのように画面端に配置する機能で、アプリケーションのウィンドウと表示が重なることがないというメリットがある。ツールバーそのものについては、変換オフのときでもボタンが有効になり、ユーティリティを起動しやすくなった。また、変換オフのときにツールバーを表示しない設定も可能だ。

変換表示では、候補表示ウィンドウで自立語以外の部分もグレーで表示されるようになり、やや視認性が増した。

入力のインタフェースに関しても、いくつかの改良が行われている。「オートコレクト」は入力の誤りを自動的に補正する機能で、ATOK9以降、各社が競って取り入れているものだ。MS-IME97のオートコレクトには次のような機能がある。

同様の機能は、細かい違いはあるものの、競合他社製品でも入力支援(ATOK10)、入力補正(VJE-Delta、Wnn95)、ゆらぎ2(WXG)などの名前で提供されている。また、先頭の2つの機能はローマ字カスタマイズで可能になる製品もある(WXG、Wnn95、Cannaなど)。

MS-IME97では英文交ぜ書きをサポートするための機能も用意された。プロパティの基本設定画面で「Shiftキーのみでローマ字かな変換を制御」をチェックしておくと、ローマ字入力・全角ひらがなモードで入力中にシフトキーを押して離すことによって一時的に半角英数モードに移行する(画面1の[4]=略)。このモードはそれ以降変換や確定などのキーが入力されると解除される。また、上記の設定の有無によらず、シフトキーと同時にローマ字を入力しても、同様に一時的な半角英数モードになる。入力中に簡単な操作で日本語と英文を切り替える方式としては、なかなか使いやすいものだろう。

これとほぼ同じ機能がMS-IME95にも用意されていたが、半角英数モードではなく全角英数モードに移行していたため、変換操作を行わない限り半角英字にならず、あまり使いものにならなかった。

難読漢字の入力を支援する機能としては、手書き文字認識による単漢字入力が最大の目玉だろう。ツールバーから「漢字辞典」を起動すると、手書き、総画数、部首、記号のいずれかで単漢字を検索して入力できる。手書き入力の画面でマウスを使っておおざっぱに文字を書くと、その文字から特徴点を取り出して、類似した単漢字を候補として表示してくれる。あとはその単漢字をダブルクリックすれば、アプリケーションに直接入力されることになる。パターン認識はかなり優秀で、いいかげんに書いた文字でもたいていは目的の漢字が見つかるようだ(画面4=略)。

なお、例によってMS-IME97にはカスタマイズ機能が用意されていない。その手の機能が必要なユーザーは競合製品を使うことになるだろう。

MS-IME95では環境設定や操作スタイルなどの情報が初期化ファイル\windows\msime95.iniに書かれていたので、これをエディタで編集すればある程度のカスタマイズも可能だったが、MS-IME97ではこれらの情報がレジストリに書き込まれるようになった。たとえば筆者の環境では、\HKEY_USERS\ohta\software\Microsoft\Ime\msime97以下にそのデータがある。もっとも、設定情報をレジストリに書き込むようにした結果、複数のユーザーが異なる環境設定、異なる操作スタイル、異なる辞書を利用できるようになったのは大きなメリットだ。

競合製品に未来はあるか?

これまで見てきたように、カスタマイズ機能のようにすっぽり抜け落ちている部分はあるものの、MS-IME97は単体製品として販売されてもおかしくないほど優秀な製品だ。OSに標準添付の日本語入力IMEまでがこれほど進化した現在、競合製品に販売ボリュームを確保する余地は残っているのだろうか?

これからの日本語入力IMEは、ATOKのように著名アプリケーションとの一括販売によってユーザー認知度を維持するか、WXGのように高度なカスタマイズ機能でユーザーにアピールするか、あるいはCannaのようにサーバー・クライアント方式を利用して特殊分野での利用を期待するしかないだろう。かな漢字変換システムの進化に期待し、その変遷を追い続けてきた筆者にとって、MS-IME97のような製品の登場はうれしい驚きでもあり、はたまた不安を増大させる原因でもあるのだ。


画面1: プロパティの「基本設定」画面 (2段取り)
[1] (「テンプレート」の左)
操作スタイルをMS-IME、ATOK、VJE、WXから選べる。
[2] (グレーになっている「半角ローマ字で変換」の左)
ローマ字入力、半角カタカナモードでここをチェックしておくと、半角英字から直接ローマ字漢字変換が行える。
[3] (グレーになっている「カナキーの自動制御」の左)
かな入力時にここをチェックしておくと、変換のオン・オフと同時にキーボードのカナ・英数が切り替わる。
[4] (「Shiftキーのみでローマ字かな変換を制御」の左)
ローマ字入力時にここをチェックしておくと、シフトキーを押すだけで半角英数モードと交互に切り替わる。
[5] (「変換モード」の左)
変換のモードを一般、人名/地名優先、話し言葉優先、無変換から選べる。
[6] (「送りがな基準」の左)
送りがなの基準を全部、本則、送る、省くから選べる。
[7] (「対象文節確定」の左)
ここをチェックしておくと、文節カーソルを右に移動するごとに現在位置の文節が確定されるようになる。
画面2: タスクトレイに入れたMS-IME97
左クリックで入力モードを変更、右クリックでユーティリティを起動できる
画面3: 変換中の候補表示ウィンドウ
自立語以外はグレー表示される
画面4: 手書き文字認識による単漢字入力
適当なものを書けば、それに似た漢字を提示してくれる
画面5: プロパティの「表示」画面
画面6: プロパティの「辞書/学習」画面
スライダーによる学習の設定、複数辞書は優先順位を変更できる
画面7: プロパティの「オートコレクト」画面

ちなみに画面4にある「適当なもの」はマウスで雑に描いた漫画っぽい人間の顔でした。:^)


このページは、太田さんのご厚意により、news:akqt07$e6o$1@ns.src.ricoh.co.jp(→Google)を使用いたしました。なお、太田さんから、「間違いがあったらそれは太田の責任」と記載しておくよう、お申し出がありました。


作成日:2002年 9月 07日 (土) 変更日: 2008年 6月 2日 (月)