「辞書登録した動詞が変換されません」!
【9月13日特記】 ネット上で質問したら答えが返って来て、久しぶりに、「こりゃ驚いた」ということがあった。
実は最近「Google 日本語入力」に辞書登録した単語のうちのいくつかが変換してくれなくなって困っていたのである。全く変換してくれないのではなくて、大抵のものは変換してくれるのに、ごく一部どうしても変換候補に上がって来ないものがある。よくよく調べていると、五段活用の動詞だけが出てこないということが判った。
しかし、辞書登録をやり直してみたり、一旦 MS-IME に戻してみたり、何日かいろいろ試行錯誤をしてみたのだが埒が明かない。ちょっと苛々して、いっそのこと MS-IME に戻そうかなどとも考えたのだが、昨日 Google の投稿サイトをふいに見つけて質問してみたのである。
夕方にフォームに記入して、夜帰宅してみたらもう返事が来ていたのだが、これが想定外の答えだった。ちなみに答えを書いてくれたのは一般の方ではなく Google の職員である。
まず、僕の質問の概略を記そう。タイトルは「辞書登録した動詞が変換されません」である。
辞書登録してある五段活用の動詞が、登録した当初は問題なく変換されていたのに、いつの間にか変換候補に全く出てこなくなった。
一段活用の動詞、他の品詞や顔文字、短縮語などは問題なく変換されている。
現在登録してある五段活用の動詞は2つ(ともに辞書登録してあるが変換候補に出てこない)。よみ 単語 品詞
やる 演る 動詞ラ行5段
わらう 嗤う 動詞ワ行5段それに対して、以下のような一段活用の動詞はちゃんと変換される。
よみ 単語 品詞
いれる 淹れる 動詞一段
おそれる 惧れる 動詞一段
返って来た答えはこうだ。ほぼ全文をコピペする。
活用する語彙に関しては、終止形ではなく語幹を入力して下さい。たとえば、わらう/嗤う は わら/嗤 で登録します。一段動詞も同様に語幹で登録します。現在一段動詞でうまくいっているように見えていますが、活用させるとでてこないと思います。
本来ならば、終止形のほうが直感的です。Google日本語入力の初期バージョンも終止形での入力を想定していました。登録した当初は問題なかったとのことですが、おそらく初期のバージョンのときに登録した単語だと思われます。しかし、世に出回っているATOK・MSIME用のユーザ辞書の多くが、語幹を前提に作られており、それらを正しく読み込めないという問題が発生したため、現在のような仕様にしています。おそらく、数年前のATOK・MSIMEは語幹での入力だったのではないかと思います。
今調査した所、ATOK・MSIMEは、終止形・語幹どちらでも入力可能のようです。 どちらの形で入力されたかは完全には把握できなくて、どうしてもヒューリスティクスに頼ることになりますが、ベストエフォートベースでどちらかを推定し、ユーザ辞書のエントリーとして登録できるよう修正したいと思います。
語幹で登録!とは思いも寄らなかった。長らく MS-IME を使ってきたが、あちらではずっと終止形登録で何の問題もなかった。まさかそれが Google ではダメだとは夢にも思わなかった。しかし、語幹で登録するというのは、国語の苦手な人たちにとっては少しハードルが高くないか?
などと思いながら、全ての活用語を語幹のみの登録に変えたところ、(家の PC にはもっともっとたくさんの例が入っていたのだが)この Google 氏のおっしゃる通り全てちゃんと変換できるようになった。明日は会社の PC でも同じ作業をやってみる。
改めて思うに Web とは便利なものである。
今回は回答者が Google の人であったので、この例自体は Web 2.0 とか集合知とかには当てはまらないのかもしれないが、仕事の合間にちょこっと書いたフォームに対して、数時間後にはこれ以上正確ではありえない回答が寄せられるのである。
これだからインターネットはやめられない。そして、問題も解決したことでもあり、やっぱり Google 日本語入力もやめられない(笑)
Comments