リククーブログ

ARTICLE PAGE

今時の日本語入力まとめと裏話

今あるパソコン用の日本語入力システムについて語ります。

Google日本語入力

https://www.google.co.jp/ime/
今隆盛なのがもちろんGoogle日本語入力
Googleの検索エンジンで集めた情報と深い関係があると言われています。後述するが変換エンジンを公開しておいて、この辞書だけは今もなお秘密になっている。
こいつの変換候補順からSEO対策をする人も現れた。
新語もオタクのスラングも顔文字も難なく打てて、うつ側が考えることがまるでなくなってしまう、
恐ろしいバカホイホイの漢字変換。だが漢字変換なんかに頭を使わずに他のことを楽しむなら、これ。
さらに電卓になり、viじゃないが矢印の文字がzhとか打てば出てくるので、キーボードから全く手を離さずに操作できる
情報収集の疑いが叫ばれたが、変換エンジンの公開で疑いはだいたい晴れた。デフォルトで無効のもしかして変換だけはGoogleと通信するらしい。
実はGoogleには漢字変換のWebAPIが存在し、これと同じ操作感を日本語入力のない外国のパソコンやさらにLinuxでは漢字変換の取次をするuimから試すことができる。もちろん、クローラーは禁止

Microsoft IME

筆のアイコンでおなじみ
日本のWindowsに必ずついてくる漢字変換。Windows95からXPか7あたりまで時代が下るに連れどんどん変換精度が下がっていったと言われている。
Windows10以前、歴代Officeにはそれ用のIMEがついており、これがないと日本のOfficeは正しく動かない。
更にOfficeXP、2003についてくるナチュラルインプットがまさに天然ぼけな変換をしてくれるので、学校で青いアイコンは赤くしようと教わった。
しかし巻き返しを図った。今のWindows10のIMEはユーザーの同意による誤変換修正を強く求め(ほら右横に出た!)、事務所で大量の名前を打つのが楽になるぐらい変わったようだ。
Office365もWindows10についてくるIMEだけで十分使える。
ちなみにMSといえば自分の検索エンジンBingを強くおすすめしてくるが、これの情報収集は自分のIMEに生かされている・・・のか?

ATOK

http://atok.com/
ATOKはJustSystemsというソフトハウスが作っている
パソコン用の漢字変換として非常に古く、すんなりあなたの意図道理に変換してくれる。その代わり有料である。
もともと一太郎という評価の高いMS-DOSのワープロソフト用だったが、
一太郎はWindowsの上では使いづらく、便利というか奥ゆかしい機能が追加され、Microsoft Officeに道を譲った。
ATOK単体でも売られてから何年立つのだろう。
ほべりぐというサイトで方言の情報を集めており、おそらく日本語の方言も完璧に打てるだろう。
だが弱点はある。それは同人誌や漫画編集には不向きだと考えられるから。そう、罵倒や差別の用語がまったく変換辞書にないのだ。
逆にそれらを使ってはいけない、大企業や官庁で役に立っているようだ。また高価な追加辞書も色々あり、医療や法務でも使える。

Baidu IME

中国の大手検索エンジンBaiduが作った、オタク用語に強いと主張される日本語入力・・・だが
なんらかの情報を外部に送信することがハッカーにバレたので評価が下がり、アンインストールのあらし。
二次元の女性が泣いてアンインストールを止めようとするという動作になった。
今でもこれが動いているうちにクレジットカード番号を入れるなと言われている。
なんらかのフリーソフトをインストールすると潜水艦のようにパソコンに潜り込んで現れることも多い。
lenovoのパソコンにはすでに入っている・・・だと・・・?

Japanist

富士通が作った漢字変換システム。
Wordだけ使えるという感じのコンピューター、ワープロが隆盛を極めた頃、富士通のワープロにはスペースキーが2つあり、右シフト、左シフトと言った。
それに応じてアルファベットキーボードにひらがなが当てられ、異常に速く日本語を打つことができた、親指シフトという優秀なものだった。
だが今パソコン用の親指シフトキーボードはJapanistという漢字変換をパソコンに入れないと、使えないようになっている。
こんなマイコン時代のビジネス戦略、オープンソースの時代には合うはずがない。日本のハッカーがNICOLAなどの普通のキーボードの親指シフト的な使い方を考え、なんとか再現しようとしている。

皆さん走っていますか、おっとっと 知っていますか。日本語入力の知られざる、ハッカーの世界を。
ハッカーは面倒くさがり屋です。最近ではWebクローラーまで走らせて、辞書の作成の手間もせず自分たちがただで打てる快適な漢字変換を研究しています。
そんな漢字変換は主にLinuxで使うことができます。漢字変換の取次をするfcitxもしくはuimとともに入れるといいでしょう。

Mozc


(mozcはLinuxディストリビューションの公式パッケージになっていることが多い。apt-getやyum、pacmanからすんなり入れることができます。)
最初に挙げた、Google日本語入力の疑いを晴らした、オープンソース版。
あの辞書だけは秘密だが固有名詞以外はなんだって打てる。沖縄方言もすこし。他の便利機能もそのまま健在(もしかして変換も)文字マップも手書き入力だってOK!
両方の作者工藤拓はmecabなど日本語のコンピューター処理で有名な人物で、
彼の必殺技が最小連接コスト法という、言葉の種類ごとに他の種類全てとのつながり「にくさ」を数字で決め、それが少なくなる組み合わせを求めるものだ。
この数字は実は単語ごとにも入っており、前後の文を読んで同じ種類の言葉でも実際に出すべき言葉を選ぶことができる。
さらに最悪でも消去法を使って出す言葉を選べるから最強だ。
これがLinuxでしょぼい漢字変換で我慢していたハッカーを驚愕させた。
さらに、ハッカー有志が辞書を拡張したmozc-utや、
LINEの技術者がクローラーで情報を集めてmecabの日本語解析の強化辞書を作ったが、なぜか無料で公開中だし、それを適用したmozc-neologd-utを筆者が今使っている。
また有志が医療用のmozc強化辞書を作っており、難なく病院のORCAシステムで使えるのだそうだ。

anthy

某アニメの影響を受けて名前をつけられた漢字変換システム。
IPAの助成を受けて開発が進んだがIPAはより進んだ1つにだけ投資するらしく、開発はダウン、変換精度はおかしくなり、
なおもLinuxに入っていることがある。
実は組み込み用も考えられており、そのせいですぐに変換を忘れてしまうのだ。今では炊飯器にも入るだろう。
これに搭載される辞書alt-cannadicは同人誌にぴったりで、anthyも相まってときに2ch的な変換結果を返し、汚い用語も平気で出てくる。まさにオープンソースの自己責任でつかうプログラムだ。
なお相棒のプログラムUtenaは現在Linuxで漢字変換の取次をするuimとして開発されているが、これもペースダウンした。
しかし、実質ネット経由でGoogle日本語入力が使える、古い漢字変換プログラムも、TUT-Codeで直接漢字を打つこともできる、
schemeで拡張できるなど、どう見ても奥ゆかしいハッカーのプログラムだ。それにまだLinuxディストリビューションのパッケージになっていることが多い。

anthy-ghal

http://www.fenix.ne.jp/~G-HAL/soft/nosettle/im.html#anthy
懐かしい人も多いだろう、anthyの非公式強化版だが、未だに開発中。もちろん安定の変換精度。
本家よりこっちをLinuxディストリビューションの公式パッケージに入れたほうがいいぐらいだ。

SKK


http://openlab.ring.gr.jp/skk/index-j.html
SKKを使うと度々シフトキーを押すことになるが、漢字に直すところと、文節を自分で指定するしくみだ。
何より自分の意志で日本語を入力していると強く感じることのできる、極めて単純で速く、ハッカー好みの奥ゆかしいプログラムだ。
もちろんハッカーはシフトキーを、暇な、スペースキーに近いキーに当てることをなんなくやる。

libkkc

libkkcはそんなにいい感じの漢字変換はしてくれない。しかし、なぜかいろいろなLinuxディストリビューションでパッケージになっている。
fedoraなんて特定の企業に開発工程を支配される漢字変換をわざと嫌って、libkkcをおすすめしている。
要するにLinuxのユーザーはいわばサイバー陰謀論者も多く、どんな仕組みなのかわからない=裏でなんかやっているだろう商用プログラムや、それによる、デジタル著作権管理、個人情報収集、特許ゴロ、クラウドストレージ、はてはSiriやCortanaを嫌うことも少なくない。
そして彼らのサイバー陰謀論は、都市伝説やオカルトなんかより、遥かに現実に立脚しているのだ。そしてインターネットの歴史によく姿を表すぐらいで、全く無力などではない。
それにlibkkcはSKKの辞書を使っている。おそらくSKK使いから脱落した誰かが作ったのだろうし、だとすると、変換候補の出方もSKKを思わせるし、細かく区切って文節ごとに入力すれば、そう不便ではないのだろう。
スポンサーサイト

0 Comments

Leave a comment

テンプレートに関するご質問・不具合のご報告の際はご自身のブログアドレス記載必須です
ご質問の前に必ずお読みください ↓
FC2テンプレート ご利用時のお願い