内容説明
膨大な変換候補の中からいかに最適解を導くか。
目次
第1章 日本語と日本語入力システムの歩み
第2章 日本語入力システムの概観
第3章 かな漢字変換エンジンに用いられるデータ構造
第4章 かな漢字変換システムの実装
第5章 統計・機械学習のアルゴリズムとその応用
第6章 日本語入力のこれから
付録
著者等紹介
徳永拓之[トクナガヒロユキ]
日本語入力に興味を持つプログラマ。大阪大学基礎工学部システム科学科、東京大学大学院情報理工学系研究科卒業。ヤフー(株)を経て、現在は(株)Preferred Infrastructureにて自然言語処理や機械学習に関する業務に携わっている(本データはこの書籍が刊行された当時に掲載されていたものです)
※書籍に掲載されている著者及び編者、訳者、監修者、イラストレーターなどの紹介情報です。
感想・レビュー
※以下の感想・レビューは、株式会社ブックウォーカーの提供する「読書メーター」によるものです。
hori-chan
3
むむぅ、数式のところをはじめ、半分くらいしか理解できなかった。ヤバイヤバイ。2018/07/23
こたろう
2
日本語のかな漢字変換システムにはどのような技術が使われているかについて記載された本。著者はアノ徳永さん。通称IME本。かな漢字変換以外にも、形態素解析にも同様の技術が使用されているため、そちらについても参考になる。メインに記載されているのは、SSVM+FOBOSという内容。CRFばかりの説明が多い中、貴重なSSVMの情報となる。また理論の式ばかりではなく、実装にする場合や、最適解としての表現方法など、実際に実装するのに役に立つ情報が多い。著者のブログなどにも、本には記載していない情報なども記載されている。2019/04/27
miwarin
2
ダブル配列、トライなどデータ構造、ビタビアルゴリズムで最短経路問題、パーセプトロン、SVMで機械学習などといったことをruby風味のサンプルコードとともに説明。付録A「数学的な基礎知識」がありがたい2013/09/12
じいふう
2
★★★ 普段何気なく使っている日本語入力システムの歴史、仕組み、変換のアルゴリズム、使われているデータ構造、実装、今後についてまとめられた本。当初使われていたn文節最長一致法から、文節感の繋がりやすさを評価する接続強度法へ、さらに機械学習をベースとしたビタビタアルゴリズムへと進化してきた。変換精度向上のための辞書の構築は現在では機械学習で行なっているようだ。後半のアルゴリズムと実装の部分は難解で挫折してしまった。2012/05/13
toru_mano
2
一般向け。雰囲気をつかむのには良いのかも。日本語入力の裏側の技術をざっくりとつかめる。ただ、アルゴリズム・データ構造・数学が出てくるので、本当に”一般”の人が読むには辛いと思う。逆にちょっと知っている人には物足りないかも?ちなみに、私はSKKユーザ。2012/04/05