内容説明
ウェブや電子メールに代表されるように、テキストデータが大量に流通、蓄積されるようになった。文字列で記述されたデータの山から情報や知識を探し出すテキストマイニングの手法がさまざまな分野で必要になってきている。テキスト化された顧客の声から新たなニーズを抽出したり、迷惑メールを自動判別するなど、実用的な場面ですでに多くの活用がなされている。また、学術的な場面でも計量言語学やゲノム解析といった分野を中心に、強力な研究手段となっている。このように幅広い分野で共通に用いられる統計的テキストマイニングの知識とスキルを、フリーのソフトウェアと具体例を用いた実践で身につけるのが本書の目的である。統計的テキストデータ解析に焦点を絞り、初歩的な統計学の解説からはじめて、近年提案されたデータマイニング手法まで紹介している。そのおもな内容は文系・理系を問わず理解できるだろう。
目次
統計的テキストマイニング
テキストのクリーニングと関連ツール
形態素解析と構文解析
テキストにおける集計モデルと集計ツール
テキストにおける統計法則と指標
テキストにおけるネットワーク分析
テキストの探索的分析
テキストにおける確率モデリング
テキストと情報量
テキストにおける推測分析
テキストにおける差異の分析と特徴抽出
テキストの特徴と話題分析
テキストのクラスター分析
テキストの分類
テキストの時系列分析
アソシエイション分析と意味処理
著者等紹介
金明哲[キンメイテツ]
1988年中国から来日。1994年9月総合研究大学院大学統計科学専攻博士後期課程修了。博士(学術)。札幌学院大学社会情報学部教授を経て、2005年より同志社大学文化情報学部教授(本データはこの書籍が刊行された当時に掲載されていたものです)
※書籍に掲載されている著者及び編者、訳者、監修者、イラストレーターなどの紹介情報です。
感想・レビュー
※以下の感想・レビューは、株式会社ブックウォーカーの提供する「読書メーター」によるものです。
むらさき
kouki_0524
Motoki Watanabe
yyhhyy
nuna