• ポイントキャンペーン

テキストデータの統計科学入門

  • ただいまウェブストアではご注文を受け付けておりません。
  • サイズ A5判/ページ数 244p/高さ 21cm
  • 商品コード 9784000057028
  • NDC分類 007.6
  • Cコード C3041

内容説明

ウェブや電子メールに代表されるように、テキストデータが大量に流通、蓄積されるようになった。文字列で記述されたデータの山から情報や知識を探し出すテキストマイニングの手法がさまざまな分野で必要になってきている。テキスト化された顧客の声から新たなニーズを抽出したり、迷惑メールを自動判別するなど、実用的な場面ですでに多くの活用がなされている。また、学術的な場面でも計量言語学やゲノム解析といった分野を中心に、強力な研究手段となっている。このように幅広い分野で共通に用いられる統計的テキストマイニングの知識とスキルを、フリーのソフトウェアと具体例を用いた実践で身につけるのが本書の目的である。統計的テキストデータ解析に焦点を絞り、初歩的な統計学の解説からはじめて、近年提案されたデータマイニング手法まで紹介している。そのおもな内容は文系・理系を問わず理解できるだろう。

目次

統計的テキストマイニング
テキストのクリーニングと関連ツール
形態素解析と構文解析
テキストにおける集計モデルと集計ツール
テキストにおける統計法則と指標
テキストにおけるネットワーク分析
テキストの探索的分析
テキストにおける確率モデリング
テキストと情報量
テキストにおける推測分析
テキストにおける差異の分析と特徴抽出
テキストの特徴と話題分析
テキストのクラスター分析
テキストの分類
テキストの時系列分析
アソシエイション分析と意味処理

著者等紹介

金明哲[キンメイテツ]
1988年中国から来日。1994年9月総合研究大学院大学統計科学専攻博士後期課程修了。博士(学術)。札幌学院大学社会情報学部教授を経て、2005年より同志社大学文化情報学部教授(本データはこの書籍が刊行された当時に掲載されていたものです)
※書籍に掲載されている著者及び編者、訳者、監修者、イラストレーターなどの紹介情報です。

感想・レビュー

※以下の感想・レビューは、株式会社ブックウォーカーの提供する「読書メーター」によるものです。

むらさき

7
面白かった。 前に読んだ「自然言語処理入門」よりも取っつきやすかった。 統計の基礎知識をついでに学ぶことが出きるので結構おすすめ。 テキストを統計量にするところで、多分経験と勘が必要になってくるのだろうなぁ。 なんとなく、言語処理の勉強は満足した感じがする。2022/11/21

kouki_0524

2
テキストマイニングの概観が短時間で学べる本。ツールの具体的な使い方も書いてあるので実践的2014/05/02

Motoki Watanabe

1
RとかMeCabとか 初めて向き2015/02/07

yyhhyy

1
テキストマイニングに必要な統計学(+言語処理)手法を一通り紹介した本。 詳細は個別書籍に寄ることとなりますが、全体を一望できる書籍は少ないので、とても良い本です。2014/01/02

nuna

1
統計処理でテキストマイニング。ツール使ってしまえば数式分からなくてもできるけど、理論を勉強しておけば応用が効くはず2009/07/21

外部のウェブサイトに移動します

よろしければ下記URLをクリックしてください。

https://bookmeter.com/books/165923
  • ご注意事項