内容説明
Google、Twitter、Facebookからのデータ収集、iTunes Store、Google Playのランキング情報、企業・株価情報・為替情報・金融指標の取得、SEOやマネジメントに役立つ情報の収集etc…データ収集効率を劇的にアップするクローラー技術をディープに解説。
目次
1 10分クローラーの作成
2 クローラー作成の基礎
3 収集したデータを分析する
4 高度な利用方法
5 目的別クローラーの作成
6 クローラーの運用
著者等紹介
佐々木拓郎[ササキタクロウ]
本業は、Web系のシステムアーキテクト。企画から設計開発、運用まで幅広く担当
るびきち[ルビキチ]
CUI系フリーライター。多数の個人用クローラーを開発(本データはこの書籍が刊行された当時に掲載されていたものです)
※書籍に掲載されている著者及び編者、訳者、監修者、イラストレーターなどの紹介情報です。
感想・レビュー
※以下の感想・レビューは、株式会社ブックウォーカーの提供する「読書メーター」によるものです。
baboocon
15
RubyでWeb上の情報を効率よく収集するクローラーと呼ばれるプログラムを作成、運用するための実践的手引き。豊富な実用例が示されていて、ほぼそのまま試してみることもできる。特にanemoneというクローラーフレームワークとHTML構文解析ライブラリのNokogiriはよく使われている。一からクローラーを作るよりも、APIが提供されている大手Webサービスはそれを利用すべきだとか、対象サイトに負荷をかけない慎重な運用を心がけるなど実際に運用する上での注意点も勉強になる。2015/04/19
しんしん
5
クローラーを作成してWeb上から情報を収集する方法が具体的に記されている。 実行するときにはサイト規約や法律上の問題・収集対象サイトのパフォーマンスに配慮したやり方をやらなければいけない。 必要な時には作ることができるという自信を持った。2016/01/11
もりけい
2
この本、いざクローリングしたくなったら読もうと積読にしていましたが、昨今のOpen Interpreterにより解決してしまう世の中になってしまい、変化の速さを感じた次第です2023/09/18
のぶ
2
本書で最も多用しているツール「アネモネ」の開発が止まっている状態(と本書でも言及してるが)なのが本書の長持ち度に暗雲となるのではと一瞬は思ったけど、考えてみたら本書の後半で実例を沢山示している現実のネット上でのサービスの側はツール界よりもさらに変化の激しい世界だから、ネット関連の技術を紙で出版しようとした時点でもう織り込み済のリスクの範囲内なのでしょうね。プログラミング本としてはニッチなテーマ設定ではあるけど、総論から実例集さらには関連技術の検討に至るまでしっかり書いてある、予想以上によくできた本でした。2015/07/06
hojojon
1
クローラーとは何かという基礎的なことから、クローリング対象のサイトに負荷をかけないようにするにはどうしたらいいか、クローリングの効率化および高速化をどのようにして実現するかといったことまで豊富な具体例とともに幅広く記載されており、興味深く読むことができました。2015/01/29