内容説明
本書では、データサイエンスを行う上で、どのようなプロセスが必要か、データサイエンティストとしてはどのようなスキルセットが必要で、どのような思考方法を選択する必要があるのかを実例を多数示しながら紹介します。Google、Microsoft、Facebookをはじめとした有名企業で使われているアルゴリズムや分析手法の紹介など、興味深い話題や事例も豊富に収録しています。内容の幅が広く、データサイエンティストの参考になるトピックが満載の一冊です。
目次
はじめに:データサイエンスとは
統計的推論、探索的データ分析、データサイエンスのプロセス
アルゴリズム
スパムフィルタ、単純ベイズ、データラングリング
ロジスティック回帰
タイムスタンプと金融モデリング
データから意味を抽出する
レコメンデーションエンジン:ユーザが直接触れる大規模データ製品を構築する
データ可視化と不正検出
ソーシャルネットワークとデータジャーナリズム
因果関係
疫学
データ分析のコンペティションから得られた教訓
データのリークとモデルの評価
データエンジニアリング
生徒たちの声
次世代のデータサイエンティスト、データに対する過信と倫理
著者等紹介
シャット,レイチェル[シャット,レイチェル] [Schutt,Rachel]
Data Science at News Corp社の上級副社長。コロンビア大学で統計学の博士号を取得後、Google Researchで数年間統計学者として働く。現在コロンビア大学統計学部の非常勤教授。コロンビア大学データサイエンス・エンジニアリング研究所教育委員会の設立メンバーでもある。Google時代の業務に基づいた複数の特許出願がある。Googleでは、アルゴリズムのプロトタイプの作成や、ユーザ行動を理解するためのモデル構築などを通じて、ユーザが扱うプロダクトの構築を支援した
オニール,キャシー[オニール,キャシー] [O’Neil,Cathy]
ハーバード大学で博士号を取得。MIT数学科でポスドクをした後、バーナードカレッジ教授に就任。バーナードカレッジでは、代数幾何についての多数の研究論文を発表した。その後民間に転じ、クオンツ(金融アナリスト)として、金融危機の最中にヘッジファンドのD.E.Shawに勤務。その後、ヘッジファンドに対するリスクを評価するソフト開発を手がけるRiskMetricsに勤務する。現在はニューヨークのスタートアップ企業のデータサイエンティストであるほか、ブログmathbabe.orgの執筆や「ウォール街を占拠せよ」の活動にも関わる
瀬戸山雅人[セトヤママサト]
大手SIerで勤務後、ベストティーチャーの起業に参画し、オンライン英会話サービスを開発。その後、Salesforceを使用した開発を行すテラスカイに勤務。現在は、プレセナ・ストラテジック・パートナーズにて、ビジネス研修をWebサービス化するシステムを開発中。大学、大学院時代には生態学を学び、マメゾウムシという昆虫の研究活動の中で統計学の基礎を学習した(本データはこの書籍が刊行された当時に掲載されていたものです)
※書籍に掲載されている著者及び編者、訳者、監修者、イラストレーターなどの紹介情報です。
感想・レビュー
※以下の感想・レビューは、株式会社ブックウォーカーの提供する「読書メーター」によるものです。
HANA
kousuke
yyhhyy
T2T3
Kazyury