内容説明
データの中に隠れた問題を見つけ出す。問題のあるデータの様々なパターンを紹介し、その対処法を解説。
目次
はじめに:バッドデータとは何か?
気のせいかな。このデータ、何かおかしくないか?
機械ではなく人間が使うことを意図したデータ
プレーンテキストに潜むバッドデータ
Webにあるデータの(再)構成
オンラインレビューから嘘つきと混乱した人を発見する
バッドデータは起立して
血と汗と尿
データと現実が一致しないとき
バイアスとエラーの源
最善は善の敵、バッドデータは本当にバッドなのか?
ファイルにこだわる
Crouching Table,Hidden Network
クラウドコンピューティングの神話
ソーシャルメディア:消去可能インク?
データ品質分析の解明:データが十分良いときを知る
著者等紹介
マッカラム,Q.イーサン[マッカラム,Q.イーサン] [McCallum,Q.Ethan]
プロフェッショナルサービスコンサルタント、作家
磯蘭水[イソランスイ]
株式会社X‐Listing勤務。広告配信システムのアーキテクチャ、配信最適化のための大規模データ処理、分析システムの構築等を中心に、エンジニアチームのディレクションまで行う
笹井崇司[ササイタカシ]
ソフトウェアエンジニア。大阪大学大学院工学研究科情報システム工学専攻修了。現在、電機メーカーに勤務(本データはこの書籍が刊行された当時に掲載されていたものです)
※書籍に掲載されている著者及び編者、訳者、監修者、イラストレーターなどの紹介情報です。