出版社内容情報
本書は世界各国で出版・公開された書籍 "Approaching (Almost) Any Machine Learning Problem" の翻訳書です。豊富なコード例と機械学習にまつわる基礎的な内容を取り上げていきます。
交差検証や特徴量エンジニアリングなどモデル作成以前の重要な要素にも紙面が割かれ、コードの再現性やモデルのデプロイといった話題にも踏み込みます。 モデル作成では、表形式のデータセットだけでなく、画像認識や自然言語処理に関する内容が具体的な実装と共に示されます。
本書の節々から、性能を追求するだけではなく実運用にも重きを置いた著者の姿勢が垣間見えるでしょう。
"KaggleのGrandmasterが書いた本"と聞くと高尚な話題が展開される印象を受ける方もいるかもしれませんが、実態は実践的なプログラミング解説書です。Kaggleコミュニティに限らず機械学習に興味を持つ多くの方に手に取っていただきたいと考えています。
この本ではコードが非常に重要です。何が起こっているのかを理解したければ、コードを注意深く見て、"自分で" 実装しなければなりません。
If you didn't code
内容説明
機械学習モデル改善のためにいつ、何を使うのか?さまざまな機械学習問題に対する解決手法を豊富なコードと共に取り上げます。
目次
実行環境の準備
教師あり学習と教師なし学習
交差検証
評価指標
機械学習プロジェクトの構築
質的変数へのアプローチ
特徴量エンジニアリング
特徴量選択
ハイパーパラメータの最適化
画像分類・セグメンテーションへのアプローチ〔ほか〕
著者等紹介
タクール,アビシェーク[タクール,アビシェーク] [Thakur,Abhishek]
世界的な機械学習のコンテストプラットフォーム「Kaggle」で、史上初めて全4カテゴリで最高位の称号「Grandmaster」を獲得したデータサイエンティスト。機械学習の自動化や自然言語処理に関心を持つ。機械学習の応用やデータサイエンスに関して、チュートリアルや動画を積極的に公開している
石原祥太郎[イシハラショウタロウ]
2017年より株式会社日本経済新聞社でデータ分析・サービス開発に従事し、2021年からは研究開発部署で上級研究員を務める。「Kaggle」では2019年にチームで参加した「PetFinder. my Adoption Prediction」で優勝し、2020年に共著で『PythonではじめるKaggleスタートブック』(講談社)を出版。2020年に国際ニュースメデイア協会「30 Under 30 Awards」でアジア太平洋部門の最優秀賞を受賞した(本データはこの書籍が刊行された当時に掲載されていたものです)
※書籍に掲載されている著者及び編者、訳者、監修者、イラストレーターなどの紹介情報です。