pandasクックブック―Pythonによるデータ処理のレシピ

個数:

pandasクックブック―Pythonによるデータ処理のレシピ

  • 提携先に在庫がございます【僅少】
    通常、5~7日程度で出荷されます。
    ※納期遅延や、在庫切れで解約させていただく場合もございます。
    (※複数冊ご注文はお取り寄せとなります)
  • 出荷予定日とご注意事項
    ※上記を必ずご確認ください

    【出荷予定日】
    通常、5~7日程度で出荷されます。

    【ご注意事項】 ※必ずお読みください
    ◆在庫状況は刻々と変化しており、ご注文手続き中やご注文後に在庫切れとなることがございます。
    ◆出荷予定日は確定ではなく、表示よりも出荷が遅れる場合が一部にございます。
    ◆複数冊をご注文の場合には全冊がお取り寄せとなります。お取り寄せの場合の納期や入手可否についてはこちらをご参照ください。
    ◆お届け日のご指定は承っておりません。
    ◆「帯」はお付けできない場合がございます。
    ◆画像の表紙や帯等は実物とは異なる場合があります。
    ◆特に表記のない限り特典はありません。
    ◆別冊解答などの付属品はお付けできない場合がございます。
  • ●店舗受取サービス(送料無料)もご利用いただけます。
    ご注文ステップ「お届け先情報設定」にてお受け取り店をご指定ください。尚、受取店舗限定の特典はお付けできません。詳細はこちら
  • サイズ A5判/ページ数 366p/高さ 21cm
  • 商品コード 9784254122428
  • NDC分類 007.64
  • Cコード C3004

出版社内容情報

科学計算,分析,可視化などPythonでのデータ処理の基本を約100のレシピを通して具体的に学ぶGitHubに詳細なサポートデータ(Jupyter Notebook)有。すぐに試せる
・Pandas Cookbook: Recipes for Scientific Computing, Time Series Analysis and Data Visualization using Python, 2017Oct, Packt の翻訳。
・pandas(Pythonによるデータ処理に必須のライブラリ)の活用例(レシピ)を約100紹介。

・扱うデータ構造や使い方、可視化などを広く取り上げる。
・各レシピは内容、手順、解説(補足、参照、注意など)という定形になっており読みやすい。

Pythonによるデータ解析を支援する機能を提供する必須のライブラリ pandas の使い方を解説する「レシピ本」。
ビッグデータを扱うデータサイエンスや科学計算に重要なツール、Pandasの実践的な使用方法=”レシピ”を約100例紹介。分析の目的から探せるレシピ本として、特定の分野に依存せずデータサイエンスのツールにpythonを選んだすべての方が読者対象。

1 Pandas基礎
レシピ1 DataFrameの解剖学
レシピ2 DataFrame主要素へのアクセス
レシピ3 データ型の理解
レシピ4 データのカラムをSeriesとして選択
レシピ5 Seriesのメソッド呼び出し
レシピ6 Seriesの演算子の働き
レシピ7 Seriesのメソッドチェイニング
レシピ8 分かりやすいインデックスに置き換え
レシピ9 行とカラムの名前変更
レシピ10 カラムの作成と削除
2 DataFrameの必須演算
レシピ11 DataFrameのカラムを複数選択
レシピ12 カラムをメソッドで選択
レシピ13 カラムを意味が分かるように順序付け
レシピ14 DataFrame全体の操作
レシピ15 DataFrameのメソッドチェイニング
レシピ16 DataFrameの演算子の働き
レシピ17 欠損値の比較
レシピ18 DataFrame演算の方向を転置
レシピ19 大学のキャンパスのダイバーシティ指標の計算
3 データ分析開始
レシピ20 データ分析ルーチンの開発
レシピ21 データ型を変更してメモリ削減
レシピ22 最大の中の最小を選択
レシピ23 ソートして各グループでの最大を選択
レシピ24 sort_valuesでnlargestの代用
レシピ25 トレール注文の価格計算
4 データから部分抽出
レシピ26 Seriesデータの選択
レシピ27 DataFrameの行の選択
レシピ28 DataFrameの行とカラムの同時選択
レシピ29 整数とラベルの両方でデータ選択
レシピ30 スカラー選択の高速化
レシピ31 行の手軽なスライシング
レシピ32 文字順にスライシング
5 booleanインデックス法
レシピ33 boolean統計量の計算
レシピ34 複数のboolean条件の構築
レシピ35 booleanインデックス法によるフィルタリング
レシピ36 インデックス選択によるbooleanインデックス法の代用
レシピ37 重複のないインデックスとソートしたインデックスによる選択
レシピ38 株価見通しの計算
レシピ39 SQLのWHERE節の翻訳
レシピ40 株式収益率の正規度判定
レシピ41 queryメソッドによるbooleanインデックス法の読みやすさ改善
レシピ42 whereメソッドによるSeriesの保持
レシピ43 DataFrameの行のマスキング
レシピ44 boolean,整数位置,ラベルによる選択
6 インデックスアラインメント
レシピ45 インデックスオブジェクトの検査
レシピ46 デカルト積の作成
レシピ47 インデックス爆発
レシピ48 等しくないインデックスの値を埋める
レシピ49 別のDataFrameからカラムを追加
レシピ50 各カラムの最大値をハイライトする
レシピ51 メソッドチェイニングでidxmaxの代用
レシピ52 最多の最大値を求める
7 集約,フィルタ,変換のためのグループ分け
レシピ53 集約の定義
レシピ54 複数のカラムと関数のグループ分けと集約
レシピ55 グループ分けの後でMultiIndex解消
レシピ56 集約関数のカスタマイズ
レシピ57 集約関数の*argsと**kwargsをカスタマイズ
レシピ58 groupbyオブジェクトの検討
レシピ59 マイノリティが多数派の(米国の)州をフィルタリング
レシピ60 減量の勝負でtransform
レシピ61 SATの加重平均点を州ごとにapplyで計算
レシピ62 連続変数でグループ分け
レシピ63 都市間の航空便の総数
レシピ64 定時離着陸の最長ストリーク
8 整然形式にデータを再構成
レシピ65 変数値カラム名をstackで整然化
レシピ66 変数値カラム名をmeltで整然化
レシピ67 複数の変数グループを同時にスタック
レシピ68 スタックしたデータを元に戻す
レシピ69 groupby集約の後でunstack
レシピ70 groupby集約でpivot_tableの代用
レシピ71 変形を容易にするレベル軸の名前変更
レシピ72 複数の変数がカラム名になっている場合の整然化
レシピ73 複数の変数がカラム値の場合の整然化
レシピ74 複数の値が同じセルにある場合の整然化
レシピ75 変数がカラム名とカラム値になっている場合の整然化
レシピ76 複数の観察が同じテーブルにある場合の整然化
9 pandasオブジェクトの結合
レシピ77 DataFrameに新たな行を追加
レシピ78 複数のDataFrameを接合
レシピ79 トランプとオバマの大統領としての信認レベル比較
レシピ80 concat, join, mergeの相違点を理解
レシピ81 SQLデータベースへの接続
10 時系列分析
レシピ82 Pythonとpandasの日付ツールの違いの理解
レシピ83 時系列を賢くスライシング
レシピ84 DatetimeIndexでだけ働くメソッドを使う
レシピ85 週ごとの犯罪件数
レシピ86 週ごとの犯罪と交通事故を別々に集約
レシピ87 曜日と年での犯罪件数の測定
レシピ88 DatetimeIndexで無名関数を使いグループ分け
レシピ89 Timestampと別のカラムでグループ分け
レシピ90 merge_asofで犯罪率が20%低かったのは最近ではいつかを見つける
11 matplotlib, pandas, seabornによる可視化
レシピ91 matplotlib入門
レシピ92 matplotlibでデータの可視化
レシピ93 pandasのプロットの基本
レシピ94 flightsデータセットの可視化
レシピ95 層グラフで今後の傾向を発見する
レシピ96 seabornとpandasの違いを理解
レシピ97 seabornグリッドで多変量解析
レシピ98 diamondsデータセットのSimpsonパラドックスをseabornで明らかにする

Theodore Petrou[セオドア ペトロウ]
著・文・その他

黒川 利明[クロカワ トシアキ]
翻訳

内容説明

pandasのデータ構造の基本から実践的なデータ整理・抽出法、matplotlib/seabornを使った可視化までデータ分析、科学計算に活かせる98のレシピ。

目次

Pandas基礎
DataFrameの必須演算
データ分析開始
データから部分抽出
Booleanインデックス法
インデックスアラインメント
集約、フィルタ、変換のためのグループ分け
整然形式にデータを再構成
pandasオブジェクトの結合
時系列分析
matplotlib、pandas、seabornによる可視化

著者等紹介

Petrou,Theodore[PETROU,THEODORE] [Petrou,Theodore]
探索的データ分析を得意とする教育関係企業Dunder Dataの創始者であるデータサイエンティスト。地域のデータ専門家が一室に集ってデータサイエンスの研鑽をはかるヒューストンデータサイエンスという2000人以上からなるミートアップグループの代表者でもある。Dunder Dataの創業以前は、石油関連サービス大手Schlumberger社のデータサイエンティストとしてデータ探索に従事していた。プロジェクトには、エンジニアの記述文から部分

黒川利明[クロカワトシアキ]
1948年大阪府に生まれる。1972年東京大学教養学部基礎科学科卒業。東芝(株)、新世代コンピュータ技術開発機構、日本IBM、(株)CSK(現SCSK(株))、金沢工業大学を経て、現在、デザイン思考教育研究所主宰。IEEE SOFTWARE Advisory Boardメンバー(本データはこの書籍が刊行された当時に掲載されていたものです)
※書籍に掲載されている著者及び編者、訳者、監修者、イラストレーターなどの紹介情報です。

感想・レビュー

※以下の感想・レビューは、株式会社ブックウォーカーの提供する「読書メーター」によるものです。

hal

1
必要そうなところを中心に流し読み。 書いてる内容は有用で、テクニック的な事だけでなく、pandasの仕組みや動作の詳細も参考になるが、読み難い。訳が直訳っぽくて回りくどく感じることが多い。 せめて句読点は日本語の、。にして欲しかった。 図書館本だから気楽に読み飛ばせたが、これを新品で自腹で買うのは勇気がいる。安価な古本があれば、手元に置いておきたいかも。2024/04/20

しんた199990

1
よくある内容薄めのデータサイエンス入門本(anaconda,Jupyter, pandas, Numpy, Matplotlib,統計を薄く広く解説した本)と異なり、pandasの一歩踏み込んだ実用的な使い方を解説した本。 具体的にはpandas.DataFrame.groupbyの集約関数に複数関数を使用し、かつ追加引数を渡す方法などが解説されている。2021/07/20

yyhhyy

1
pandasの丁寧な解説。同じ前処理や作図が複数の方法でできるので著者によってクセがある。そんな混乱を整理する為にドリル的に読むのに最適。2019/05/06

外部のウェブサイトに移動します

よろしければ下記URLをクリックしてください。

https://bookmeter.com/books/13439049
  • ご注意事項

    ご注意
    リンク先のウェブサイトは、株式会社ブックウォーカーの提供する「読書メーター」のページで、紀伊國屋書店のウェブサイトではなく、紀伊國屋書店の管理下にはないものです。
    この告知で掲載しているウェブサイトのアドレスについては、当ページ作成時点のものです。ウェブサイトのアドレスについては廃止や変更されることがあります。
    最新のアドレスについては、お客様ご自身でご確認ください。
    リンク先のウェブサイトについては、「株式会社ブックウォーカー」にご確認ください。