【2023最新】「pandas」のおすすめ本!人気ランキング
- pandasクックブック ―Pythonによるデータ処理のレシピ―
- Pythonによるデータ分析入門 第2版 ―NumPy、pandasを使ったデータ処理
- Pythonデータサイエンスハンドブック ―Jupyter、NumPy、pandas、Matplotlib、scikit-learnを使ったデータ分析、機械学習
- Pythonデータ分析/機械学習のための基本コーディング! pandasライブラリ活用入門 (impress top gear)
- Python実践データ分析100本ノック
- Kaggleで勝つデータ分析の技術
- 現場で使える! pandasデータ前処理入門 機械学習・データサイエンスで役立つ前処理手法
- Python1年生 第2版 体験してわかる!会話でまなべる!プログラミングのしくみ
- pandasデータ処理ドリル Pythonによるデータサイエンスの腕試し
- めんどうな作業が秒速で終わる! Excel×Python自動化の超基本
大人気オンライン学習サービス「PyQ」(パイキュー)のコンテンツが書籍になった!pandasデータ処理の腕試しをしてみよう! PyQの人気コンテンツが書籍化!データサイエンス力を試してみよう! 【本書の背景】 今日、Pythonを取り巻くデータサイエンスの実務の中で、pandasは欠かすことのできないライブラリーです。pandasには豊富な機能が用意されていますが、実務で使いこなすためには自分の頭で考え、手を動かして試行錯誤することが重要です。また、他の人が書いたコードを読むことで「そんな効率の良い書き方、知らなかった!」といった新たな気づきが得られることもあります(「はじめに」より抜粋)。 【本書の内容】 pandasを使ったプログラミングの腕試しができるように、9つのトピックについて全部で51個の問題を用意しました。各問題にはメインとなる模範解答以外にも「別解」を用意し、なるべくいろいろな考え方に触れられるよう構成しています(「はじめに」より抜粋)。 【PyQ(パイキュー)とは】 株式会社ビープラウドが運営するブラウザだけで学べるオンライン学習サービス。 【本書の問題の一例】 ・最小と最大を抽出するには ・条件で行を絞り込むには ・文字列を日付時刻に変換するには 【学習環境】 実行環境:PyQ、Jupyter Lab 利用言語:Python 3.11 利用ライブラリ:pandas:1.5.2、JupyterLab:3.5.1、Matplotlib:3.6.2 【対象読者】 ・Pythonとpandasの基本的な操作を学んだ入門者 ・pandasでもっと効率的な書き方を知りたい・知識を広げたい方 【前提知識】 ・Pythonの基本的な文法 ・pandasおよびNumPyの基本的な使い方 【目次】 第0章 本書の使い方 第1章 pandasの基礎知識 第2章 データを入出力しよう 第3章 データの概要を確認しよう 第4章 データを部分的に参照しよう 第5章 データを変形しよう 第6章 データを加工・演算しよう 第7章 データをグループ化しよう 第8章 文字列を操作しよう 第9章 日付時刻型のデータを操作しよう 第10章 テーブル表示を見やすくしよう 【著者プロフィール】 株式会社ビープラウド PyQチーム 斎藤 努(さいとう・つとむ) 株式会社ビープラウドにてPyQなどを担当。 古木 友子(ふるき・ともこ) 株式会社ビープラウドにて分析業務などを担当。 ProloguePyQでPythonやpandasを学ぶ P.1 PyQとは P.2 本書とPyQの併用・購入特典 第 0 章 本書の使い方 0.1 使い方(1)PyQ上で解く 0.2 使い方(2)ローカルPC のJupyter上で解く 第 1 章 pandasの基礎知識 1.1 データの参照と更新(loc / iloc) 1.2 行の絞り込み(ブールインデックス) 1.3 インデックスの設定(DataFrame.set_index()) 1.4 インデックスのリセット(DataFrame.reset_index()) 1.5 Series のインデックスのリセット(Series.reset_index()) 1.6 データの結合(DataFrame.merge()) 1.7 データの結合(DataFrame.join()) 1.8 関数の適用(DataFrame.apply() / Series.apply()) 1.9 データのグループ化(DataFrame.groupby()) 第 2 章 データを入出力しよう 問題2.1 CSVファイル保存時の余計な列を除くには 解答2.1 CSVファイル保存時の余計な列を除くには 補講 インデックス付きのファイルの読み込み 問題2.2 ファイルのエンコーディングエラーを解消するには 解答2.2 ファイルのエンコーディングエラーを解消するには 問題2.3 タブ区切り形式のファイルを読み込むには 解答2.3 タブ区切り形式のファイルを読み込むには 別解2.3 タブ区切り形式のファイルを読み込むには 補講 その他のフォーマットについて 第 3 章 データの概要を確認しよう 問題3.1 列ごとの統計量を確認するには 解答3.1 列ごとの統計量を確認するには 補講 数値以外の列の統計量の確認 問題3.2 最小と最大を抽出するには 解答3.2 最小と最大を抽出するには 別解3.2 最小と最大を抽出するには 問題3.3 列ごとに昇順/降順を変えて確認するには 解答3.3 列ごとに昇順/降順を変えて確認するには 第 4 章 データを部分的に参照しよう 問題4.1 データの先頭を取得するには 解答4.1 データの先頭を取得するには 別解4.1 データの先頭を取得するには 問題4.2 データを1 列おきに取得するには 解答4.2 データを1 列おきに取得するには 補講 いろいろなスライス 問題4.3 条件で行を絞り込むには 解答4.3 条件で行を絞り込むには 問題4.4 一部の列を取得するには 解答4.4 一部の列を取得するには 問題4.51 列だけのDataFrameを作成するには 解答4.51 列だけのDataFrameを作成するには 補講 Series からDataFrame への変換 第 5 章 データを変形しよう 問題5.1 異なる列名同士で連結するには 解答5.1 異なる列名同士で連結するには 問題5.2別のDataFrame の列を結合するには 解答5.2別のDataFrame の列を結合するには 別解5.2別のDataFrame の列を結合するには 問題5.3 ロング形式からワイド形式に変換するには 解答5.3 ロング形式からワイド形式に変換するには 問題5.4 ワイド形式からロング形式に変換するには 解答5.4 ワイド形式からロング形式に変換するには 別解5.4 ワイド形式からロング形式に変換するには 問題5.5 クロス集計するには 解答5.5 クロス集計するには 別解5.5 クロス集計するには 補講 ある縦軸と横軸の組み合わせに対して、複数のデータがある場合 問題5.6 区切り文字で列を複数列に分解するには 解答5.6 区切り文字で列を複数列に分解するには 問題5.7 区切り文字で列を複数行に分解するには 解答5.7 区切り文字で列を複数行に分解するには 第 6 章 データを加工・演算しよう 問題6.1 負の値を0 に置換するには 解答6.1負の値を0 に置換するには 別解6.1負の値を0 に置換するには 問題6.2 欠損値を置換するには 解答6.2 欠損値を置換するには 補講1 DataFrame の欠損値 補講2 欠損値の削除 問題6.3欠損値を別の列の値で補完するには 解答6.3欠損値を別の列の値で補完するには 別解6.3欠損値を別の列の値で補完するには 問題6.4 重複する行を削除するには 解答6.4 重複する行を削除するには 問題6.5特定の列のTop3 の順位を追加するには 解答6.5特定の列のTop3 の順位を追加するには 問題6.6 指定した境界値で階級を分けるには 解答6.6 指定した境界値で階級を分けるには 補講 区間の記法 問題6.7 四分位数で階級を分けるには 解答6.7 四分位数で階級を分けるには 補講 階級の境界値の確認 第 7 章 データをグループ化しよう 問題7.1 点数の合計の列を追加するには 解答7.1点数の合計の列を追加するには 問題7.2 生徒ごとの教科名の一覧を追加するには 解答7.2 生徒ごとの教科名の一覧を追加するには 問題7.3 値の種類から辞書を作成するには 解答7.3 値の種類から辞書を作成するには 別解7.3 値の種類から辞書を作成するには 補講 agg() について 問題7.4 特定の列ごとに順位を追加するには 解答7.4 特定の列ごとに順位を追加するには 問題7.5 グループごとに通し番号を追加するには 解答7.5 グループごとに通し番号を追加するには 補講1 前の行と連続する値のグループで通し番号を割り当てるには 補講2 NumPy のユニバーサル関数のaccumulate() 第 8 章 文字列を操作しよう 問題8.1 列内の文字列を置換するには 解答8.1 列内の文字列を置換するには 補講 strアクセサ 問題8.2 列から特定の文字列パターンだけを抽出するには 解答8.2 列から特定の文字列パターンだけを抽出するには 補講 パターンにマッチする箇所を1 行にまとめる場合 問題8.3 特定の文字列を含んでいる行を除くには 解答8.3 特定の文字列を含んでいる行を除くには 別解8.3 特定の文字列を含んでいる行を除くには 補講 指定する文字列の注意 問題8.4 どちらかの文字列を含む行を除くには 解答8.4 どちらかの文字列を含む行を除くには 問題8.5 正規表現にマッチする行を抽出するには 解答8.5 正規表現にマッチする行を抽出するには 補講 str.match()とstr.contains() の違い 問題8.6 文字列を分割してダミー変数にするには 解答8.6 文字列を分割してダミー変数にするには 補講 strアクセサのget_dummies()とpd.get_dummies() の違い 第 9 章日付時刻型のデータを操作しよう 問題9.1 文字列を日付時刻に変換するには 解答9.1 文字列を日付時刻に変換するには 別解9.1 文字列を日付時刻に変換するには 補講 変換できないフォーマット 問題9.2 日付や曜日の情報を抽出するには 解答9.2 日付や曜日の情報を抽出するには 補講 dtアクセサ 問題9.3 タイムゾーンを変換するには 解答9.3 タイムゾーンを変換するには 補講 指定可能なタイムゾーン情報 問題9.4特定の期間の行を抽出するには 解答9.4特定の期間の行を抽出するには 別解9.4特定の期間の行を抽出するには 問題9.5 日時から年+ 週番号の列を作成するには 解答9.5 日時から年+ 週番号の列を作成するには 別解9.5 日時から年+ 週番号の列を作成するには 問題9.6 日時から週の開始日の列を作成するには 解答9.6 日時から週の開始日の列を作成するには 別解9.6 日時から週の開始日の列を作成するには 補講 Timedelta 型とpd.to_timedelta() 問題9.7 飛び飛びの日付のデータを補完するには 解答9.7 飛び飛びの日付のデータを補完するには 別解9.7 飛び飛びの日付のデータを補完するには 補講 補完する期間を指定する場合 問題9.8 週ごとにデータを集約するには 解答9.8 週ごとにデータを集約するには 補講 データがない日を補完して集約するには 第10章 テーブル表示を見やすくしよう 問題10.1 値によってスタイルを変えるには 解答10.1 値によってスタイルを変えるには 別解10.1 値によってスタイルを変えるには 補講 太字以外のスタイル 問題10.2 平均値未満の値のスタイルを変えるには 解答10.2 平均値未満の値のスタイルを変えるには 別解10.2 平均値未満の値のスタイルを変えるには 補講 style のapplymap()とapply() の違い 問題10.3 値が大きいほど背景色を濃くするには 解答10.3 値が大きいほど背景色を濃くするには 補講 グラデーションのカスタマイズ 問題10.4Jupyter のセルの途中でDataFrameを表示するには 解答10.4Jupyter のセルの途中でDataFrameを表示するには 問題10.5pandas の行を省略させずに表示するには 解答10.5pandas の行を省略させずに表示するには 別解10.5pandas の行を省略させずに表示するには 補講 その他のpandas の設定 問題10.6数値の書式を指定するには 解答10.6数値の書式を指定するには 別解10.6数値の書式を指定するには 補講 style.format() のその他の設定 問題10.7 複数のスタイルを適用するには 解答10.7 複数のスタイルを適用するには 補講 スタイルを適用したExcel の出力
デキるビジネスパーソンの間で話題沸騰中の「Python(パイソン)」というプログラミング言語で、Excel作業の質とスピードが劇的アップ!!!! コピペや分類など、あらゆる単純作業が全自動化! マクロVBAを上回る超絶パフォーマンスが満載! 著者は専門学校でも教鞭をとり、難解なプログラミングをやさしく解説することに定評のある教育系YouTuber。プログラミングを一切知らないビジネスパーソンのために、章を細かく分け、図解をまじえてやさしく解説していきます。
本書は「PythonによるExcel操作の自動化」を目的別に多数集めた1冊です。ブックやシート、セルや行列を操作するといった基本的なプログラミングはもちろん、「表の見た目を整える」「グラフを作成する」「ブックの体裁を一度に整える」「複数のシートから集計シートを作成する」といった、身近な業務を想定した用例を豊富に用意しました。また、Pythonライブラリとの連携方法についても詳しく解説しています。どのサンプルも短くて簡単に書けるものが多数のため、アレンジもしやすく、Python初心者にもとっつきやすい内容です。
Python(パイソン)は初心者が比較的修得しやすく、AI(人工知能)やパターン認識などの先端技術に活用されている優れたプログラミング言語です。 本書では、初心者を対象に、Pythonを使ったプログラミングの勘所をやさしく解説しました。 例題に取り組むことで、プログラミングとはどういうものかを理解し、プログラミング的思考を身につけてもらうことを目的に執筆しました。 読者の皆さんが、楽しみながらPythonの素晴らしさやプログラミングの醍醐味を感じていただけたら、著者として望外の喜びです。
RAPソフトに頼らなくても、業務は自動化できる! 「これ、毎日同じ作業をしているけど、自動化できないかな?」 「この作業、手でやってたらとても終わらない…どうにかできないかな?」 そんな声にお答えするのが本書です。 本書では、Pythonを使って、ビジネス上よく起きるさまざまな作業を自動化します。 サンプルが用意されているので、実際にプログラムを動かして試してみることができます。 Pythonの文法も要点を押さえて説明してあるので、自分の作業に合わせてカスタマイズしやすくなっています。 1章では、Pythonをインストールして自動化を行うための環境を整えます。簡単なプログラムを通して、プログラムを実行するコツをつかみます。 2章、3章では、Excelへのデータ入力、データ抽出、書式設定、請求書などテンプレートがあるファイルへのデータ流し込み、Wordのテンプレートへのデータ流し込み、PDF化など、一般的なオフィス文書の自動化を扱います。基本的にはopenpyxlモジュールを使い、後半ではpython-docxやpywin32も使います。 4章では、Webブラウザからのデータ取り込み、一括ダウンロード、パスワードがかかっているサイトへのログインなど、Webブラウザの操作自動化について説明します。「Beautiful Soup」モジュールやSeleniumを使います。 5章では、メールの送信、LINEやTwitterなどのSNSの操作を扱います。また、即時に実行するのではなく、日々の決まった時間や先の日付けで実行したいスケジューリングの設定について説明します。 6章では、ダイアログを出してユーザーから言葉やファイルの入力を得る方法や、正規表現の使い方、プログラムをデスクトップアプリにする方法、他の人が実行しやすい形でプログラムを渡す方法、マウスやキーボードの操作を自動化する方法など、便利な情報を詰め込んでいます。TkinterやPyInstallerを使います。 Pythonの知識の浅い方でも使いやすいように、インストール方法から、実行方法までを丁寧に説明しています。また、巻末には文法をまとめたAppendixを入れています。 実行環境としては、Windows、macOS、Linuxに対応していますが、項目によっては一部OSにしか対応していないものもありますのでご注意ください。 Python3.x対応。 ※他の人が実行しやすい形でプログラムを渡す目的で使うPyInstallerは、Python3.5~3.7対応です。 Chapter1 Pythonで仕事を自動化しよう Chapter2 Excel作業を自動化しよう Chapter3 Excelの高度な作業も自動化しよう Chapter4 Webブラウザの自動化/スクレイピング Chapter5 メールやLINE/SNSを自動化しよう Chapter6 そのほかの便利な自動化テクニック Appendix Pythonの基本文法の紹介
東大 松尾研究室が提供するあの人気講座が待望の書籍化! 本書は、2017年と2018年に東京大学で実施された「グローバル消費インテリジェンス寄付 講座」の学生向けオフライン講義と、社会人向けオンライン講座で使われた教材がベースになっています。 約400名ほどの受講枠(2年間)に、のべ1,800人以上の応募があった人気の講義です。この本のベースとなるコンテンツはJupyter Notebook形式で公開されていますが、この内容をさらに精査、ブラッシュアップし、読みやすく整えたものが本書になります。 ●本書の内容 本書には、データサイエンティストになるための基礎をつめこんでいます。データサイエンティストは、Pythonや確率・統計、機械学習など、幅広くさまざまな分野の知識を必要とします。 すべての分野を1冊で学ぶことは無理ですので、各分野で深入りはせず基礎的な事項を取り扱っています。データサイエンティストになるための地図と羅針盤のような位置づけとなることをイメージしています。 この本は主にPython 3を使って、基本的なプログラムの書き方、データの取得、読み込み、そのデータ操作からはじまり、さまざまなPythonのライブラリの使い方、確率統計の手法、機械学習(教師あり学習、教師なし学習とチューニング)の使い方についても学びます。取り扱っているデータは、マーケティングに関するデータやログデータ、金融時系列データなどさまざまで、モデリングの前にそれらを加工する手法も紹介しています。データサイエンティストになるには、どれも必要なスキルです。 本書には、さらに以下の3つの特徴があります。 ・実際のデータを使って手を動かしながら、データサイエンスのスキルを身に付けることができる ・データ分析の現場で使える実践的な内容(データ前処理など)が含まれている ・練習問題や総合問題演習など実際に頭を使って考える内容がたくさんある この本に書いてあることを実践し、読み終えた後には、実際の現場でデータ分析ができるようになるはずです。 ●この本の対象読者 この本は、プログラミングの経験があり、理系の大学1~2年生程度の教養課程の数学(線形代数、微分積分学、確率統計の基礎など)を終えている方を対象にしています。具体的には、勉強熱心な大学3~4年生の理系の学生さんや大学院生の方、また社会人になってデータサイエンスを学ぼうという意欲の高い方たちが対象です。データサイエンスの入門レベルから中級レベルの手前までを考えている人に最適で、本書のゴールもデータサイエンス入門レベルを卒業できることを想定しています。 "Contents Chapter 1 本書の概要とPythonの基礎 1-1 データサイエンティストの仕事 1-1-1 データサイエンティストの仕事 1-1-2 データ分析のプロセス 1-1-3 本書の構成 1-1-4 本書を読み進めるのに役立つ文献 1-1-5 手を動かして習得しよう 1-2 Pythonの基礎 1-2-1 Jupyter Notebookの使い方 1-2-2 Pythonの基礎 1-2-3 リストと辞書型 1-2-4 条件分岐とループ Column format記法と%記法 1-2-5 関数 Practice 練習問題1-1 Practice 練習問題1-2 1-2-6 クラスとインスタンス Practice 1章 総合問題 Chapter 2 科学計算、データ加工、グラフ描画ライブラリの使い方の基礎 2-1 データ分析で使うライブラリ 2-1-1 ライブラリの読み込み 2-1-2 マジックコマンド 2-1-3 この章で使うライブラリのインポート 2-2 Numpyの基礎 2-2-1 Numpyのインポート 2-2-2 配列操作 2-2-3 乱数 Column Numpyは高速 2-2-4 行列 Practice 練習問題2-1 練習問題2-2 練習問題2-3 2-3 Scipyの基礎 2-3-1 Scipyのライブラリのインポート 2-3-2 行列計算 2-3-3 ニュートン法 Practice 練習問題2-4 練習問題2-5 練習問題2-6 2-4 Pandasの基礎 2-4-1 Pandasのライブラリのインポート 2-4-2 Seriesの使い方 2-4-3 DataFrameの使い方 2-4-4 行列操作 2-4-5 データの抽出 2-4-6 データの削除と結合 2-4-7 集計 2-4-8 値のソート 2-4-9 nan(null)の判定 Practice 練習問題2-7 Practice 練習問題2-8 Practice 練習問題2-9 2-5 Matplotlibの基礎 2-5-1 Matplotlibを使うための準備 2-5-2 散布図 2-5-3 グラフの分割 2-5-4 関数グラフの描画 2-5-5 ヒストグラム Column さまざまなデータのビジュアル化 Practice 練習問題2-10 Practice 練習問題2-11 Practice 練習問題2-12 Practice 2章 総合問題 Chapter 3 記述統計と単回帰分析 3-1 統計解析の種類 3-3-1 記述統計と推論統計 3-3-2 この章で使うライブラリのインポート 3-2 データの読み込みと対話 3-2-1 インターネットなどで配布されている対象データの読み込み 3-2-2 データの読み込みと確認 3-2-3 データの性質を確認する Column 「変数」という用語について 3-2-4 量的データと質的データ 3-3 記述統計 3-3-1 ヒストグラム 3-3-2 平均、中央値、最頻値 3-3-3 分散と標準偏差 3-3-4 要約統計量とパーセンタイル値 3-3-5 箱ひげ図 3-3-6 変動係数 3-3-7 散布図と相関係数 3-3-8 すべての変数のヒストグラムや散布図を描く Practice 練習問題3-1 Practice 練習問題3-2 Practice 練習問題3-3 3-4 単回帰分析 3-4-1 線形単回帰分析 3-4-2 決定係数 Practice 練習問題3-4 Practice 練習問題3-5 Practice 練習問題3-6 Practice 3章 総合問題 Chapter 4 確率と統計の基礎 4-1 確率と統計を学ぶ準備 4-1-1 この章の前提知識 4-1-2 この章で使うライブラリのインポート 4-2 確率 4-2-1 数学的確率 4-2-2 統計的確率 4-2-3 条件付き確率と乗法定理 4-2-4 独立と従属 4-2-5 ベイズの定理 Practice 練習問題4-1 Practice 練習問題4-2 Practice 練習問題4-3 4-3 確率変数と確率分布 4-3-1 確率変数、確率関数、分布関数、期待値 4-3-2 さまざまな分布関数 4-3-3 カーネル密度関数 Practice 練習問題4-4 Practice 練習問題4-5 Practice 練習問題4-6 4-4 応用:多次元確率分布 4-4-1 同時確率関数と周辺確率関数 4-4-2 条件付き確率関数と条件付き期待値 4-4-3 独立の定義と連続分布 4-5 推計統計学 4-5-1 大数の法則 4-5-2 中心極限定理 4-5-3 標本分布 Practice 練習問題4-7 Practice 練習問題4-8 Practice 練習問題4-9 4-6 統計的推定 4-6-1 推定量と点推定 4-6-2 不偏性と一致性 4-6-3 区間推定 4-6-4 推定量を求める Practice 練習問題4-10 Practice 練習問題4-11 Practice 練習問題4-12 4-7 統計的検定 4-7-1 検定 4-7-2 第1種の過誤と第2種の過誤 4-7-3 ビッグデータに対する検定の注意 Practice 練習問題4-13 Practice 4章 総合問題 Chapter 5 Pythonによる科学計算(NumpyとScipy) 5-1 概要と事前準備 5-1-1 この章の概要 5-1-2 この章で使うライブラリのインポート 5-2 Numpyを使った計算の応用 5-2-1 インデックス参照 Practice 練習問題5-1 Practice 練習問題5-2 Practice 練習問題5-3 5-2-2 Numpyの演算処理 Practice 練習問題5-4 Practice 練習問題5-5 Practice 練習問題5-6 5-2-3 配列操作とブロードキャスト Practice 練習問題5-7 Practice 練習問題5-8 Practice 練習問題5-9 5-3 Scipyを使った計算の応用・ 5-3-1 補間 5-3-2 線形代数:行列の分解 Practice 練習問題5-10 Practice 練習問題5-11 Practice 練習問題5-12 Practice 練習問題5-13 Practice 練習問題5-14 5-3-3 積分と微分方程式 Practice 練習問題5-15 Practice 練習問題5-16 5-3-4 最適化 Practice 練習問題5-17 Practice 練習問題5-18 Practice 5章 総合問題 Chapter 6 Pandasを使ったデータ加工処理 6-1 概要と事前準備 6-1-1 この章で使うライブラリのインポート 6-2 Pandasの基本的なデータ操作 6-2-1 階層型インデックス Practice 練習問題6-1 Practice 練習問題6-2 Practice 練習問題6-3 6-2-2 データの結合 Practice 練習問題6-4 練習問題6-5 練習問題6-6 6-2-3 データの操作と変換 Practice 練習問題6-7 Practice 練習問題6-8 Practice 練習問題6-9 6-2-4 データの集約とグループ演算 Practice 練習問題6-10 Practice 練習問題6-11 Practice 練習問題6-12 6-3 欠損データと異常値の取り扱いの基礎 6-3-1 欠損データの扱い方 Practice 練習問題6-13 Practice 練習問題6-14 Practice 練習問題6-15 6-3-2 異常データの扱い方 6-4 時系列データの取り扱いの基礎 6-4-1 時系列データの処理と変換 Practice 練習問題6-16 6-4-2 移動平均 Practice 練習問題6-17 Practice 6章 総合問題 Chapter 7 Matplotlibを使ったデータ可視化 7-1 データの可視化 7-1-1 データの可視化について 7-1-2 この章で使うライブラリのインポート 7-2 データ可視化の基礎 7-2-1 棒グラフ 7-2-2 円グラフ Practice 練習問題7-1 Practice 練習問題7-2 Practice 練習問題7-3 7-3 応用:金融データの可視化 7-3-1 可視化する金融データ 7-3-2 ローソクチャートを表示するライブラリ 7-4 応用:分析結果の見せ方を考えよう 7-4-1 資料作成のポイントについて Practice 7章 総合問題 Column 移動平均時系列データと対数時系列データ Chapter 8 機械学習の基礎(教師あり学習) 8-1 機械学習の全体像 8-1-1 機械学習とは 8-1-2 教師あり学習 8-1-3 教師なし学習 8-1-4 強化学習 8-1-5 この章で使うライブラリのインポート 8-2 重回帰 8-2-1 自動車価格データの取り込み 8-2-2 データの整理 8-2-3 モデル構築と評価 8-2-4 モデル構築とモデル評価の流れのまとめ Practice 練習問題8-1 8-3 ロジスティック回帰 8-3-1 ロジスティック回帰の例 8-3-2 データの整理 8-3-3 モデル構築と評価 8-3-4 スケーリングによる予測精度の向上 Practice 練習問題8-2 Practice 練習問題8-3 8-4 正則化項のある回帰:ラッソ回帰、リッジ回帰 8-4-1 ラッソ回帰、リッジ回帰の特徴 8-4-2 重回帰とリッジ回帰の比較 Practice 練習問題8-4 8-5 決定木 8-5-1 キノコデータセット 8-5-2 データの整理 8-5-3 エントロピー:不純度の指標 8-5-4 情報利得:分岐条件の有益さを測る 8-5-5 決定木のモデル構築 Practice 練習問題8-5 8-6 k-NN(k近傍法) 8-6-1 k-NNのモデル構築 Practice 練習問題8-6 Practice 練習問題8-7 8-7 サポートベクターマシン 8-7-1 サポートベクターマシンのモデル構築 Practice 練習問題8-8 Practice 8章 総合問題 Chapter 9 機械学習の基礎(教師なし学習) 9-1 教師なし学習 9-1-1 教師なしモデルの種類 9-1-2 この章で使うライブラリのインポート 9-2 クラスタリング 9-2-1 k-means法 9-2-2 k-means法でクラスタリングする 9-2-3 金融マーケティングデータをクラスタリングする 9-2-4 エルボー法によるクラスター数の推定 9-2-5 クラスタリング結果の解釈 9-2-6 k-means法以外の手法 Practice 練習問題9-1 9-3 主成分分析 9-3-1 主成分分析を試す 9-3-2 主成分分析の実例 Practice 練習問題9-2 9-4 マーケットバスケット分析とアソシエーションルール 9-4-1 マーケットバスケット分析とは 9-4-2 マーケットバスケット分析のためのサンプルデータを読み込む 9-4-3 アソシエーションルール Practice 9章 総合問題 Chapter 10 モデルの検証方法とチューニング方法 10-1 モデルの評価と精度を上げる方法とは 10-1-1 機械学習の課題とアプローチ 10-1-2 この章で使うライブラリのインポート 10-2 モデルの評価とパフォーマンスチューニング 10-2-1 ホールドアウト法と交差検証法 10-2-2 パフォーマンスチューニング:ハイパーパラメータチューニング Practice 練習問題10-1 Practice 練習問題10-2 10-2-3 パフォーマンスチューニング:特徴量の扱い 10-2-4 モデルの種類 10-3 モデルの評価指標 10-3-1 分類モデルの評価:混同行列と関連指標 10-3-2 分類モデルの評価:ROC曲線とAUC Practice 練習問題10-3 10-3-3 回帰モデルの評価指標 Practice 練習問題10-4 10-4 アンサンブル学習 10-4-1 バギング Practice 練習問題10-5 10-4-2 ブースティング 10-4-3 ランダムフォレスト、勾配ブースティング Practice 練習問題10-6 10-4-4 今後の学習に向けて Practice 練習問題10-7 Practice 10 章 総合問題 Chapter 11 総合演習問題 11-1 総合演習問題 11-1-1 総合演習問題(1) 11-1-2 総合演習問題(2) 11-1-3 総合演習問題(3) 11-1-4 総合演習問題(4) 11-1-5 総合演習問題(5) 11-1-6 総合演習問題(6) 11-1-7 参考:今後のデータ分析に向けて Appendix A-1 本書の環境構築について A-1-1 Anacondaについて A-1-2 Anacondaのパッケージをダウンロードする A-1-3 Anacondaをインストールする A-1-4 pandas-datareaderおよびPlotlyのインストール A-2 練習問題解答 A-2-1 Chapter1 練習問題 A-2-2 Chapter2 練習問題 A-2-3 Chapter3 練習問題 A-2-4 Chapter4 練習問題 A-2-5 Chapter5 練習問題 A-2-6 Chapter6 練習問題 A-2-7 Chapter7 練習問題 A-2-8 Chapter8 練習問題 A-2-9 Chapter9 練習問題 A-2-10 Chapter10 練習問題 A-2-11 Chapter11 総合演習問題 Column ダミー変数と多重共線性 A-3 参考文献・参考URL A-3-1 参考文献 A-3-2 参考URL