【2023最新】「pandas」のおすすめ本!人気ランキング

この記事では、「pandas」のおすすめ本をランキング形式で紹介していきます。インターネット上の口コミや評判をベースに集計し独自のスコアでランク付けしています。

pandasクックブック ―Pythonによるデータ処理のレシピ―

Theodore Petrou
朝倉書店
おすすめ度
100
紹介文
科学計算,分析,可視化などPythonでのデータ処理の基本を約100のレシピを通して具体的に学ぶ GitHubに詳細なサポートデータ(Jupyter Notebook)有。すぐに試せる ・Pandas Cookbook: Recipes for Scientific Computing, Time Series Analysis and Data Visualization using Python, 2017Oct, Packt の翻訳。 ・pandas(Pythonによるデータ処理に必須のライブラリ)の活用例(レシピ)を約100紹介。 ・扱うデータ構造や使い方、可視化などを広く取り上げる。 ・各レシピは内容、手順、解説(補足、参照、注意など)という定形になっており読みやすい。 Pythonによるデータ解析を支援する機能を提供する必須のライブラリ pandas の使い方を解説する「レシピ本」。 ビッグデータを扱うデータサイエンスや科学計算に重要なツール、Pandasの実践的な使用方法=”レシピ”を約100例紹介。分析の目的から探せるレシピ本として、特定の分野に依存せずデータサイエンスのツールにpythonを選んだすべての方が読者対象。 1 Pandas基礎 レシピ1 DataFrameの解剖学 レシピ2 DataFrame主要素へのアクセス レシピ3 データ型の理解 レシピ4 データのカラムをSeriesとして選択 レシピ5 Seriesのメソッド呼び出し レシピ6 Seriesの演算子の働き レシピ7 Seriesのメソッドチェイニング レシピ8 分かりやすいインデックスに置き換え レシピ9 行とカラムの名前変更 レシピ10 カラムの作成と削除 2 DataFrameの必須演算 レシピ11 DataFrameのカラムを複数選択 レシピ12 カラムをメソッドで選択 レシピ13 カラムを意味が分かるように順序付け レシピ14 DataFrame全体の操作 レシピ15 DataFrameのメソッドチェイニング レシピ16 DataFrameの演算子の働き レシピ17 欠損値の比較 レシピ18 DataFrame演算の方向を転置 レシピ19 大学のキャンパスのダイバーシティ指標の計算 3 データ分析開始 レシピ20 データ分析ルーチンの開発 レシピ21 データ型を変更してメモリ削減 レシピ22 最大の中の最小を選択 レシピ23 ソートして各グループでの最大を選択 レシピ24 sort_valuesでnlargestの代用 レシピ25 トレール注文の価格計算 4 データから部分抽出 レシピ26 Seriesデータの選択 レシピ27 DataFrameの行の選択 レシピ28 DataFrameの行とカラムの同時選択 レシピ29 整数とラベルの両方でデータ選択 レシピ30 スカラー選択の高速化 レシピ31 行の手軽なスライシング レシピ32 文字順にスライシング 5 booleanインデックス法 レシピ33 boolean統計量の計算 レシピ34 複数のboolean条件の構築 レシピ35 booleanインデックス法によるフィルタリング レシピ36 インデックス選択によるbooleanインデックス法の代用 レシピ37 重複のないインデックスとソートしたインデックスによる選択 レシピ38 株価見通しの計算 レシピ39 SQLのWHERE節の翻訳 レシピ40 株式収益率の正規度判定 レシピ41 queryメソッドによるbooleanインデックス法の読みやすさ改善 レシピ42 whereメソッドによるSeriesの保持 レシピ43 DataFrameの行のマスキング レシピ44 boolean,整数位置,ラベルによる選択 6 インデックスアラインメント レシピ45 インデックスオブジェクトの検査 レシピ46 デカルト積の作成 レシピ47 インデックス爆発 レシピ48 等しくないインデックスの値を埋める レシピ49 別のDataFrameからカラムを追加 レシピ50 各カラムの最大値をハイライトする レシピ51 メソッドチェイニングでidxmaxの代用 レシピ52 最多の最大値を求める 7 集約,フィルタ,変換のためのグループ分け レシピ53 集約の定義 レシピ54 複数のカラムと関数のグループ分けと集約 レシピ55 グループ分けの後でMultiIndex解消 レシピ56 集約関数のカスタマイズ レシピ57 集約関数の*argsと**kwargsをカスタマイズ レシピ58 groupbyオブジェクトの検討 レシピ59 マイノリティが多数派の(米国の)州をフィルタリング レシピ60 減量の勝負でtransform レシピ61 SATの加重平均点を州ごとにapplyで計算 レシピ62 連続変数でグループ分け レシピ63 都市間の航空便の総数 レシピ64 定時離着陸の最長ストリーク 8 整然形式にデータを再構成 レシピ65 変数値カラム名をstackで整然化 レシピ66 変数値カラム名をmeltで整然化 レシピ67 複数の変数グループを同時にスタック レシピ68 スタックしたデータを元に戻す レシピ69 groupby集約の後でunstack レシピ70 groupby集約でpivot_tableの代用 レシピ71 変形を容易にするレベル軸の名前変更 レシピ72 複数の変数がカラム名になっている場合の整然化 レシピ73 複数の変数がカラム値の場合の整然化 レシピ74 複数の値が同じセルにある場合の整然化 レシピ75 変数がカラム名とカラム値になっている場合の整然化 レシピ76 複数の観察が同じテーブルにある場合の整然化 9 pandasオブジェクトの結合 レシピ77 DataFrameに新たな行を追加 レシピ78 複数のDataFrameを接合 レシピ79 トランプとオバマの大統領としての信認レベル比較 レシピ80 concat, join, mergeの相違点を理解 レシピ81 SQLデータベースへの接続 10 時系列分析 レシピ82 Pythonとpandasの日付ツールの違いの理解 レシピ83 時系列を賢くスライシング レシピ84 DatetimeIndexでだけ働くメソッドを使う レシピ85 週ごとの犯罪件数 レシピ86 週ごとの犯罪と交通事故を別々に集約 レシピ87 曜日と年での犯罪件数の測定 レシピ88 DatetimeIndexで無名関数を使いグループ分け レシピ89 Timestampと別のカラムでグループ分け レシピ90 merge_asofで犯罪率が20%低かったのは最近ではいつかを見つける 11 matplotlib, pandas, seabornによる可視化 レシピ91 matplotlib入門 レシピ92 matplotlibでデータの可視化 レシピ93 pandasのプロットの基本 レシピ94 flightsデータセットの可視化 レシピ95 層グラフで今後の傾向を発見する レシピ96 seabornとpandasの違いを理解 レシピ97 seabornグリッドで多変量解析 レシピ98 diamondsデータセットのSimpsonパラドックスをseabornで明らかにする

Pythonによるデータ分析入門 第2版 ―NumPy、pandasを使ったデータ処理

Wes McKinney
オライリージャパン
おすすめ度
98
紹介文
Pythonのデータ分析ツールpandasのメイン開発者による、Pythonでデータサイエンスを行うための情報をまとめた。 Pythonの豊富で強力なライブラリを使ってデータ分析を行うための情報を凝縮! 2013年に発刊以来、高い人気を誇ってきたロングセラー待望の改訂版です。NumPy、SciPy、pandas、Matplotlib、IPython、Jupyterをはじめ、高機能で使いやすい数学・科学計算用ライブラリが充実しているPythonは、科学計算、統計解析、機械学習のみならず、金融や経済分野でも不動の地位を築きつつあります。本書はPythonの代表的なデータ分析ツール、pandasのメイン開発者による、Pythonでデータサイエンスを行うための情報をまとめた一冊です。

Pythonデータサイエンスハンドブック ―Jupyter、NumPy、pandas、Matplotlib、scikit-learnを使ったデータ分析、機械学習

Jake VanderPlas
オライリージャパン
おすすめ度
83
紹介文
Pythonのデータサイエンス用のツールを使いこなし、効率よく仕事を進めるための、実用的な情報が詰め込まれたリファレンス。 Pythonでデータ分析や機械学習を行うためのリファレンス! Pythonのデータサイエンス用のツールを使いこなし、効率よく仕事を進めるための、実用的な情報が詰め込まれたリファレンスです。IPythonとJupyter、NumPy、pandas、matplotlib、scikit-Learnをカバーします。それぞれのトピックについて、押さえておくべき基本、tips、便利なコマンドなどを紹介します。普段、Pythonで、データの操作、変換、可視化、統計的処理、データモデルの構築、科学計算を行う人にとって必須のリファレンスです。

Pythonデータ分析/機械学習のための基本コーディング! pandasライブラリ活用入門 (impress top gear)

Daniel Y. Chen
インプレス
おすすめ度
69

Python実践データ分析100本ノック

下山 輝昌
秀和システム
おすすめ度
67
紹介文
データ分析の現場にあって入門書にない「汚いデータ」(ダーティデータ)に対応する、プロのノウハウを解説します。 これがリアルなデータ分析だ! 君は「汚いデータ」を処理できるか? データ分析の現場にあって入門書にないもの――それは、「汚いデータ」(ダーティデータ)です。本書は、データ分析の現場では①どんなデータに出会い、②どのような問題が生じ、③どう対応すればよいのかというノウハウを解説。 事前の加工(視覚化)から機械学習、最適化問題まで、100本ノックをこなして、ビジネス現場で即戦力になれる「応用力」を身につけよう! 練習するライブラリ ・Pandas ・Numpy ・Matplotlib ・scikit-learn ・Networkxs ・pulp ・ortoolpy ・opencv ・dlib ・MeCab 第1部 基礎編:データ加工 第1章 ウェブからの注文数を分析する10本ノック 第2章 小売店のデータでデータ加工を行う10本ノック 第2部 実践編①:機械学習 第3章 顧客の全体像を把握する10本ノック 第4章 顧客の行動を予測する10本ノック 第5章 顧客の退会を予測する10本ノック 第3部 実践編②:最適化問題 第6章 物流の最適ルートをコンサルティングする10本ノック 第7章 ロジスティクスネットワークの最適設計を行う10本ノック 第8章 数値シミュレーションで消費者行動を予測する10本ノック 第4部 発展編:画像処理/言語処理 第9章 潜在顧客を把握するための画像認識10本ノック 第10章 アンケート分析を行うための自然言語処理10本ノック

Kaggleで勝つデータ分析の技術

門脇 大輔
技術評論社
おすすめ度
66
紹介文
データサイエンスの認知の高まりとともに、データ分析に関するコンペティションが多数開催されるようになってきました。最も有名なコンペティションプラットフォームであるKaggleにおけるプレイヤー数は10万人を超え、多くのエンジニアが自分の腕を試すためにコンペティションに参加しています。分析コンペでは、実際のデータを扱うため、機械学習の解説書にはあまり載っていないような手法やテクニックが数多く活用されています。これらを理解し自身で使えるようにしておくことはコンペだけでなく、実務でのモデル構築において非常に役に立ちます。 そこでこれらのテクニックや事例を多くの人に知っていただくために、現時点で最新のものを整理して本書にまとめました。特徴量の作り方、バリデーション、パラメータチューニングなどについて、一般的な書籍ではあまり言及されない暗黙知やポイントについて記述しています。分析コンペにこれから参加してみたい方、あるいはもっと上を目指したい方だけでなく、実務で予測モデルの精度を上げたいという方にも参考になる情報が多いでしょう。 第1章 分析コンペとは? 1.1 分析コンペって何? 1.1.1 何をするものか 1.1.2 予測結果の提出と順位表(Leaderboard) 1.1.3 チームでの参加 1.1.4 入賞賞金・特典 1.2 分析コンペのプラットフォーム 1.2.1 Kaggle 1.2.2 Rankings(ランキング・称号制度) 1.2.3 Kernel 1.2.4 Discussion 1.2.5 Datasets 1.2.6 API 1.2.7 Newsfeed 1.2.8 開催された分析コンペの種類と具体例 1.2.9 分析コンペのフォーマット 1.3 分析コンペに参加してから終わるまで 1.3.1 分析コンペに参加 1.3.2 規約に同意 1.3.3 データをダウンロード 1.3.4 予測値の作成 1.3.5 予測値の提出 1.3.6 Public Leaderboardをチェック 1.3.7 最終予測値を選ぶ 1.3.8 Private Leaderboardをチェック 1.4 分析コンペに参加する意義 1.4.1 賞金を得る 1.4.2 称号やランキングを得る 1.4.3 実データを用いた分析の経験・技術を得る 1.4.4 データサイエンティストとのつながりを得る 1.4.5 就業機会を得る 1.5 上位を目指すためのポイント 1.5.1 タスクと評価指標 1.5.2 特徴量の作成 1.5.3 モデルの作成 1.5.4 モデルの評価 1.5.5 モデルのチューニング 1.5.6 アンサンブル 1.5.7 分析コンペの流れ Column  計算リソース 第2章 タスクと評価指標 2.1 分析コンペにおけるタスクの種類 2.1.1 回帰タスク 2.1.2 分類タスク 2.1.3 レコメンデーション 2.1.4 その他のタスク 2.2 分析コンペのデータセット 2.2.1 テーブルデータ 2.2.2 外部データ 2.2.3 時系列データ 2.2.4 画像や自然言語などのデータ 2.3 評価指標 2.3.1 評価指標(evaluation metrics)とは 2.3.2 回帰における評価指標 2.3.3 二値分類における評価指標?正例か負例かを予測値とする場合 2.3.4 二値分類における評価指標?正例である確率を予測値とする場合 2.3.5 多クラス分類における評価指標 2.3.6 レコメンデーションにおける評価指標 2.4 評価指標と目的関数 2.4.1 評価指標と目的関数の違い 2.4.2 カスタム評価指標とカスタム目的関数 2.5 評価指標の最適化 2.5.1 評価指標の最適化のアプローチ 2.5.2 閾値の最適化 2.5.3 閾値の最適化をout-of-foldで行うべきか? Column out-of-foldとは? 2.5.4 予測確率とその調整 2.6 評価指標の最適化の例 2.6.1 balanced accuracyの最適化 2.6.2 mean-F1における閾値の最適化 2.6.3 quadratic weighted kappaにおける閾値の最適化 2.6.4 カスタム目的関数での評価指標の近似によるMAEの最適化 2.6.5 MCCのPR-AUCによる近似とモデル選択 2.7 リーク(data leakage) 107 2.7.1 予測に有用な情報が想定外に漏れている意味でのリーク 2.7.2 バリデーションの枠組みの誤りという意味でのリーク 第3章 特徴量の作成 3.1 本章の構成 3.2 モデルと特徴量 3.2.1 モデルと特徴量 3.2.2 ベースラインとなる特徴量 3.2.3 決定木の気持ちになって考える 3.3 欠損値の扱い 3.3.1 欠損値のまま取り扱う 3.3.2 欠損値を代表値で埋める 3.3.3 欠損値を他の変数から予測する 3.3.4 欠損値から新たな特徴量を作成する 3.3.5 データ上の欠損の認識 3.4 数値変数の変換 3.4.1 標準化(standardization) Column データ全体の数値を利用して変換を行うときに、学習データのみを使うか、テストデータも使うか 3.4.2 Min-Maxスケーリング 3.4.3 非線形変換 3.4.4 clipping 3.4.5 binning 3.4.6 順位への変換 3.4.7 RankGauss 3.5 カテゴリ変数の変換 3.5.1 one-hot encoding 3.5.2 label encoding 3.5.3 feature hashing 3.5.4 frequency encoding 3.5.5 target encoding 3.5.6 embedding 3.5.7 順序変数の扱い 3.5.8 カテゴリ変数の値の意味を抽出する 3.6 日付・時刻を表す変数の変換 3.6.1 日付・時刻を表す変数の変換のポイント 3.6.2 日付・時刻を表す変数の変換による特徴量 3.7 変数の組み合わせ 3.8 他のテーブルの結合 3.9 集約して統計量をとる 3.9.1 単純な統計量をとる 3.9.2 時間的な統計量をとる 3.9.3 条件を絞る 3.9.4 集計する単位を変える 3.9.5 ユーザ側でなく、アイテム側に注目する 3.10 時系列データの扱い 3.10.1 時系列データとは? 3.10.2 予測する時点より過去の情報のみを使う 3.10.3 ワイドフォーマットとロングフォーマット 3.10.4 ラグ特徴量 3.10.5 時点と紐付いた特徴量を作る 3.10.6 予測に使えるデータの期間 3.11 次元削減・教師なし学習による特徴量 3.11.1 主成分分析(PCA) 3.11.2 非負値行列因子分解(NMF) 3.11.3 Latent Dirichlet Allocation(LDA) 3.11.4 線形判別分析(LDA) 3.11.5 t-SNE、UMAP 3.11.6 オートエンコーダ 3.11.7 クラスタリング 3.12 その他のテクニック 3.12.1 背景にあるメカニズムから考える 3.12.2 レコード間の関係性に注目する 3.12.3 相対値に注目する 3.12.4 位置情報に注目する 3.12.5 自然言語処理の手法 3.12.6 自然言語処理の手法の応用 3.12.7 トピックモデルの応用によるカテゴリ変数の変換 3.12.8 画像特徴量を扱う手法 3.12.9 decision tree feature transformation 3.12.10 匿名化されたデータの変換前の値を推測する 3.12.11 データの誤りを修正する 3.13 分析コンペにおける特徴量の作成の例 3.13.1 Kaggleの「Recruit Restaurant Visitor Forecasting」 3.13.2 Kaggleの「Santander Product Recommendation」 3.13.3 Kaggleの「Instacart Market Basket Analysis」 3.13.4 KDD Cup 2015 3.13.5 分析コンペにおけるその他のテクニックの例 第4章 モデルの作成 4.1 モデルとは何か? 4.1.1 モデルとは何か? 4.1.2 モデル作成の流れ 4.1.3 モデルに関連する用語とポイント 4.2 分析コンペで使われるモデル 4.3 GBDT(勾配ブースティング木) 4.3.1 GBDTの概要 4.3.2 GBDTの特徴 4.3.3 GBDTの主なライブラリ 4.3.4 GBDTの実装 4.3.5 xgboostの使い方のポイント 4.3.6 lightgbm 4.3.7 catboost Column xgboostのアルゴリズムの解説 4.4 ニューラルネット 4.4.1 ニューラルネットの概要 4.4.2 ニューラルネットの特徴 4.4.3 ニューラルネットの主なライブラリ 4.4.4 ニューラルネットの実装 4.4.5 kerasの使い方のポイント 4.4.6 参考になるソリューション - 多層パーセプトロン 4.4.7 参考になるソリューション - 最近のニューラルネットの発展 4.5 線形モデル 4.5.1 線形モデルの概要 4.5.2 線形モデルの特徴 4.5.3 線形モデルの主なライブラリ 4.5.4 線形モデルの実装 4.5.5 線形モデルの使い方のポイント 4.6 その他のモデル 4.6.1 k近傍法(k-nearest neighbor algorithm、kNN) 4.6.2 ランダムフォレスト(Random Forest、RF) 4.6.3 Extremely Randomized Trees(ERT) 4.6.4 Regularized Greedy Forest(RGF) 4.6.5 Field-aware Factorization Machines(FFM) 4.7 モデルのその他のポイントとテクニック 4.7.1 欠損値がある場合 4.7.2 特徴量の数が多い場合 4.7.3 目的変数に1対1で対応するテーブルでない場合 4.7.4 pseudo labeling Column 分析コンペ用のクラスやフォルダの構成 第5章 モデルの評価 5.1 モデルの評価とは? 5.2 バリデーションの手法 5.2.1 hold-out法 5.2.2 クロスバリデーション 5.2.3 stratified k-fold 5.2.4 group k-fold 5.2.5 leave-one-out 5.3 時系列データのバリデーション手法 5.3.1 時系列データのhold-out法 5.3.2 時系列データのクロスバリデーション(時系列に沿って行う方法) 5.3.3 時系列データのクロスバリデーション(単純に時間で分割する方法) 5.3.4 時系列データのバリデーションの注意点 5.3.5 Kaggleの「Recruit Restaurant Visitor Forecasting」 5.3.6 Kaggleの「Santander Product Recommendation」 5.4 バリデーションのポイントとテクニック 5.4.1 バリデーションを行う目的 5.4.2 学習データとテストデータの分割をまねる 5.4.3 学習データとテストデータの分布が違う場合 5.4.4 Leaderboardの情報を利用する 5.4.5 バリデーションデータやPublic Leaderboardへの過剰な適合 5.4.6 クロスバリデーションのfoldごとに特徴量を作り直す 5.4.7 使える学習データを増やす 第6章 モデルのチューニング 6.1 パラメータチューニング 6.1.1 ハイパーパラメータの探索手法 6.1.2 パラメータチューニングで設定すること 6.1.3 パラメータチューニングのポイント 6.1.4 ベイズ最適化でのパラメータ探索 6.1.5 GBDTのパラメータおよびそのチューニング Column xgboostの具体的なパラメータチューニングの方法 6.1.6 ニューラルネットのパラメータおよびそのチューニング Column 多層パーセプトロンの具体的なパラメータチューニングの方法 6.1.7 線形モデルのパラメータおよびそのチューニング 6.2 特徴選択および特徴量の重要度 6.2.1 単変量統計を用いる方法 6.2.2 特徴量の重要度を用いる方法 6.2.3 反復して探索する方法 6.3 クラスの分布が偏っている場合 Column ベイズ最適化およびTPEのアルゴリズム 第7章 アンサンブル 7.1 アンサンブルとは? 7.2 シンプルなアンサンブル手法 7.2.1 平均、加重平均 7.2.2 多数決、重みづけ多数決 7.2.3 注意点とその他のテクニック 7.3 スタッキング 7.3.1 スタッキングの概要 7.3.2 特徴量作成の方法としてのスタッキング 7.3.3 スタッキングの実装 7.3.4 スタッキングのポイント 7.3.5 hold-outデータへの予測値を用いたアンサンブル 7.4 どんなモデルをアンサンブルすると良いか? 7.4.1 多様なモデルを使う 7.4.2 ハイパーパラメータを変える 7.4.3 特徴量を変える 7.4.4 問題のとらえ方を変える 7.4.5 スタッキングに含めるモデルの選択 7.5 分析コンペにおけるアンサンブルの例 7.5.1 Kaggleの「Otto Group Product Classification Challenge」 7.5.2 Kaggleの「Home Depot Product Search Relevance」 7.5.3 Kaggleの「Home Credit Default Risk」 付 録 A.1 分析コンペの参考資料 A.2 参考文献 A.3 本書で参照した分析コンペ 索引 著者プロフィール

現場で使える! pandasデータ前処理入門 機械学習・データサイエンスで役立つ前処理手法

株式会社ロンバート
翔泳社
おすすめ度
65
紹介文
データの前処理をpandasで効率よく行おう! 機械学習エンジニア&データサイエンティスト必携! 初学者でもpandasによる前処理手法がわかる 【本書の背景】 機械学習やデータサイエンスでは、いかに「きれいなデータ」を用意できるかが非常に重要です。データクレンジングともいわれますが、実際の現場のデータは、機械学習やデータ分析にすぐ利用できるデータは皆無に等しく、エンジニアによりデータの前処理が必須となってきています。 【本書の概要】 本書は、機械学習やデータサイエンスの現場では、データ処理に必要な定番のライブラリ「pandas」を用いて、前処理の基本と様々な前処理手法について、あますところなく解説した書籍です。 初学者向けにシンプルでわかりやすいサンプルを用いていますので、pandasの基本操作方法やデータ構造、さらに前処理の基本の理解についてもしっかり学ぶことができます。 pandasを理解することで、様々な機械学習・データ分析タスクがスムーズに行えるようになります。 【本書の対象読者】 ・機械学習エンジニア(初学者) ・データサイエンティスト(初学者) 【著書からひとこと】 機械学習では「Garbage In, Garbage Out(略、GIGO)」と言う概念があります。これは「無意味な(ゴミのような)データを入力すると無意味な結果が戻される」の意味です。 GIGOの概念でも解る通り、機械学習エンジニアは様々な手法で収集された膨大なデータの分析を行い、意味のある結果を得るために、多種多様な手法の前処理/分析を行います。 機械学習において約7割の時間はデータの前処理に費やされると言われていますが、その多くは「pandas」を使ったものです。 CSVファイルの読み込みから始まり、要約統計量や欠損値・外れ値・重複データの確認、さらにデータのマージやグループ化などの様々なタスクをpandasで行います。 本書では機械学習「初学者向け」にpandasの基本的な操作を解説しています。初歩的な要約統計量の算出やグループ化やダミー変数、さらに文字列や時系列データの基本操作など、幅広い範囲をカバーしています。 日々、データを業務で取り扱う機械学習エンジニアやKaggle等のデータ分析競技をやられている方に向けて、pandasを使ったデータ前処理のお役に立てばと思い執筆いたしました。 Chapter 1 pandasの概要とPythonの基本操作 1.1 機械学習の分野でなくてはならないライブラリ「pandas」 1.2 pandasを利用する環境の構築 1.3 Pythonのデータ構造 1.4 Pythonの基本操作 1.5 Jupyter Notebookの基本操作 Chapter 2 pandasのデータ構造 2.1 シリーズ 2.2 データフレーム 2.3 インデックス 2.4 pandasを触ってみよう Chapter 3 データ参照と読み込み 3.1 データ参照 3.2 ファイルの読み込み・書き出し Chapter 4 データ集計と並べ替え 4.1 データ集計 4.2 データ並べ替え Chapter 5 データ変形 5.1 追加と削除 5.2 データ連結とマージ 5.3 その他のデータ変形 Chapter 6 欠損値・外れ値・重複データ 6.1 欠損値 6.2 外れ値 6.3 重複データ Chapter 7 関数適用とグループ化 7.1 関数処理 7.2 for文によるループ処理 7.3 データのグループ化 Chapter 8 その他の操作 8.1 文字列操作 8.2 データの可視化 8.3 階層型インデックス 8.4 時系列データ Chapter 9 データ分析の基本 9.1 探索的データ解析(EDA) 9.2 整然データ(Tidy Data) 9.3 データ分析の実例(Bank Marketing) 9.4 データ分析の実例(Online Retail Data Set)

Python1年生 第2版 体験してわかる!会話でまなべる!プログラミングのしくみ

森 巧尚
翔泳社
おすすめ度
65
紹介文
最新のPython、ライブラリおよびWindoes 11に対応した「Python1年生」の第2版の登場! おかげさまで8万部突破! 読者の声に応えて 第2版の登場 【本書の概要】 Web開発やデータ分析などの分野で、ユーザー数が増えてきているPython。 最近では、Pythonに触れる方も多くなってきています。 本書はそうしたPython初心者の方に向けて、 ヤギ博士とフタバちゃんと一緒に 基本的なプログラムの作成から、面白い人工知能アプリの作成までを体験。 対話形式でプログラミングのしくみを学ぶことができます。 【対象読者】 Pythonについて何も知らないプログラミング超初心者 【本書のポイント】 ・対話形式で解説し、イラストを交えながら、基礎知識を解説します。 ・初めての方でも安心して学習できるよう基本文法もしっかり解説します。 ・平易なサンプルを用意していますので、安心してプログラムを体験できます。 ・2022年時点の最新の環境(Windows 11、Python 3.10など)に対応しています。 ・エラーでつまづいた場合の対応方法を巻末に掲載しています。 【目次】 第1章 Pythonで何ができるの? 第2章 Pythonを触ってみよう 第3章 プログラムの基本を知ろう 第4章 アプリを作ってみよう 第5章 人工知能くんと遊んでみよう 【著者プロフィール】 森 巧尚(もり・よしなお) 『マイコンBASICマガジン』(電波新聞社)の時代からゲームを作り続けて現在はコンテンツ制作や執筆活動を行い関西学院大学非常勤講師、 関西学院高等部非常勤講師、成安造形大学非常勤講師、大阪芸術大学非常勤講師、プログラミングスクールコプリ講師などを行っている。 近著に、『Python1年生』『Python2年生 スクレイピングのしくみ』『Python2年生 データ分析のしくみ』『Python3年生 機械学習のしくみ』 『Java1年生』『動かして学ぶ!Vue.js開発入門』『Python自動化簡単レシピ』(いずれも翔泳社)、 『ゲーム作りで楽しく学ぶ Pythonのきほん』『楽しく学ぶ Unity2D超入門講座』『楽しく学ぶ Unity3D超入門講座』(いずれもマイナビ出版)などがある。 第1章 Pythonで何ができるの? 第2章 Pythonを触ってみよう 第3章 プログラムの基本を知ろう 第4章 アプリを作ってみよう 第5章 人工知能くんと遊んでみよう

pandasデータ処理ドリル Pythonによるデータサイエンスの腕試し

株式会社ビープラウド
翔泳社
おすすめ度
62
紹介文
大人気オンライン学習サービス「PyQ」(パイキュー)のコンテンツが書籍になった!pandasデータ処理の腕試しをしてみよう! PyQの人気コンテンツが書籍化!データサイエンス力を試してみよう! 【本書の背景】 今日、Pythonを取り巻くデータサイエンスの実務の中で、pandasは欠かすことのできないライブラリーです。pandasには豊富な機能が用意されていますが、実務で使いこなすためには自分の頭で考え、手を動かして試行錯誤することが重要です。また、他の人が書いたコードを読むことで「そんな効率の良い書き方、知らなかった!」といった新たな気づきが得られることもあります(「はじめに」より抜粋)。 【本書の内容】 pandasを使ったプログラミングの腕試しができるように、9つのトピックについて全部で51個の問題を用意しました。各問題にはメインとなる模範解答以外にも「別解」を用意し、なるべくいろいろな考え方に触れられるよう構成しています(「はじめに」より抜粋)。 【PyQ(パイキュー)とは】 株式会社ビープラウドが運営するブラウザだけで学べるオンライン学習サービス。 【本書の問題の一例】 ・最小と最大を抽出するには ・条件で行を絞り込むには ・文字列を日付時刻に変換するには 【学習環境】 実行環境:PyQ、Jupyter Lab 利用言語:Python 3.11 利用ライブラリ:pandas:1.5.2、JupyterLab:3.5.1、Matplotlib:3.6.2 【対象読者】 ・Pythonとpandasの基本的な操作を学んだ入門者 ・pandasでもっと効率的な書き方を知りたい・知識を広げたい方 【前提知識】 ・Pythonの基本的な文法 ・pandasおよびNumPyの基本的な使い方 【目次】 第0章 本書の使い方 第1章 pandasの基礎知識 第2章 データを入出力しよう 第3章 データの概要を確認しよう 第4章 データを部分的に参照しよう 第5章 データを変形しよう 第6章 データを加工・演算しよう 第7章 データをグループ化しよう 第8章 文字列を操作しよう 第9章 日付時刻型のデータを操作しよう 第10章 テーブル表示を見やすくしよう 【著者プロフィール】 株式会社ビープラウド PyQチーム 斎藤 努(さいとう・つとむ) 株式会社ビープラウドにてPyQなどを担当。 古木 友子(ふるき・ともこ) 株式会社ビープラウドにて分析業務などを担当。 ProloguePyQでPythonやpandasを学ぶ P.1 PyQとは P.2 本書とPyQの併用・購入特典 第 0 章 本書の使い方 0.1 使い方(1)PyQ上で解く 0.2 使い方(2)ローカルPC のJupyter上で解く 第 1 章 pandasの基礎知識 1.1 データの参照と更新(loc / iloc) 1.2 行の絞り込み(ブールインデックス) 1.3 インデックスの設定(DataFrame.set_index()) 1.4 インデックスのリセット(DataFrame.reset_index()) 1.5 Series のインデックスのリセット(Series.reset_index()) 1.6 データの結合(DataFrame.merge()) 1.7 データの結合(DataFrame.join()) 1.8 関数の適用(DataFrame.apply() / Series.apply()) 1.9 データのグループ化(DataFrame.groupby()) 第 2 章 データを入出力しよう 問題2.1 CSVファイル保存時の余計な列を除くには 解答2.1 CSVファイル保存時の余計な列を除くには 補講 インデックス付きのファイルの読み込み 問題2.2 ファイルのエンコーディングエラーを解消するには 解答2.2 ファイルのエンコーディングエラーを解消するには 問題2.3 タブ区切り形式のファイルを読み込むには 解答2.3 タブ区切り形式のファイルを読み込むには 別解2.3 タブ区切り形式のファイルを読み込むには 補講 その他のフォーマットについて 第 3 章 データの概要を確認しよう 問題3.1 列ごとの統計量を確認するには 解答3.1 列ごとの統計量を確認するには 補講 数値以外の列の統計量の確認 問題3.2 最小と最大を抽出するには 解答3.2 最小と最大を抽出するには 別解3.2 最小と最大を抽出するには 問題3.3 列ごとに昇順/降順を変えて確認するには 解答3.3 列ごとに昇順/降順を変えて確認するには 第 4 章 データを部分的に参照しよう 問題4.1 データの先頭を取得するには 解答4.1 データの先頭を取得するには 別解4.1 データの先頭を取得するには 問題4.2 データを1 列おきに取得するには 解答4.2 データを1 列おきに取得するには 補講 いろいろなスライス 問題4.3 条件で行を絞り込むには 解答4.3 条件で行を絞り込むには 問題4.4 一部の列を取得するには 解答4.4 一部の列を取得するには 問題4.51 列だけのDataFrameを作成するには 解答4.51 列だけのDataFrameを作成するには 補講 Series からDataFrame への変換 第 5 章 データを変形しよう 問題5.1 異なる列名同士で連結するには 解答5.1 異なる列名同士で連結するには 問題5.2別のDataFrame の列を結合するには 解答5.2別のDataFrame の列を結合するには 別解5.2別のDataFrame の列を結合するには 問題5.3 ロング形式からワイド形式に変換するには 解答5.3 ロング形式からワイド形式に変換するには 問題5.4 ワイド形式からロング形式に変換するには 解答5.4 ワイド形式からロング形式に変換するには 別解5.4 ワイド形式からロング形式に変換するには 問題5.5 クロス集計するには 解答5.5 クロス集計するには 別解5.5 クロス集計するには 補講 ある縦軸と横軸の組み合わせに対して、複数のデータがある場合 問題5.6 区切り文字で列を複数列に分解するには 解答5.6 区切り文字で列を複数列に分解するには 問題5.7 区切り文字で列を複数行に分解するには 解答5.7 区切り文字で列を複数行に分解するには 第 6 章 データを加工・演算しよう 問題6.1 負の値を0 に置換するには 解答6.1負の値を0 に置換するには 別解6.1負の値を0 に置換するには 問題6.2 欠損値を置換するには 解答6.2 欠損値を置換するには 補講1 DataFrame の欠損値 補講2 欠損値の削除 問題6.3欠損値を別の列の値で補完するには 解答6.3欠損値を別の列の値で補完するには 別解6.3欠損値を別の列の値で補完するには 問題6.4 重複する行を削除するには 解答6.4 重複する行を削除するには 問題6.5特定の列のTop3 の順位を追加するには 解答6.5特定の列のTop3 の順位を追加するには 問題6.6 指定した境界値で階級を分けるには 解答6.6 指定した境界値で階級を分けるには 補講 区間の記法 問題6.7 四分位数で階級を分けるには 解答6.7 四分位数で階級を分けるには 補講 階級の境界値の確認 第 7 章 データをグループ化しよう 問題7.1 点数の合計の列を追加するには 解答7.1点数の合計の列を追加するには 問題7.2 生徒ごとの教科名の一覧を追加するには 解答7.2 生徒ごとの教科名の一覧を追加するには 問題7.3 値の種類から辞書を作成するには 解答7.3 値の種類から辞書を作成するには 別解7.3 値の種類から辞書を作成するには 補講 agg() について 問題7.4 特定の列ごとに順位を追加するには 解答7.4 特定の列ごとに順位を追加するには 問題7.5 グループごとに通し番号を追加するには 解答7.5 グループごとに通し番号を追加するには 補講1 前の行と連続する値のグループで通し番号を割り当てるには 補講2 NumPy のユニバーサル関数のaccumulate() 第 8 章 文字列を操作しよう 問題8.1 列内の文字列を置換するには 解答8.1 列内の文字列を置換するには 補講 strアクセサ 問題8.2 列から特定の文字列パターンだけを抽出するには 解答8.2 列から特定の文字列パターンだけを抽出するには 補講 パターンにマッチする箇所を1 行にまとめる場合 問題8.3 特定の文字列を含んでいる行を除くには 解答8.3 特定の文字列を含んでいる行を除くには 別解8.3 特定の文字列を含んでいる行を除くには 補講 指定する文字列の注意 問題8.4 どちらかの文字列を含む行を除くには 解答8.4 どちらかの文字列を含む行を除くには 問題8.5 正規表現にマッチする行を抽出するには 解答8.5 正規表現にマッチする行を抽出するには 補講 str.match()とstr.contains() の違い 問題8.6 文字列を分割してダミー変数にするには 解答8.6 文字列を分割してダミー変数にするには 補講 strアクセサのget_dummies()とpd.get_dummies() の違い 第 9 章日付時刻型のデータを操作しよう 問題9.1 文字列を日付時刻に変換するには 解答9.1 文字列を日付時刻に変換するには 別解9.1 文字列を日付時刻に変換するには 補講 変換できないフォーマット 問題9.2 日付や曜日の情報を抽出するには 解答9.2 日付や曜日の情報を抽出するには 補講 dtアクセサ 問題9.3 タイムゾーンを変換するには 解答9.3 タイムゾーンを変換するには 補講 指定可能なタイムゾーン情報 問題9.4特定の期間の行を抽出するには 解答9.4特定の期間の行を抽出するには 別解9.4特定の期間の行を抽出するには 問題9.5 日時から年+ 週番号の列を作成するには 解答9.5 日時から年+ 週番号の列を作成するには 別解9.5 日時から年+ 週番号の列を作成するには 問題9.6 日時から週の開始日の列を作成するには 解答9.6 日時から週の開始日の列を作成するには 別解9.6 日時から週の開始日の列を作成するには 補講 Timedelta 型とpd.to_timedelta() 問題9.7 飛び飛びの日付のデータを補完するには 解答9.7 飛び飛びの日付のデータを補完するには 別解9.7 飛び飛びの日付のデータを補完するには 補講 補完する期間を指定する場合 問題9.8 週ごとにデータを集約するには 解答9.8 週ごとにデータを集約するには 補講 データがない日を補完して集約するには 第10章 テーブル表示を見やすくしよう 問題10.1 値によってスタイルを変えるには 解答10.1 値によってスタイルを変えるには 別解10.1 値によってスタイルを変えるには 補講 太字以外のスタイル 問題10.2 平均値未満の値のスタイルを変えるには 解答10.2 平均値未満の値のスタイルを変えるには 別解10.2 平均値未満の値のスタイルを変えるには 補講 style のapplymap()とapply() の違い 問題10.3 値が大きいほど背景色を濃くするには 解答10.3 値が大きいほど背景色を濃くするには 補講 グラデーションのカスタマイズ 問題10.4Jupyter のセルの途中でDataFrameを表示するには 解答10.4Jupyter のセルの途中でDataFrameを表示するには 問題10.5pandas の行を省略させずに表示するには 解答10.5pandas の行を省略させずに表示するには 別解10.5pandas の行を省略させずに表示するには 補講 その他のpandas の設定 問題10.6数値の書式を指定するには 解答10.6数値の書式を指定するには 別解10.6数値の書式を指定するには 補講 style.format() のその他の設定 問題10.7 複数のスタイルを適用するには 解答10.7 複数のスタイルを適用するには 補講 スタイルを適用したExcel の出力

めんどうな作業が秒速で終わる! Excel×Python自動化の超基本

伊沢 剛
宝島社
おすすめ度
62
紹介文
デキるビジネスパーソンの間で話題沸騰中の「Python(パイソン)」というプログラミング言語で、Excel作業の質とスピードが劇的アップ!!!! コピペや分類など、あらゆる単純作業が全自動化! マクロVBAを上回る超絶パフォーマンスが満載! 著者は専門学校でも教鞭をとり、難解なプログラミングをやさしく解説することに定評のある教育系YouTuber。プログラミングを一切知らないビジネスパーソンのために、章を細かく分け、図解をまじえてやさしく解説していきます。

よくわかるPython入門

富士通ラーニングメディア
富士通ラーニングメディア
おすすめ度
62
紹介文
富士通ラーニングメディアがご提供する人気の研修コース「Python入門」をベースに書籍化しています。 Pythonは、データ解析やAI(人工知能)など様々な用途に使えることから、近年最も注目されているプログラミング言語です。富士通ラーニングメディアでは、Pythonに関する研修コースをラインナップとしてご提供しており、その中でも入門レベルに相当し、人気ベスト10にもよく入る「Python入門」の研修コースの内容を今回書籍化しました。 セールスポイント ●人気の研修コース「Python入門」を書籍化! 富士通ラーニングメディアがご提供する人気の研修コース「Python入門」をベースに書籍化しています。富士通ラーニングメディアの研修コースの特徴である「実習が多い」という特性を活かし、実習中心の作りにしています。 ●手を動かしてプログラムをどんどん作る! 基本的な構文(文法)のプログラム実践例を、手を動かしてどんどん作成し、実行結果を確認します。1行でもわからないと理解できなくなるのがプログラムの常です。本書ではプログラム1行1行すべての動きを解説しています。 ●挫折しやすいエラーを徹底フォロー! プログラミングはエラーで挫折する傾向があります。本書では「よく起きるエラー」を随所で取り上げ、エラーの発生場所やその意味、対処方法(どこを修正したらよいか)を徹底解説しているので、学習を1人でも進めていけます。 ●実習問題で実力がバッチリ身に付く! 実習問題を随所でご用意しており、プログラミングの実力を深められます。「実行結果例」をみて、同じように動作するプログラムの作成に取り組みます。解答例はプログラム1行1行すべての動きを解説しており、理解が深まります。 本書をご利用いただく前に 第1章 Pythonの概要を理解する 1-1 プログラムの概要  1-1-1 プログラムとは  1-1-2 プログラミング言語とは  1-1-3 プログラムを開発する流れ 1-2 Pythonの概要  1-2-1 Pythonとは  1-2-2 Pythonの様々な利用シーン 第2章 Pythonの環境構築を行う 2-1 環境構築  2-1-1 Pythonのインストール  2-1-2 開発ツール 2-2 Pythonの体験操作  2-2-1 メモ帳とコマンドプロンプトでPythonの      プログラムを実行する  2-2-2 対話モードでPythonのプログラムを実行      する  2-2-3 Visual Studio CodeでPythonのプログラ      ムを実行する 第3章 Pythonの基本文法を学ぶ 3-1 記述規約  3-1-1 Pythonのプログラムが読みやすい理由  3-1-2 Pythonの書き方  3-1-3 Pythonのプログラムを読みやすくするた      めの規則 3-2 データの保持  3-2-1 変数とは  3-2-2 関数の呼び出しとデータ入力  3-2-3 リストとは  3-2-4 多次元リストとは  3-2-5 タプルとは  3-2-6 辞書とは  3-2-7 集合とは 3-3 演算子  3-3-1 演算子とは  3-3-2 算術演算子  3-3-3 累計代入演算子  3-3-4 文字列を連結する演算子  3-3-5 比較演算子  3-3-6 論理演算子 3-4 制御構造  3-4-1 制御構造の種類  3-4-2 条件分岐  3-4-3 繰り返し ~for文~  3-4-4 繰り返し ~while文~  3-4-5 繰り返し処理の制御 3-5 関数  3-5-1 関数とは  3-5-2 関数の定義 3-6 例外処理  3-6-1 例外処理とは  3-6-2 例外処理の実装 第4章 外部プログラムの呼び出し方を学ぶ 4-1 ライブラリ  4-1-1 ライブラリとは  4-1-2 ライブラリの管理ツール 4-2 モジュールの関数の呼び出し  4-2-1 モジュールの関数の呼び出し方法  4-2-2 標準ライブラリのモジュールの利用例  4-2-3 外部ライブラリのモジュールの利用例 第5章 ファイルの入出力を学ぶ 5-1 アプリケーションとやり取りする    データの形式  5-1-1 データの入出力  5-1-2 JSON  5-1-3 XML  5-1-4 CSV 5-2 ファイルの読み書き  5-2-1 テキストファイルの読み込み  5-2-2 テキストファイルの書き込み  5-2-3 JSON形式のファイルの読み込み  5-2-4 JSON形式のファイルの書き込み  5-2-5 XML形式のファイルの読み込み  5-2-6 XML形式のファイルの書き込み  5-2-7 CSV形式のファイルの読み込み  5-2-8 CSV形式のファイルの書き込み 第6章 一歩進んだプログラムに挑戦する 6-1 オブジェクト指向プログラミング  6-1-1 オブジェクトとクラス  6-1-2 クラスの作成  6-1-3 オブジェクトの作成  6-1-4 継承  6-1-5 アクセス制御 6-2 PythonによるExcelの操作  6-2-1 Excelの操作のための外部ライブラリ  6-2-2 Excelシートのセルから値の読み込み  6-2-3 Excelシートのセルへの値の書き込み 付録 付録A よく起きるエラーの一覧 付録B 研修コースのご紹介 索引

できる 仕事がはかどるPython&Excel自動処理 全部入り。 (できる全部入り。)

リブロワークス
インプレス
おすすめ度
60
紹介文
本書は「PythonによるExcel操作の自動化」を目的別に多数集めた1冊です。ブックやシート、セルや行列を操作するといった基本的なプログラミングはもちろん、「表の見た目を整える」「グラフを作成する」「ブックの体裁を一度に整える」「複数のシートから集計シートを作成する」といった、身近な業務を想定した用例を豊富に用意しました。また、Pythonライブラリとの連携方法についても詳しく解説しています。どのサンプルも短くて簡単に書けるものが多数のため、アレンジもしやすく、Python初心者にもとっつきやすい内容です。

例題でわかる Pythonプログラミング入門

佐村 敏治
電気書院
おすすめ度
60
紹介文
Python(パイソン)は初心者が比較的修得しやすく、AI(人工知能)やパターン認識などの先端技術に活用されている優れたプログラミング言語です。 本書では、初心者を対象に、Pythonを使ったプログラミングの勘所をやさしく解説しました。 例題に取り組むことで、プログラミングとはどういうものかを理解し、プログラミング的思考を身につけてもらうことを目的に執筆しました。 読者の皆さんが、楽しみながらPythonの素晴らしさやプログラミングの醍醐味を感じていただけたら、著者として望外の喜びです。

AI・データ分析プロジェクトのすべて[ビジネス力×技術力=価値創出]

大城 信晃(監修・著者)
技術評論社
おすすめ度
60
紹介文
データサイエンティストと呼ばれる職種が登場して、いまや10年以上が経過しようとしています。ビッグデータやディープラーニングなど技術的な流行も後押しして、AI・データ分析プロジェクトに取り組む企業も増えました。また、データサイエンス、データエンジニアリングに関する技術情報は次第に増え、データ分析コンペティションの盛り上がりもあって技術的な知識を持つ方が増えているのは事実です。ところが、実際にAI・データ分析プロジェクトに取り組んでみると、そううまくはいかないようです。プロジェクトを進めるには技術知識だけでなく「ビジネス力」が必要なのです。 そこで、本書はこれまでメインテーマとして語られることのなかった「ビジネス力」に焦点をあてて、データ分析プロジェクトを一通り解説していきます。プロジェクトの入口として「組織の立ち上げ方」から「案件獲得」にふれ、続く実際のデータ分析プロセスにおいては、課題とゴールを明確にして、分析結果は出して終わりではなく共有、評価のサイクルが必要であることを解説します。最後に出口となる「収益化」に関する情報をまとめます。 先を行くデータ分析者達は、これまでさまざまな罠にかかり、見えない落とし穴にはまっても奮闘してノウハウを蓄積してきたのがこの10年です。これからAI・データ分析プロジェクトに取り組む方/関わる方へ向けて、先人たちのノウハウをまとめたのが本書です。 第1部 プロジェクトの準備 第1章 AI・データ分析業界の概要 第2章 データサイエンティストのキャリアと雇用 第3章 AI・データサイエンティストの実務と情報収集 第2部 プロジェクトの入口 第4章 社内案件の獲得と外部リソースの検討 第5章 データのリスクマネジメントと契約 第3部 プロジェクトの実行 第6章 AI・データ分析プロジェクトの起ち上げと管理 第7章 データの種類と分析手法の検討 第8章 分析結果の評価と改善 第9章 レポーティングとBI 第10章 データ分析基盤の構築と運用 第4部 プロジェクトの出口 第11章 プロジェクトのバリューと継続性 第12章 業界事例

図解ポケット 今日から使える! データサイエンスがよくわかる本

今西航平 西沢衛 酒井健三郎
秀和システム
おすすめ度
60
紹介文
いまや「データをビジネスに生かす」のは当たり前の時代。一般のビジネスパーソンにも「データサイエンス」のリテラシーが求められています。本書は「そもそも、データサイエンスって何?」というところから始まり、よく聞くキーワードや押さえておきたいトピック、実際のビジネスシーンでデータサイエンスがどう生かされているか? という実例まで、ポイントを絞って解説します。 文章だけだとわかりづらい内容も、豊富な図やイラストでフォロー。「なるほど、そういうことか!」とイメージをつかみやすいよう配慮しています。 また、データサイエンスは数学が深く関係しますが、本書では難しい数式や専門用語はナシ。初心者でもデータサイエンスの概要、肝が掴めるよう解説します。「データサイエンスについて知りたい、学んでみたい」けれど、「どこから学べばいいのか…?」という方に、まずは一冊目に読んで欲しい本です! ビジネスパーソンだけでなく、学生さんにもオススメです。 第1章 データサイエンスとは? 第2章 機械学習とは 第3章 データサイエンスの活用事例と手法 第4章 データ分析、活用プロセス 第5章 先端テクノロジー 第6章 学習ロードマップ

シゴトがはかどる Python自動処理の教科書

クジラ飛行机
マイナビ出版
おすすめ度
60
紹介文
RAPソフトに頼らなくても、業務は自動化できる! 「これ、毎日同じ作業をしているけど、自動化できないかな?」 「この作業、手でやってたらとても終わらない…どうにかできないかな?」 そんな声にお答えするのが本書です。 本書では、Pythonを使って、ビジネス上よく起きるさまざまな作業を自動化します。 サンプルが用意されているので、実際にプログラムを動かして試してみることができます。 Pythonの文法も要点を押さえて説明してあるので、自分の作業に合わせてカスタマイズしやすくなっています。 1章では、Pythonをインストールして自動化を行うための環境を整えます。簡単なプログラムを通して、プログラムを実行するコツをつかみます。 2章、3章では、Excelへのデータ入力、データ抽出、書式設定、請求書などテンプレートがあるファイルへのデータ流し込み、Wordのテンプレートへのデータ流し込み、PDF化など、一般的なオフィス文書の自動化を扱います。基本的にはopenpyxlモジュールを使い、後半ではpython-docxやpywin32も使います。 4章では、Webブラウザからのデータ取り込み、一括ダウンロード、パスワードがかかっているサイトへのログインなど、Webブラウザの操作自動化について説明します。「Beautiful Soup」モジュールやSeleniumを使います。 5章では、メールの送信、LINEやTwitterなどのSNSの操作を扱います。また、即時に実行するのではなく、日々の決まった時間や先の日付けで実行したいスケジューリングの設定について説明します。 6章では、ダイアログを出してユーザーから言葉やファイルの入力を得る方法や、正規表現の使い方、プログラムをデスクトップアプリにする方法、他の人が実行しやすい形でプログラムを渡す方法、マウスやキーボードの操作を自動化する方法など、便利な情報を詰め込んでいます。TkinterやPyInstallerを使います。 Pythonの知識の浅い方でも使いやすいように、インストール方法から、実行方法までを丁寧に説明しています。また、巻末には文法をまとめたAppendixを入れています。 実行環境としては、Windows、macOS、Linuxに対応していますが、項目によっては一部OSにしか対応していないものもありますのでご注意ください。 Python3.x対応。 ※他の人が実行しやすい形でプログラムを渡す目的で使うPyInstallerは、Python3.5~3.7対応です。 Chapter1 Pythonで仕事を自動化しよう Chapter2 Excel作業を自動化しよう Chapter3 Excelの高度な作業も自動化しよう Chapter4 Webブラウザの自動化/スクレイピング Chapter5 メールやLINE/SNSを自動化しよう Chapter6 そのほかの便利な自動化テクニック Appendix Pythonの基本文法の紹介

たのしいプログラミング Pythonではじめよう!

Jason R.Briggs
オーム社
おすすめ度
60

Python×Excelで作る かんたん自動化ツール

リブロワークス
日経BP
おすすめ度
59
紹介文
Pythonの汎用性とExcelの操作性。組み合わせれば、みんなで使える実用ツールに! --------------------------- Pythonの汎用性とExcelの操作性。 組み合わせれば、みんなで使える実用ツールに! --------------------------- デジタル化(デジタルトランスフォーメーション=DX)による業務効率化や生産性向上が強く求められている昨今、小学校でプログラミング教育が必修化されたこともあって、「これからの時代を生きるには大人も子どももプログラミングを学ぶことが重要」という意識が広がってきています。 特にビジネスパーソンにとっては毎日の仕事に直接的に役立つ大きな利点があります。プログラムを書くことができれば、面倒な業務をコンピューターという労働力に任せて自動化し、もっと優先度が高く重要な仕事をするための時間を生み出せるのです。 本書では、プログラミング言語Python(パイソン)の基礎からスタートして、最終的にはそれをExcelと組み合わせて職場のみんなに広く使ってもらえる自動化ツールを作る方法までを学んでいきます。特に力を入れたのは、Pythonで作ったツールを職場のみんなに使ってもらうための以下のような工夫です。 ・だれでも使えるExcelを使って入力・設定を行う方法 ・Pythonがインストールされていない環境でもプログラムを実行する方法 ・だれにでも理解できるエラーメッセージの書き方 本書の内容をマスターすれば、自分にとって便利なのはもちろん、同じチームで働くみんなに貢献できる自動化ツールを作れるようになります。プログラミング未経験でも大丈夫。PythonとExcelを駆使して、職場のヒーローになりましょう。 -------------------------- 180度ベタッと開く特別製本(コデックス装)を採用。 ぺージを押さえていなくても勝手に閉じることがないので、 解説を読みながら両手で楽々プログラムを入力できます。 プログラムのサンプルファイルもダウンロードできます。 -------------------------- Pythonの汎用性とExcelの操作性。組み合わせれば、みんなで使える実用ツールに! 第1章 Python×Excelで職場のヒーローに!  01 習得しやすく応用しやすいプログラミング言語Python  02 Pythonを開発・実行する環境を整える 第2章 Python基礎の基礎  01 データの型を意識する  02 大事なデータは変数に記憶させる  03 便利な関数・メソッドを呼び出す  04 条件によって行う処理を変える  05 Pythonに繰り返し処理をさせる  06 さまざまなライブラリでPythonの機能を拡張する 第3章 PythonでExcelを操作する  01 openpyxlでPythonからExcelを操作する  02 Excelシートからデータを読み込む  03 Excelシートにデータを書き込む  04 大量のコピー&ペーストを自動化する 第4章 Python×Excelで便利なツールを作る  01 Excelをデータファイルとして使う  02 Excelに書かれた人の名前をランダムにグループ分けする  03 Excelテンプレートのコピーを自動化する  04 複数のテキストファイルの検索・置換を一括で行う 第5章 みんなに使ってもらえるツールにするために  01 Pythonで作ったプログラムをみんなに配布する  02 ユーザーの入力によってプログラムに変化を与える  03 ユーザーを戸惑わせないためのエラー処理  04 ダイアログウィンドウでユーザーの操作を受け付ける  05 Excelファイルで入力を制御する 第6章 Python×Excelでファイル・フォルダー操作  01 Excelファイルのコピーツールを作る  02 複数のファイルの内容をExcelファイルにまとめる 第7章 Python×ExcelでWebスクレイピング  01 Webスクレイピングで情報収集を自動化する  02 Webページからテキストを取得する  03 知りたい言葉をまとめてWikipediaで検索する 第8章 Python×Excelでメール自動送信  01 メール送信を自動化する  02 送信先リストに対してメールを一括送信

前処理大全[データ分析のためのSQL/R/Python実践テクニック]

本橋 智光
技術評論社
おすすめ度
59

入門 Python 3 第2版

Bill Lubanovic
オライリージャパン
おすすめ度
59
紹介文
プログラミング初心者向けPython入門書。5年ぶりの改訂版でPython3.9.0に対応。新機能追加でボリュームアップ。 実践を見据えた本格的な入門書の改訂版! プログラミング初心者を対象としたPythonの総括的な入門書で、前提知識がなくても取り組むことができます。プログラミングとPythonの基礎から、データベース処理、Webプログラミング、ネットワークプログラミング、初歩の並列処理といった応用までわかりやすく丁寧に解説します。「入門Python 3」の5年ぶりの改訂版でPython3.9.0に対応、f文字列などの新機能が追加され大幅にボリュームアップしています。 プログラミング初心者向けPython入門書。5年ぶりの改訂版でPython3.9.0に対応。新機能追加でボリュームアップ。

Pythonでかなえる Excel作業効率化

北野 勝久
技術評論社
おすすめ度
59
紹介文
Excelは全ビジネスマン必須のアプリケーションですが、操作がめんどうだと感じたことはありませんか? 本書は、「Python」というプログラミング言語を使って、そんなめんどうな業務を自動化・効率化する方法を紹介します。プログラミングがはじめての人にもわかるように、コードの書き方からしっかり解説。ExcelやGoogleスプレッドシートでのグラフ作成やデータ収集、表計算、データ分析など、ひととおりの業務をプログラムで動かす方法がわかります。 プログラミングのはじめの一歩としてもオススメです。 ■■はじめに ■■■第1章 Pythonをはじめよう ■■1-1 Pythonの特徴 ■Column オープンソースソフトウェア(OSS)はどうして無料なの? ■■1-2 Pythonのインストール ■1-2-1 Anacondaのダウンロード ■Column Python 2? Python 3? ■1-2-2 Anacondaのインストール ■■1-3 Pythonをさわってみよう ■1-3-1 CUIの起動 ■1-3-2 Pythonの対話モードの起動 ■■1-4 PyCharmを使おう ■1-4-1 PyCharmのダウンロード ■1-4-2 PyCharmのインストール ■1-4-3 PyCharmを日本語で利用する ■1-4-4 インタープリターの設定 ■1-4-5 「hello world」と表示するプログラムの作成 ■Column PyCharmをすぐ呼び出せるようにしておこう ■■■第2章 Pythonを動かしてみよう ■■2-1 Pythonのきほん ■2-1-1 データの性質 ■2-1-2 オブジェクトと関数 ■2-1-3 計算してみよう ■2-1-4 異なるデータ型同士の計算 ■2-1-5 オブジェクトを操作する ■2-1-6 同じオブジェクトを使いまわす ■■2-2 ある条件で処理を分ける ■2-2-1 条件を判定する ■2-2-2 条件に応じて処理をする ■■2-3 オブジェクトをひとまとまりで扱う ■2-3-1 中身をあとから変更できるリスト型 ■2-3-2 中身をあとから変更できないタプル型 ■Column ミュータブルとイミュータブル ■2-3-3 キーと値をセットで扱う辞書型 ■■2-4 同じ処理を繰り返し行う ■2-4-1 要素の数だけ処理を繰り返す ■2-4-2 条件が続く限り処理を繰り返す ■2-4-3 処理の途中でループを抜け出す ■■2-5 定義した処理を実行する ■Column インデントは半角スペース4つ? ■2-5-1 関数にわたす情報・関数から戻ってくる情報 ■2-5-2 変数が使える範囲 ■Column エラーメッセージが表示されたら ■2-5-3 あらかじめ用意されている関数 ■■2-6 ファイルを機能ごとに分けて再利用する ■2-6-1 使いたいファイルを読み込ませる ■2-6-2 あらかじめ用意されているライブラリを使う ■Column サードパーティライブラリ ■■2-7 例外処理 ■■■第3章 Excel作業を自動化しよう ■■3-1 Excelファイルを操作するための準備 ■3-1-1 OpenPyXLをインストールする ■3-1-2 新しいフォルダの作成 ■3-1-3 Excelファイルをフォルダに配置する ■Column PyCharm上でのファイル移動 ■■3-2 Excelの値を表示する ■3-2-1 指定したセルの値を取得する ■Column 取得するセル位置を指定するほかの方法 ■3-2-2 複数のセルをまとめて取得する ■■3-3 Excelファイルを編集する ■3-3-1 Excelファイルを新規作成する ■3-3-2 Excelシートを追加/削除する ■3-3-3 セルの値を編集する ■3-3-4 フォントを設定する ■■3-4 Excelのレイアウトを編集する ■3-4-1 Excelの行と列の幅を設定する ■3-4-2 行と列を固定表示する ■Column #からはじまる行はなに? ■■3-5 Excelのグラフを作成する ■3-5-1 グラフが読み込むデータを決める ■3-5-2 グラフの種類を決める ■3-5-3 グラフにデータをわたす ■3-5-4 グラフをつくる ■3-5-5 データから系列をつくる ■Column PyCharmのコーディングアシスタンスについて ■Column GitやGitHubでプログラムを管理しよう ■■■第4章 Googleスプレッドシート操作も自動化しよう ■■4-1 Googleスプレッドシートを操作するための初期設定 ■4-1-1 Googleアカウントの作成 ■4-1-2 Google Cloud Platformプロジェクトの作成 ■4-1-3 スプレッドシートを操作するためのAPIを有効化する ■4-1-4 サービスアカウントを作成し、認証情報をダウンロードする ■4-1-5 利用ライブラリをインストールする ■■4-2 新しいスプレッドシートを作成する ■4-2-1 プログラムがAPIにアクセスできるよう設定する ■4-2-2 スプレッドシートを作成する ■4-2-3 スプレッドシートの共有権限を変更する ■4-2-4 スプレッドシートのURLを表示する ■Column 新しいシートを追加する ■■4-3 セルの値を取得する ■4-3-1 事前準備 ■4-3-2 スプレッドシートを開く ■4-3-3 セルの値を取得する ■■4-4 セルの値を編集する ■■■第5章 Excel作業の前工程・後工程を自動化しよう ■■5-1 フォルダ・ファイル操作 ■5-1-1 絶対パスと相対パス ■5-1-2 フォルダにあるファイルを一覧表示する ■5-1-3 フォルダを作成する ■5-1-4 ファイルの書き込みと読み込み ■Column モードオプションw、x、a の選び方 ■5-1-5 ファイルを移動する ■■5-2 文字列操作 ■5-2-1 文字列を検索する ■Column encoding オプションの指定について ■5-2-2 正規表現を使って文字列を検索する ■5-2-3 検索一致した文字列の位置を調べる ■5-2-4 文字列を置換する ■Column よりシンプルな文字列置換 ■Column format()メソッドで文字列に変数を埋め込む ■■5-3 CSVデータの処理 ■5-3-1 CSVの出力 ■Column newlineオプションの指定について ■5-3-2 CSVの読み込み ■5-3-3 CSVの加工 ■■5-4 Webからデータを取得しよう ■Column Webから情報を取得する際の注意点 ■■■第6章 表計算やデータ分析をやってみよう ■■6-1 データ分析を始める前に ■6-1-1 ExcelとPythonの使い分け ■6-1-2 データ分析の流れ ■■6-2 JupyterLabを使ってみよう ■6-2-1 JupyterLabとは ■Column Jupyter Notebookとの違いは? ■6-2-2 JupyterLabを起動する ■6-2-3 実行してみよう ■Column 新しいファイルの追加 ■6-2-4 pandasの基本的な使い方 ■■6-3 データを分析する ■6-3-1 データの準備 ■6-3-2 データを読み込む ■Column データセットの書き込み方法 ■6-3-3 データを結合する ■Column 手動でのデータ追加方法 ■Column 欠損値を補うには ■6-3-4 データを集計する ■■6-4 データを可視化する ■6-4-1 日本語フォントの使用について ■6-4-2 棒グラフを作成する ■6-4-3 折れ線グラフを作成する ■Column プログラムの書き進め方 ■■■第7章 いろんな業務を自動化してみよう ■■7-1 複数のExcelファイルに分散した売上データを分析する ■例題の説明 ■7-1-1 フォルダの中のExcelファイルを読み込む ■7-1-2 各月ごとに分かれている売上データを連結する ■Column インポートの順序とグループ化 ■7-1-3 売上データと顧客流入元データを結合する ■7-1-4 顧客流入元ごとの売上合計を集計する ■7-1-5 Excelファイルに集計データを出力する ■さらなる応用 ■■7-2 特定のルールに従って、フォルダ構成を整理する ■例題の説明 ■7-2-1 作業用フォルダにすべてのファイルをコピーする ■7-2-2 すべてのファイルを取得する ■7-2-3 取得したファイルが請求書ファイルかどうかを判別する ■Column 処理を関数にする基準は? ■7-2-4 新しいファイル名とフォルダ名を取得する ■7-2-5 新しいフォルダを作成する ■7-2-6 ファイル名変更とフォルダ移動を行う ■さらなる応用 ■■7-3 Webスクレイピングでデータを取得する ■例題の説明 ■7-3-1 対象のWebページを確認する ■Column クエリパラメータ ■7-3-2 Webページから情報を取得する ■7-3-3 CSSセレクタを確認する ■7-3-4 取得したHTMLを解析する ■7-3-5 書籍のURLを取り出す ■さらなる応用 ■Column Webページから画像を取得する ■■おわりに ■■参考文献 ■■索引 ■■読者特典

独習Python

山田 祥寛
翔泳社
おすすめ度
59
紹介文
プログラミング初学者に向けた独習シリーズに『独習Python』が新登場。山田祥寛氏によるPython入門書の決定版。 手を動かしておぼえるPythonプログラミング ――独学に最適な“標準教科書” プログラミングの初学者に向けた独習シリーズに『独習Python』が新登場。 プログラミング言語入門書の執筆で定評のある山田祥寛氏による、 Python入門書の決定版です。 独習シリーズの強みである、手を動かしておぼえる(書いて実行して結果を確認する) 特長を生かし、Pythonの基本的な言語仕様から、標準ライブラリ、ユーザー定義関数、 オブジェクト指向構文、モジュールまで、サンプルプログラムを例示しながら 詳細かつ丁寧に解説します。 プログラミングの基礎知識がない方でも、解説→例題(サンプル)→理解度チェック という3つのステップで、Pythonでプログラミングを行う際に必要な知識・概念・機能を 体系的に習得できます。 プログラミングの入門者、これからPythonで開発を始めたい初学者から、再入門者、 学生・ホビープログラマまで、「一からPython言語を学びたい」「Pythonプログラミング の基本をしっかり身につけたい」という方におすすめの一冊です。 第1章 イントロダクション 1.1 Pythonとは? 1.2 Pythonの歴史と現状 1.3 Pythonアプリを開発/実行するための基本環境 1.4 Pythonプログラミングの基本 1.5 Pythonの基本ルール 1.6 開発/学習の前に押さえておきたいテーマ 第2章 Pythonの基本 2.1 変数 2.2 データ型 第3章 演算子 3.1 算術演算子 3.2 代入演算子 3.3 比較演算子 3.4 論理演算子 3.5 ビット演算子 3.6 演算子の優先順位と結合則 第4章 制御構文 4.1 条件分岐 4.2 繰り返し処理 4.3 ループの制御 4.4 例外処理 第5章 標準ライブラリ[基本] 5.1 ライブラリの分類 5.2 文字列の操作 5.3 日付/時刻の操作 第6章 標準ライブラリ[コレクション] 6.1 シーケンス型 6.2 セット(集合)型 6.3 辞書(dict)型 第7章 標準ライブラリ[その他] 7.1 正規表現 7.2 ファイル操作 7.3 ファイルシステムの操作 7.4 HTTP経由でコンテンツを取得する 7.5 その他の機能 第8章 ユーザー定義関数 8.1 ユーザー定義関数の基本 8.2 変数の有効範囲(スコープ) 8.3 引数のさまざまな記法 8.4 関数呼び出しと戻り値 第9章 ユーザー定義関数[応用] 9.1 デコレーター 9.2 ジェネレーター 9.3 関数のモジュール化 9.4 非同期処理 9.5 ドキュメンテーション 第10章 オブジェクト指向構文 10.1 クラスの定義 10.2 カプセル化 10.3 継承 10.4 ポリモーフィズム 第11章 オブジェクト指向構文[応用] 11.1 例外処理 11.2 特殊メソッド 11.3 データクラス 11.4 イテレーター 11.5 メタクラス 付録A 「練習問題」「このの理解度チェック」解答

独学プログラマー Python言語の基本から仕事のやり方まで

コーリー・アルソフ
日経BP
おすすめ度
59
紹介文
本書は「Pythonだけ」を学ぶ本ではありません。Pythonを使ってプログラミングを紹介していますが、伝えたい内容はPythonに限らない「プログラミング全般」の知識です。 本書の著者、コーリー・アルソフ(Cory Althoff)は、「独学プログラマー」です。本書は、彼が独学で、ゼロからプログラミングを学んだ体験に基づいて書かれました。 プログラミングを独学で身に付けるために、著者がPythonを通して学んだエッセンスが書かれています。彼の独学プログラマーとしての学び方は、Amazon.comでの本書の評価を見るとわかるように、多くの人に支持されています。 ――訳者あとがきより 第1部(Part1) 第1章 イントロダクション 第2章 さあ、はじめよう! 第3章 プログラミング入門 第4章 関数 第5章 コンテナ 第6章 文字列操作 第7章 ループ 第8章 モジュール 第9章 ファイル 第10章 知識を1つにまとめる 第11章 ハマったときの助け 第2部(Part2) 第12章 プログラミングパラダイム 第13章 オブジェクト指向プログラミングの4大要素 第14章 もっとオブジェクト指向プログラミング 第15章 知識を1つにまとめる 第3部(Part3) 第16章 Bash 第17章 正規表現 第18章 パッケージ管理 第19章 バージョン管理 第20章 知識を1つにまとめる 第4部(Part4) 第21章 データ構造 第22章 アルゴリズム 第5部(Part5)  第23章 プログラミングのベストプラクティス 第24章 プログラマーとしての最初の仕事 第25章 チームで働く 第26章 さらに学ぼう 第27章 次のステップ 第6部(Part6) 補章 より良いコードにするために 補章 継続して学ぶために 謝辞 訳者あとがき 索引 第1部(Part1) 第1章 イントロダクション 第2章 さあ、はじめよう! 第3章 プログラミング入門 第4章 関数 第5章 コンテナ 第6章 文字列操作 第7章 ループ 第8章 モジュール 第9章 ファイル 第10章 知識を1つにまとめる 第11章 ハマったときの助け 第2部(Part2) 第12章 プログラミングパラダイム 第13章 オブジェクト指向プログラミングの4大要素 第14章 もっとオブジェクト指向プログラミング 第15章 知識を1つにまとめる 第3部(Part3) 第16章 Bash 第17章 正規表現 第18章 パッケージ管理 第19章 バージョン管理 第20章 知識を1つにまとめる 第4部(Part4) 第21章 データ構造 第22章 アルゴリズム 第5部(Part5)  第23章 プログラミングのベストプラクティス 第24章 プログラマーとしての最初の仕事 第25章 チームで働く 第26章 さらに学ぼう 第27章 次のステップ 第6部(Part6) 補章 より良いコードにするために 補章 継続して学ぶために 謝辞 訳者あとがき 索引

Pythonエンジニア ファーストブック

鈴木 たかのり
技術評論社
おすすめ度
59

シリコンバレー一流プログラマーが教える Pythonプロフェッショナル大全

酒井 潤
KADOKAWA
おすすめ度
59
紹介文
現役シリコンバレーエンジニアが教える「最強のプログラミング」講義! 10万人が選んだ人気No.1オンライン講座が 超わかりやすくパワーアップして書籍化! 海外企業でも通用する 一流のプログラミング技術が学べます! ★基礎から応用、一流コードスタイルまで1冊で学べる★ 【応用編】ではニーズの高い実践的テクニックを中心に、 【入門編】では基礎から1歩ずつ、わかりやすく解説。 シリコンバレーのトップIT企業で活躍する著者が 世界標準のPythonスキルを一気に伝えます。 ★海外でも通用する 一流のプログラミング技術が身につく★ 知っていましたか?  アメリカのエンジニアの年収は日本の5~10倍です。 本書は「いつか海外で活躍したい」、 そんな夢の実現も強力にバックアップしてくれる 「海外進出の道しるべ」ともなる一冊です。 ★10万人が選んだ人気No.1講座の書籍化★ 本書のもととなったのは、オンライン講座Udemyで人気No.1を獲得したPython講座。 本格的な内容をわかりやすく伝える著者の講座は人気が高く、延べ20万人以上が受講しています(全講座計)。 本書はさらに内容を充実させてパワーアップ! 自分のペースでしっかり学べます。 独学の強い味方、「サンプルコード」の無料ダウンロードサービス付き。 ★エンジニアの成功戦略も教えます★ コラムでは、エンジニアのキャリア戦略の立て方、成功するポイント、独学のコツなども紹介。 文系出身、TOEIC300点代からスタートした著者が渾身のエールを送ります。 ★用語集、Pointなども充実★ コードを書くときの注意点、知っておきたい豆知識、 開発の現場で必要なことなどは 「Point」としてたっぷり掲載。 巻末には「用語集」も収録し、 徹底して実践的な内容となっています。 オンライン講座Udemyで9万人以上が選んだ人気No.1講座を完全書籍化! 超わかりやすくパワーアップして、基礎から応用、一流コードスタイルまで、世界で通用する「最強のプログラミング」が学べる! 学習を始める前に ~Pythonの環境設定 【入門編】 Lesson 1 Pythonの基本  1 変数の宣言と数値の計算をマスターしよう  2 文字列のさまざまな操作方法 Lesson 2 データ構造  1 複数データを並列にまとめる  2 変更できないリスト? いえ、タプルです  3 キーと値をセットで記憶する辞書型  4 データ同士の演算ができる集合 Lesson 3 制御フロー  1 読みやすいコードを書こう  2 条件に応じて処理を分岐させよう  3 繰り返し処理でデータを一気に処理しよう Lesson 4 関数と例外処理  1 何度も実行する処理の関数を作ろう  2 関数の応用をマスターしよう  3 内包表記でリストをシンプルに生成しよう  4 変数の有効範囲  5 例外処理 Lesson 5 モジュールとパッケージ  1 作成したパッケージをインポートしよう  2 Pythonのライブラリの使い方 Lesson 6 オブジェクトとクラス  1 クラスとメソッド  2 クラスをもっと活用してみよう Lesson 7 ファイル操作とシステム  1 ファイルの基本的な操作  2 ファイルの便利な活用方法  3 圧縮ファイルを扱おう  4 さらに高度なファイルに関する操作 【演習編】 Lesson 8 簡単なアプリケーションを作ってみよう 【応用編】 Lesson 9 コードスタイル  1 Pythonのコードスタイル  2 さらにくわしくPythonの書き方を知ろう Lesson 10 コンフィグとロギング  1 設定ファイルのさまざまな形式  2 ロギングの基本と適切な書き方  3 ログをメールで送信しよう  4 実行環境を切り替えて使う Lesson 11  Webとネットワーク  1 Webでよく使うファイル形式  2 Pythonで通信してみよう  3 PythonでWeb サーバーを作ろう  4 Webスクレイピングしてみよう Lesson 12 並列化  1 マルチスレッドで並列化しよう  2 マルチプロセスによる並列化  3 高水準のインターフェースを使って並列化しよう Lesson 13 データ解析  1 データ解析を始める前に  2 データをまとめて扱うnumpy  3 pandasで表形式のデータを扱う  4 matplotlibでグラフを描画する  5 scikit-learnで機械学習を行う  6 株価のデータ解析と予測

Head First Python 第2版 ―頭とからだで覚えるPythonの基本

Paul Barry
オライリージャパン
おすすめ度
59
紹介文
イラストや写真を多用したビジュアル重視の紙面で初心者に直観的に理解できると人気のHead FirstシリーズのPython版 人気の入門書、Head Firstシリーズ待望のPythonバージョン! イラストや写真を多用したビジュアル重視の紙面で初心者に直観的に理解できると人気のHead FirstシリーズのPython版です。前半でPythonの基本を一通り説明してから、実際に独自のWebアプリケーションをステップバイステップで構築する作業通じて、データベース管理、例外処理、データ処理などの理解を深めていきます。手を動かしながら学べる入門書の決定版です。

統計学の基礎から学ぶ Excelデータ分析の全知識 (できるビジネス)

三好大悟
インプレス
おすすめ度
58
紹介文
本書は、これからデータ分析を行う人が知っておくべきことを全部学べる解説書です。本当に役立つ、使えるスキルが身につくように、「統計学の基礎からしっかり学ぶ」「学んだことをExcelを使って実践する」という構成になっています。そのため、これまでまったく統計学に触れたことのない人でも理解しやすく、また、Excelの操作も1つ1つ画面を見せながら解説しているため、分析が初めてでも迷わず実践できます。

プログラマーになりたい! 改訂新版

長岡 英史
日経BP
おすすめ度
58
紹介文
プログラマーを仕事にしたいなら、まずはひと通りの“開発”を体験してみませんか。スキルアップのための指針が必ず見つかります! ■ 開発の仕事をWebアプリケーションで実体験! 「プログラマーが足りない!」との指摘をよく耳にします。プログラマーやソフトウェアエンジニアを目指している人も多いことでしょう。でも、ゼロから目指すとなると未経験ということに…。何から勉強すればいいか、迷うこともあるのではないでしょうか。 そこで、まずは本書でソフトウェアの開発を“経験”してみませんか? 本書では、たとえプログラミング経験がない人でも、プログラムを作って、サーバーに転送し、誰にでも使ってもらえるようにWeb上のサービスとして公開するところまでできるよう、必要な作業やプロセスを解説しました。プログラミング経験がまったくなくても、本書の解説に沿って作業を進めていけば自分のサービスとしてアプリケーションを公開するところまでひと通りの開発を自分の手で実現できます。 本書を通じて開発したWebアプリケーションは、面接でアピールできる自分の実績になります。面接の場ではぜひ胸を張って「こういうアプリケーションを独力で公開しました」と見てもらってください。 プログラミングを学ぶ際の王道は、文法の基礎からコツコツと学んでいくこと。それはもちろん大事です。でも、それだけだといつになったら何らかのアプリケーションを作れるようになるのか、その道筋がわからず行き詰まってしまう人も少なくありません。 その点で、本書でコーディングからデプロイまで、アプリケーション開発を“実際にやってみる”ことにより、コツコツと学んだ基礎が実際の開発現場でどのように役立つのか、必要とされるのかを実感することができるでしょう。もし、基礎を学びながらモヤモヤとしたものを抱え、学習がはかどらなくなってしまっているのなら、いったん本書で全体像を把握してみることをお薦めします。全体を見渡すことで、基礎の重要性がわかると学習の効率も格段に上がるはず。 本書で取り上げた主なサービスやツールは、AWS(Amazon Web Services)、Django、Git、Herokuです。すべてクラウドで完結しているので、お手元の環境のOSやスペックに依存せず、Webを利用できる環境であれば誰でも同じように開発プロセスをトレースできます。 第1章 プログラマーと開発の仕事 第2章 Webアプリケーション開発の基本 第3章 Pythonの基礎の基礎 第4章 Webアプリ開発――開発環境の作成 第5章 Webアプリ開発――コーディング 第6章 Webアプリ開発――デプロイ 第7章 これからのスキルアップ戦略

退屈なことはPythonにやらせよう ―ノンプログラマーにもできる自動化処理プログラミング

Al Sweigart
オライリージャパン
おすすめ度
58
紹介文
手作業だと膨大に時間がかかる処理を一瞬でこなすPython 3プログラムの作り方について学べる入門書。 Pythonによる自動処理入門。とにかく、わかりやすい! ファイル名の変更や表計算のデータ更新といった作業は、日々の仕事の中で頻繁に発生します。ひとつふたつ修正するだけであれば問題はありません。しかし、それが数十、数百となってくると手に負えません。そのような単純な繰り返し作業はコンピュータに肩代わりしてもらうとすごくラクになります。本書では、手作業だと膨大に時間がかかる処理を一瞬でこなすPython 3プログラムの作り方について学びます。対象読者はノンプログラマー。本書で基本をマスターすれば、プログラミング未経験者でも面倒な単純作業を苦もなくこなす便利なプログラムを作れるようになります。さらに、章末の練習問題を解くことで、類似のタスクを自動処理するスキルをもっと高めることができます。

実践Data Scienceシリーズ データ分析のためのデータ可視化入門 (KS情報科学専門書)

キーラン・ヒーリー
講談社
おすすめ度
58
紹介文
全世界のRユーザーが絶賛したベストセラーがついに翻訳! ggplotとtidyverseの事前知識ゼロでもすぐに実践できる! ★全世界のRユーザーが絶賛したベストセラー“Data Visualization: A Practical Introduction”がついに翻訳!! ・データ可視化の奥深さを、すべての人に! ・ggplotとtidyverseの事前知識ゼロでも、すぐに実践できる! ・可視化の手順はもちろん、「データをどう見せるか」という意図まで踏み込んで解説! 【サポートページ】 https://github.com/uribo/kspub-dataviz 【推薦の言葉:原著刊行にあたって】 この本は,学生や実務家がデータを定量的可視化して研究結果を最大限に活用するために必要な実践的なスキルを提供します. ・Rとggplot2を使用したハンズ・オン形式の実践的な入門を提供します. ・tidyverseを使うことでRの作業をより簡単に,より一貫性のあるものにする方法を示します. ・データセット,コード,関数が含まれたパッケージを含んでいます. ――エリザベス・ブルッフ(Elizabeth Bruch) ミシガン大学 この本はデータの可視化法を読者に教えるだけでなく,データ可視化がなぜ優れた社会学において不可欠なものであるのか丁寧に考察しているすばらしい本です.どのレベルの学生であっても簡単に本書に取り組むことができるでしょう. ――ベッキー・ペッティ(Becky Petti) テキサス大学オースティン校 ヒーリーは定量的なデータ可視化のプロセスに対して独創的な入門書を作りました.このすばらしい一貫した論じ方は,解析の初心者にも上級者にも学びが大きいでしょう.このような本は他にはありません. ――トーマス・J・リーパー(Thomas J. Leeper) ロンドン・スクール・オブ・エコノミクス 【主な内容】 第1章 データを見る 第2章 さあ,始めよう! 第3章 プロットを作る 第4章 正しい数値の示し方 第5章 データの整形・ラベル・メモの追加 第6章 モデルデータの可視化 第7章 地図を描画する 第8章 プロットを整える 付録A 第1章 データを見る 1.1 なぜデータを見るのか 1.2 悪いグラフのどこが悪いのか 1.3 知覚とデータ可視化 1.4 視覚的タスクとグラフの復号化 1.5 データ表現のための表象の種類と形式 1.6 誠実さと適切な判断に関する問題 1.7 グラフに関する明確な思考 1.8 次の一手 第2章 さあ,始めよう! 2.1 プレーンテキストでのR Markdownを使った作業 2.2 RとRStudioを利用する 2.3 Rについて知っておくべきこと 2.4 自分自身,Rへの忍耐 2.5 Rにデータを読み込ませる 2.6 最初の図を作る 2.7 次の一手 第3章 プロットを作る 3.1 ggplotはどうやって動くのか 3.2 tidyデータ 3.3 マッピングがデータと表示物を結びつける 3.4 プロットをレイヤーごとに作り上げていく 3.5 審美的要素のマッピングとテーマの設定 3.6 審美的要素はgeomでもマッピングできる 3.7 保存しよう 3.8 次の一手 第4章 正しい数値の示し方 4.1 文法としては正しいが意味をなさない 4.2 グループ別データに対応する審美的要素 4.3 複数の図を並べるためのfacet_ 関数群 4.4 geomによるデータの変換 4.5 回りくどく度数分布表を描いてみる 4.6 ヒストグラムと密度プロット 4.7 不要な変換を避ける 4.8 次の一手 第5章 データの整形・ラベル・メモの追加 5.1 パイプを使ったデータの集計 5.2 グループ化・カテゴリ化された連続変数の取り扱い 5.3 図にテキストを直接描画する 5.4 特定のデータへのラベリング 5.5 図内への描画と書き込み 5.6 scale_関数・guides()関数・theme()関数 5.7 次の一手 第6章 モデルデータの可視化 6.1 複数の回帰直線を凡例付きで一度に図示する 6.2 モデルオブジェクトの中身を確認する 6.3 モデルから図に使えるデータを正しく抽出する 6.4 予測の図示 6.5 broomパッケージによるtidyなモデルオブジェクトの取り扱い 6.6 グループ化したデータの分析およびリスト列の取り扱い 6.7 限界効果の可視化 6.8 複雑な調査データの可視化 6.9 次の一手 第7章 地図を描画する 7.1 アメリカ合衆国の州単位での地図 7.2 階級区分に頼らないアメリカ合衆国の地図 7.3 地理的な空間配置を考慮したグラフ 7.4 複数の地図を1枚の図にまとめる 7.5 そのデータは本当に空間情報を含みますか 7.6 次の一手 第8章 プロットを整える 8.1 色を使いこなす 8.2 色とテキストを一緒に重ねる 8.3 テーマを使ってプロットの外観を変更する 8.4 テーマ要素を実務的に使う 8.5 ケーススタディ 8.6 次の一手 付録A

退屈なことはPythonにやらせよう 第2版 ―ノンプログラマーにもできる自動化処理プログラミング

Al Sweigart
オライリージャパン
おすすめ度
58
紹介文
日常業務でよく直面する面倒で退屈な作業を、Pythonと豊富なモジュールを使って自動化!ベストセラーの改訂版。 和書5万部突破のベストセラー書の改訂版! 一歩先行くハイパフォーマンスなビジネスパーソンからの圧倒的な支持を獲得し、自作RPA本の草分けとして大ヒットしたベストセラー書の改訂版。劇的な「業務効率化」「コスト削減」「生産性向上」を達成するには、単純な繰り返し作業の自動化は必須です。本書ではWordやExcel、PDF文書の一括処理、Webサイトからのダウンロード、メールやSMSの送受信、画像処理、GUI操作といった日常業務でよく直面する面倒で退屈な作業を、Pythonと豊富なモジュールを使って自動化します。今回の改訂では、GmailやGoogleスプレッドシートの操作、Pythonと各種モジュールの最新版への対応、演習等を増補しています。日本語版では、PyInstallerによるEXEファイルの作成方法を巻末付録として収録しました。

データ分析のための数理モデル入門 本質をとらえた分析のために

貴裕, 江崎
ソシム
おすすめ度
58
紹介文
「数理モデル」とは、現実のデータを理解・活用するために生み出された様々な数理的な手段の総称である。これには、近年注目を浴びている機械学習だけでなく、物理学、生物学、生態学などの自然科学、また心理学、経済学、といった人文社会科学分野で用いられる諸手法が含まれている。 こうした極めて多様な方法論の間には、データの背後に存在するメカニズムをある種の数式で表現し、それを利用するという共通の目的・手続きが存在する。 データと目的が与えられたとして、どのモデリング手法に頼ればいいのだろうか?特に、現象の理解を目的とした分析には、機械学習の諸手法では太刀打ちできないこともある。 こういった場合には、統計モデリングだけでなく所謂計算論的モデルと呼ばれるボトムアップ型のモデリング手法が必要とされることもあるだろう。こうした俯瞰的な視点でモデルの「種類」を選択することはデータ分析において必須のステップであるが、そうした分野を跨いだ解説書は殆ど存在していないといっても良い。 そこで本書は、数理モデル全体が有機的に繋がって見えるような「横糸的な」理解を可能にする、全く新しい入門的な教科書を目指した。 本書では、さまざまなモデリング手法の基礎的な部分を解説するだけでなく、それらをどのように選択して使用すればよいか、そしてモデリングによって得られる結論について初学者が勘違いしやすい事項について丁寧に解説した。 主な読者としては、「これからデータ分析を始める」、或いは「ある種の分析で結果を出すことはできるが、それが何をやっていることになるのかがモヤモヤする」といった初学者・初級者を想定している。大学の一年次でも読み通せる程度の解説レベルを採用しているが、内容が淡泊になりすぎないように注意した。 また、通常データ分析の文脈では言及されない(しかし重要な)種々の数理手法についても解説することで、ある程度モデリングに慣れた読者が読んでも楽しめる内容を目指した。 第一部 数理モデルとは 第1章 データ分析と数理モデル 〔データを分析するということ/数理モデルの役割〕 第2章 数理モデルの構成要素・種類 〔理解志向型・応用志向型モデリング/数理モデルの適用限界〕 第二部 基礎的な数理モデル 第3章 少数の方程式によるモデル 〔線形モデル/実験式・カーブフィッティング/最適化問題〕 第4章 少数の微分方程式によるモデル 〔線形微分方程式/非線形微分方程式/安定性解析/制御理論〕 第5章 確率モデル 〔確率過程/マルコフ過程/待ち行列理論〕 第6章 統計モデル 〔正規分布/統計的検定/回帰分析〕 第三部 高度な数理モデル 第7章 時系列モデル 〔時系列データの構造/自己回帰モデル/状態空間モデル/非線形時系列解析〕 第8章 機械学習モデル 〔複雑なモデルと過学習/分類・回帰問題/クラスタリング/次元削減/深層学習〕 第9章 強化学習モデル 〔行動モデルとしての強化学習/機械学習モデルとしての強化学習〕 第10章 多体系モデル・エージェントベースモデル 〔ミクロからマクロへ/さまざまな集団現象モデル/相互作用のネットワーク分析〕 第四部 数理モデルを作る 第11章 モデルを決めるための要素 〔数理モデルの性質/理解志向型・応用志向型モデリングのポイント〕 第12章 モデルを設計する 〔変数の選択/データの取得・実験計画/数理構造・パラメータの選択/間違ったモデリングをしないために〕 第13章 パラメータを推定する 〔目的に応じたパラメータ推定/パラメータ推定における目的関数の最小化/ベイズ推定・ベイズモデリング〕 第14章 モデルを評価する 〔「いいモデル」とは/分類精度の指標/情報量基準/ヌルモデルとの比較・尤度比検定/交差検証〕

PythonでExcel、メール、Webを自動化する本

中嶋英勝
SBクリエイティブ
おすすめ度
58
紹介文
プログラミング初心者でも全部できる! Excelシート間のコピペをはじめ、単純なパソコン仕事は小さなプログラムを書くことで自動で行うことができます。 こうしたプログラムを書けるようになることが、自分の仕事を効率化したい社会人にとって大きな武器になることは間違いありません。 本書ではプログラミング言語Pythonを使って、パソコン仕事の中心であるExcel作業を自動化する方法を紹介します。 Excelの自動化といえば「マクロ・VBA」が定番ですが、Pythonの強みは ・Excelアプリを起動しなくてよい ・メールやWebブラウザなども簡単に自動化できる という点にあります。 本書ではExcelとともにメール、Webの自動化もしっかり扱います。これにより、Webから抽出したデータをExcelファイルに保存してメールで送信、といった連携も行えるようになり、仕事での活用の幅が広がります。 プログラミング初心者である社会人が、実際に自分の仕事が自動化できるように、必要な情報をもれなく丁寧に解説することを心掛けました。本書を片手に「新しい仕事のやり方」を始めましょう! <本書の方針> ・オブジェクトなどの難しいプログラム理論は一切使いません。 ・一番単純な道具だけで、準備に時間をかけず、すぐ始められます。 ・実践的な例題で、実務で本当に使えるプログラムを紹介します。 第1章 Pythonプログラミングの基本 1-1 プログラムを書いて実行する方法を覚える 1-2 変数を使ったコードを書いてみよう 1-3 複数のデータはリストに入れる 1-4 複数のデータをループで処理する 1-5 データの状態に応じて処理を分ける 1-6 IDLEを使いやすく設定する 第2章 PythonでExcelファイルを操作する 2-1 Excelファイルの基本構造を理解しよう 2-2 ブックの開き方・保存方法を覚えよう 2-3 プログラムでセルの値を読み書きしよう 2-4 セルを1行ずつ読み書きする 2-5 シートの操作方法を覚えよう 2-6 複数のシートをまとめる 2-7 絶対に覚えておきたいプログラミングのコツ 第3章 PythonでCSVファイルを操作する 3-1 CSVファイルを読み込んでみよう 3-2 CSVファイルにデータを書き込んでみよう 3-3 Excelブックと相互に変換する 第4章 Excelファイルの転記・集計をPythonでおこなう 4-1 転記・集計を実現するExcelの三大関数とは 4-2 Excelのマスタを取り込む 4-3 Excelのマスタからデータを検索する 4-4 表のデータを別のブックに転記する 4-5 条件を満たすデータの個数や合計を求める 4-6 Pythonで自動化するメリットとは 第5章 帳票作成をPythonでおこなう 5-1 請求書作成の手順を整理する 5-2 顧客ごとの売上データの絞り込み 5-3 顧客ごとの請求書を作成する 5-4 請求書を印刷してPDFとして保存しよう 5-5 業務全体ではExcelと良いとこ取りを目指す 第6章 Pythonでもっと作業を自動化するには 6-1 Pythonの強みは豊富なライブラリ 6-2 PythonならメールもWebも自動化できる 第7章 Pythonで複数の人にまとめてメール送信する 7-1 メールサーバーとの交信方法 7-2 メールで送るメッセージを作成する 7-3 メールを自動送信する 第8章 PythonでWebから情報を収集する 8-1 Seleniumのインストール 8-2 ブラウザを操作してみる 8-3 Selenium IDEでブラウザ操作を記録 8-4 Webページから情報を読み取る 8-5 実際のWebページから情報を読み取る 8-6 Webからの情報収集を自動化する

Python2年生 データ分析のしくみ 体験してわかる! 会話でまなべる!

森 巧尚
翔泳社
おすすめ度
58
紹介文
こんどはデータ分析に挑戦!「数式一切なし」で理解できちゃう!データ分析のきほんとしくみ Pythonでデータ分析を体験してみよう! 【データ分析を一緒に体験しよう】 スクレイピングなどで集めた大量のデータ。 どうやって分析してたらよいか、困っていませんか? 「数式があって難しそう」 「プログラムも大変そう」 と思っている方も多いはず。 本書は、そうした方に向けて、サンプルを元にやさしく データ分析の方法を解説しています。 【Python2年生について】 「Python2年生」は、「Python1年生」を読み終えた方を対象とした入門書です。 ある程度、技術的なことを盛り込み、本書で扱う技術について身に着けてもらいます。 『Python2年生 スクレイピングのしくみ』(ISBN:9784798161914)も刊行されています。 【対象読者】 ・データの分析方法を知りたい初心者 【本書のポイント】 ヤギ博士&フタバちゃんと一緒に、データ分析の考え方から丁寧に解説。 データを分析する時に必要な前処理の方法や、データの集まりの見方、 データを見やすいグラフにする方法、データの分布の見方、予測の立て方を 解説する書籍です。 【著者プロフィール】 森 巧尚(もり・よしなお) アプリの開発や、技術書や電子工作マガジンなどでの執筆活動。関西学院大学非常勤講師、 関西学院高等部非常勤講師、成安造形大学非常勤講師、プログラミングスクールコプリ講師など、 プログラミングに関する幅広い活動を行っている。 近著に『Python1年生』、『Python2年生 スクレイピングのしくみ』、 『Java1年生』、『動かして学ぶ!Vue.js開発入門』(いずれも翔泳社)、 『楽しく学ぶ アルゴリズムとプログラミングの図鑑』(マイナビ出版)などがある。 第1章 データ分析って何? LESSON 01 データ分析って何 LESSON 02 データ分析の手順:PPDACサイクル LESSON 03 Jupyter Notebookをインストールしよう LESSON 04 Jupyter Notebookの使い方 第2章 集めたデータは前処理が必要 LESSON 05 表データを読み込もう LESSON 06 データをざっくりと眺める LESSON 07 データのどこを使う? LESSON 08 データのミスをチェックする 第3章 データの集まりをひとことでいうと?:代表値 LESSON 09 データを平らに均(なら)す LESSON 10 平均値を代表といっていいの? LESSON 11 平均値が同じなら、同じといっていいの? 第4章 図で特徴をイメージしよう:グラフ LESSON 12 データのばらつきがわかる LESSON 13 基本的なグラフを作ろう LESSON 14 ばらつきのわかるグラフ LESSON 15 グラフをわかりやすく調整する 第5章 これって普通なこと?珍しいこと?:正規分布 LESSON 16 データのばらつきを数値で表す LESSON 17 自然なばらつき LESSON 18 この値は普通なこと?珍しいこと? LESSON 19 このデータは自然なばらつき? LESSON 20 違うばらつきのデータでの比較ができる 第6章 関係から予測しよう:回帰分析 LESSON 21 2種類のデータの関係性の強さ:相関係数 LESSON 22 散布図の上に線を引いて予測 LESSON 23 総当たりで表示させる散布図 LESSON 24 アヤメのデータを見てみよう

つくりながら学ぶ! Pythonによる因果分析 ~因果推論・因果探索の実践入門 (Compass Data Science)

小川雄太郎
マイナビ出版
おすすめ度
58
紹介文
ビジネスで実践できるデータ分析力をマスター! ビジネス現場ではデータ活用の重要性がますます高まっています。データに基づいた経営施策の実施とその効果検証のためには、一般的な統計指標(平均、標準偏差、相関)だけでなく「因果」にまで分析を広げる必要があります。 本書は因果分析の重要な2つの領域である「因果推論」および「因果探索」について、実際にプログラムを実装しながら学ぶ書籍です。因果推論や因果探索を学びたいビジネスパーソンや、初学者の方を対象としています。 ・因果推論とは「テレビCM放映で、商品購入量がどれくらい増えたのか?」「研修の実施で、社員スキルがどの程度向上したのか?」など、なんらかの施策を実施した際に、その施策の効果を推定する手法です。 ・因果探索とは「生活習慣と疾病の調査」「働き方改革に伴う社員調査」など、アンケート調査等で収集した各項目間の因果関係を明らかにする試みです。 本書は「因果推論、因果探索とはどのようなものか」「因果推論、因果探索を実施するには、具体的にどうしたら良いのか・分析プログラムをどう実装したら良いのか」「因果推論、因果探索が、どのように機械学習やディープラーニングと結びついているのか」が理解・習得できる内容となっています。 プログラミング言語Python、実行環境Google Colaboratory、機械学習ライブラリscikit-learn、PyTorchで実際に手を動かしながら実装し、習得していきます。 データに基づいた経営・ビジネスを実践するうえでスタンダードな手法となる因果分析をマスターしよう。 Part 1:因果推論 第1章 相関と因果の違いを理解しよう 第2章 因果効果の種類を把握しよう 第3章 グラフ表現とバックドア基準を理解しよう 第4章 因果推定を実装しよう 第5章 機械学習を用いた因果推論 Part 2:因果探索 第6章 LiNGAMの実装 第7章 ベイジアンネットワークの実装 第8章 ディープラーニングを用いた因果探索 第1部 因果推論 第1章 相関と因果の違いを理解しよう 1-1 因果推論が必要となる架空事例の紹介 1-2 相関と因果の違い、疑似相関とは 1-3 Google Colaboratoryを用いたPythonプログラミング:疑似相関の確認 第2章 因果効果の種類を把握しよう 2-1 反実仮想と様々な因果効果(ATE、ATT、ATU、CATE) 2-2 介入(doオペレータ)とは 2-3 本書で使用する数学記法の整理 2-4 調整化公式とは 第3章 グラフ表現とバックドア基準を理解しよう 3-1 構造方程式モデルとグラフ表現(因果ダイアグラムDAG) 3-2 バックドア基準、バックドアパス、d分離 3-3 ランダム化比較試験RCTによる因果推論 第4章 因果推論を実装しよう 4-1 回帰分析による因果推論の実装 4-2 傾向スコアを用いた逆確率重み付け法(IPTW)の実装 4-3 Doubly Robust法(DR法)による因果推論の実装 第5章 機械学習を用いた因果推論 5-1 ランダムフォレストによる分類と回帰のしくみ 5-2 Meta-Learners(T-Learner、S-Learner、X-Learner)の実装 5-3 Doubly Robust Learningの実装 第2部 因果探索 第6章 LiNGAMの実装 6-1 LiNGAM(Linear Non-Gaussian Acyclic Model)とは 6-2 独立成分分析とは 6-3 LiNGAMによる因果探索の実装 第7章 ベイジアンネットワークの実装 7-1 ベイジアンネットワークとは 7-2 ネットワークの当てはまりの良さを測る方法 7-3 変数間の独立性の検定 7-4 3タイプのベイジアンネットワークの探索手法 7-5 PCアルゴリズムによるベイジアンネットワーク探索の実装 第8章 ディープラーニングを用いた因果探索 8-1 因果探索とGAN(Generative Adversarial Networks)の関係 8-2 SAM(Structural Agnostic Model)の概要 8-3 SAMの識別器Dと生成器Gの実装 8-4 SAMの損失関数の解説と因果探索の実装 8-5 Google ColaboratoryでGPUを使用した因果探索の実行

欠測データ処理: Rによる単一代入法と多重代入法 (統計学One Point)

将宜, 高橋
共立出版
おすすめ度
58
紹介文
 一般的に調査・観測データには欠測が生じることが多く,適切な欠測データの処理をしなければ,解析結果に偏りが生じることがある。多重代入法は,尤度解析法と並んで最も汎用的な欠測データ解析法であるが,これまでの書籍では理論的な解説が主で,実際の応用事例や具体的な手順の記述が少なかった。そのため,実証分析を行う社会科学者や実務者が多重代入法を実際に活用することにはハードルがあった。  本書は,ワンポイントとして代入法を中心に解説している。平均値のt検定,重回帰分析,ロジスティック回帰分析,時系列分析,パネルデータ分析といった社会科学において頻繁に使用される分析手法に関して,データに欠測が生じている場合に,多重代入法を用いてどのように欠測データを処理していけばよいかを具体的に示している。  事例で扱ったデータとRコードが掲載されているので,読者は本書に示された手順を再現しながら,欠測データの解析法を学んでいくことができる。主に,ウェブ上で入手可能な実データで解説しているので,実践的な技能が身につく。本書は,座学として単に読むだけでなく,ぜひコンピュータ上で実際に処理を体験して欲しい。それが,欠測データの解析法を理解し,修得する近道である。 第1章 Rによるデータ解析 1.1 Rへのデータ読み込み 1.2 平均値と標準偏差 1.3 回帰分析 1.4 forループ 第2章 不完全データの統計解析 2.1 無回答とは 2.2 欠測パターン 2.3 欠測メカニズム 2.4 MARデータのシミュレーション 2.5 MARについての注意点 2.6 欠測の処理方法 2.7 代入法の目的 第3章 単一代入法 3.1 データ 3.2 確定的回帰代入法 3.3 比率代入法 3.4 平均値代入法 3.5 ホットデック法 3.6 確率的回帰代入法 第4章 多重代入法の概要 4.1 単一代入法の実態 4.2 ベイズ統計学概論 4.3 多重代入モデルの概要 4.4 多重代入法による代入結果の例 4.5 多重代入法による分析の流れ 4.6 多重代入法による分析結果の統合方法 4.7 多重代入法による分析結果の統合方法の数値例 4.8 多重代入法の諸条件   4.8.1 適切な多重代入法   4.8.2 適合性   4.8.3 多重代済みデータ数M 第5章 多重代入法のアルゴリズム 5.1 データ 5.2 DAアルゴリズムによる多重代入法 5.3 FCSアルゴリズムによる多重代入法 5.4 EMBアルゴリズムによる多重代入法 5.5 アルゴリズム間の長所と短所 5.6 MCMC系アルゴリズムにおける収束判定 5.7 多重代入法の性能比較 第6章 多重代入モデルの診断 6.1 診断の考え方 6.2 データ 6.3 Rパッケージ Ameliaによる代入の診断 6.4 Rパッケージ miceによる代入の診断 6.5 Rパッケージ normによる代入の診断 6.6 対数正規分布データの代入法 第7章 量的データの多重代入法I:平均値のt検定 7.1 多重代入済みデータの平均値と分散の復習 7.2 t検定の概論   7.2.1 多重代入済みデータを用いたt検定   7.2.2 多重代入済みデータを用いた自由度の算出 7.3 データ 7.4 Rパッケージ Ameliaによるt検定 7.5 Rパッケージ miceによるt検定 7.6 Rパッケージ normによるt検定 第8章 量的データの多重代入法II:重回帰分析 8.1 重回帰分析概論 8.2 データ 8.3 Rパッケージ Ameliaによる重回帰分析 8.4 回帰診断   8.4.1 誤差項の正規性   8.4.2 不均一分散   8.4.3 多重共線性   8.4.4 外れ値 8.5 Rパッケージ miceによる重回帰分析と診断 8.6 Rパッケージ normによる重回帰分析と診断 第9章 質的データの多重代入法I:ダミー変数のある重回帰分析 9.1 質的データの代入法に関する議論 9.2 ダミー変数のある重回帰モデル概論 9.3 データ 9.4 Rパッケージ miceによるダミー変数のある重回帰分析 9.5 Rパッケージ hot.deckによるダミー変数のある重回帰分析 第10章 質的データの多重代入法II:ロジスティック回帰分析 10.1 ロジスティック回帰分析概論 10.2 データ 10.3 Rパッケージ miceによるロジスティック回帰分析 10.4 Rパッケージ hot.deckによるロジスティック回帰分析 10.5 順序変数と多項変数の多重代入法 第11章 時系列データの多重代入法:ARIMAモデル 11.1 時系列分析概論 11.2 データ 11.3 Rパッケージ Ameliaによる時系列データ分析   11.3.1 ARIMAモデルの推定   11.3.2 モデルの診断   11.3.3 予測 第12章 パネルデータの多重代入法:固定効果と変量効果 12.1 パネルデータ分析概論   12.1.1 プール最小二乗法   12.1.2 固定効果モデル   12.1.3 変量効果モデル   12.1.4 不均一分散と系列相関 12.2 データと使用するRパッケージ 12.3 Rパッケージ Ameliaによるパネルデータ分析 第13章 感度分析:NMARの統計解析 13.1 感度分析 13.2 NMARにおける解析手法 13.3 Rパッケージ SensMiceとAmeliaによる感度分析 13.4 Rパッケージ SensMiceとmiceによる感度分析 13.5 Rパッケージ SensMiceとnormによる感度分析 第14章 事前分布の導入 14.1 Rパッケージ Ameliaによる事前分布の活用   14.1.1 観測値に関する事前分布   14.1.2 変数の値に関する事前分布   14.1.3 リッジ事前分布   14.1.4 複数の事前分布 14.2 Rパッケージ normによる事前分布の活用 14.3 Rパッケージ miceによる事前分布の活用 参考文献 索  引

最短コースでわかる Pythonプログラミングとデータ分析

赤石 雅典
日経BP
おすすめ度
58
紹介文
Pythonの基本からデータ分析まで、1冊で学べる本。データを分析するのに必要最小限の知識を最短コースで習得できる。  身近なデータをPythonで分析できるようになるための知識を、最短コースで身に付けられる本です。Pythonのホントの基本から、データ分析に必要なPythonライブラリの使い方、データ分析の実践例までを一気に学べます。プログラミングの経験がない方もこの1冊を読めば、実際のデータ分析を始められます。    ベストセラーの「最短コースでわかる ディープラーニングの数学」「Pythonで儲かるAIをつくる」などを執筆した著者が送るデータ分析&AI書籍の第4弾。いつもの平易な解説で、初学者も安心して学べます。  本書は次のような方に最適です。 (1)プログラミング言語自体を知らないが、データ分析のためにこれから勉強したいという方 (2)Pythonのプログラミングは理解しているが、pandasなどの分析用ライブラリがわからないのでAI書籍の実習コードが読めない方 (3)データ分析の全体像がつかめず、いざデータ分析をしようとすると、どこから手を付けていいかわからない方  本書において、Pythonプログラミングとデータ分析を「最短コース」で学べるようにしたポイントは三つあります。 (1)学習内容を最低限に抑える  Python自体も、pandasなどの分析用ライブラリも、機能は多いですが、データ分析で本当に必要なものは意外と多くありません。各領域で本当に必要な機能に絞り込んで解説しています。データ分析の実務でほとんど登場しないPythonの機能は、思い切って全部落としました。Pythonやpandas、Matplotlibなど、それぞれを分厚い本で学ぶ必要はなく、本書1冊で身に付けられます。 (2)演習問題でプログラミングの実地訓練を積む  テーマ(節)ごとに演習問題を設けていて、実際のコーディングによる訓練でプログラミングの実務スキルが身に付きます。 (3)開発環境(Google Colab)上の試行錯誤で体得  関数の細かい挙動について、トライアンドエラーを繰り返して体験・実験により理解できます。  実際にデータ分析ができるようになるには、さらに「洞察の導出」という難しいタスクがあります。このタスクは内容が抽象的なだけに、なかなか体系的には学べません。そこで本書では「この業務要件でこのデータを分析した場合、こんな洞察が得られる」という話をたくさん入れ込みました。このような具体例を通して、自分自身のテーマに対して洞察を導くためのヒントが得られます。  本書を読了した方は、プログラミングとデータ分析という必須スキルを身に付けられ、ニーズの高いDX人材のど真ん中に位置できます。 Pythonの基本からデータ分析まで、1冊で学べる本。データを分析するのに必要最小限の知識を最短コースで習得できる。 1章 Pythonプログラミング入門  Google Colabの基本操作、変数、データ型、 条件分岐、関数とメソッド、リストとループ処理、タプルと辞書、関数定義、やや高度なループ処理 2章 データ分析ライブラリ入門編  ライブラリ入門、NumPy入門、Matplotlib入門、pandas入門 3章 データ分析ライブラリ中級編  pandas活用、データ読み込み、確認・加工(前処理)、集計、可視化、検索・結合、日付データの処理 4章 データ分析実践編  公開データセットから知見を導出、相関関係と因果関係の違い、仮説と検証

データ視覚化のデザイン

永田 ゆかり
SBクリエイティブ
おすすめ度
58
紹介文
達人が教えるビジュアライゼーションの極意!! 達人が教えるビジュアライゼーションの極意!! 本書で言う「データ視覚化」(ビジュアライゼーション)とは、単に手元にあるデータをグラフにすることではありません。いくらデータを視覚化しても、その中から人間が重要な情報を読み取れないのなら、データ視覚化をする意味がないからです。 あくまで、そのデータが指し示す意味を明確にすること、そしてより多くの人たち(オーディエンス)に興味を持って見てももらえることがデータ視覚化の目的です。 本書では、日本人女性唯一のTableau ZEN MASTERである筆者が長年にわたって培ってきたデータ視覚化のノウハウ、ベストプラクティス、アンチパターン等を整理分類してエッセンスを抽出し、具体的な事例をあげながら、できるかぎり丁寧に解説しました。また、セミナーなどの現場でよくされる質問に対する答えをまとめたものでもあるので、ある意味、"FAQ"でもあります。 達人が教えるビジュアライゼーションの極意!! 第1章 データ視覚化「キモのキモ」 この章では、第2章、第3章を理解するために必要な基礎知識を解説しています。もし、あなたがデータ視覚化の基礎概念に精通していらっしゃる方であれば読み飛ばしていただいても結構ですが、第2章、第3章は、ここで解説する視覚属性やデータのタイプの知識が前提となっています。 第2章 これだけでグッとプロっぽくなるコツ この章では、少し気をつけるだけで素人っぽさから抜け出せるポイントに焦点を当てて解説しました。明日からすぐにあなたのデータ視覚化のクオリティを上げる具体的な方法を詰めています。 第3章 目的に応じたチャートの選択 この章では、表現したいものに対して適切なチャートを解説し、さらにいくつかの「やってはいけないこと」としてアンチパターンも記載しています。やってはいけないことの構造や理由を知ることで、グラフの目利き力がさらにアップするはずです。 第4章 事例で学ぶ -ダッシュボード作成思考のキャプション- 実際に私がコンサルティングで作ったダッシュボード、トレーニングやワークショップで使用したケースを題材に説明します。ビジネス領域での使用事例を具体的に丁寧に解説することで、ご自身のビジネスや状況に合わせて適切なデータ視覚化が自分の頭で考えられるようになることを目指しています。 第5章 本当に組織に根付かせるために データ視覚化は、「力の入れどころ」と「勇気を出してあえて力を抜くところ」を知り、さらにオーディエンスを意識すると誰でもご自身が伝えたいメッセージを効果的に届けることができます。この章では、さらにそれらを加速させるコツを書きました。これを知っていれば、あなたのデータ視覚化ライフはさらに楽しくなること間違いなしです。

みんなのPython 第4版

柴田 淳
SBクリエイティブ
おすすめ度
58
紹介文
今、最も熱いプログラミング言語、それがPython Python入門書のデファクトスタンダードが4年ぶりに大改訂。 近年、Pythonの利用が、機械学習、AIなどの科学技術分野へ 大きく広がっている現状を踏まえて、すべてのパートに手を入れ いくつかの新章を追加しました。 次の10年を担うPythonプログラマを養成するための一冊。 Chapter01 プログラミング言語Python Chapter02 Pythonでプログラミングをはじめよう Chapter03 Pythonの基礎をマスターする Chapter04 組み込み型を使いこなす Chapter05 Pythonと関数型プログラミング Chapter06 クラスとオブジェクト指向開発 Chapter07 クラスの継承と高度なオブジェクト指向機能 Chapter08 モジュール Chapter09 スコープとオブジェクト Chapter10 例外処理 Chapter11 標準ライブラリを使う Chapter12 Pythonとデータサイエンス Chapter13 Pythan2 ・AnacondaやJupyter Notebookなど、Pythonの最新開発環境に対応 ・NumPy、matplotlibなどの科学技術系ライブラリに対応 ・Windows、macOS、Linux対応 Chapter01 プログラミング言語Python Chapter02 Pythonでプログラミングをはじめよう Chapter03 Pythonの基礎をマスターする Chapter04 組み込み型を使いこなす Chapter05 Pythonと関数型プログラミング Chapter06 クラスとオブジェクト指向開発 Chapter07 クラスの継承と高度なオブジェクト指向機能 Chapter08 モジュール Chapter09 スコープとオブジェクト Chapter10 例外処理 Chapter11 標準ライブラリを使う Chapter12 Pythonとデータサイエンス Chapter13 Pythan2

Python3年生 機械学習のしくみ 体験してわかる! 会話でまなべる!

森 巧尚
翔泳社
おすすめ度
58
紹介文
待望の「機械学習のしくみ」が登場!ヤギ博士&フタバちゃんと一緒に機械学習の世界を体験してみよう! ヤギ博士・フタバちゃんと一緒に 機械学習のしくみを学ぼう! 【機械学習をいちから学んでみよう!】 「最近よく耳にする人工知能と機械学習について知りたい」 「機械学習ってどのようなことをするの?」 と思っている方は多いと思います。 本書はそうした方に向けて「機械学習」について いちからやさしく解説します。 【Python3年生について】 「Python1年生」「Python2年生」を読み終えた方を対象とした入門書です。 (※「Python3年生」から初めて学ぶ方でもわかるように工夫しています) 【読者対象】 機械学習の初心者 【本書のポイント】 ヤギ博士&フタバちゃんと一緒に、 機械学習のしくみについて、 サンプルを動かしながら、 楽しく学ぶことができます。 【著者プロフィール】 森 巧尚(もり・よしなお) アプリの開発や、技術書や電子工作マガジンなどでの執筆活動。 関西学院大学非常勤講師、関西学院高等部非常勤講師、 成安造形大学非常勤講師、大阪芸術大学非常勤講師、プログラミングスクールコプリ講師など、 プログラミングに関する幅広い活動を行っている。 近著に『Python1年生』、『Python2年生 スクレイピングのしくみ』、『Python2年生 データ分析のしくみ』、 『Java1年生』、『動かして学ぶ! Vue.js開発入門』(いずれも翔泳社)、 『楽しく学ぶ アルゴリズムとプログラミングの図鑑』(マイナビ出版)などがある。 第1章 機械学習の準備 01 機械学習ってなんだろう? 02 分けることは、わかること 03 機械学習の準備をしよう 第2章 サンプルデータを見てみよう 04 scikit-learn のサンプルデータセット 05 サンプルデータセットを自動生成しよう 第3章 機械学習の手順を理解しよう 06 データを用意する 07 データを学習用とテスト用に分ける 08 モデルを選んで、学習する 09 モデルをテストする 10 新しい値を渡して、予測する 11 分類の状態を可視化しよう 第4章 機械学習のいろいろなアルゴリズム 12 回帰:線形回帰 13 分類:ロジスティック回帰 14 分類:SVM(サポートベクターマシン) 15 分類:決定木 16 分類:ランダムフォレスト 17 分類:k-NN(k 近傍法) 18 クラスタリング:k-means(k 平均法) 第5章 チノふたたび! 画像から数字を予測しよう 19 データを準備する 20 学習データを準備する 21 学習させる 22 予測させる 23 教師なし学習を利用して、データをイメージしよう 24 さらに先へ進もう

Python2年生 スクレイピングのしくみ 体験してわかる!会話でまなべる!

森 巧尚
翔泳社
おすすめ度
58
紹介文
データ収集の基本!スクレイピングを体験してみよう! Pythonでスクレイピングを体験してみよう! 【スクレイピングとは】 機械学習やデータ分析になくてはならない「データ」。 このようなデータは、インターネット上に膨大にありますが、Pythonを使えば効率よくデータ収集できます。 こうした手法を「スクレイピング」といいます。 サイト自体もオープンデータ化が進んでおり、データを集めやすい環境が整ってきています。 【Python2年生について】 「Python2年生」シリーズは、「Python1年生」を読み終えた方を対象とした入門書です。 ある程度、技術的なことを盛り込み、本書で扱う技術について身に着けてもらいます。 【ターゲット】 ・ネット上からデータ収集を行う初心者 ・データ分析の手前の初心者 【本書の売り】 ヤギ博士&フタバちゃんと一緒に、インターネットからのファイルのダウンロード方法、 HTML解析の方法、いろいろなデータの読み書き、 APIの使い方といったデータ収集と便利なライブラリを利用した簡単な可視化手法を解説する書籍です。 また最終的にデータ収集を自動化する方法も簡単に解説します。 第1章 Pythonでデータをダウンロード  LESSON 01 スクレイピングってなに?  LESSON 02 Pythonをインストールしてみよう  LESSON 03 requestsでアクセスしてみよう 第2章 HTMLを解析しよう  LESSON 04 HTMLを解析してみよう  LESSON 05 ニュースの最新記事一覧を取得してみよう  LESSON 06 リンク一覧をファイルに書き出そう  LESSON 07 画像を一括ダウンロードしよう 第3章 表データを読み書きしよう  LESSON 08 pandasを使ってみよう  LESSON 09 さまざまなデータの加工  LESSON 10 グラフで表示してみよう  LESSON 11 Excelファイルを読み書きしてみよう 第4章 オープンデータを分析してみよう  LESSON 12 オープンデータってなに?  LESSON 13 郵便局:郵便番号データ  LESSON 14 e-Stat:政府統計の相互窓口  LESSON 15 キッズすたっと:探そう統計データ  LESSON 16 自治体のデータ:データシティ鯖江 第5章 Web APIでデータを収集しよう  LESSON 17 Web APIってなに?  LESSON 18 OpenWeatherMapってなに?  LESSON 19 現在の天気を調べよう  LESSON 20 現在から5日間(3時間ごと)の天気を調べよう

Python最速データ収集術 〜スクレイピングでWeb情報を自動で集める (IT×仕事術)

清水 義孝
技術評論社
おすすめ度
58
紹介文
「競合商品のデータを毎回探すのは大変」 「常にチェックしている売上ランキングをまとめおきたい」 「情報を集めるのに手間取って、じっくり分析する時間がない」 こんな情報収集の悩みは、プログラムを使えば解決できます! 多くのビジネスにおいて、自社や他社の商品情報や人気トレンド、口コミ評判などのデータ収集・分析は欠かせません。しかし、膨大なネット上の情報を手作業で集めるのは容易ではありません。データ収集に時間がかかりすぎてしまい、本来の目的である分析に時間をかけられないケースも多いでしょう。 そんなときは、データ収集をプログラムで自動化してみましょう! 本書では、プログラミング言語Python(パイソン)を使ったスクレイピングという技術で、WebページやSNSなどから自動でデータ収集する方法を学べます。初心者でも実践できるように、プログラミングやWebページのしくみの知識は必要最小限に抑え、練習用のページやサンプルのプログラムでスクレイピングを実践しながら学びます。練習用ページなどには、実際のビジネス利用シーンをイメージしやすい事例を用意しました。 プログラミングで業務を自動化・効率化したいビジネスパーソン必見の1冊です! ●はじめに ■第1章 データ収集をハックする ■■1-1 プログラムを使って自動でデータを集める ■■■データを集める重要性が高まっている自動収集の必要性とメリット ■■■本書で取り上げるトピック ■■1-2 自動で集められるデータとは ■■■データの分類を知る ■■■データの提供方法を知る ■■■本書で取り上げる自動収集データ ■■1-3 自動収集の注意点を押さえる ■■■1. サイトの利用規約を守る ■■■2. データ取得には十分な間隔をあけて、サーバーに負担をかけすぎない ■■■3. 取得したデータの利用に際しては、著作権や個人情報を侵害しない ■第2章 Webからデータを集める準備 ■■2-1 データ収集に役立つPython ■■2-2 Pythonが使える環境を準備する ■■■Anacondaを準備する ■■■Jupyter Notebookの使い方を理解する ■■■Jupyter Notebookを起動する ■■■Pythonのプログラムを実行する ■■■エディットモード・コマンドモードを理解する ■■■ショートカットキーを理解する ■■■作成したノートブックを保存する ■■■Jupyter Notebookを終了する ■■2-3 Python超入門 ■■■データ型と変数を理解する ■■■数値計算をする ■■■文字や数値を画面に出力する(print関数) ■■■データ構造を押さえる(リスト、タプル、辞書) ■■■条件で処理を分岐させる(if文、else) ■■■くり返し処理を押さえる(for文、while文) ■■■関数で何度もおこなう処理をまとめる ■■■ライブラリの使い方を理解する ■第3章 データ自動収集のしくみを押さえる ■■3-1 Webページ・WebAPIのしくみを理解する ■■■Webページの通信方法を押さえる ■■■HTMLを理解しよう ■■■HTMLタグの種類を押さえる ■■■HTMLタグの属性を押さえる ■■■HTMLの階層構造を理解する ■■■CSSを理解しよう ■■■JavaScriptを知ろう ■■■Web APIを理解しよう ■■3-2 データのフォーマットや種類を理解する ■■■フォーマットの種類と特徴 ■■■データのおもな種類とオープンデータ ■■3-3 Webページからデータを取得する方法を理解する ■■■データ取得の3ステップ ■■3-4 ステップ1:HTMLをダウンロードする ■■■requestsをインストールする ■■■requestsの使い方を理解する ■■■ダウンロードしたHTMLの内容を確認する ■■3-5 ステップ2:データを抽出する ■■■Beautiful Soupをインストールする ■■■Beautiful Soupの使い方を理解する ■■■Chrome開発者ツールの使い方を理解する ■■■データを抽出する3つの方法 ■■■抽出方法1 要素を検索して取り出す ■■■抽出方法2 HTMLの階層を移動して探し出す ■■■抽出方法3 CSSセレクタを用いて要素を指定する ■■■3つの抽出方法の選び方 ■■■3つの方法を組み合せて使う ■■■CSSセレクタをもっと理解する ■■3-6 ステップ3:データを保存する ■■■テキストデータを保存する ■■■バイナリデータ(画像、PDF、EXCELファイル)を保存する ■■3-7 Webページから実際にデータを取得する ■■■練習用ページを確認する ■■■作成するプログラムを理解する ■■■データ取得方法を検討する ■■■一覧・詳細ページからデータを取得する ■■■取得したデータを保存する ■第4章 Pythonでデータを自動で集める ■■4-1 売れ筋ランキング情報を収集しよう ■■■売れ筋でマーケットトレンドを把握しよう ■■■Webページからの情報収集の準備 ■■■データ取得方法を検討する ■■■ライブラリをインポートする ■■■一覧ページからデータを取得する ■■■詳細ページからデータを取得する ■■4-2 人気商品の画像情報を集めよう ■■■活用の幅が広がる画像情報 ■■■画像情報収集の準備 ■■■データ取得方法を検討するライブラリをインポートする ■■■一覧ページからデータを取得する ■■■一覧ページから取得したデータを保存する ■■■画像データをダウンロード・保存する ■■4-3 メディアから記事情報を収集しよう ■■■メディアから定性情報を収集しよう ■■■記事情報収集の準備 ■■■データ取得方法を検討する ■■■ライブラリをインポートする ■■■記事データを取得する ■■■取得した記事データを保存する ■■4-4 オープンデータの統計情報を収集しよう ■■■オープンデータで自社サービスを強化しよう ■■■政府統計の総合窓口e-Statとは ■■■e-Stat APIの基本的な使い方 ■■■統計データを取得する ■■■取得した統計データを保存する ■■4-5 TwitterAPIから口コミ情報を集めよう ■■■口コミ情報でサービス・製品の改善点を分析しよう ■■■Twitter APIを準備する ■■■Twitter APIの基本的な使い方 ■■■ツイートデータを取得する取得したツイートデータを保存する ■第5章 集めたデータを活用しやすい形にする ■■5-1 データ活用までに必要な準備 ■■5-2 保存したデータを取り出す ■■■データ表の形式を理解する ■■■CSVファイルを読み込む ■■■読み込んだデータを確認する ■■5-3 データを整形する ■■■不要な列データを取り除く ■■■欠損データに対応する ■■■データ型を変換する ■■■整形したデータを保存する ■■5-4 データをグラフで表示する ■■■必要な行だけを取り出す ■■■データフレームを結合する ■■■統計値を取得する ■■■グラフに表示する ●索引 ●著者プロフィール

データサイエンスの森 Kaggleの歩き方

坂本 俊之
シーアンドアール研究所
おすすめ度
58
紹介文
Kaggleとは、コンペティションを主催するほかに、機械学習エンジニアの育成から就職支援まで携わる、データサイエンティスト支援の一大ポータルです。本書では、Kaggleの概要から、コンペティションへの参加方法、コードの実行方法、活用方法など、幅広く解説しています。

Pythonでつくる ゲーム開発 入門講座

廣瀬 豪
ソーテック社
おすすめ度
58
紹介文
大手メーカーで活躍してきたクリエイターが ゲーム開発のノウハウをゼロから教えます! 本書はPythonを使用した、ゲームプログラミングの解説書です。 類書とは異なり、終始一貫「ゲーム開発」に焦点を当て、 今書いているプログラムがどのような"動き"に反映され、 どのような"面白さ"に結びつくのかを、正しく学ぶことができます。 一般的なソフト開発ではなく「ゲーム開発の作法」をきちんと学ぶことによって、ゲーム好きな読者の皆さんの就職や趣味といったリアルな世界がより充実してくれることを願い、出版されました。 【読者対象】 ○ゲーム業界に就職したい学生・社会人 ○SNSや同人で自作ゲームを発表したい方 ○落ち物パズル、RPGの作り方を知りたい方 ○一般ソフトとゲーム制作の違いを知りたい方 ○Pythonを始めたけど作るものが浮かばない方 ……高校生ぐらいから読めます! 【本書の特長】 ○業界の基礎知識やプログラマーの役割からきちんと解説 ○Pythonの基本文法をしっかり解説、プログラミング初心者も安心 ○プログラム1行ごとに説明を付けており、理解しやすい ○豊富な図解とイラストを用い、イメージで理解できる ○開発に必要な素材はすべて無償ダウンロードできる クイズ、すごろく、おみくじ、診断アプリ、迷路、自動生成ダンジョン、落ち物パズル、本格PRGなど……簡単なミニゲームから難しいものまで幅広く教材を用意しています。 さらに、読者特典として3つのおまけゲームもプレゼント! すべてのゲームをつくり終えた時、あたなのプログラミングスキルは何倍にも向上しているに違いありません。 本書を機に、ぜひゲームプログラミングの世界に飛び込んでみてください! Prologueゲームプログラマーになろう! Chapter 1 Pythonのインストール Lesson 1-1 Pythonとは? Lesson 1-2 Pythonのインストール Lesson 1-3 Pythonを起動しよう COLUMN ゲームクリエイターって儲かるの? Chapter 2 Pythonを始めよう Lesson 2-1 計算してみる Lesson 2-2 文字列を出力する Lesson 2-3 カレンダーを出力する Lesson 2-4 プログラミングの準備 Lesson 2-5 プログラムを記述しよう Lesson 2-6 入出力命令を知ろう Lesson 2-7 プログラムの記述の仕方 COLUMN ゲームが完成するまで Chapter 3 プログラミングの基礎を学ぼう Lesson 3-1 変数と計算式 Lesson 3-2 リストについて Lesson 3-3 条件分岐について Lesson 3-4 繰り返しについて Lesson 3-5 関数について COLUMN ゲームの開発費はどれくらい? その1 Chapter 4 importの使い方 Lesson 4-1 モジュールについて Lesson 4-2 カレンダーの復習 Lesson 4-3 日時を扱う Lesson 4-4 乱数の使い方 COLUMN RPGで逃げるのに失敗する確率 Chapter 5 CUIでつくるミニゲーム Lesson 5-1 CUIとGUI Lesson 5-2 クイズゲームを作る Lesson 5-3 すごろくを作る Lesson 5-4 消えたアルファベットを探すゲームを作る COLUMN ゲームの開発費はどれくらい? その2 Chapter 6 GUIの基礎1 Lesson 6-1 GUIについて Lesson 6-2 ラベルを配置する Lesson 6-3 ボタンを配置する Lesson 6-4 キャンバスを使う Lesson 6-5 おみくじを引くソフトを作る COLUMN キャンバスに図形を表示する Chapter 7 GUIの基礎2 Lesson 7-1 テキスト入力欄を配置する Lesson 7-2 複数行のテキスト入力欄を配置する Lesson 7-3 チェックボタンを配置する Lesson 7-4 メッセージボックスを表示する Lesson 7-5 診断ゲームを作る COLUMN RGBによる色指定 Chapter 8 本格的なゲーム開発の技術 Lesson 8-1 リアルタイム処理を実現する Lesson 8-2 キー入力を受け付ける Lesson 8-3 キー入力で画像を動かす Lesson 8-4 迷路のデータを定義する Lesson 8-5 二次元画面のゲーム開発の基礎 COLUMN ゲームソフトを完成させるには Lesson 8-6 ゲームとして完成させる COLUMN デジタルフォトフレームを作る Chapter 9 落ち物パズルを作ろう! Lesson 9-1 ゲームの仕様を考える Lesson 9-2 マウス入力を組み込む Lesson 9-3 ゲーム用のカーソルの表示 Lesson 9-4 マス上のデータを管理する Lesson 9-5 ブロックを落下させるアルゴリズム Lesson 9-6 クリックしてブロックを置く Lesson 9-7 ブロックが揃ったかを判定するアルゴリズム Lesson 9-8 正しいアルゴリズムを組み込む Lesson 9-9 タイトル画面とゲームオーバー画面 Lesson 9-10 落ち物パズルの完成 COLUMN winsoundで音を鳴らす Chapter 10 Pygameの使い方 Lesson 10-1 Pygameのインストール Lesson 10-2 Pygameのシステム Lesson 10-3 画像を描画する Lesson 10-4 図形を描画する Lesson 10-5 キー入力を行う Lesson 10-6 マウス入力を行う Lesson 10-7 サウンドを出力する COLUMN Pygameで日本語を使う Chapter 11 本格RPGを作ろう! 前編 Lesson 11-1 ロールプレイングゲームについて Lesson 11-2 迷路を自動生成する Lesson 11-3 ダンジョンを作る Lesson 11-4 ダンジョン内を移動する Lesson 11-5 戦闘シーンを作る その1 Lesson 11-6 戦闘シーンを作る その2 Lesson 11-7 戦闘シーンを作る その3 COLUMN ゲームの画面演出 287 Chapter 12 本格RPGを作ろう! 後編 Lesson 12-1 ロールプレイングゲームの全体像 Lesson 12-2 ファイルのダウンロードとプログラムの実行 Lesson 12-3 プログラムリスト Lesson 12-4 プログラムの詳細 COLUMN Pythonでのファイル処理 Chapter 13 オブジェクト指向プログラミング Lesson 13-1 オブジェクト指向プログラミングについて Lesson 13-2 クラスとオブジェクト Lesson 13-3 tkinterを使ってオブジェクト指向を学ぶ Lesson 13-4 オブジェクト指向プログラミングをもっと学ぶ COLUMN 筆者も苦労したオブジェクト指向プログラミング Appendix 池山高校Python研究部 Intro ゲームをつくろう! 1つ目 一筆書き迷路ゲーム 2つ目 英単語学習ソフト 3つ目 ブロック崩し

ゲーム作りで楽しく学ぶ Pythonのきほん

森 巧尚
マイナビ出版
おすすめ度
58
紹介文
ゲームを作りながらPythonを楽しく学ぶ! プログラミングを習得する一番効率的な方法、それはゲームを作りながら学ぶこと。 文法だけを学んでも、何に、どうやって使うかわからないままでは、きちんとプログラミングを覚えたとは言えません。 本書の特徴は「プログラミング学習に最適なPythonを使って」、「ゲームを作りながらプログラミングの実践的な考え方を身に付けられる」ことです。 PART1では「Pythonの基礎知識」を学び、PART2ではその知識をもとにpygameを使って「ゲームを作る」2つのパートで構成されています。 「いきなりゲームを作るなんて難しそう!」 そう感じる人もいるかもしれませんが大丈夫。 まずは、サンプルコードを真似しながら手を動かしてプログラムが動くことを実感してみましょう。 Pythonに詳しいやさしいカエルくんがしっかり丁寧に教えてくれます。 サンプルファイルもダウンロードできるから、自分で書いたプログラミングが動かないときもしっかりサポート。 プログラミングで一番大切なことは、命令をたくさん覚えることでも、エラーなく正しく書くことでもありません。 もちろんそれらも大事。でも一番は、「自分で考えたアイデアをカタチにする」ことなんです。 「ゲームってこうやって作るんだ」「シューティングゲームってこうやって動いていたんだ!」 新しい発見をしながら学習した知識は、しっかり身に付きます。 自分で考えたゲームやアイデアを形にできる瞬間は、とても楽しいですよ。 「プログラミングには興味があるけど、どうやって勉強したらいいんだろう?」 「何度も挑戦してるけど難しくて脱落してしまった……」 そんなふうに考えているプログラミング入門者、Python入門者にぜひ手に取っていただきたい1冊です! 【本書で作るゲーム】 PART1ではPythonの基礎を学びながら「体重と身長を入力してBMI値を出す」簡単なアプリのようなものを作っていきます。 PART2ではpygameをインストールして、 ・「衝突判定を使ったアクションゲーム」、 ・「ボール反射を利用したブロック崩しゲーム」、 ・「集大成のシューティングゲーム」 など本格的なゲームを作っていきます。 作れるゲームが増えていくことで感じる「できた!」という達成感は、まるでゲームをクリアしたときのような快感にも似ていますよ。 【本書の特徴】 ・ゲームを作りながらPythonとプログラミングの基本が学べる ・Pythonに詳しいカエルくんがやさしく教えてくれる ・『お手本のコードを真似して書く』→『動かす』の積み重ねで知識が定着、しっかり身に付く ・ダウンロードできるサンプルファイルつき ========================================================== PART 1 Pythonを学ぼう ========================================================== CHAPTER 1 Pythonってなに? ---------------------------------------------------------- 1.1 Pythonを始めよう 1.2 Pythonのインストール 1.3 IDLEでPythonに触れてみよう 1.4 最初の命令はprint 1.5 ファイルを作ってプログラミング ---------------------------------------------------------- CHAPTER 2 プログラムの基本1 順次、変数 ---------------------------------------------------------- 2.1 プログラムの3つの基本 順次、分岐、反復 2.2 順次 上から順番に、実行する 2.3 変数 2.4 データ型 2.5 ユーザーからの入力はinput 2.6 inputと計算でアプリを作ろう! ---------------------------------------------------------- CHAPTER 3 プログラムの基本2 条件分岐、ランダム ---------------------------------------------------------- 3.1 分岐 もしも~だったら、○○する 3.2 ランダム コンピュータのサイコロ 3.3 if文とランダムでアプリを作ろう ---------------------------------------------------------- CHAPTER 4 プログラムの基本3 反復、たくさんのデータ ---------------------------------------------------------- 4.1 たくさんのデータはリストに入れて使う 4.2 反復 同じ処理をくり返す 4.3 range くり返す範囲を決める 4.4 リストでアプリを作ろう ---------------------------------------------------------- CHAPTER 5 プログラムをまとめる 関数、ループ ---------------------------------------------------------- 5.1 関数 仕事をひとまとめにする 5.2 モジュールで分割 5.3 ループ 条件を満たす間くり返す 5.4 関数とループでアプリを作ろう ========================================================== PART 2 ゲームを作ろう ========================================================== CHAPTER 1 pygameで絵を描こう ---------------------------------------------------------- 1.1 pygameでゲームを作ろう 1.2 pygameの基本 1.3 図形や、文字、画像を描こう 1.4 グラフィックスを動かそう ---------------------------------------------------------- CHAPTER 2 キーやマウスで動かそう ---------------------------------------------------------- 2.1 キーで絵を動かそう 2.2 マウスで絵を動かそう 2.3 ボタンを作ろう ---------------------------------------------------------- CHAPTER 3 画面の切り換えで紙芝居 ---------------------------------------------------------- 3.1 1ページを1つの関数にまとめる 3.2 一本道の紙芝居 3.3 枝分かれの紙芝居 ---------------------------------------------------------- CHAPTER 4 衝突判定でアクションゲーム ---------------------------------------------------------- 4.1 キャラクターを上下左右に移動する 4.2 他のRectとの衝突判定 4.3 複数のRectとの衝突判定 4.4 ワナをたくさんばらまく 4.5 ワナと衝突したらゲームオーバー 4.6 ゴールと衝突したらゲームクリア 4.7 追いかけてくるオバケ登場! ---------------------------------------------------------- CHAPTER 5 ボールを反射してブロック崩し ---------------------------------------------------------- 5.1 ボールをバーで打ち返す 5.2 ボールが画面の下に移動したら、ゲームオーバー 5.3 ブロックをたくさん並べる ---------------------------------------------------------- CHAPTER 6 ブロック崩しから、シューティングゲームへ ---------------------------------------------------------- 6.1 自機を左右に移動 6.2 UFOが落下する 6.3 自機とUFOが衝突したら、ゲームオーバー 6.4 弾とUFOが衝突したら、UFOが消える 6.5 星を降らせて、スコアを追加 ========================================================== APPENDIX 巻末付録 Pygameリファレンス ========================================================== ・Pygameの命令一覧 ・色の名前リストプログラム

東京大学のデータサイエンティスト育成講座 ~Pythonで手を動かして学ぶデ―タ分析~

塚本邦尊
マイナビ出版
おすすめ度
58
紹介文
東大 松尾研究室が提供するあの人気講座が待望の書籍化! 本書は、2017年と2018年に東京大学で実施された「グローバル消費インテリジェンス寄付 講座」の学生向けオフライン講義と、社会人向けオンライン講座で使われた教材がベースになっています。 約400名ほどの受講枠(2年間)に、のべ1,800人以上の応募があった人気の講義です。この本のベースとなるコンテンツはJupyter Notebook形式で公開されていますが、この内容をさらに精査、ブラッシュアップし、読みやすく整えたものが本書になります。 ●本書の内容 本書には、データサイエンティストになるための基礎をつめこんでいます。データサイエンティストは、Pythonや確率・統計、機械学習など、幅広くさまざまな分野の知識を必要とします。 すべての分野を1冊で学ぶことは無理ですので、各分野で深入りはせず基礎的な事項を取り扱っています。データサイエンティストになるための地図と羅針盤のような位置づけとなることをイメージしています。 この本は主にPython 3を使って、基本的なプログラムの書き方、データの取得、読み込み、そのデータ操作からはじまり、さまざまなPythonのライブラリの使い方、確率統計の手法、機械学習(教師あり学習、教師なし学習とチューニング)の使い方についても学びます。取り扱っているデータは、マーケティングに関するデータやログデータ、金融時系列データなどさまざまで、モデリングの前にそれらを加工する手法も紹介しています。データサイエンティストになるには、どれも必要なスキルです。 本書には、さらに以下の3つの特徴があります。 ・実際のデータを使って手を動かしながら、データサイエンスのスキルを身に付けることができる ・データ分析の現場で使える実践的な内容(データ前処理など)が含まれている ・練習問題や総合問題演習など実際に頭を使って考える内容がたくさんある この本に書いてあることを実践し、読み終えた後には、実際の現場でデータ分析ができるようになるはずです。 ●この本の対象読者 この本は、プログラミングの経験があり、理系の大学1~2年生程度の教養課程の数学(線形代数、微分積分学、確率統計の基礎など)を終えている方を対象にしています。具体的には、勉強熱心な大学3~4年生の理系の学生さんや大学院生の方、また社会人になってデータサイエンスを学ぼうという意欲の高い方たちが対象です。データサイエンスの入門レベルから中級レベルの手前までを考えている人に最適で、本書のゴールもデータサイエンス入門レベルを卒業できることを想定しています。 "Contents Chapter 1 本書の概要とPythonの基礎 1-1 データサイエンティストの仕事  1-1-1 データサイエンティストの仕事  1-1-2 データ分析のプロセス  1-1-3 本書の構成  1-1-4 本書を読み進めるのに役立つ文献  1-1-5 手を動かして習得しよう 1-2 Pythonの基礎   1-2-1 Jupyter Notebookの使い方  1-2-2 Pythonの基礎  1-2-3 リストと辞書型  1-2-4 条件分岐とループ  Column format記法と%記法  1-2-5 関数  Practice 練習問題1-1  Practice 練習問題1-2  1-2-6 クラスとインスタンス  Practice 1章 総合問題 Chapter 2 科学計算、データ加工、グラフ描画ライブラリの使い方の基礎 2-1 データ分析で使うライブラリ  2-1-1 ライブラリの読み込み  2-1-2 マジックコマンド  2-1-3 この章で使うライブラリのインポート 2-2 Numpyの基礎  2-2-1 Numpyのインポート  2-2-2 配列操作  2-2-3 乱数  Column Numpyは高速 2-2-4 行列  Practice 練習問題2-1  練習問題2-2  練習問題2-3 2-3 Scipyの基礎  2-3-1 Scipyのライブラリのインポート  2-3-2 行列計算  2-3-3 ニュートン法  Practice 練習問題2-4  練習問題2-5  練習問題2-6 2-4 Pandasの基礎  2-4-1 Pandasのライブラリのインポート  2-4-2 Seriesの使い方  2-4-3 DataFrameの使い方  2-4-4 行列操作  2-4-5 データの抽出  2-4-6 データの削除と結合  2-4-7 集計  2-4-8 値のソート  2-4-9 nan(null)の判定  Practice 練習問題2-7  Practice 練習問題2-8  Practice 練習問題2-9 2-5 Matplotlibの基礎  2-5-1 Matplotlibを使うための準備  2-5-2 散布図  2-5-3 グラフの分割  2-5-4 関数グラフの描画  2-5-5 ヒストグラム  Column さまざまなデータのビジュアル化  Practice 練習問題2-10  Practice 練習問題2-11  Practice 練習問題2-12  Practice 2章 総合問題 Chapter 3 記述統計と単回帰分析 3-1 統計解析の種類  3-3-1 記述統計と推論統計  3-3-2 この章で使うライブラリのインポート 3-2 データの読み込みと対話  3-2-1 インターネットなどで配布されている対象データの読み込み  3-2-2 データの読み込みと確認  3-2-3 データの性質を確認する  Column  「変数」という用語について  3-2-4 量的データと質的データ 3-3 記述統計  3-3-1 ヒストグラム  3-3-2 平均、中央値、最頻値  3-3-3 分散と標準偏差  3-3-4 要約統計量とパーセンタイル値  3-3-5 箱ひげ図  3-3-6 変動係数  3-3-7 散布図と相関係数  3-3-8 すべての変数のヒストグラムや散布図を描く  Practice 練習問題3-1  Practice 練習問題3-2  Practice 練習問題3-3 3-4 単回帰分析  3-4-1 線形単回帰分析  3-4-2 決定係数  Practice 練習問題3-4  Practice 練習問題3-5  Practice 練習問題3-6  Practice 3章 総合問題 Chapter 4 確率と統計の基礎 4-1 確率と統計を学ぶ準備  4-1-1 この章の前提知識  4-1-2 この章で使うライブラリのインポート 4-2 確率  4-2-1 数学的確率  4-2-2 統計的確率  4-2-3 条件付き確率と乗法定理  4-2-4 独立と従属  4-2-5 ベイズの定理  Practice 練習問題4-1  Practice 練習問題4-2  Practice 練習問題4-3 4-3 確率変数と確率分布  4-3-1 確率変数、確率関数、分布関数、期待値  4-3-2 さまざまな分布関数  4-3-3 カーネル密度関数  Practice 練習問題4-4  Practice 練習問題4-5  Practice 練習問題4-6 4-4 応用:多次元確率分布  4-4-1 同時確率関数と周辺確率関数  4-4-2 条件付き確率関数と条件付き期待値  4-4-3 独立の定義と連続分布 4-5 推計統計学  4-5-1 大数の法則  4-5-2 中心極限定理  4-5-3 標本分布  Practice 練習問題4-7  Practice 練習問題4-8  Practice 練習問題4-9 4-6 統計的推定  4-6-1 推定量と点推定  4-6-2 不偏性と一致性  4-6-3 区間推定  4-6-4 推定量を求める  Practice 練習問題4-10  Practice 練習問題4-11  Practice 練習問題4-12 4-7 統計的検定  4-7-1 検定  4-7-2 第1種の過誤と第2種の過誤  4-7-3 ビッグデータに対する検定の注意  Practice 練習問題4-13  Practice 4章 総合問題 Chapter 5 Pythonによる科学計算(NumpyとScipy) 5-1 概要と事前準備  5-1-1 この章の概要  5-1-2 この章で使うライブラリのインポート 5-2 Numpyを使った計算の応用  5-2-1 インデックス参照  Practice 練習問題5-1  Practice 練習問題5-2  Practice 練習問題5-3 5-2-2 Numpyの演算処理  Practice 練習問題5-4  Practice 練習問題5-5  Practice 練習問題5-6 5-2-3 配列操作とブロードキャスト  Practice 練習問題5-7  Practice 練習問題5-8  Practice 練習問題5-9 5-3 Scipyを使った計算の応用・  5-3-1 補間  5-3-2 線形代数:行列の分解  Practice 練習問題5-10  Practice 練習問題5-11  Practice 練習問題5-12  Practice 練習問題5-13  Practice 練習問題5-14  5-3-3 積分と微分方程式  Practice 練習問題5-15  Practice 練習問題5-16  5-3-4 最適化  Practice 練習問題5-17  Practice 練習問題5-18  Practice 5章 総合問題 Chapter 6 Pandasを使ったデータ加工処理 6-1 概要と事前準備  6-1-1 この章で使うライブラリのインポート 6-2 Pandasの基本的なデータ操作  6-2-1 階層型インデックス  Practice 練習問題6-1  Practice 練習問題6-2  Practice 練習問題6-3 6-2-2 データの結合  Practice 練習問題6-4   練習問題6-5   練習問題6-6 6-2-3 データの操作と変換  Practice 練習問題6-7  Practice 練習問題6-8  Practice 練習問題6-9 6-2-4 データの集約とグループ演算  Practice 練習問題6-10  Practice 練習問題6-11  Practice 練習問題6-12 6-3 欠損データと異常値の取り扱いの基礎  6-3-1 欠損データの扱い方  Practice 練習問題6-13  Practice 練習問題6-14  Practice 練習問題6-15  6-3-2 異常データの扱い方 6-4 時系列データの取り扱いの基礎  6-4-1 時系列データの処理と変換  Practice 練習問題6-16  6-4-2 移動平均  Practice 練習問題6-17  Practice 6章 総合問題 Chapter 7 Matplotlibを使ったデータ可視化 7-1 データの可視化  7-1-1 データの可視化について  7-1-2 この章で使うライブラリのインポート 7-2 データ可視化の基礎  7-2-1 棒グラフ  7-2-2 円グラフ  Practice 練習問題7-1  Practice 練習問題7-2  Practice 練習問題7-3 7-3 応用:金融データの可視化  7-3-1 可視化する金融データ  7-3-2 ローソクチャートを表示するライブラリ 7-4 応用:分析結果の見せ方を考えよう  7-4-1 資料作成のポイントについて  Practice 7章 総合問題  Column 移動平均時系列データと対数時系列データ Chapter 8 機械学習の基礎(教師あり学習) 8-1 機械学習の全体像  8-1-1 機械学習とは  8-1-2 教師あり学習  8-1-3 教師なし学習  8-1-4 強化学習  8-1-5 この章で使うライブラリのインポート 8-2 重回帰  8-2-1 自動車価格データの取り込み  8-2-2 データの整理  8-2-3 モデル構築と評価  8-2-4 モデル構築とモデル評価の流れのまとめ  Practice 練習問題8-1 8-3 ロジスティック回帰  8-3-1 ロジスティック回帰の例  8-3-2 データの整理  8-3-3 モデル構築と評価  8-3-4 スケーリングによる予測精度の向上  Practice 練習問題8-2  Practice 練習問題8-3 8-4 正則化項のある回帰:ラッソ回帰、リッジ回帰  8-4-1 ラッソ回帰、リッジ回帰の特徴  8-4-2 重回帰とリッジ回帰の比較  Practice 練習問題8-4 8-5 決定木  8-5-1 キノコデータセット  8-5-2 データの整理  8-5-3 エントロピー:不純度の指標  8-5-4 情報利得:分岐条件の有益さを測る  8-5-5 決定木のモデル構築  Practice 練習問題8-5 8-6 k-NN(k近傍法)  8-6-1 k-NNのモデル構築  Practice 練習問題8-6  Practice 練習問題8-7 8-7 サポートベクターマシン  8-7-1 サポートベクターマシンのモデル構築  Practice 練習問題8-8  Practice 8章 総合問題 Chapter 9 機械学習の基礎(教師なし学習) 9-1 教師なし学習  9-1-1 教師なしモデルの種類  9-1-2 この章で使うライブラリのインポート 9-2 クラスタリング  9-2-1 k-means法  9-2-2 k-means法でクラスタリングする  9-2-3 金融マーケティングデータをクラスタリングする  9-2-4 エルボー法によるクラスター数の推定  9-2-5 クラスタリング結果の解釈  9-2-6 k-means法以外の手法  Practice 練習問題9-1 9-3 主成分分析  9-3-1 主成分分析を試す  9-3-2 主成分分析の実例  Practice 練習問題9-2 9-4 マーケットバスケット分析とアソシエーションルール  9-4-1 マーケットバスケット分析とは  9-4-2 マーケットバスケット分析のためのサンプルデータを読み込む  9-4-3 アソシエーションルール  Practice 9章 総合問題 Chapter 10 モデルの検証方法とチューニング方法 10-1 モデルの評価と精度を上げる方法とは  10-1-1 機械学習の課題とアプローチ  10-1-2 この章で使うライブラリのインポート 10-2 モデルの評価とパフォーマンスチューニング  10-2-1 ホールドアウト法と交差検証法  10-2-2 パフォーマンスチューニング:ハイパーパラメータチューニング  Practice 練習問題10-1  Practice 練習問題10-2  10-2-3 パフォーマンスチューニング:特徴量の扱い  10-2-4 モデルの種類  10-3 モデルの評価指標  10-3-1 分類モデルの評価:混同行列と関連指標  10-3-2 分類モデルの評価:ROC曲線とAUC  Practice 練習問題10-3  10-3-3 回帰モデルの評価指標  Practice 練習問題10-4 10-4 アンサンブル学習  10-4-1 バギング  Practice 練習問題10-5  10-4-2 ブースティング  10-4-3 ランダムフォレスト、勾配ブースティング  Practice 練習問題10-6  10-4-4 今後の学習に向けて  Practice 練習問題10-7  Practice 10 章 総合問題 Chapter 11 総合演習問題 11-1 総合演習問題  11-1-1 総合演習問題(1)  11-1-2 総合演習問題(2)  11-1-3 総合演習問題(3)  11-1-4 総合演習問題(4)  11-1-5 総合演習問題(5)  11-1-6 総合演習問題(6)  11-1-7 参考:今後のデータ分析に向けて Appendix A-1 本書の環境構築について  A-1-1 Anacondaについて  A-1-2 Anacondaのパッケージをダウンロードする  A-1-3 Anacondaをインストールする  A-1-4 pandas-datareaderおよびPlotlyのインストール A-2 練習問題解答  A-2-1 Chapter1 練習問題  A-2-2 Chapter2 練習問題  A-2-3 Chapter3 練習問題  A-2-4 Chapter4 練習問題  A-2-5 Chapter5 練習問題  A-2-6 Chapter6 練習問題  A-2-7 Chapter7 練習問題  A-2-8 Chapter8 練習問題  A-2-9 Chapter9 練習問題  A-2-10 Chapter10 練習問題  A-2-11 Chapter11 総合演習問題  Column ダミー変数と多重共線性 A-3 参考文献・参考URL  A-3-1 参考文献  A-3-2 参考URL

仕事を自動化する! Python入門講座

廣瀬 豪
ソーテック社
おすすめ度
58
紹介文
面倒くさい日々の作業は、プログラミングで簡単に処理しよう。 ビジネスの現場で自動化・効率化を実現する入門書の決定版! 本書は日常業務の効率化・自動化を目標に、「Python」というプログラミング言語でビジネス用のアプリケーション・ソフトウェア開発を学ぶ入門書です。 効率化や自動化、あるいはビジネスソフトという言葉を耳にすると、プログラミング未経験者や初心者の方は難しそうと感じるかもしれませんが、心配は無用です。 Pythonは、とても学びやすいプログラミング言語です。本書は、初学者が理解できるようにプログラミングの基礎から学び始める構成になっています。 また、Pythonや他のプログラミング言語ですでにソフトウェアを開発できるスキルをお持ちで、 「本格的に自動化プログラムを組みたい」「GUIを用いたソフトウェア開発をしたい」という方のために、Pythonのプログラミング・テクニックも網羅しています。 Chapter 1 プログラミングを始めよう! Section 1-1 Pythonとは? Section 1-2 ハードウェアとソフトウェア Section 1-3 作業の自動化について理解しよう! Section 1-4 プログラミングの準備〜拡張子の表示〜 Section 1-5 Pythonをインストールしよう! Section 1-6 Pythonを起動しよう! Column Pythonを優秀な部下にしよう! Chapter 2 Pythonに色々させてみよう! Section 2-1 IDLEの使い方 Section 2-2 計算をさせる Section 2-3 ホームページを開かせる Section 2-4 カレンダーを出力させる Section 2-5 シェルウィンドウとエディタウィンドウ Section 2-6 プログラムの入力と実行 Section 2-7 プログラムの記述ルール Column プログラミング習得への近道 Chapter 3 プログラミングの基礎知識 Section 3-1 入力と出力 Section 3-2 変数と計算式 Section 3-3 データ型について Section 3-4 条件分岐 Section 3-5 繰り返し Column Pythonに九九の表を作らせよう! Chapter 4 関数とリストについて学ぼう! Section 4-1 関数を理解する Section 4-2 関数の定義 Section 4-3 関数の引数と戻り値 Section 4-4 リストを理解する Section 4-5 二次元リストを理解する Section 4-6 日時の取得 Section 4-7 ファイル操作 Column CUIでミニゲームを作ろう! Chapter 5 GUIの基礎知識 Section 5-1 GUIとは? Section 5-2 ウィンドウを表示する Section 5-3 ラベルを配置する Section 5-4 メッセージを配置する Section 5-5 ボタンを配置する Section 5-6 ボタンをクリックしたときの処理 Section 5-7 メッセージボックスを表示する Column サイコロアプリを作ろう! Chapter 6 GUIの高度な使い方 Section 6-1 1行のテキスト入力欄を配置する Section 6-2 複数行のテキスト入力欄を配置する Section 6-3 チェックボタンを配置する Section 6-4 チェックボタンを操作する Section 6-5 コンボボックスを配置する Section 6-6 キャンバスを配置する Section 6-7 その他のGUI Section 6-8 複数のウィンドウを扱う Column キャンバスに画像を表示しよう! Chapter 7 時計アプリを作ってみよう! Section 7-1 リアルタイム処理を行う Section 7-2 グローバル変数とローカル変数を理解する Section 7-3 日時を表示する Section 7-4 時計アプリの完成 Section 7-5 時計アプリの応用 Column Pythonに円周率を計算させよう! Chapter 8 テキストエディタを作ってみよう! Section 8-1 スクロールバーを設置する Section 8-2 メニューを作る Section 8-3 ファイルダイアログの使い方 Section 8-4 ファイルを読み込む Section 8-5 ファイルを書き込む Section 8-6 テキストエディタの完成 Section 8-7 半角カタカナを全角に置換する Column 複数のファイルを自動処理する Chapter 9 Pythonで仕事を自動化・効率化しよう! Section 9-1 エクセルファイルを扱う Section 9-2 CSVファイルを読み込む Section 9-3 CSVファイルに書き込む Section 9-4 データをグラフ化する Section 9-5 データを分析する Column openpyxlを利用する 特別付録 オブジェクト指向プログラミングを学ぼう! Appendix 1 オブジェクト指向プログラミングとは? Appendix 2 クラスの宣言 Appendix 3 オブジェクトを作る Appendix 4 オブジェクトに機能を持たせる Appendix 5 複数のオブジェクトを作る Appendix 6 リストでオブジェクトを作る Appendix 7 継承とオーバーライド

Excel×Python最速仕事術

金宏 和實
日経BP
おすすめ度
58
紹介文
全オフィスパーソン必読! Excelの面倒な操作はパソコンにやらせよう 全オフィスパーソン必読!Excelの面倒な操作はパソコンにやらせよう ビジネスパーソンが必ず使うExcelは、面倒な手作業が多いのが残念なところ。いくら操作を効率化しても、マウスやキーボードでの作業がなくなりません。決まったセルの範囲を別のシートの決められたところにコピーしたり、毎月のデータをグラフにしたり……。1回だけの作業だけならまだしも、部署別や事業所別にほとんど同じ作業を何度も何度も繰り返すような作業もしばしば。オフィスでのパソコン操作には、こんな無駄がたくさんあってうんざりしている人は多いでしょう。抜本的に解決するは、操作方法を工夫するだけでは追いつきません。 そんな単純で面倒な作業は、Pythonで自動化しましょう! 一度、自分の作業に合わせて自動化すれば、どんなに大量のデータでもパソコンにすべてまかせてOK。自分は他の仕事を進められます。 今から始めるならVBAよりPythonがお薦め。 Pythonを学びながらExcelを効率化するか。 Excel業務を自動化しながらプログラミングも身に付けるか。 どちらにしても“一石二鳥”なのは間違いありません。 プログラミングをやったことがないという人も多いでしょう。普通のビジネスパーソンがプログラミング未経験なのは当たり前。でも、大丈夫。必要な基礎知識をさっと身に付けられるよう、簡潔に解説。ざっと一読するだけでプログラミングの基本が学べます。 「ExcelをPythonで自動化」なんていうと難しそうに聞こえるかもしれません。でも、実はどのプログラムもものすごくシンプル。すでに身に染みついているExcelの手作業を基にしているので、プログラムを読んでいるだけでも「何をやっているか」がリアルにわかるのが本書のミソ。ビジネスパーソンがプログラミングに入門するにはピッタリの題材なのではないでしょうか。 「そうは言っても、プログラムをイチから書くのは大変そう」。そんな心配はご無用です! 本書で取り上げたサンプルプログラムはダウンロードしてすぐに利用可能。実際の業務に即したプログラムなのに加え、どこをどう書き換えれば、手っ取り早く自分の業務に応用できるかもできる限り解説しました。プログラムによっては、ほぼ無改造で即業務に役立てられるものもあります。 「どうせならじっくりプログラミングを勉強したい」。そんな人は各章の後半を重点的に読んでください。各章のサンプルプログラムで使われているテクニックをより詳しく、深く解説。必要に応じて、学習用のシンプルなプログラムも提供しています。簡単なプログラムでも、自分で書いて動かせば学習効果は抜群。基本をしっかり身に付ければ、自分のアイデアを生かしたオリジナルのExcel自動化プログラムも可能です。 ちまちました手作業のせいで無駄な残業をするのはもうたくさん。すぐに業務に役立てたい人にも、ディープに学んで高度に自動化したい人にも、本書がきっとお役に立ちます。 【第1章 Pythonとは】 なぜPythonを使うのがいいのか/VBAではなくPythonを使う理由/Pythonの環境を作る、など 【第2章 Pythonとプログラミングの基本】 Pythonの文法/変数とデータ型。変数名の付け方/様々な演算子/組み込み関数とオリジナルの関数、など 【第3章 Excelシートを扱う】 ・定型のExcelデータ(売上伝票)を読み込んで一覧データを作るプログラム ・外部ライブラリ/if文による条件分岐/for構文による繰り返し処理/読み込むセル範囲の指定方法/CSV形式で出力する/ネットワークにあるデータを扱う/パーミッションエラー対策、など 【第4章 集計】 ・個々の伝票から売上を集計するプログラムと/受注データをクロス集計するプログラム ・辞書形式のデータ/2次元リストの使い方と初期化/Excel関数の埋め込み/ピボットテーブルもPythonで、など 【第5章 書式設定と印刷】 ・集計表に書式を設定するプログラム ・import文の便利な書き方/行と列の非表示を制御/セルの書式設定総まとめ/罫線を自動で引く/ファイル制御に必要はraw文字列/いろいろなセル範囲の指定方法/条件付き書式をPythonで、など 【第6章 グラフ】 ・ビジネスでよく使うグラフを作るプログラム ・棒グラフ/積み上げ棒グラフ/折れ線グラフ/面グラフ/レーダーチャート/バブルチャート、など 【第7章 PDF出力と加工】 ・複数の納品書データをまとめてPDF化するプログラム ・テキストや画像をレイアウトしてPDFを作成するプログラム ・COMを使ったExcel操作/win32comのインストール/VBAを応用する方法、など

Python2年生 デスクトップアプリ開発のしくみ 体験してわかる!会話でまなべる!

森 巧尚
翔泳社
おすすめ度
58
紹介文
初心者でも大丈夫!アプリ開発を体験してみよう! Pythonで デスクトップアプリ開発を 体験してみよう! 【初心者でもできる!デスクトップアプリ開発を一緒に体験しよう】 Pythonの基礎知識はあるけど、 「アプリ開発って初心者には難しそう」 「プログラムで何か残るものを作ってみたい」 と思っていませんか? 本書はそうした方に向けて、初心者にも簡単に作れる方法を使ってデスクトップアプリ開発の基本をやさしく解説します。スマホアプリ、Webアプリに比べて、手軽に取り組めますので挫折することなく学習できます。本書を読んだあとは、スマホアプリやWebアプリ開発に挑戦してみてください。 【Python2年生について】 「Python2年生」は、「Python1年生」を読み終えた方を対象とした入門書です。ある程度、技術的なことを盛り込み、本書で扱う技術について身につけてもらいます。 『Python2年生 スクレイピングのしくみ』(ISBN:9784798161914) 『Python2年生 データ分析のしくみ』(ISBN:9784798164960) も刊行されています。 【対象読者】 デスクトップアプリの作り方を知りたい初心者 【本書のポイント】 ヤギ博士&フタバちゃんと一緒に、デスクトップアプリ開発の考え方から丁寧に解説。デスクトップアプリ開発をする時に必要な前提知識からはじまり、デスクトップアプリ作りの基本、応用的なデスクトップアプリ、そしてゲームアプリ開発まで解説します。 【著者プロフィール】 森 巧尚(もり・よしなお) アプリの開発や、技術書や電子工作マガジンなどでの執筆活動。関西学院大学非常勤講師、関西学院高等部非常勤講師、成安造形大学非常勤講師、プログラミングスクールコプリ講師など、プログラミングに関する幅広い活動を行っている。近著に、『Python1年生 第2版』、『Python3年生機械学習のしくみ』、『Python2年生 スクレイピングのしくみ』、『Python2年生 データ分析のしくみ』、『Java1年生』、『動かして学ぶ!Vue.js開発入門』(いずれも翔泳社)、『楽しく学ぶ アルゴリズムとプログラミングの図鑑』(マイナビ出版)などがある。 第1章 Pythonでアプリを作ろう LESSON 01 デスクトップアプリってなに? LESSON 02 Pythonをインストールしよう LESSON 03 tkinterでアプリを作ろう LESSON 04 PySimpleGUIでアプリを作ろう 第2章 アプリ作りの基本 LESSON 05 アプリの作り方を理解しよう LESSON 06 配色を選べるよ LESSON 07 レイアウトで画面を作ろう 第3章 計算アプリを作ろう LESSON 08 変数で文字列を作るなら、f文字列が便利 LESSON 09 割り勘アプリ LESSON 10 BMI値計算アプリ LESSON 11 出生の秘密アプリ LESSON 12 干支調べアプリ 第4章 時計アプリを作ろう LESSON 13 時間を測ろう LESSON 14 時計アプリ LESSON 15 ストップウォッチアプリ LESSON 16 時間割アプリ 第5章 ファイル操作アプリを作ろう LESSON 17 ファイルの読み書きをしよう LESSON 18 テキストエディタアプリ LESSON 19 画像を表示するアプリ LESSON 20 画像の加工アプリ LESSON 21 QRコードメーカーアプリ 第6章 ゲームアプリを作ろう LESSON 22 おみくじアプリ LESSON 23 じゃんけんアプリ LESSON 24 足し算ゲームアプリ LESSON 25 数当てゲームアプリ LESSON 26 31ゲームアプリ LESSON 27 これから先は、どうしたらいいの?
search