【2023最新】「データ分析」のおすすめ本!人気ランキング

この記事では、「データ分析」のおすすめ本をランキング形式で紹介していきます。インターネット上の口コミや評判をベースに集計し独自のスコアでランク付けしています。

実践Data Scienceシリーズ RとStanではじめる ベイズ統計モデリングによるデータ分析入門 (KS情報科学専門書)

馬場 真哉
講談社
おすすめ度
100
紹介文
「基本をより実践的に!」学べる新シリーズの第一弾は、「統計モデリングの世界」へのファーストブック。基礎から学べる超入門! 「基本をより実践的に!」学べる新シリーズの第一弾は、「統計モデリングの世界」へのファーストブック。基礎から学べる超入門! ・チュートリアル形式だから、すぐに実践できる! ・統計、確率、ベイズ推論、MCMCの基本事項から、やさしくサポート! ・brmsやbayesplotなどのパッケージの使い方も、しっかり身につく! ・一般化線形モデル(GLM)→一般化線形混合モデル(GLMM)→動的線形モデル(DLM)→動的一般化線形モデル(DGLM)を体系的に学べる! 【本書のサポートページ】 https://logics-of-blue.com/r-stan-bayesian-model-intro-book-support/ 【実践Data Scienceシリーズ】  「基本をより実践的に!」を合言葉に、データサイエンスで用いられる各種手法の基本を、プログラミングの実装とともに解説していきます。はじめて学ぶ大学生、大学院生、ソフトウェアエンジニアに向けた注目の新シリーズです。 【主な内容】 1部 【理論編】ベイズ統計モデリングの基本 1 はじめよう! ベイズ統計モデリング 2 統計学の基本 3 確率の基本 4 確率分布の基本 5 統計モデルの基本 6 ベイズ推論の基本 7 MCMCの基本 2部 【基礎編】RとStanによるデータ分析 1 Rの基本 2 データの要約 3 ggplot2によるデータの可視化 4 Stanの基本 5 MCMCの結果の評価 6 Stanコーディングの詳細 3部 【実践編】一般化線形モデル 1 一般化線形モデルの基本 2 単回帰モデル 3 モデルを用いた予測 4 デザイン行列を用いた一般化線形モデルの推定 5 brmsの使い方 6 ダミー変数と分散分析モデル 7 正規線形モデル 8 ポアソン回帰モデル 9 ロジスティック回帰モデル 10 交互作用 4部 【応用編】一般化線形混合モデル 1 階層ベイズモデルと一般化線形混合モデルの基本 2 ランダム切片モデル 3 ランダム係数モデル 5部 【応用編】状態空間モデル 1 時系列分析と状態空間モデルの基本 2 ローカルレベルモデル 3 状態空間モデルによる予測と補間 4 時変係数モデル 5 トレンドの構造 6 周期性のモデル化 7 自己回帰モデルとその周辺 8 動的一般化線形モデル:二項分布を仮定した例 9 動的一般化線形モデル:ポアソン分布を仮定した例 第1部 【理論編】ベイズ統計モデリングの基本 第1章 はじめよう! ベイズ統計モデリング 第2章 統計学の基本 第3章 確率の基本 第4章 確率分布の基本 第5章 統計モデルの基本 第6章 ベイズ推論の基本 第7章 MCMCの基本 第2部 【基礎編】RとStanによるデータ分析 第1章 Rの基本 第2章 データの要約 第3章 ggplot2によるデータの可視化 第4章 Stanの基本 第5章 MCMCの結果の評価 第6章 Stanコーディングの詳細 第3部 【実践編】一般化線形モデル 第1章 一般化線形モデルの基本 第2章 単回帰モデル 第3章 モデルを用いた予測 第4章 デザイン行列を用いた一般化線形モデルの推定 第5章 brmsの使い方 第6章 ダミー変数と分散分析モデル 第7章 正規線形モデル 第8章 ポアソン回帰モデル 第9章 ロジスティック回帰モデル 第10章 交互作用 第4部 【応用編】一般化線形混合モデル 第1章 階層ベイズモデルと一般化線形混合モデルの基本 第2章 ランダム切片モデル 第3章 ランダム係数モデル 第5部 【応用編】状態空間モデル 第1章 時系列分析と状態空間モデルの基本 第2章 ローカルレベルモデル 第3章 状態空間モデルによる予測と補間 第4章 時変係数モデル 第5章 トレンドの構造 第6章 周期性のモデル化 第7章 自己回帰モデルとその周辺 第8章 動的一般化線形モデル:二項分布を仮定した例 第9章 動的一般化線形モデル:ポアソン分布を仮定した例

AI・データ分析プロジェクトのすべて[ビジネス力×技術力=価値創出]

大城 信晃(監修・著者)
技術評論社
おすすめ度
100
紹介文
データサイエンティストと呼ばれる職種が登場して、いまや10年以上が経過しようとしています。ビッグデータやディープラーニングなど技術的な流行も後押しして、AI・データ分析プロジェクトに取り組む企業も増えました。また、データサイエンス、データエンジニアリングに関する技術情報は次第に増え、データ分析コンペティションの盛り上がりもあって技術的な知識を持つ方が増えているのは事実です。ところが、実際にAI・データ分析プロジェクトに取り組んでみると、そううまくはいかないようです。プロジェクトを進めるには技術知識だけでなく「ビジネス力」が必要なのです。 そこで、本書はこれまでメインテーマとして語られることのなかった「ビジネス力」に焦点をあてて、データ分析プロジェクトを一通り解説していきます。プロジェクトの入口として「組織の立ち上げ方」から「案件獲得」にふれ、続く実際のデータ分析プロセスにおいては、課題とゴールを明確にして、分析結果は出して終わりではなく共有、評価のサイクルが必要であることを解説します。最後に出口となる「収益化」に関する情報をまとめます。 先を行くデータ分析者達は、これまでさまざまな罠にかかり、見えない落とし穴にはまっても奮闘してノウハウを蓄積してきたのがこの10年です。これからAI・データ分析プロジェクトに取り組む方/関わる方へ向けて、先人たちのノウハウをまとめたのが本書です。 第1部 プロジェクトの準備 第1章 AI・データ分析業界の概要 第2章 データサイエンティストのキャリアと雇用 第3章 AI・データサイエンティストの実務と情報収集 第2部 プロジェクトの入口 第4章 社内案件の獲得と外部リソースの検討 第5章 データのリスクマネジメントと契約 第3部 プロジェクトの実行 第6章 AI・データ分析プロジェクトの起ち上げと管理 第7章 データの種類と分析手法の検討 第8章 分析結果の評価と改善 第9章 レポーティングとBI 第10章 データ分析基盤の構築と運用 第4部 プロジェクトの出口 第11章 プロジェクトのバリューと継続性 第12章 業界事例

Python実践データ分析100本ノック

下山 輝昌
秀和システム
おすすめ度
96
紹介文
データ分析の現場にあって入門書にない「汚いデータ」(ダーティデータ)に対応する、プロのノウハウを解説します。 これがリアルなデータ分析だ! 君は「汚いデータ」を処理できるか? データ分析の現場にあって入門書にないもの――それは、「汚いデータ」(ダーティデータ)です。本書は、データ分析の現場では①どんなデータに出会い、②どのような問題が生じ、③どう対応すればよいのかというノウハウを解説。 事前の加工(視覚化)から機械学習、最適化問題まで、100本ノックをこなして、ビジネス現場で即戦力になれる「応用力」を身につけよう! 練習するライブラリ ・Pandas ・Numpy ・Matplotlib ・scikit-learn ・Networkxs ・pulp ・ortoolpy ・opencv ・dlib ・MeCab 第1部 基礎編:データ加工 第1章 ウェブからの注文数を分析する10本ノック 第2章 小売店のデータでデータ加工を行う10本ノック 第2部 実践編①:機械学習 第3章 顧客の全体像を把握する10本ノック 第4章 顧客の行動を予測する10本ノック 第5章 顧客の退会を予測する10本ノック 第3部 実践編②:最適化問題 第6章 物流の最適ルートをコンサルティングする10本ノック 第7章 ロジスティクスネットワークの最適設計を行う10本ノック 第8章 数値シミュレーションで消費者行動を予測する10本ノック 第4部 発展編:画像処理/言語処理 第9章 潜在顧客を把握するための画像認識10本ノック 第10章 アンケート分析を行うための自然言語処理10本ノック

前処理大全[データ分析のためのSQL/R/Python実践テクニック]

本橋 智光
技術評論社
おすすめ度
95

はじめてのパターン認識

平井 有三
森北出版
おすすめ度
93
紹介文
パターン認識にはじめて触れる読者に向け,基礎からわかりやすく解説した入門書です.パターン認識の概念がよく理解できるとともに,Rによる実行例など,実際に応用する際にも役立つ内容が盛り込まれています. 第1章 はじめに 第2章 識別規則と学習法の概要 第3章 ベイズの識別規則 第4章 確率モデルと識別関数 第5章 k最近傍法(kNN法) 第6章 線形識別関数 第7章 パーセプトロン型学習規則 第8章 サポートベクトルマシン 第9章 部分空間法 第10章 クラスタリング 第11章 識別器の組み合わせによる性能強化

Kaggleで勝つデータ分析の技術

門脇 大輔
技術評論社
おすすめ度
92
紹介文
データサイエンスの認知の高まりとともに、データ分析に関するコンペティションが多数開催されるようになってきました。最も有名なコンペティションプラットフォームであるKaggleにおけるプレイヤー数は10万人を超え、多くのエンジニアが自分の腕を試すためにコンペティションに参加しています。分析コンペでは、実際のデータを扱うため、機械学習の解説書にはあまり載っていないような手法やテクニックが数多く活用されています。これらを理解し自身で使えるようにしておくことはコンペだけでなく、実務でのモデル構築において非常に役に立ちます。 そこでこれらのテクニックや事例を多くの人に知っていただくために、現時点で最新のものを整理して本書にまとめました。特徴量の作り方、バリデーション、パラメータチューニングなどについて、一般的な書籍ではあまり言及されない暗黙知やポイントについて記述しています。分析コンペにこれから参加してみたい方、あるいはもっと上を目指したい方だけでなく、実務で予測モデルの精度を上げたいという方にも参考になる情報が多いでしょう。 第1章 分析コンペとは? 1.1 分析コンペって何? 1.1.1 何をするものか 1.1.2 予測結果の提出と順位表(Leaderboard) 1.1.3 チームでの参加 1.1.4 入賞賞金・特典 1.2 分析コンペのプラットフォーム 1.2.1 Kaggle 1.2.2 Rankings(ランキング・称号制度) 1.2.3 Kernel 1.2.4 Discussion 1.2.5 Datasets 1.2.6 API 1.2.7 Newsfeed 1.2.8 開催された分析コンペの種類と具体例 1.2.9 分析コンペのフォーマット 1.3 分析コンペに参加してから終わるまで 1.3.1 分析コンペに参加 1.3.2 規約に同意 1.3.3 データをダウンロード 1.3.4 予測値の作成 1.3.5 予測値の提出 1.3.6 Public Leaderboardをチェック 1.3.7 最終予測値を選ぶ 1.3.8 Private Leaderboardをチェック 1.4 分析コンペに参加する意義 1.4.1 賞金を得る 1.4.2 称号やランキングを得る 1.4.3 実データを用いた分析の経験・技術を得る 1.4.4 データサイエンティストとのつながりを得る 1.4.5 就業機会を得る 1.5 上位を目指すためのポイント 1.5.1 タスクと評価指標 1.5.2 特徴量の作成 1.5.3 モデルの作成 1.5.4 モデルの評価 1.5.5 モデルのチューニング 1.5.6 アンサンブル 1.5.7 分析コンペの流れ Column  計算リソース 第2章 タスクと評価指標 2.1 分析コンペにおけるタスクの種類 2.1.1 回帰タスク 2.1.2 分類タスク 2.1.3 レコメンデーション 2.1.4 その他のタスク 2.2 分析コンペのデータセット 2.2.1 テーブルデータ 2.2.2 外部データ 2.2.3 時系列データ 2.2.4 画像や自然言語などのデータ 2.3 評価指標 2.3.1 評価指標(evaluation metrics)とは 2.3.2 回帰における評価指標 2.3.3 二値分類における評価指標?正例か負例かを予測値とする場合 2.3.4 二値分類における評価指標?正例である確率を予測値とする場合 2.3.5 多クラス分類における評価指標 2.3.6 レコメンデーションにおける評価指標 2.4 評価指標と目的関数 2.4.1 評価指標と目的関数の違い 2.4.2 カスタム評価指標とカスタム目的関数 2.5 評価指標の最適化 2.5.1 評価指標の最適化のアプローチ 2.5.2 閾値の最適化 2.5.3 閾値の最適化をout-of-foldで行うべきか? Column out-of-foldとは? 2.5.4 予測確率とその調整 2.6 評価指標の最適化の例 2.6.1 balanced accuracyの最適化 2.6.2 mean-F1における閾値の最適化 2.6.3 quadratic weighted kappaにおける閾値の最適化 2.6.4 カスタム目的関数での評価指標の近似によるMAEの最適化 2.6.5 MCCのPR-AUCによる近似とモデル選択 2.7 リーク(data leakage) 107 2.7.1 予測に有用な情報が想定外に漏れている意味でのリーク 2.7.2 バリデーションの枠組みの誤りという意味でのリーク 第3章 特徴量の作成 3.1 本章の構成 3.2 モデルと特徴量 3.2.1 モデルと特徴量 3.2.2 ベースラインとなる特徴量 3.2.3 決定木の気持ちになって考える 3.3 欠損値の扱い 3.3.1 欠損値のまま取り扱う 3.3.2 欠損値を代表値で埋める 3.3.3 欠損値を他の変数から予測する 3.3.4 欠損値から新たな特徴量を作成する 3.3.5 データ上の欠損の認識 3.4 数値変数の変換 3.4.1 標準化(standardization) Column データ全体の数値を利用して変換を行うときに、学習データのみを使うか、テストデータも使うか 3.4.2 Min-Maxスケーリング 3.4.3 非線形変換 3.4.4 clipping 3.4.5 binning 3.4.6 順位への変換 3.4.7 RankGauss 3.5 カテゴリ変数の変換 3.5.1 one-hot encoding 3.5.2 label encoding 3.5.3 feature hashing 3.5.4 frequency encoding 3.5.5 target encoding 3.5.6 embedding 3.5.7 順序変数の扱い 3.5.8 カテゴリ変数の値の意味を抽出する 3.6 日付・時刻を表す変数の変換 3.6.1 日付・時刻を表す変数の変換のポイント 3.6.2 日付・時刻を表す変数の変換による特徴量 3.7 変数の組み合わせ 3.8 他のテーブルの結合 3.9 集約して統計量をとる 3.9.1 単純な統計量をとる 3.9.2 時間的な統計量をとる 3.9.3 条件を絞る 3.9.4 集計する単位を変える 3.9.5 ユーザ側でなく、アイテム側に注目する 3.10 時系列データの扱い 3.10.1 時系列データとは? 3.10.2 予測する時点より過去の情報のみを使う 3.10.3 ワイドフォーマットとロングフォーマット 3.10.4 ラグ特徴量 3.10.5 時点と紐付いた特徴量を作る 3.10.6 予測に使えるデータの期間 3.11 次元削減・教師なし学習による特徴量 3.11.1 主成分分析(PCA) 3.11.2 非負値行列因子分解(NMF) 3.11.3 Latent Dirichlet Allocation(LDA) 3.11.4 線形判別分析(LDA) 3.11.5 t-SNE、UMAP 3.11.6 オートエンコーダ 3.11.7 クラスタリング 3.12 その他のテクニック 3.12.1 背景にあるメカニズムから考える 3.12.2 レコード間の関係性に注目する 3.12.3 相対値に注目する 3.12.4 位置情報に注目する 3.12.5 自然言語処理の手法 3.12.6 自然言語処理の手法の応用 3.12.7 トピックモデルの応用によるカテゴリ変数の変換 3.12.8 画像特徴量を扱う手法 3.12.9 decision tree feature transformation 3.12.10 匿名化されたデータの変換前の値を推測する 3.12.11 データの誤りを修正する 3.13 分析コンペにおける特徴量の作成の例 3.13.1 Kaggleの「Recruit Restaurant Visitor Forecasting」 3.13.2 Kaggleの「Santander Product Recommendation」 3.13.3 Kaggleの「Instacart Market Basket Analysis」 3.13.4 KDD Cup 2015 3.13.5 分析コンペにおけるその他のテクニックの例 第4章 モデルの作成 4.1 モデルとは何か? 4.1.1 モデルとは何か? 4.1.2 モデル作成の流れ 4.1.3 モデルに関連する用語とポイント 4.2 分析コンペで使われるモデル 4.3 GBDT(勾配ブースティング木) 4.3.1 GBDTの概要 4.3.2 GBDTの特徴 4.3.3 GBDTの主なライブラリ 4.3.4 GBDTの実装 4.3.5 xgboostの使い方のポイント 4.3.6 lightgbm 4.3.7 catboost Column xgboostのアルゴリズムの解説 4.4 ニューラルネット 4.4.1 ニューラルネットの概要 4.4.2 ニューラルネットの特徴 4.4.3 ニューラルネットの主なライブラリ 4.4.4 ニューラルネットの実装 4.4.5 kerasの使い方のポイント 4.4.6 参考になるソリューション - 多層パーセプトロン 4.4.7 参考になるソリューション - 最近のニューラルネットの発展 4.5 線形モデル 4.5.1 線形モデルの概要 4.5.2 線形モデルの特徴 4.5.3 線形モデルの主なライブラリ 4.5.4 線形モデルの実装 4.5.5 線形モデルの使い方のポイント 4.6 その他のモデル 4.6.1 k近傍法(k-nearest neighbor algorithm、kNN) 4.6.2 ランダムフォレスト(Random Forest、RF) 4.6.3 Extremely Randomized Trees(ERT) 4.6.4 Regularized Greedy Forest(RGF) 4.6.5 Field-aware Factorization Machines(FFM) 4.7 モデルのその他のポイントとテクニック 4.7.1 欠損値がある場合 4.7.2 特徴量の数が多い場合 4.7.3 目的変数に1対1で対応するテーブルでない場合 4.7.4 pseudo labeling Column 分析コンペ用のクラスやフォルダの構成 第5章 モデルの評価 5.1 モデルの評価とは? 5.2 バリデーションの手法 5.2.1 hold-out法 5.2.2 クロスバリデーション 5.2.3 stratified k-fold 5.2.4 group k-fold 5.2.5 leave-one-out 5.3 時系列データのバリデーション手法 5.3.1 時系列データのhold-out法 5.3.2 時系列データのクロスバリデーション(時系列に沿って行う方法) 5.3.3 時系列データのクロスバリデーション(単純に時間で分割する方法) 5.3.4 時系列データのバリデーションの注意点 5.3.5 Kaggleの「Recruit Restaurant Visitor Forecasting」 5.3.6 Kaggleの「Santander Product Recommendation」 5.4 バリデーションのポイントとテクニック 5.4.1 バリデーションを行う目的 5.4.2 学習データとテストデータの分割をまねる 5.4.3 学習データとテストデータの分布が違う場合 5.4.4 Leaderboardの情報を利用する 5.4.5 バリデーションデータやPublic Leaderboardへの過剰な適合 5.4.6 クロスバリデーションのfoldごとに特徴量を作り直す 5.4.7 使える学習データを増やす 第6章 モデルのチューニング 6.1 パラメータチューニング 6.1.1 ハイパーパラメータの探索手法 6.1.2 パラメータチューニングで設定すること 6.1.3 パラメータチューニングのポイント 6.1.4 ベイズ最適化でのパラメータ探索 6.1.5 GBDTのパラメータおよびそのチューニング Column xgboostの具体的なパラメータチューニングの方法 6.1.6 ニューラルネットのパラメータおよびそのチューニング Column 多層パーセプトロンの具体的なパラメータチューニングの方法 6.1.7 線形モデルのパラメータおよびそのチューニング 6.2 特徴選択および特徴量の重要度 6.2.1 単変量統計を用いる方法 6.2.2 特徴量の重要度を用いる方法 6.2.3 反復して探索する方法 6.3 クラスの分布が偏っている場合 Column ベイズ最適化およびTPEのアルゴリズム 第7章 アンサンブル 7.1 アンサンブルとは? 7.2 シンプルなアンサンブル手法 7.2.1 平均、加重平均 7.2.2 多数決、重みづけ多数決 7.2.3 注意点とその他のテクニック 7.3 スタッキング 7.3.1 スタッキングの概要 7.3.2 特徴量作成の方法としてのスタッキング 7.3.3 スタッキングの実装 7.3.4 スタッキングのポイント 7.3.5 hold-outデータへの予測値を用いたアンサンブル 7.4 どんなモデルをアンサンブルすると良いか? 7.4.1 多様なモデルを使う 7.4.2 ハイパーパラメータを変える 7.4.3 特徴量を変える 7.4.4 問題のとらえ方を変える 7.4.5 スタッキングに含めるモデルの選択 7.5 分析コンペにおけるアンサンブルの例 7.5.1 Kaggleの「Otto Group Product Classification Challenge」 7.5.2 Kaggleの「Home Depot Product Search Relevance」 7.5.3 Kaggleの「Home Credit Default Risk」 付 録 A.1 分析コンペの参考資料 A.2 参考文献 A.3 本書で参照した分析コンペ 索引 著者プロフィール

統計学の基礎から学ぶ Excelデータ分析の全知識 (できるビジネス)

三好大悟
インプレス
おすすめ度
84
紹介文
本書は、これからデータ分析を行う人が知っておくべきことを全部学べる解説書です。本当に役立つ、使えるスキルが身につくように、「統計学の基礎からしっかり学ぶ」「学んだことをExcelを使って実践する」という構成になっています。そのため、これまでまったく統計学に触れたことのない人でも理解しやすく、また、Excelの操作も1つ1つ画面を見せながら解説しているため、分析が初めてでも迷わず実践できます。

図解ポケット 今日から使える! データサイエンスがよくわかる本

今西航平 西沢衛 酒井健三郎
秀和システム
おすすめ度
84
紹介文
いまや「データをビジネスに生かす」のは当たり前の時代。一般のビジネスパーソンにも「データサイエンス」のリテラシーが求められています。本書は「そもそも、データサイエンスって何?」というところから始まり、よく聞くキーワードや押さえておきたいトピック、実際のビジネスシーンでデータサイエンスがどう生かされているか? という実例まで、ポイントを絞って解説します。 文章だけだとわかりづらい内容も、豊富な図やイラストでフォロー。「なるほど、そういうことか!」とイメージをつかみやすいよう配慮しています。 また、データサイエンスは数学が深く関係しますが、本書では難しい数式や専門用語はナシ。初心者でもデータサイエンスの概要、肝が掴めるよう解説します。「データサイエンスについて知りたい、学んでみたい」けれど、「どこから学べばいいのか…?」という方に、まずは一冊目に読んで欲しい本です! ビジネスパーソンだけでなく、学生さんにもオススメです。 第1章 データサイエンスとは? 第2章 機械学習とは 第3章 データサイエンスの活用事例と手法 第4章 データ分析、活用プロセス 第5章 先端テクノロジー 第6章 学習ロードマップ

Python2年生 データ分析のしくみ 体験してわかる! 会話でまなべる!

森 巧尚
翔泳社
おすすめ度
83
紹介文
こんどはデータ分析に挑戦!「数式一切なし」で理解できちゃう!データ分析のきほんとしくみ Pythonでデータ分析を体験してみよう! 【データ分析を一緒に体験しよう】 スクレイピングなどで集めた大量のデータ。 どうやって分析してたらよいか、困っていませんか? 「数式があって難しそう」 「プログラムも大変そう」 と思っている方も多いはず。 本書は、そうした方に向けて、サンプルを元にやさしく データ分析の方法を解説しています。 【Python2年生について】 「Python2年生」は、「Python1年生」を読み終えた方を対象とした入門書です。 ある程度、技術的なことを盛り込み、本書で扱う技術について身に着けてもらいます。 『Python2年生 スクレイピングのしくみ』(ISBN:9784798161914)も刊行されています。 【対象読者】 ・データの分析方法を知りたい初心者 【本書のポイント】 ヤギ博士&フタバちゃんと一緒に、データ分析の考え方から丁寧に解説。 データを分析する時に必要な前処理の方法や、データの集まりの見方、 データを見やすいグラフにする方法、データの分布の見方、予測の立て方を 解説する書籍です。 【著者プロフィール】 森 巧尚(もり・よしなお) アプリの開発や、技術書や電子工作マガジンなどでの執筆活動。関西学院大学非常勤講師、 関西学院高等部非常勤講師、成安造形大学非常勤講師、プログラミングスクールコプリ講師など、 プログラミングに関する幅広い活動を行っている。 近著に『Python1年生』、『Python2年生 スクレイピングのしくみ』、 『Java1年生』、『動かして学ぶ!Vue.js開発入門』(いずれも翔泳社)、 『楽しく学ぶ アルゴリズムとプログラミングの図鑑』(マイナビ出版)などがある。 第1章 データ分析って何? LESSON 01 データ分析って何 LESSON 02 データ分析の手順:PPDACサイクル LESSON 03 Jupyter Notebookをインストールしよう LESSON 04 Jupyter Notebookの使い方 第2章 集めたデータは前処理が必要 LESSON 05 表データを読み込もう LESSON 06 データをざっくりと眺める LESSON 07 データのどこを使う? LESSON 08 データのミスをチェックする 第3章 データの集まりをひとことでいうと?:代表値 LESSON 09 データを平らに均(なら)す LESSON 10 平均値を代表といっていいの? LESSON 11 平均値が同じなら、同じといっていいの? 第4章 図で特徴をイメージしよう:グラフ LESSON 12 データのばらつきがわかる LESSON 13 基本的なグラフを作ろう LESSON 14 ばらつきのわかるグラフ LESSON 15 グラフをわかりやすく調整する 第5章 これって普通なこと?珍しいこと?:正規分布 LESSON 16 データのばらつきを数値で表す LESSON 17 自然なばらつき LESSON 18 この値は普通なこと?珍しいこと? LESSON 19 このデータは自然なばらつき? LESSON 20 違うばらつきのデータでの比較ができる 第6章 関係から予測しよう:回帰分析 LESSON 21 2種類のデータの関係性の強さ:相関係数 LESSON 22 散布図の上に線を引いて予測 LESSON 23 総当たりで表示させる散布図 LESSON 24 アヤメのデータを見てみよう

pandasクックブック ―Pythonによるデータ処理のレシピ―

Theodore Petrou
朝倉書店
おすすめ度
80
紹介文
科学計算,分析,可視化などPythonでのデータ処理の基本を約100のレシピを通して具体的に学ぶ GitHubに詳細なサポートデータ(Jupyter Notebook)有。すぐに試せる ・Pandas Cookbook: Recipes for Scientific Computing, Time Series Analysis and Data Visualization using Python, 2017Oct, Packt の翻訳。 ・pandas(Pythonによるデータ処理に必須のライブラリ)の活用例(レシピ)を約100紹介。 ・扱うデータ構造や使い方、可視化などを広く取り上げる。 ・各レシピは内容、手順、解説(補足、参照、注意など)という定形になっており読みやすい。 Pythonによるデータ解析を支援する機能を提供する必須のライブラリ pandas の使い方を解説する「レシピ本」。 ビッグデータを扱うデータサイエンスや科学計算に重要なツール、Pandasの実践的な使用方法=”レシピ”を約100例紹介。分析の目的から探せるレシピ本として、特定の分野に依存せずデータサイエンスのツールにpythonを選んだすべての方が読者対象。 1 Pandas基礎 レシピ1 DataFrameの解剖学 レシピ2 DataFrame主要素へのアクセス レシピ3 データ型の理解 レシピ4 データのカラムをSeriesとして選択 レシピ5 Seriesのメソッド呼び出し レシピ6 Seriesの演算子の働き レシピ7 Seriesのメソッドチェイニング レシピ8 分かりやすいインデックスに置き換え レシピ9 行とカラムの名前変更 レシピ10 カラムの作成と削除 2 DataFrameの必須演算 レシピ11 DataFrameのカラムを複数選択 レシピ12 カラムをメソッドで選択 レシピ13 カラムを意味が分かるように順序付け レシピ14 DataFrame全体の操作 レシピ15 DataFrameのメソッドチェイニング レシピ16 DataFrameの演算子の働き レシピ17 欠損値の比較 レシピ18 DataFrame演算の方向を転置 レシピ19 大学のキャンパスのダイバーシティ指標の計算 3 データ分析開始 レシピ20 データ分析ルーチンの開発 レシピ21 データ型を変更してメモリ削減 レシピ22 最大の中の最小を選択 レシピ23 ソートして各グループでの最大を選択 レシピ24 sort_valuesでnlargestの代用 レシピ25 トレール注文の価格計算 4 データから部分抽出 レシピ26 Seriesデータの選択 レシピ27 DataFrameの行の選択 レシピ28 DataFrameの行とカラムの同時選択 レシピ29 整数とラベルの両方でデータ選択 レシピ30 スカラー選択の高速化 レシピ31 行の手軽なスライシング レシピ32 文字順にスライシング 5 booleanインデックス法 レシピ33 boolean統計量の計算 レシピ34 複数のboolean条件の構築 レシピ35 booleanインデックス法によるフィルタリング レシピ36 インデックス選択によるbooleanインデックス法の代用 レシピ37 重複のないインデックスとソートしたインデックスによる選択 レシピ38 株価見通しの計算 レシピ39 SQLのWHERE節の翻訳 レシピ40 株式収益率の正規度判定 レシピ41 queryメソッドによるbooleanインデックス法の読みやすさ改善 レシピ42 whereメソッドによるSeriesの保持 レシピ43 DataFrameの行のマスキング レシピ44 boolean,整数位置,ラベルによる選択 6 インデックスアラインメント レシピ45 インデックスオブジェクトの検査 レシピ46 デカルト積の作成 レシピ47 インデックス爆発 レシピ48 等しくないインデックスの値を埋める レシピ49 別のDataFrameからカラムを追加 レシピ50 各カラムの最大値をハイライトする レシピ51 メソッドチェイニングでidxmaxの代用 レシピ52 最多の最大値を求める 7 集約,フィルタ,変換のためのグループ分け レシピ53 集約の定義 レシピ54 複数のカラムと関数のグループ分けと集約 レシピ55 グループ分けの後でMultiIndex解消 レシピ56 集約関数のカスタマイズ レシピ57 集約関数の*argsと**kwargsをカスタマイズ レシピ58 groupbyオブジェクトの検討 レシピ59 マイノリティが多数派の(米国の)州をフィルタリング レシピ60 減量の勝負でtransform レシピ61 SATの加重平均点を州ごとにapplyで計算 レシピ62 連続変数でグループ分け レシピ63 都市間の航空便の総数 レシピ64 定時離着陸の最長ストリーク 8 整然形式にデータを再構成 レシピ65 変数値カラム名をstackで整然化 レシピ66 変数値カラム名をmeltで整然化 レシピ67 複数の変数グループを同時にスタック レシピ68 スタックしたデータを元に戻す レシピ69 groupby集約の後でunstack レシピ70 groupby集約でpivot_tableの代用 レシピ71 変形を容易にするレベル軸の名前変更 レシピ72 複数の変数がカラム名になっている場合の整然化 レシピ73 複数の変数がカラム値の場合の整然化 レシピ74 複数の値が同じセルにある場合の整然化 レシピ75 変数がカラム名とカラム値になっている場合の整然化 レシピ76 複数の観察が同じテーブルにある場合の整然化 9 pandasオブジェクトの結合 レシピ77 DataFrameに新たな行を追加 レシピ78 複数のDataFrameを接合 レシピ79 トランプとオバマの大統領としての信認レベル比較 レシピ80 concat, join, mergeの相違点を理解 レシピ81 SQLデータベースへの接続 10 時系列分析 レシピ82 Pythonとpandasの日付ツールの違いの理解 レシピ83 時系列を賢くスライシング レシピ84 DatetimeIndexでだけ働くメソッドを使う レシピ85 週ごとの犯罪件数 レシピ86 週ごとの犯罪と交通事故を別々に集約 レシピ87 曜日と年での犯罪件数の測定 レシピ88 DatetimeIndexで無名関数を使いグループ分け レシピ89 Timestampと別のカラムでグループ分け レシピ90 merge_asofで犯罪率が20%低かったのは最近ではいつかを見つける 11 matplotlib, pandas, seabornによる可視化 レシピ91 matplotlib入門 レシピ92 matplotlibでデータの可視化 レシピ93 pandasのプロットの基本 レシピ94 flightsデータセットの可視化 レシピ95 層グラフで今後の傾向を発見する レシピ96 seabornとpandasの違いを理解 レシピ97 seabornグリッドで多変量解析 レシピ98 diamondsデータセットのSimpsonパラドックスをseabornで明らかにする

これなら分かる最適化数学: 基礎原理から計算手法まで

健一, 金谷
共立出版
おすすめ度
79
紹介文
各種の最適化手法の原理や計算法をやさしく解説  最適化手法とは,利益,損失などの望ましい,あるいは望ましくない値を最大,または最小にするように設計する手法である。従来から経営学やオペレーションズリサーチ(OR)の中心テーマであったが,計算機技術の進歩によって過去には不可能と思われた複雑な問題が実際的な時間で解けるようになり,今日ではあらゆる工学分野,特に電子,情報,通信技術の設計のほとんどに浸透している。  本書はこの立場から,最適化手法の入門書として書かれたもので,経営学やORのみならず,統計的最適化や機械学習に関する話題も扱っている。また,各手法を紹介するだけでなく,その数学的背景の解説に力点を置いている。  本文中では最適化手法の要領を理解させることに重点を置き,例題を多く用いてやさしく解説している。中には独自の説明法を採用している箇所もある。また,内容の幅を広げ,読者により関心が高まるよう,本文を補足する,関連する話題や注意すべき事項を箇条書きの形で随所に挿入している。理解を促すために,各所で簡略化したり,直観的な説明を行ったが,そのような箇所にはより数学的に厳密な説明を補足している。 第1章 数学的準備 1.1 曲線と曲面 1.2 1次形式と2次形式 1.3 2次形式の標準形 第2章 関数の極値 2.1 1次関数と2次関数 2.2 関数の勾配と等高線 2.3 関数の極値 2.4 ラグランジュの未定乗数法 第3章 関数の最適化 3.1 勾配法 3.2 ニュートン法 3.3 共役勾配法 第4章 最小二乗法 4.1 式の当てはめ 4.2 連立1次方程式 4.3 非線形最小二乗法 第5章 統計的最適化 5.1 最尤推定 5.2 直線当てはめ 5.3 データの分類 5.4 不完全データからの最尤推定 第6章 線形計画法 6.1 線形計画の標準形 6.2 可能領域 6.3 線形計画の基本定理 6.4 スラック変数 6.5 シンプレックス法 6.6 退化 6.7 人工変数 6.8 双対原理 第7章 非線形計画法 7.1 非線形計画 7.2 ラグランジュ乗数 7.3 双対原理 第8章 動的計画法 8.1 多段階決定問題 8.2 動的計画法 8.3 最適経路問題 8.4 ストリングマッチング 8.5 制約のある多段階決定問題

見て試してわかる機械学習アルゴリズムの仕組み 機械学習図鑑

秋庭 伸也
翔泳社
おすすめ度
78
紹介文
複雑な機械学習アルゴリズムの違いがオールカラーの図で見てわかる! 機械学習アルゴリズムの違いが見てわかる! 「機械学習アルゴリズムは種類が多く、複雑で何をしているのかわかりにくい」と思ったこと、ありませんか?本書は、そのような機械学習アルゴリズムをオールカラーの図を用いて解説した機械学習の入門書です。 いままで複雑でわかりにくかった機械学習アルゴリズムを図解し、わかりやすく解説しています。アルゴリズムごとに項目を立てているので、どのアルゴリズムがどのような仕組みで動いているのか比較をしやすくしています。 これから機械学習を勉強する方だけでなく、実際に機械学習を業務で使用している方にも新しい気付きを得られるのでお勧めの1冊です。 【本書の特徴】 ・複雑な機械学習アルゴリズムの仕組みを1冊で学べる ・オールカラーの図をたくさん掲載 ・各アルゴリズム毎にScikit-Learnを使用したコードを記載しているので、見るだけでなく試すこともできる ・仕組みだけでなく、実際の使い方や注意点もわかる 【本書で紹介するアルゴリズム】 01 線形回帰 02 正則化 03 ロジスティック回帰 04 サポートベクトルマシン 05 サポートベクトルマシン(カーネル法) 06 ナイーブベイズ 07 ランダムフォレスト 08 ニューラルネットワーク 09 kNN 10 PCA 11 LSA 12 NMF 13 LDA 14 k-means 15 混合ガウス 16 LLE 17 t-SNE 第1章 機械学習の基礎  1.1 機械学習の概要  1.2 機械学習に必要なステップ 第2章 教師あり学習  01 線形回帰  02 正則化  03 ロジスティック回帰  04 サポートベクトルマシン  05 サポートベクトルマシン(カーネル法)  06 ナイーブベイズ  07 ランダムフォレスト  08 ニューラルネットワーク  09 kNN 第3章 教師なし学習  10 PCA  11 LSA  12 NMF  13 LDA  14 k-means法  15 混合ガウス分布  16 LLE  17 t-SNE 第4章 評価方法および各種データの扱い  4.1 評価方法  4.2 文書データの変換処理  4.3 画像データの変換処理 第5章 環境構築  5.1 Python3 のインストール  5.2 仮想環境  5.3 パッケージインストール

統計学入門 (基礎統計学Ⅰ)

東京大学教養学部統計学教室
東京大学出版会
おすすめ度
78
紹介文
文科と理科両方の学生のために,統計的なものの考え方の基礎をやさしく解説するとともに,統計学の体系的な知識を与えるように,編集・執筆された.豊富な実際例を用いつつ,図表を多くとり入れ,視覚的にもわかりやすく親しみながら学べるよう配慮した. 第1章 統計学の基礎(中井検裕,縄田和満,松原 望) 第2章 1次元のデータ(中井検裕) 第3章 2次元のデータ(中井研裕,松原 望) 第4章 確率(縄田和満,松原 望) 第5章 確率変数(松原 望) 第6章 確率分布(松原 望) 第7章 多次元の確率分布(松原 望) 第8章 大数の法則と中心極限定理(中井検裕) 第9章 標本分布(縄田和満) 第10章 正規分布からの標本(縄田和満) 第11章 推定(縄田和満) 第12章 仮説検定(縄田和満,松原 望) 第13章 回帰分析(縄田和満) 統計数値表 練習問題の解答

データ解析のための統計モデリング入門――一般化線形モデル・階層ベイズモデル・MCMC (確率と情報の科学)

久保 拓弥
岩波書店
おすすめ度
78
紹介文
現象を数理モデルで表現・説明するのに慣れていない人のために、章ごとに異なる例題を解決していく過程を通して、統計モデルの基本となる考えかたを紹介する。前半では、応用範囲のひろい統計モデルのひとつである一般化線形モデルの基礎を、後半では、実際のデータ解析に使えるように、階層ベイズモデル化する方法を、RとWinBUGSの具体例を用いて説明する。 第1章 データを理解するために統計モデルを作る 第2章 確率分布と統計モデルの最尤推定 第3章 一般化線形モデル(GLM)-ポアソン回帰 第4章 GLMのモデル選択-AICとモデルの予測の良さ 第5章 GLMの尤度比検定と検定の非対称性 第6章 GLMの応用範囲をひろげる-ロジスティック回帰など 第7章 一般化線形混合モデル(GLMM)-個体差のモデリング 第8章 マルコフ連鎖モンテカルロ(MCMC)法とベイズ統計モデル 第9章 GLMのベイズモデル化と事後分布の推定 第10章 階層ベイズモデル-GLMMのベイズモデル化 第11章 空間構造のある階層ベイズモデル

統計学が最強の学問である

西内 啓
ダイヤモンド社
おすすめ度
78
紹介文
あえて断言しよう。あらゆる学問のなかで統計学が最強の学問であると。どんな権威やロジックも吹き飛ばして正解を導き出す統計学の影響は、現代社会で強まる一方である。「ビッグデータ」などの言葉が流行ることもそうした状況の現れだが、はたしてどれだけの人が、その本当の魅力とパワフルさを知っているだろうか。本書では、最新の事例と研究結果をもとに、今までにない切り口から統計学の世界を案内する。 第1章 なぜ統計学が最強の学問なのか? 第2章 サンプリングが情報コストを激減させる 第3章 誤差と因果関係が統計学のキモである 第4章 「ランダム化」という最強の武器 第5章 ランダム化ができなかったらどうするか? 第6章 統計家たちの仁義なき戦い 終章 巨人の肩に立つ方法

データ視覚化のデザイン

永田 ゆかり
SBクリエイティブ
おすすめ度
78
紹介文
達人が教えるビジュアライゼーションの極意!! 達人が教えるビジュアライゼーションの極意!! 本書で言う「データ視覚化」(ビジュアライゼーション)とは、単に手元にあるデータをグラフにすることではありません。いくらデータを視覚化しても、その中から人間が重要な情報を読み取れないのなら、データ視覚化をする意味がないからです。 あくまで、そのデータが指し示す意味を明確にすること、そしてより多くの人たち(オーディエンス)に興味を持って見てももらえることがデータ視覚化の目的です。 本書では、日本人女性唯一のTableau ZEN MASTERである筆者が長年にわたって培ってきたデータ視覚化のノウハウ、ベストプラクティス、アンチパターン等を整理分類してエッセンスを抽出し、具体的な事例をあげながら、できるかぎり丁寧に解説しました。また、セミナーなどの現場でよくされる質問に対する答えをまとめたものでもあるので、ある意味、"FAQ"でもあります。 達人が教えるビジュアライゼーションの極意!! 第1章 データ視覚化「キモのキモ」 この章では、第2章、第3章を理解するために必要な基礎知識を解説しています。もし、あなたがデータ視覚化の基礎概念に精通していらっしゃる方であれば読み飛ばしていただいても結構ですが、第2章、第3章は、ここで解説する視覚属性やデータのタイプの知識が前提となっています。 第2章 これだけでグッとプロっぽくなるコツ この章では、少し気をつけるだけで素人っぽさから抜け出せるポイントに焦点を当てて解説しました。明日からすぐにあなたのデータ視覚化のクオリティを上げる具体的な方法を詰めています。 第3章 目的に応じたチャートの選択 この章では、表現したいものに対して適切なチャートを解説し、さらにいくつかの「やってはいけないこと」としてアンチパターンも記載しています。やってはいけないことの構造や理由を知ることで、グラフの目利き力がさらにアップするはずです。 第4章 事例で学ぶ -ダッシュボード作成思考のキャプション- 実際に私がコンサルティングで作ったダッシュボード、トレーニングやワークショップで使用したケースを題材に説明します。ビジネス領域での使用事例を具体的に丁寧に解説することで、ご自身のビジネスや状況に合わせて適切なデータ視覚化が自分の頭で考えられるようになることを目指しています。 第5章 本当に組織に根付かせるために データ視覚化は、「力の入れどころ」と「勇気を出してあえて力を抜くところ」を知り、さらにオーディエンスを意識すると誰でもご自身が伝えたいメッセージを効果的に届けることができます。この章では、さらにそれらを加速させるコツを書きました。これを知っていれば、あなたのデータ視覚化ライフはさらに楽しくなること間違いなしです。

欠測データ処理: Rによる単一代入法と多重代入法 (統計学One Point)

将宜, 高橋
共立出版
おすすめ度
78
紹介文
 一般的に調査・観測データには欠測が生じることが多く,適切な欠測データの処理をしなければ,解析結果に偏りが生じることがある。多重代入法は,尤度解析法と並んで最も汎用的な欠測データ解析法であるが,これまでの書籍では理論的な解説が主で,実際の応用事例や具体的な手順の記述が少なかった。そのため,実証分析を行う社会科学者や実務者が多重代入法を実際に活用することにはハードルがあった。  本書は,ワンポイントとして代入法を中心に解説している。平均値のt検定,重回帰分析,ロジスティック回帰分析,時系列分析,パネルデータ分析といった社会科学において頻繁に使用される分析手法に関して,データに欠測が生じている場合に,多重代入法を用いてどのように欠測データを処理していけばよいかを具体的に示している。  事例で扱ったデータとRコードが掲載されているので,読者は本書に示された手順を再現しながら,欠測データの解析法を学んでいくことができる。主に,ウェブ上で入手可能な実データで解説しているので,実践的な技能が身につく。本書は,座学として単に読むだけでなく,ぜひコンピュータ上で実際に処理を体験して欲しい。それが,欠測データの解析法を理解し,修得する近道である。 第1章 Rによるデータ解析 1.1 Rへのデータ読み込み 1.2 平均値と標準偏差 1.3 回帰分析 1.4 forループ 第2章 不完全データの統計解析 2.1 無回答とは 2.2 欠測パターン 2.3 欠測メカニズム 2.4 MARデータのシミュレーション 2.5 MARについての注意点 2.6 欠測の処理方法 2.7 代入法の目的 第3章 単一代入法 3.1 データ 3.2 確定的回帰代入法 3.3 比率代入法 3.4 平均値代入法 3.5 ホットデック法 3.6 確率的回帰代入法 第4章 多重代入法の概要 4.1 単一代入法の実態 4.2 ベイズ統計学概論 4.3 多重代入モデルの概要 4.4 多重代入法による代入結果の例 4.5 多重代入法による分析の流れ 4.6 多重代入法による分析結果の統合方法 4.7 多重代入法による分析結果の統合方法の数値例 4.8 多重代入法の諸条件   4.8.1 適切な多重代入法   4.8.2 適合性   4.8.3 多重代済みデータ数M 第5章 多重代入法のアルゴリズム 5.1 データ 5.2 DAアルゴリズムによる多重代入法 5.3 FCSアルゴリズムによる多重代入法 5.4 EMBアルゴリズムによる多重代入法 5.5 アルゴリズム間の長所と短所 5.6 MCMC系アルゴリズムにおける収束判定 5.7 多重代入法の性能比較 第6章 多重代入モデルの診断 6.1 診断の考え方 6.2 データ 6.3 Rパッケージ Ameliaによる代入の診断 6.4 Rパッケージ miceによる代入の診断 6.5 Rパッケージ normによる代入の診断 6.6 対数正規分布データの代入法 第7章 量的データの多重代入法I:平均値のt検定 7.1 多重代入済みデータの平均値と分散の復習 7.2 t検定の概論   7.2.1 多重代入済みデータを用いたt検定   7.2.2 多重代入済みデータを用いた自由度の算出 7.3 データ 7.4 Rパッケージ Ameliaによるt検定 7.5 Rパッケージ miceによるt検定 7.6 Rパッケージ normによるt検定 第8章 量的データの多重代入法II:重回帰分析 8.1 重回帰分析概論 8.2 データ 8.3 Rパッケージ Ameliaによる重回帰分析 8.4 回帰診断   8.4.1 誤差項の正規性   8.4.2 不均一分散   8.4.3 多重共線性   8.4.4 外れ値 8.5 Rパッケージ miceによる重回帰分析と診断 8.6 Rパッケージ normによる重回帰分析と診断 第9章 質的データの多重代入法I:ダミー変数のある重回帰分析 9.1 質的データの代入法に関する議論 9.2 ダミー変数のある重回帰モデル概論 9.3 データ 9.4 Rパッケージ miceによるダミー変数のある重回帰分析 9.5 Rパッケージ hot.deckによるダミー変数のある重回帰分析 第10章 質的データの多重代入法II:ロジスティック回帰分析 10.1 ロジスティック回帰分析概論 10.2 データ 10.3 Rパッケージ miceによるロジスティック回帰分析 10.4 Rパッケージ hot.deckによるロジスティック回帰分析 10.5 順序変数と多項変数の多重代入法 第11章 時系列データの多重代入法:ARIMAモデル 11.1 時系列分析概論 11.2 データ 11.3 Rパッケージ Ameliaによる時系列データ分析   11.3.1 ARIMAモデルの推定   11.3.2 モデルの診断   11.3.3 予測 第12章 パネルデータの多重代入法:固定効果と変量効果 12.1 パネルデータ分析概論   12.1.1 プール最小二乗法   12.1.2 固定効果モデル   12.1.3 変量効果モデル   12.1.4 不均一分散と系列相関 12.2 データと使用するRパッケージ 12.3 Rパッケージ Ameliaによるパネルデータ分析 第13章 感度分析:NMARの統計解析 13.1 感度分析 13.2 NMARにおける解析手法 13.3 Rパッケージ SensMiceとAmeliaによる感度分析 13.4 Rパッケージ SensMiceとmiceによる感度分析 13.5 Rパッケージ SensMiceとnormによる感度分析 第14章 事前分布の導入 14.1 Rパッケージ Ameliaによる事前分布の活用   14.1.1 観測値に関する事前分布   14.1.2 変数の値に関する事前分布   14.1.3 リッジ事前分布   14.1.4 複数の事前分布 14.2 Rパッケージ normによる事前分布の活用 14.3 Rパッケージ miceによる事前分布の活用 参考文献 索  引

「原因と結果」の経済学―――データから真実を見抜く思考法

中室牧子
ダイヤモンド社
おすすめ度
78
紹介文
「健診を受けていれば健康になれる」「テレビを見せると子どもの学力が下がる」「偏差値の高い大学に行けば収入は上がる」はなぜ間違いなのか? 世界中の経済学者がこぞって用いる最新手法「因果推論」を数式なしで徹底的にわかりやすく解説。世のなかにあふれる「根拠のない通説」にだまされなくなる!

新版 統計学のセンス ―デザインする視点・データを見る目― (医学統計学シリーズ1)

丹後 俊郎
朝倉書店
おすすめ度
77
紹介文
好評の旧版に加筆・アップデート.データを見る目を磨き,センスある研究を遂行するために。 好評の旧版に加筆・アップデート。データを見る目を磨き,センスある研究を遂行するために。〔内容〕randomness/統計学的推測の意味/研究デザイン/統計解析以前のデータを見る目/平均値の比較/頻度の比較/イベント発生までの時間の比較

データ分析のための数理モデル入門 本質をとらえた分析のために

貴裕, 江崎
ソシム
おすすめ度
77
紹介文
「数理モデル」とは、現実のデータを理解・活用するために生み出された様々な数理的な手段の総称である。これには、近年注目を浴びている機械学習だけでなく、物理学、生物学、生態学などの自然科学、また心理学、経済学、といった人文社会科学分野で用いられる諸手法が含まれている。 こうした極めて多様な方法論の間には、データの背後に存在するメカニズムをある種の数式で表現し、それを利用するという共通の目的・手続きが存在する。 データと目的が与えられたとして、どのモデリング手法に頼ればいいのだろうか?特に、現象の理解を目的とした分析には、機械学習の諸手法では太刀打ちできないこともある。 こういった場合には、統計モデリングだけでなく所謂計算論的モデルと呼ばれるボトムアップ型のモデリング手法が必要とされることもあるだろう。こうした俯瞰的な視点でモデルの「種類」を選択することはデータ分析において必須のステップであるが、そうした分野を跨いだ解説書は殆ど存在していないといっても良い。 そこで本書は、数理モデル全体が有機的に繋がって見えるような「横糸的な」理解を可能にする、全く新しい入門的な教科書を目指した。 本書では、さまざまなモデリング手法の基礎的な部分を解説するだけでなく、それらをどのように選択して使用すればよいか、そしてモデリングによって得られる結論について初学者が勘違いしやすい事項について丁寧に解説した。 主な読者としては、「これからデータ分析を始める」、或いは「ある種の分析で結果を出すことはできるが、それが何をやっていることになるのかがモヤモヤする」といった初学者・初級者を想定している。大学の一年次でも読み通せる程度の解説レベルを採用しているが、内容が淡泊になりすぎないように注意した。 また、通常データ分析の文脈では言及されない(しかし重要な)種々の数理手法についても解説することで、ある程度モデリングに慣れた読者が読んでも楽しめる内容を目指した。 第一部 数理モデルとは 第1章 データ分析と数理モデル 〔データを分析するということ/数理モデルの役割〕 第2章 数理モデルの構成要素・種類 〔理解志向型・応用志向型モデリング/数理モデルの適用限界〕 第二部 基礎的な数理モデル 第3章 少数の方程式によるモデル 〔線形モデル/実験式・カーブフィッティング/最適化問題〕 第4章 少数の微分方程式によるモデル 〔線形微分方程式/非線形微分方程式/安定性解析/制御理論〕 第5章 確率モデル 〔確率過程/マルコフ過程/待ち行列理論〕 第6章 統計モデル 〔正規分布/統計的検定/回帰分析〕 第三部 高度な数理モデル 第7章 時系列モデル 〔時系列データの構造/自己回帰モデル/状態空間モデル/非線形時系列解析〕 第8章 機械学習モデル 〔複雑なモデルと過学習/分類・回帰問題/クラスタリング/次元削減/深層学習〕 第9章 強化学習モデル 〔行動モデルとしての強化学習/機械学習モデルとしての強化学習〕 第10章 多体系モデル・エージェントベースモデル 〔ミクロからマクロへ/さまざまな集団現象モデル/相互作用のネットワーク分析〕 第四部 数理モデルを作る 第11章 モデルを決めるための要素 〔数理モデルの性質/理解志向型・応用志向型モデリングのポイント〕 第12章 モデルを設計する 〔変数の選択/データの取得・実験計画/数理構造・パラメータの選択/間違ったモデリングをしないために〕 第13章 パラメータを推定する 〔目的に応じたパラメータ推定/パラメータ推定における目的関数の最小化/ベイズ推定・ベイズモデリング〕 第14章 モデルを評価する 〔「いいモデル」とは/分類精度の指標/情報量基準/ヌルモデルとの比較・尤度比検定/交差検証〕

統計クイックリファレンス 第2版

Sarah Boslaugh
オライリージャパン
おすすめ度
77
紹介文

統計学が最強の学問である[実践編]――データ分析のための思想と方法

西内 啓
ダイヤモンド社
おすすめ度
77
紹介文
平均値の知られざる本質から代表的な6手法の使い方まで、「ビジネス×統計学」の最前線で活躍する著者が明かす因果関係を見抜くためのフレームワーク。 序章 ビジネスと統計学を繋ぐために 第1章 統計学の実践は基本の見直しから始まる-「平均」と「割合」の本質 第2章 統計学が「最強」であるもう1つの理由-標準誤差と仮説検定 第3章 洞察の王道となる手法群-重回帰分析とロジスティック回帰 第4章 データの背後にある「何か」-因子分析とクラスター分析 終章 統計手法のまとめと使用の手順

効果検証入門〜正しい比較のための因果推論/計量経済学の基礎

安井 翔太
技術評論社
おすすめ度
77
紹介文
ビジネスで利用されるデータの多くは、その施策の意思決定を行う人物や組織の目的にそった活動の延長上で作られています。具体的には、DM送付などの広告施策であれば、担当者はユーザの反応率を上げるために、反応しやすいであろうユーザに対してのみDMを発送します。ここで発生したデータでDMの効果を計る場合、単純にDMを受け取っているか否かで結果を比較することは、DMの効果以外にも意図的にリストされたユーザの興味や関心を含んでしまうことになります。 データが生まれるプロセスに人の意思が関わる場合、単純な集計では判断ミスとなる可能性があります。わずかな計算の狂いでも後々のビジネスにおいて大きな影響を及ぼすことになるため、バイアスのない状態で効果検証できることが望まれるのです。 本書では「単純に比較すると間違った結論に導くデータ」から、より正しい結果を導くための分析手法と考え方を提供します。計量経済学における効果とは何か? を提示し、RCT(ランダム化比較試験)がいかに理想的な方法かを説明し、RCTができない場合でも因果推論を用いてRCTの再現が可能だということを説明していきます。 嘘っぱちの効果とそれを見抜けないデータ分析 思い込みによる意思決定の蔓延 「バイアス」によって見誤る効果 因果推論と計量経済学のビジネス適用 本書の構成 想定する読者 サンプルコードとサポート 1 章 セレクションバイアスとRCT 1.1 セレクションバイアスとは 1.1.1 効果 1.1.2 潜在的な購買量の差 1.1.3 誤った施策の検証 1.2 RCT(Randomized Controlled Trial) 1.2.1 本当の「効果」と理想的な検証方法 1.2.2 RCTによる検証 1.3 効果を測る理想的な方法 1.3.1 母集団と推定 1.3.2 ポテンシャルアウトカムフレームワーク 1.3.3 ポテンシャルアウトカムフレームワークによる介入効果の推定 1.3.4 平均的な効果 1.3.5 平均的な効果の比較とセレクションバイアス 1.3.6 介入の決まり方がセレクションバイアスの有無を決める 1.3.7 RCTを行った疑似データでの比較 1.3.8 有意差検定の概要と限界 1.4 R によるメールマーケティングの効果の検証 1.4.1 RCTを行ったデータの準備 1.4.2 RCTデータの集計と有意差検定 1.4.3 バイアスのあるデータによる効果の検証 1.5 ビジネスにおける因果推論の必要性 1.5.1 RCTの実行にはコストがかかる 1.5.2 セレクションバイアスが起きる理由 1.5.3 ビジネスにおけるバイアスのループ 参考文献 2 章 介入効果を測るための回帰分析 2.1 回帰分析の導入 2.1.1 単回帰分析 2.1.2 効果分析のための回帰分析 2.1.3 回帰分析による効果の推定 2.1.4 回帰分析における有意差検定 2.1.5 Rによるメールマーケティングデータの分析(回帰編) 2.1.6 効果検証のための回帰分析で行わないこと 2.2 回帰分析におけるバイアス 2.2.1 共変量の追加による効果への作用 2.2.2 脱落変数バイアス(OVB) 2.2.3 R によるOVBの確認 2.2.4 OVB が与えてくれる情報 2.2.5 Conditional Independence Assumption 2.2.6 変数の選び方とモデルの評価 2.2.7 Post treatment bias 2.3 回帰分析を利用した探索的な効果検証 2.3.1 PACESによる学費の割引券配布の概要 2.3.2 R による回帰分析の実行 2.3.3 私立学校への通学と割引券の利用についての分析 2.3.4 割引券は留年を減らしているか? 2.3.5 性別による効果差 2.3.6 分析のまとめ 2.4 回帰分析に関するさまざまな議論 2.4.1 予測と効果推定 2.4.2 制限被説明変数(Limited Dependent Variable) 2.4.3 対数を利用した回帰分析 2.4.4 多重共線性 2.4.5 パラメータの計算 参考文献 3 章 傾向スコアを用いた分析 3.1 傾向スコアのしくみ 3.1.1 傾向スコアのアイデア 3.1.2 傾向スコアの推定 3.2 傾向スコアを利用した効果の推定 3.2.1 傾向スコアマッチング 3.2.2 逆確率重み付き推定 3.2.3 より良い傾向スコアとは 3.2.4 傾向スコアと回帰分析の比較 3.2.5 マッチングとIPW の差 3.3 機械学習を利用したメールマーケティング施策の効果推定 3.3.1 データの作成 3.3.2 RCTと平均の比較 3.3.3 傾向スコアを用いた分析 3.4 LaLonde データセットの分析 3.4.1 NSW の概要とデータの準備 3.4.2 RCTによる結果の確認 3.4.3 回帰分析による効果の推定 3.4.4 傾向スコアによる効果の推定 参考文献 4 章 差分の差分法(DID)とCausalImpact 4.1 DID(差分の差分法) 4.1.1 DID が必要になる状況 4.1.2 集計による効果検証とその欠点 4.1.3 DID のアイデアを用いた集計分析 4.1.4 回帰分析を利用したDID 4.1.5 DID における標準誤差 4.1.6 平行トレンド仮定(Common Trend Assumption)と共変量 4.2 CausalImpact 4.2.1 DID の欠点 4.2.2 CausalImpactのアイデア 4.3 大規模禁煙キャンペーンがもたらすタバコの売上への影響 4.3.1 データの準備 4.3.2 DID の実装 4.3.3 CausalImpactの実装 4.3.4 分析結果の比較 4.4 不完全な実験を補佐する 4.4.1 DID のアイデアを用いた分析が使えないとき 参考文献 5 章 回帰不連続デザイン(RDD) 5.1 ルールが生み出すセレクションバイアス 5.1.1 回帰不連続デザインのしくみ 5.1.2 集計によるセレクションバイアスの確認 5.2 回帰不連続デザイン(RDD) 5.2.1 線形回帰による分析 5.2.2 非線形回帰による分析 5.2.3 メールによる来訪率の増加効果を分析する 5.3 nonparametric RDD 5.3.1 nonparametric RDD のしくみ 5.3.2 R によるnonparametric RDD の実装 5.4 回帰不連続デザインの仮定 5.4.1 Continuity of Conditional Regression Functions 5.4.2 non-manipulation 5.4.3 LATEの妥当性 5.5 ビジネスにおける介入割り当てルール 5.5.1 ユーザセグメントへの介入 5.5.2 Uber による価格変更の分析 参考文献 付録 RとRStudioの基礎 A.1 R およびRStudio のダウンロード Rのインストール Rの起動と終了 RStudio のインストール A.2 RStudio の基本 パネルの役割 プロジェクトと作業ディレクトリ A.3 R プログラミングの初歩 オブジェクト ベクトル 関数 データフレーム 行列 パッケージの利用 ■ 作業(ワーク)スペース 因果推論をビジネスにするために 因果推論を活用できる環境とは より正しい意思決定をするために 高次元の共変量を扱うためのR パッケージ より強い因果効果を得るために 参考文献 索引

経済・ファイナンスデータの計量時系列分析 (統計ライブラリー)

竜義, 沖本
朝倉書店
おすすめ度
77
紹介文
基礎的な考え方を丁寧に説明し,時系列モデルを実際のデータに応用する際に必要な知識を紹介 基礎的な考え方を丁寧に説明すると共に,時系列モデルを実際のデータに応用する際に必要な知識を紹介。〔内容〕基礎概念/ARMA過程/予測/VARモデル/単位根過程/見せかけの回帰と共和分/GARCHモデル/状態変化を伴うモデル 1. 時系列分析の基礎概念 1.1 時系列分析の基礎 1.2 定常性 1.3 ホワイトノイズ 1.4 自己相関の検定 2. ARMA過程 2.1 ARMA過程の性質 2.2 ARMA過程の定常性と反転可能性 2.3 ARMAモデルの推定 2.4 ARMAモデルの選択 3. 予測 3.1 予測の基礎  3.2 AR過程の予測 3.3 区間予測 3.4 MA過程の予測 3.5 ARMA過程の予測 4. VARモデル 4.1 弱定常ベクトル過程 4.2 VARモデル 4.3 グレンジャー因果性 4.4 インパルス応答関数 4.5 分散分解 4.6 構造VARモデル 5. 単位根過程 5.1 単位根過程の性質 5.2 単位根検定 5.3 単位根AR過程における統計的推測 6. 見せかけの回帰と共和分 6.1 見せかけの回帰 6.2 共和分 6.3 Granger表現定理 6.4 共和分関係の推定 6.5 共和分の検定 7. GARCHモデル 7.1 ボラティリティのモデル化の重要性 7.2 GARCHモデル 7.3 GARCHモデルの統計的推測 7.4 多変量GARCHモデル 7.5 相関変動モデル 8. 状態変化を伴うモデル 8.1 閾値モデル 8.2 平滑推移モデル 8.3 マルコフ転換モデル

基礎からわかる時系列分析 ―Rで実践するカルマンフィルタ・MCMC・粒子フィルター (Data Science Library)

萩原 淳一郎
技術評論社
おすすめ度
77

個体群生態学と行列モデル ー統計学がつなぐ野外調査と数理の世界ー (統計スポットライト・シリーズ)

島谷 健一郎
近代科学社
おすすめ度
76
紹介文
動植物の個体数推移を、行列と統計推論を使って予測する「個体群行列モデル」を分かりやすく解説。 【線形代数で、希少動物の生存可否を見極める!】  統計スポットライト・シリーズ第5巻となる本書は、個体群(ある同種の動物もしくは植物の集団)の生息数の推移を「個体群行列モデル」で予測する方法を解説する。このモデルにより、野外調査で得られる個体数データから希少動物の生存の可否などが予測可能になる。  このモデルで使う数学は線形代数の基礎に限られ、その都度丁寧に説明するため数学が苦手な読者でも挫折しにくい。また、現実的な個体数推移を保証するために仮定する、生態学を基にした統計推論についても適宜解説する。統計ソフトRによる計算結果も一部掲載。 統計スポットライト・シリーズ第5巻。動植物の個体数推移を、行列と統計推論を使って予測する「個体群行列モデル」を丁寧にわかりやすく解説。野外調査の個体数データから希少動物の生存の可否などが予測可能になる。 第1章 シミュレーションで数式を用いる恩恵を知る 第2章 生物集団の野外調査データと生活史の図式化 第3章 個体群行列と3 つの基本統計量 第4章 行列要素の推定法1:統計モデルと最尤法 第5章 環境条件の効果を見る1――感度分析の基礎 第6章 行列要素の推定法2:ベイズ統計とランダムなサンプル 第7章 環境条件の効果を見る2――感度分析の発展(生命表反応解析(LTRE解析))

パワークエリも関数もぜんぶ使う! Excelでできるデータの収集・整形・加工を極めるための本

森田貢士
ソシム
おすすめ度
76

Python1年生 第2版 体験してわかる!会話でまなべる!プログラミングのしくみ

森 巧尚
翔泳社
おすすめ度
76
紹介文
最新のPython、ライブラリおよびWindoes 11に対応した「Python1年生」の第2版の登場! おかげさまで8万部突破! 読者の声に応えて 第2版の登場 【本書の概要】 Web開発やデータ分析などの分野で、ユーザー数が増えてきているPython。 最近では、Pythonに触れる方も多くなってきています。 本書はそうしたPython初心者の方に向けて、 ヤギ博士とフタバちゃんと一緒に 基本的なプログラムの作成から、面白い人工知能アプリの作成までを体験。 対話形式でプログラミングのしくみを学ぶことができます。 【対象読者】 Pythonについて何も知らないプログラミング超初心者 【本書のポイント】 ・対話形式で解説し、イラストを交えながら、基礎知識を解説します。 ・初めての方でも安心して学習できるよう基本文法もしっかり解説します。 ・平易なサンプルを用意していますので、安心してプログラムを体験できます。 ・2022年時点の最新の環境(Windows 11、Python 3.10など)に対応しています。 ・エラーでつまづいた場合の対応方法を巻末に掲載しています。 【目次】 第1章 Pythonで何ができるの? 第2章 Pythonを触ってみよう 第3章 プログラムの基本を知ろう 第4章 アプリを作ってみよう 第5章 人工知能くんと遊んでみよう 【著者プロフィール】 森 巧尚(もり・よしなお) 『マイコンBASICマガジン』(電波新聞社)の時代からゲームを作り続けて現在はコンテンツ制作や執筆活動を行い関西学院大学非常勤講師、 関西学院高等部非常勤講師、成安造形大学非常勤講師、大阪芸術大学非常勤講師、プログラミングスクールコプリ講師などを行っている。 近著に、『Python1年生』『Python2年生 スクレイピングのしくみ』『Python2年生 データ分析のしくみ』『Python3年生 機械学習のしくみ』 『Java1年生』『動かして学ぶ!Vue.js開発入門』『Python自動化簡単レシピ』(いずれも翔泳社)、 『ゲーム作りで楽しく学ぶ Pythonのきほん』『楽しく学ぶ Unity2D超入門講座』『楽しく学ぶ Unity3D超入門講座』(いずれもマイナビ出版)などがある。 第1章 Pythonで何ができるの? 第2章 Pythonを触ってみよう 第3章 プログラムの基本を知ろう 第4章 アプリを作ってみよう 第5章 人工知能くんと遊んでみよう

Pythonスタートブック [増補改訂版]

辻 真吾
技術評論社
おすすめ度
76

Rによるデータサイエンス(第2版):データ解析の基礎から最新手法まで

金 明哲
森北出版
おすすめ度
76
紹介文
R言語によるデータ解析の入門書.深層学習など,ますます充実するパッケージの解説を加えたロングセラーの第2版. ――進化を続ける「R」を使い倒す! R言語によるデータ解析の入門書.データサイエンスブームに先駆けた初版の発行以来,網羅性と実用性の高さから,多くのRユーザーに支持を得てきたロングセラー.Rのバージョンアップへの対応に加え,深層学習やネットワーク分析など,ますます充実するパッケージの解説を加えた第2版. ~こんな方に~ ・因子分析・ネットワーク分析・深層学習などの分析手法をすぐに試したい ・Rを使うとどんなデータ解析ができるのか,一通り知っておきたい ・幅広いデータ解析手法・機械学習法を,Rで動かしながら体感的に学びたい 第1部 Rとデータマイニングの基礎 1.データマイニングとR言語 2.データの入出力と編集 3.データの演算と固有値,基本統計量 4.データの視覚化 第2部 Rによるデータ解析・データマイニング 5.主成分分析 6.因子分析 7.対応分析 8.多次元尺度法 9.クラスター分析 10.自己組織化マップ 11.線形回帰分析 12.非線形回帰分析 13.線形判別分析 14.非線形判別分析 15.ツリーモデル 16.集団学習 17.カーネル法とサポートベクターマシン 18.ニューラルネットワーク 19.ネットワーク分析 20.アソシエーション分析 21.時系列分析 22.生存分析

本質を捉えたデータ分析のための分析モデル入門 統計モデル、深層学習、強化学習等 用途・特徴から原理まで一気通貫!

杉山聡
ソシム
おすすめ度
69

問題解決のためのデータ分析 BtoB事業編

齋藤 健太
クロスメディア・パブリッシング(インプレス)
おすすめ度
69

データサイエンス入門:データ取得・可視化・分析の全体像がわかる (単行本)

上田 雅夫
有斐閣
おすすめ度
69
紹介文
ビジネスや意思決定の場面で,データを活用したい方に手にとっていただきたいデータサイエンスの入門書。目的別の分析手法を幅広く… ビジネスや意思決定の場面で,データを活用したい方に向けたデータサイエンスの入門書。データの種類ごとの性質や収集時の注意点,目的別の分析手法からデータ可視化まで幅広く扱う。各章末には課題を設置し,最終章ではデータサイエンスの展望や限界についても言及。 第1章 データサイエンスとは 第2章 データ収集のための基礎知識 第3章 データ空間の構成法 第4章 データ生成のメカニズム 第5章 データの可視化手法 第6章 データ分析の手法 第7章 データ活用のフレームワーク 第8章 データの分析事例 第9章 データ分析上の注意点と応用知識

よくわかるPython入門

富士通ラーニングメディア
富士通ラーニングメディア
おすすめ度
69
紹介文
富士通ラーニングメディアがご提供する人気の研修コース「Python入門」をベースに書籍化しています。 Pythonは、データ解析やAI(人工知能)など様々な用途に使えることから、近年最も注目されているプログラミング言語です。富士通ラーニングメディアでは、Pythonに関する研修コースをラインナップとしてご提供しており、その中でも入門レベルに相当し、人気ベスト10にもよく入る「Python入門」の研修コースの内容を今回書籍化しました。 セールスポイント ●人気の研修コース「Python入門」を書籍化! 富士通ラーニングメディアがご提供する人気の研修コース「Python入門」をベースに書籍化しています。富士通ラーニングメディアの研修コースの特徴である「実習が多い」という特性を活かし、実習中心の作りにしています。 ●手を動かしてプログラムをどんどん作る! 基本的な構文(文法)のプログラム実践例を、手を動かしてどんどん作成し、実行結果を確認します。1行でもわからないと理解できなくなるのがプログラムの常です。本書ではプログラム1行1行すべての動きを解説しています。 ●挫折しやすいエラーを徹底フォロー! プログラミングはエラーで挫折する傾向があります。本書では「よく起きるエラー」を随所で取り上げ、エラーの発生場所やその意味、対処方法(どこを修正したらよいか)を徹底解説しているので、学習を1人でも進めていけます。 ●実習問題で実力がバッチリ身に付く! 実習問題を随所でご用意しており、プログラミングの実力を深められます。「実行結果例」をみて、同じように動作するプログラムの作成に取り組みます。解答例はプログラム1行1行すべての動きを解説しており、理解が深まります。 本書をご利用いただく前に 第1章 Pythonの概要を理解する 1-1 プログラムの概要  1-1-1 プログラムとは  1-1-2 プログラミング言語とは  1-1-3 プログラムを開発する流れ 1-2 Pythonの概要  1-2-1 Pythonとは  1-2-2 Pythonの様々な利用シーン 第2章 Pythonの環境構築を行う 2-1 環境構築  2-1-1 Pythonのインストール  2-1-2 開発ツール 2-2 Pythonの体験操作  2-2-1 メモ帳とコマンドプロンプトでPythonの      プログラムを実行する  2-2-2 対話モードでPythonのプログラムを実行      する  2-2-3 Visual Studio CodeでPythonのプログラ      ムを実行する 第3章 Pythonの基本文法を学ぶ 3-1 記述規約  3-1-1 Pythonのプログラムが読みやすい理由  3-1-2 Pythonの書き方  3-1-3 Pythonのプログラムを読みやすくするた      めの規則 3-2 データの保持  3-2-1 変数とは  3-2-2 関数の呼び出しとデータ入力  3-2-3 リストとは  3-2-4 多次元リストとは  3-2-5 タプルとは  3-2-6 辞書とは  3-2-7 集合とは 3-3 演算子  3-3-1 演算子とは  3-3-2 算術演算子  3-3-3 累計代入演算子  3-3-4 文字列を連結する演算子  3-3-5 比較演算子  3-3-6 論理演算子 3-4 制御構造  3-4-1 制御構造の種類  3-4-2 条件分岐  3-4-3 繰り返し ~for文~  3-4-4 繰り返し ~while文~  3-4-5 繰り返し処理の制御 3-5 関数  3-5-1 関数とは  3-5-2 関数の定義 3-6 例外処理  3-6-1 例外処理とは  3-6-2 例外処理の実装 第4章 外部プログラムの呼び出し方を学ぶ 4-1 ライブラリ  4-1-1 ライブラリとは  4-1-2 ライブラリの管理ツール 4-2 モジュールの関数の呼び出し  4-2-1 モジュールの関数の呼び出し方法  4-2-2 標準ライブラリのモジュールの利用例  4-2-3 外部ライブラリのモジュールの利用例 第5章 ファイルの入出力を学ぶ 5-1 アプリケーションとやり取りする    データの形式  5-1-1 データの入出力  5-1-2 JSON  5-1-3 XML  5-1-4 CSV 5-2 ファイルの読み書き  5-2-1 テキストファイルの読み込み  5-2-2 テキストファイルの書き込み  5-2-3 JSON形式のファイルの読み込み  5-2-4 JSON形式のファイルの書き込み  5-2-5 XML形式のファイルの読み込み  5-2-6 XML形式のファイルの書き込み  5-2-7 CSV形式のファイルの読み込み  5-2-8 CSV形式のファイルの書き込み 第6章 一歩進んだプログラムに挑戦する 6-1 オブジェクト指向プログラミング  6-1-1 オブジェクトとクラス  6-1-2 クラスの作成  6-1-3 オブジェクトの作成  6-1-4 継承  6-1-5 アクセス制御 6-2 PythonによるExcelの操作  6-2-1 Excelの操作のための外部ライブラリ  6-2-2 Excelシートのセルから値の読み込み  6-2-3 Excelシートのセルへの値の書き込み 付録 付録A よく起きるエラーの一覧 付録B 研修コースのご紹介 索引

Rを使った〈全自動〉ベイズファクタ分析:js-STAR_XR+でかんたんベイズ仮説検定

田中 敏
北大路書房
おすすめ度
67
紹介文
フリーソフトjs-STAR_XRが拡張され,ベイズ仮説検定にも新たに対応。データ分析から結果の書き方まで懇切にガイド。 「できる」から「わかる」へと読者の理解を体験的に導く,好評〈全自動〉シリーズ第2弾! フリーソフトjs-STAR_XRが拡張され,帰無仮説検定の代替案として近年関心が高まるベイズ仮説検定に新たに対応。巻末には半期や全7回の授業用シラバスを収載。データ分析からレポートの書き方まで,前著同様懇切にガイドする。 はじめに1:ベイズファクタと統計分析の学習法 はじめに2:シミュレーションによる主体的で深い学び Chapter0 事前準備  0.1 フリーウェア及び関連ファイルの準備  0.2 R画面の設定 Chapter1 1×2表のベイズファクタ分析  【演習1a】 みんなが好きなもの  1.1 データ入力・分析  1.2 『結果の書き方』    レポート例01-1  1.3 統計的概念・手法の解説1    ●ベイズファクタとは何か ●確率分布の尺度設定 ●95%確信区間推定 ●真の比率の範囲検定  【演習1b】 統計的仮説検定のシミュレーション  1.4 シミュレーションの操作手順    ●シミュレーションの基本操作 ●シミュレーションの応用操作  1.5 統計的概念・手法の解説2    ●ベイズファクタ分析のメリット ●二項検定のp値とBF値の比較 Chapter2 1×2表・母比率不等のベイズファクタ分析  【演習2a】 鶏肉は低温調理がおいしい  2.1 シミュレーションの操作手順  2.2 統計的概念・手法の解説1    ●p値とBF値の検定の仕組み  【演習2b】 新型ウイルスは従来型よりも危険か  2.3 データ入力・分析  2.4 『結果の書き方』    レポート例02-1  2.5 統計的概念・手法の解説2    ●ベイズファクタの事前設定問題 Chapter3 1×J表のベイズファクタ分析と対応のある度数の検定  【演習3a】 お昼に食べたいメニューは何か  3.1 データ入力・分析  3.2 『結果の書き方』    レポート例03-1  3.3 統計的概念・手法の解説1    ●多項分布によるBF値の計算 ●確信区間を用いた多重比較  3.4 自動評価判定1×2:統計的グレード付与  【演習3b】 道徳性に評価グレードを与える  3.5 純肯定率とグレードの付け方  3.6 自動集計検定2×2:連関の探索  【演習3c】 道徳性の項目間の関連を探索する  3.7 対応のある度数の検定:Q検定とMcNemar検定  【演習3d】 不支持の理由は集計するとダメ?    レポート例03-2  3.7 統計的概念・手法の解説2    ●CochranのQ検定 ●McNemar検定 Chapter4 i×J表のベイズファクタ分析  【演習4a】 感受性が低い人は感情知能が働かない?  4.1 データ入力・分析  4.2 『結果の書き方』  4.3 標本タイプの選択    ●ポアソンタイプ:N =無作為,行・列=無作為 ●同時多項タイプ:N =固定,行・列=無作為 ●独立多項タイプ:行=固定,列=無作為 ●独立多項タイプの列組み:行=無作為,列=固定 ●超幾何タイプ:行・列=固定(2×2表のみ)    レポート例04-1  4.4 統計的概念・手法の解説1    ●i×J表の事前確率分布  4.5 データセットraceDollsの分析:BF値の警報は誤報か  【演習4b】 黒人・白人の子どもは同人種の人形を好むか    レポート例04-2  4.6 統計的概念・手法の解説2    ●Fisherの正確検定とBF値の検定 ●2×2表のp値とBF値の比較  4.7 ステレオタイプ効果と学習意欲  【演習4c】 ステレオタイプ効果で学習時間を延ばす    レポート例04-3 Chapter5 t検定のベイズファクタ分析  【演習5a】 トレーニング法は分散法がよいか集中法がよいか  5.1 データ入力・分析  5.2 『結果の書き方』  5.3 統計的概念・手法の解説1    ●t値と効果量δ(delta) ●t検定のベイズファクタ分析の仕組み ●p値とBF値の検定結果の不一致 ●BF値を用いたノンパラメトリック検定 ●t検定のp値とBF値の比較  5.4 シミュレーション学習①:正規分布をつくる  【課題1〉正規分布をつくる  5.5 シミュレーション学習②:データを再現する  【課題2〉データを再現する  5.6 時間データの対数変換による分析  【演習5b】 トレーニングは伸び盛りに!    レポート例05-1  5.7 統計的概念・手法の解説2    ●効果量δの範囲検定 Chapter6 1要因分散分析デザインのベイズファクタ分析  【演習6a】 SD法で創造性を高める  6.1 データ入力・分析  6.2 『結果の書き方』    レポート例06-1  6.3 統計的概念・手法の解説1    ●多重比較の早見表の利用 ●ベイズファクタ分析の仕組み:分散分析デザイン ●平均の95%確信区間 ●分散分析A sデザインのp値とBF値の比較  6.4 小学校英語指導に必要な技能は何か  【演習6b】 英語指導にどんな技能が必要か  6.5 『結果の書き方』    レポート例06-2  6.6 統計的概念・手法の解説2    ●参加者内デザインのベイズファクタ分析 Chapter7 2要因・3要因分散分析デザインのベイズファクタ分析  【演習7a】 協同経験はルール意識を高めるか  7.1 データ入力・分析  7.2 『結果の書き方』    レポート例07-1  7.3 統計的概念・手法の解説1    ●Inclusion BF:BF値のモデル平均化 ●全体モデル平均化  7.4 アイディア・プロダクション法  【演習7b】 アイディアの発想に“ 書き送り法”を用いる  7.5 『結果の書き方』 3要因デザイン    レポート例07-2  7.6 統計的概念・手法の解説2    ●3要因デザインのBF値の平均化  7.7 シミュレーション学習①:2要因データを再現する  【課題1】 データの再現  7.8 シミュレーション学習②:交互作用を判別する  【課題2】 交互作用の判別    ●シミュレーションによる交互作用問題の解答要領  7.9 シミュレーション学習③:N,SDを変えてみる  【課題3】 N,SDを変える Chapter8 相関係数のベイズファクタ分析  【演習8a】 気温とアイスクリーム,ホットコーヒーの売り上げは相関するか  8.1 データ入力・分析  8.2 『結果の書き方』  8.3 統計的概念・手法の解説1    ●p値有意・BF値有効となる最小相関係数の比較 ●相関係数の差の検定  8.4 相関係数のシミュレーション学習  【演習8b】 シミュレーション課題①:散布図をつくる  【演習8c】 シミュレーション課題②:相関係数を予想する    ●散布図問題の解答例  【演習8d】 シミュレーション課題③:外れ値のある散布図をつくる  8.5 統計的概念・手法の解説2    ●相関係数と説明率 Chapter9 回帰モデルのベイズファクタ分析  【演習9a】 革新性を高める職場風土とは?  9.1 データ入力・分析  9.2 『結果の書き方』  9.3 統計的概念・手法の解説1    ●初期モデルの選び方と独立変数の上限数 ●交互作用モデルの探索:ベイズ ファクタ回帰分析 ●BF値による回帰モデルの選出率  9.4 交互作用の単純傾斜分析  【演習9b】 明るさ×温かさの交互作用を分析する  9.5 『結果の書き方』 ステップワイズ回帰分析    レポート例09-1:単純傾斜分析の結果  9.6 統計的概念・手法の解説2    ●交互作用モデルの探索:ステップワイズ回帰分析 ●ベイズ情報量規準とベイズファクタ Chapter10 各種ユーティリティ  10.1 乱数発生ユーティリティ&乱数コマンド    ●一様乱数コマンド unif(ユニフ) ●正規乱数コマンド norm(ノゥム)  10.2 階級化集計ユーティリティ  10.3 数値変換ユーティリティ  【練習問題1】 困難度の異なるテスト得点を標準化する  【練習問題2】 2ポイント尺度を4ポイント尺度に変換  【練習問題3】 3ポイント尺度を5ポイント尺度に変換  10.4 逆転項目処理ユーティリティ  10.5 欠損値処理ユーティリティ 付録 統計分析の授業用シラバス(参考例)    シラバス参考例1 統計分析入門    シラバス参考例2 統計分析演習 索引 Column 1 セルへの数値入力の基本と小技 Column 2 分析結果の保存 Column 3 ダイアグラムで連関・相関を視覚的に表示 Column 4 スタック形式によるデータ入力 Column 5 平均のグラフとボックスプロットの利用 Column 6 シミュレーションボタンの使い方

完全独習 統計学入門

小島 寛之
ダイヤモンド社
おすすめ度
67
紹介文
超基本を理解するだけで、マーケティング調査のデータ分析、金融商品のリスクとリターン、株・為替相場のボラティリティ、選挙の出口調査までわかる。 第1部 速習!標準偏差から検定・区間推定まで(度数分布表とヒストグラムで、データの特徴を浮き彫りにする 平均値とはやじろべえの支点である-平均値の役割と捉え方 データの散らばり具合を見積る統計量-分散と標準偏差 そのデータは「月並み」か「特殊」か?標準偏差(S.D.)で評価する ほか) 第2部 観測データから背後に広がる巨大な世界を推測する(「部分」によって「全体」を推論する-母集団と統計的推定 母集団のデータの散らばり具合を表す統計量-母分散と母標準偏差 複数データの平均値は、1個のデータより母平均に近くなる-標本平均の考え方 観測データが増えるほど、予言区間は狭くなる-正規母集団の便利グッズ、標本平均 ほか)

例題でわかる Pythonプログラミング入門

佐村 敏治
電気書院
おすすめ度
67
紹介文
Python(パイソン)は初心者が比較的修得しやすく、AI(人工知能)やパターン認識などの先端技術に活用されている優れたプログラミング言語です。 本書では、初心者を対象に、Pythonを使ったプログラミングの勘所をやさしく解説しました。 例題に取り組むことで、プログラミングとはどういうものかを理解し、プログラミング的思考を身につけてもらうことを目的に執筆しました。 読者の皆さんが、楽しみながらPythonの素晴らしさやプログラミングの醍醐味を感じていただけたら、著者として望外の喜びです。

RStudioではじめるRプログラミング入門

Garrett Grolemund
オライリージャパン
おすすめ度
67
紹介文
「統計を使わずに、Rを純粋にプログラミング言語として学ぼう」というコンセプトに基づいて書かれた本書は、統計学の難しい知識がなくてもプログラミングの経験があまりなくても、プログラミングを学んでみようという意欲さえあれば読める、画期的な書籍です。サイコロを作る、ゲームで遊べるトランプを作る、スロットマシンを作る、という3つの簡単なプロジェクトに取り組む過程で、Rのプログラミング統合環境、RStudioを活用して、楽しみながら効率的にRのプログラミングスキルを身に付けていきます。統計だけに使うのはもったいない、Rのプログラミング言語としての隠れた魅力と可能性と、さらにはデータサイエンスの基礎としてのデータ分析を紹介します。 1部 プロジェクト1:ウェイトをかけたサイコロ(基本中の基本 パッケージとヘルプページ) 2部 プロジェクト2:トランプ(Rのオブジェクト Rの記法 値の書き換え 環境) 3部 プロジェクト3:スロットマシン(プログラム S3 ループ スピード) 付録

Pythonによるあたらしいデータ分析の教科書

寺田 学
翔泳社
おすすめ度
67
紹介文
Python業界の第一線で活躍する執筆陣によるデータ分析エンジニアに求められる技術が最速で身に付く入門書 データ分析エンジニアに求められる技術の基礎が最短で身に付く ビッグデータの時代といわれ始めて数年が経過しました。 デバイスの進化により多くの情報がデジタル化され、 それらのデータを活用しようとデータ分析エンジニアに注目が集まっています。 この書籍では、データ分析において、 デファクトスタンダードになりつつあるプログラミング言語Pythonを活用し、 データ分析エンジニアになるための基礎を身に付けることができます。 書籍ではデータ分析エンジニアになるために必須となる技術を身につけていきます。 ・データの入手や加工などのハンドリング ・データの可視化 ・プログラミング ・基礎的な数学の知識 ・機械学習の流れや実行方法 本書で学べること ・Pythonの基本的な文法 ・データフォーマットについて ・データの前処理技術 ・データの可視化技術 ・既存アルゴリズムでの機械学習の実装 対象読者 データ分析エンジニアを目指す方 目次(抜粋) 第1章 データ分析とは 第2章 Pythonと環境 第3章 数学の基礎 第4章 ツールの基礎 第5章 応用:データ収集と加工 はじめに 謝辞 本書の対象読者と構成について Chapter1 データ分析エンジニアの役割 1.1 データ分析の世界 1.2 機械学習の位置づけと流れ 1.3 データ分析に使う主なパッケージ Chapter2 Pythonと環境 2.1 実行環境構築 2.2 Pythonの基礎 2.3 Jupyter Notebook Chapter3 数学の基礎 3.1 数式を読むための基礎知識 3.2 線形代数 3.3 基礎解析 3.4 確率と統計 Chapter4 ライブラリによる分析の実践 4.1 NumPy 4.2 pandas 4.3 Matplotlib 4.4 scikit-learn Chapter5 応用:データ収集と加工 5.1 スクレイピング 5.2 自然言語の処理 5.3 画像データの処理 INDEX 奥付

[第3版]Python機械学習プログラミング 達人データサイエンティストによる理論と実践 (impress top gear)

Sebastian Raschka
インプレス
おすすめ度
67
紹介文
本書は、機械学習コンセプト全般をカバーし、理論的背景とPythonコーディングの実際を解説しています。初歩的な線形回帰から始め、ディープラーニング(CNN/RNN)、敵対的生成ネットワーク、強化学習などを取り上げ、scikit-learnやTensorFlowなどPythonライブラリの新版を使ってプログラミング。第3版では13~16章の内容をほとんど刷新したほか、敵対的生成ネットワークと強化学習の章を新たに追加。機械学習プログラミングの本格的な理解と実践に向けて大きく飛躍できる一冊です。

実践Data Scienceシリーズ ゼロからはじめるデータサイエンス入門 R・Python一挙両得 (KS情報科学専門書)

辻 真吾
講談社
おすすめ度
66
紹介文
RとPython両方学べる。コスパ最強の一冊!「データサイエンスの準備」にページを割いたから、プログラミング経験ゼロで大丈夫 ◆RとPython両方学べる。コスパ最強の一冊!◆ ・コードが理解の試金石! ・「データサイエンスの準備」にページを割いているから、プログラミング経験ゼロで大丈夫!  ・自分に合った言語を見つけたい、言語を乗り換えたいという方にもおすすめ! [サポートサイト] https://github.com/taroyabuki/fromzero [主な内容] 第1部 データサイエンスのための準備 1章 コンピュータとネットワーク 2章 データサイエンスのための環境 3章 RとPython 4章 統計入門 5章 前処理 第2部 機械学習 6章 機械学習の目的・データ・手法 7章 回帰1(単回帰) 8章 回帰2(重回帰) 9章 分類1(多値分類) 10章 分類2(2値分類) 11章 深層学習とAutoML 12章 時系列予測 13章 教師なし学習 付録A 環境構築 第1部 データサイエンスのための準備 1章 コンピュータとネットワーク 1.1 コンピュータの基本操作 1.2 ネットワークのしくみ 2章 データサイエンスのための環境 2.1 実行環境の選択 2.2 クラウド 2.3 Docker 2.4 ターミナルの使い方 2.5 RとPython 2.6 サンプルコードの利用 3章 RとPython 3.1 入門 3.2 関数 3.3 コレクション 3.4 データフレーム 3.5 1次元データの(非)類似度 3.6 Rのパッケージ,Pythonのモジュール 3.7 反復処理 3.8 その他 4章 統計入門 4.1 記述統計 4.2 データの可視化 4.3 乱数 4.4 統計的推測 5章 前処理 5.1 データの読み込み 5.2 データの変換 第2部 機械学習 6章 機械学習の目的・データ・手法 6.1 機械学習の目的(本書の場合) 6.2 機械学習のためのデータ 6.3 機械学習の手法 7章 回帰1(単回帰) 7.1 自動車の停止距離 7.2 データの確認 7.3 回帰分析 7.4 当てはまりの良さの指標 7.5 K最近傍法 7.6 検証 7.7 パラメータチューニング 8章 回帰2(重回帰) 8.1 ブドウの生育条件とワインの価格 8.2 重回帰分析 8.3 標準化 8.4 入力変数の数とモデルの良さ 8.5 変数選択 8.6 補足:正則化 8.7 ニューラルネットワーク 9章 分類1(多値分類) 9.1 アヤメのデータ 9.2 木による分類 9.3 正解率 9.4 複数の木を使う方法 9.5 欠損のあるデータでの学習 9.6 他の分類手法 10章 分類2(2値分類) 10.1 2値分類の性能指標 10.2 トレードオフ 10.3 2値分類の実践 10.4 ロジスティック回帰 11章 深層学習とAutoML 11.1 Kerasによる回帰 11.2 Kerasによる分類 11.3 MNIST:手書き数字の分類 11.4 AutoML 12章 時系列予測 12.1 日時と日時の列 12.2 時系列データの予測 13章 教師なし学習 13.1 主成分分析 13.2 クラスタ分析 付録A 環境構築

すべての医療系学生・研究者に贈る 独習統計学応用編24講 ─分割表・回帰分析・ロジスティック回帰─

鶴田 陽和
朝倉書店
おすすめ度
66
紹介文
統計学基礎,分割表,回帰分析,ロジスティック回帰の四部構成。事例・問題豊富で独習に最適。 好評の「独習」テキスト待望の続編。統計学基礎,分割表,回帰分析,ロジスティック回帰の四部構成。前著同様とくに初学者がつまづきやすい点を明解に解説する。豊富な事例と演習問題,計算機の実行で理解を深める。再入門にも好適。 1. 基本編  第1講 統計学の基本  第2講 標本の集計と標本の分布  第3講 母集団の分布  第4講 区間推定  第5講 仮説検定 2. 分割表編  第6講 χ2分布―母分散の信頼区間はどうやって計算するの?―  第7講 適合度の検定―このサイコロはイカサマでは?―  第8講 尤度比検定  第9講 四分表の確率モデル  第10講 Fisherの正確検定  第11講 独立性の検定―相似検定と漸近的な方法―  第12講 適合度の検定と独立性の検定:手法の選択 3. 回帰分析編  第13講 共分散と相関係数  第14講 単回帰  第15講 偏相関係数  第16講 重回帰 4. ロジスティック回帰編  第17講 オッズ比と相対危険度―リスクの指標―  第18講 リスクの相乗モデルとロジスティック回帰  第19講 ロジスティック回帰(1)―説明変数のモデル化―  第20講 ロジスティック回帰(2)―数値計算上の問題―  第21講 ロジスティック回帰(3)―計算結果の見方―  第22講 バイアス,交絡,交互作用  第23講 変数選択  第24講 診断・検査とROC曲線 参考図書/付表/索引

ブランディングの教科書 ブランド戦略の理論と実践がこれ一冊でわかる

羽田康祐 k_bird
NextPublishing Authors Press
おすすめ度
66

確率論

岩田 耕一郎
森北出版
おすすめ度
66
紹介文
測度論に真正面から取り組み、確率論を深く理解することができます。 「測度論に真正面から取り組み、確率論を最大限理解する」 本書は、測度論に基づいた確率論を、深く、深く理解するための本です。 ・ルベーグ積分を用いて分布や期待値の計算ができる。 ・フビニの定理やディンキン族定理を証明の中で正しく使える。 これらができるようになって初めて、測度論に基づく確率論を深く理解できたといえます。そしてそのためには、具体的な計算に取り組み、定理の証明の1行1行を理解していく必要があります。 本書では、他書では割愛されがちな測度論の議論の細部に切り込みながら、確率論の基礎である「確率空間」「分布と期待値」「フビニの定理」「独立性」「特性関数」「独立性と極限の関係」「ブラウン運動の構成」を解説していきます。 確率微分方程式など、確率論の先にある理論を学習するための基礎固めとして、確かな地力を養うことができる一冊です。 第1章 プロローグ 第2章 確率空間 第3章 分布と期待値 第4章 フビニの定理 第5章 独立性 第6章 特性関数 第7章 独立性と極限 第8章 ブラウン運動の構成

スッキリわかるSQL入門 第2版 ドリル222問付き! (スッキリわかる入門シリーズ)

中山清喬
インプレス
おすすめ度
66

分析者のためのデータ解釈学入門 データの本質をとらえる技術

江崎貴裕
ソシム
おすすめ度
66
紹介文
 本書は,データを分析して背後にあるメカニズムを解釈したり,データに基づいた意思決定や問題解決を行う際に,分析者が知っておかなければならない知識をわかりやすく網羅的に解説した教科書です。データ分析が上手くいくかどうかは,分析手法の技術だけでなく,データの質や扱い方,解釈の方法にも大きく影響を受けます。しかし,実践的にデータや分析の質を高く保ち,間違った解釈をしないための知識について,わかりやすくまとまった入門書はまだまだ少ないのが現状です。  本書では,各種分析手法をただ網羅するだけでなく,データのばらつきやバイアスに関する基礎知識,データにさまざまな偏りを生じさせる行動心理学,サンプリングの方法と理論,データハンドリングのノウハウ,各種分析の考え方,データの解釈における認知バイアスや数理モデリングのポイント,システム運用時に発生する問題など,非常に幅広い視点でデータ分析者が知っておかなければならない知識を整理し,平易に解説することを目指しました。  記述については,本質的な考え方の部分に特に重点を置き,数学に自信のない読者の方でも読み通せるように工夫しました。興味深い事例もふんだんに紹介することで,読み物としての面白さも追求しています。データサイエンティストを目指す方はもちろん,(任意の分野の)研究でデータを分析したい学生の方,データ分析について深く知りたいビジネスマンの方にも楽しんでいただけると思います。

Excel & Access 連携実践ガイド ~仕事の現場で即使える[増補改訂版]

今村 ゆうこ
技術評論社
おすすめ度
66
紹介文
本書は、ExcelのデータをAccessに移行して、Acceessでデータを管理し、そのデータをExcelに書き出して活用する、という使い方を解説した書籍です。 プログラミングまでは行いたくないけど、Accessでデータを管理したい人には、VBAを使わずにExcelとAccessの標準機能を使う方法を解説しています。 また、VBAを使い、オリジナルのユーザーフォームを作成して本格的なアプリケーションを作成して行う方法も丁寧に解説しています。 CHAPTER 1 Excel&Access連携の基礎知識 1-1 Excelの得意・不得意 1-2 Accessと連携することのメリット 1-3 連携に必要な技術 1-4 データの運用について CHAPTER 2 標準機能を使ってExcel のデータをAccessに書き込む 2-1 Accessを利用するための基本 2-2 データの型というルール 2-3 書込に理想的なExcelのシート 2-4 Excelシートを書き込む状態にする 2-5 Accessへデータを書き込む 2-6 クエリを使ってデータ表記を統一する 2-7 Accessでのデータ管理 CHAPTER 3 VBAを使ってExcel のデータをAccessに書き込む 3-1 テーブルを作成する 3-2 VBAの基礎知識 3-3 VBAコード内でADOとSQLを利用する 3-4 複数のレコードを一度に書き込む 3-5 関数の戻り値によって動作を変える CHAPTER 4 標準機能を使ってAccess のデータをExcelに読み込む 4-1 テーブルをエクスポートする 4-2 条件に一致するものだけを読み込む 4-3 条件を設定して実行する 4-4 クエリをエクスポートする 4-5 クエリの種類とその他の活用方法 CHAPTER 5 VBAで専用フォームを作成してAccess のデータをExcelに読み込む 5-1 Excelで専用フォームを作成するための知識 5-2 データを読み込むための準備 5-3 「メニュー」フォームを作成する 5-4 読込機能を実装する CHAPTER 6 専用フォームを使ってExcel からデータを追加・更新・削除する 6-1 データの追加・更新・削除用のフォームを作成する 6-2 データの追加・更新・削除に対応するVBAを記述する 6-3 読込機能を拡張するフォームを作成する 6-4 フォームに合わせて読込のコードを変更する 6-5 自分用にカスタマイズするには CHAPTER 7 列数の多いExcelシートを分割しAccessの複数テーブルで利用する 7-1 列数が増え過ぎて見づらくなったテーブル 7-2 シートを分割する 7-3 複数のテーブルを利用する 7-4 Accessにエクスポートする 7-5 主キーとリレーションシップ 7-6 複数のテーブルをまたいでデータを抽出する 7-7 コードを複数テーブルに対応させる CHAPTER 8 [完全版]Excel & Access 連携アプリケーション 8-1 Excelのシートを作成する 8-2 Accessのテーブルを作成する 8-3 一括書込のコードを拡張する 8-4 「データ読込」フォームを拡張する 8-5 「編集」フォームを拡張する 8-6 追加/更新のコードを対応させる Appendix 付録 A-1 デバッグするには A-2 エラーが起きた場合には

Pythonによるデータ分析入門 第2版 ―NumPy、pandasを使ったデータ処理

Wes McKinney
オライリージャパン
おすすめ度
66
紹介文
Pythonのデータ分析ツールpandasのメイン開発者による、Pythonでデータサイエンスを行うための情報をまとめた。 Pythonの豊富で強力なライブラリを使ってデータ分析を行うための情報を凝縮! 2013年に発刊以来、高い人気を誇ってきたロングセラー待望の改訂版です。NumPy、SciPy、pandas、Matplotlib、IPython、Jupyterをはじめ、高機能で使いやすい数学・科学計算用ライブラリが充実しているPythonは、科学計算、統計解析、機械学習のみならず、金融や経済分野でも不動の地位を築きつつあります。本書はPythonの代表的なデータ分析ツール、pandasのメイン開発者による、Pythonでデータサイエンスを行うための情報をまとめた一冊です。

たのしいプログラミング Pythonではじめよう!

Jason R.Briggs
オーム社
おすすめ度
66

入門 統計解析法

永田 靖
日科技連出版社
おすすめ度
66
紹介文
本書は、入門書でありながら統計解析の基礎手法を幅広い視野から解説してあるので、統計解析の全容がつかめます。 データの整理 分布と期待値 検定と推定の考え方 計量値に関する検定と推定 分散分析 相関分析 回帰分析 計数値に関する検定と推定

紙と鉛筆で身につける データサイエンティストの仮説思考

孝忠 大輔
翔泳社
おすすめ度
66
紹介文
データサイエンティストがどのようにデータと向き合っているのか、プログラミング言語を使わずにその思考過程を体験できます。 データサイエンティストはどのように考えるのか? 本書は、紙と鉛筆で学ぶというコンセプトのもと、 PythonやRなどのプログラミング言語を使わずに データサイエンティストの思考過程を体験できます。 データサイエンティストがどのような思考回路でデータと向き合っているのか、 本書掲載の40問のクイズを解きながら体験してみてください。 本書掲載のクイズは複雑な計算やExcelなども不要で、 紙と鉛筆さえあれば解くことができますので、ぜひチャレンジしてみてください。 【こんな方におすすめ!】 ・デジタル時代を生き抜くためにデータを読み解くスキルを身につけたい人 ・「データを使って論理的に考えろ」と言われるが、 データのどこを見ればよいのかわからない人 ・大学時代に政府が提唱するデータリテラシーを学ぶことができなかった人 ・大学でデータリテラシーを身につけた新入社員を受け入れる部署の管理職 ・社会でデータリテラシーがどう活用されているか知りたい人 ・データサイエンティストと仕事をすることになったが、 どのような思考回路の専門家なのか知りたい人 【本書を読むことで得られる知識/できるようになること】 ・データを活用するプロであるデータサイエンティストが どのような思考回路でデータに向き合っているかわかる ・データサイエンティストの思考過程を知る(なぞる)ことによって、 自分自身でデータを正しく読み解くことができるようになる ・データを読み解く際の勘所(着眼点)がわかる ・与えられたデータの意味を適切に読み解き、 他者に対して正しくデータを説明できるようになる ・恣意的に誇張されたグラフや不適切に切り取られたデータに騙されなくなる ・データ分析の考え方、留意事項がわかる ・データを分類する方法、データから法則を見つけ出す方法、予測する方法がわかる ・データを基に論理的に意思決定できるようになる 【目次】 第1章 デジタル時代に必要なデータリテラシー 第2章 データを読む力を身につける 第3章 データを説明する力を身につける 第4章 データを分類する力を身につける 第5章 データから法則を見つける力を身につける 第6章 データから予測する力を身につける 第7章 仕事でデータリテラシーを活用する 第1章 デジタル時代に必要なデータリテラシー 1-1  デジタル時代の到来 1-2 データリテラシーはこれからのビジネスパーソンに必須のスキル 1-3 データリテラシーを身につけよう 第2章 データを読む力を身につける 2-1 考えながらデータを読もう! クイズ1:目的に即したデータの見方について学ぶ クイズ2:データの特徴や傾向の見方について学ぶ クイズ3:データの着眼点について学ぶ 2-2 全体の傾向をつかもう! クイズ4:平均値・最頻値・中央値の算出方法について学ぶ クイズ5:代表値とデータ分布の関係について学ぶ 2-3 データの細部を確認しよう! クイズ6:外れ値・異常値について学ぶ 2-4 データの関係性を読み解こう! クイズ7:2つのデータの関係性について学ぶ クイズ8:相関と因果について学ぶ 第3章:データを説明する力を身につける 3-1 データを可視化してみよう! クイズ1:適切なグラフ表現について学ぶ クイズ2:不適切なグラフ表現について学ぶ 3-2 データを比較するとは? クイズ3:適切な比較対象の設定について学ぶ クイズ4:ある時点との比較について学ぶ クイズ5:他者との比較について学ぶ 3-3 データから課題を見つけ出す! クイズ6 〜9:データから課題を見つけ出す手順について学ぶ  第4章:データを分類する力を身につける 4-1 特徴の似たデータでグループを作ろう! クイズ1:データをグループに分ける意義について学ぶ クイズ2:データ間の距離について学ぶ クイズ3:距離計算する際の注意事項について学ぶ 4-2 目的に応じてデータを分類しよう! クイズ4:データを分類するための観点について学ぶ 4-3 データを機械的に分類しよう! クイズ5:グループの重心について学ぶ 4-4 データの分類を体験しよう! クイズ6 〜8:データを分類する手順について学ぶ 第5章:データから法則を見つける力を身につける 5-1 データから法則を見つけ出す! クイズ1:データから法則を見つけ出す方法について学ぶ クイズ2:見つけ出した法則を適用する方法について学ぶ 5-2 判別問題を解く決定木モデル クイズ3:決定木モデルの作り方について学ぶ クイズ4:決定木モデルを用いて結果を推測する方法について学ぶ 5-3 判別問題の精度を評価してみよう! クイズ5:判別問題の評価方法について学ぶ 5-4 決定木モデルを活用してみよう! クイズ6:データから法則を見つけ出し判別問題を解く手順について学ぶ  第6章:データから予測する力を身につける 6-1 数値データの関係性を確認しよう! クイズ1:数値データの関係性を確認する方法について学ぶ クイズ2:数値データの関係性を絞り込めない場合について学ぶ クイズ3:数値以外のデータとの関係性を確認する方法について学ぶ 6-2 内挿と外挿に注意しよう! クイズ4:データから予測する際に注意すべき内挿と外挿について学ぶ 6-3 データの偏りに注意しよう! クイズ5:データに偏りがある場合の注意事項について学ぶ 6-4 時間の変化に着目しよう! クイズ6:時系列データのトレンドと周期性について学ぶ 6-5 データから予測しよう! クイズ7 〜9:データから予測する手順について学ぶ 第7章 仕事でデータリテラシーを活用する 7-1 データを読む力を活用する 7-2 データを説明する力を活用する 7-3 データを分類する力を活用する 7-4 データから法則を見つける力を活用する 7-5 データから予測する力を活用する

日本統計学会公式認定 統計検定 3級・4級 公式問題集[2018〜2021年]

日本統計学会
実務教育出版
おすすめ度
66
紹介文
統計に関する知識や活用力を問う全国統一試験「統計検定」。学生・社会人問わず注目の資格で、統計学会認定、唯一の公式問題集です!

入門 Python 3 第2版

Bill Lubanovic
オライリージャパン
おすすめ度
66
紹介文
プログラミング初心者向けPython入門書。5年ぶりの改訂版でPython3.9.0に対応。新機能追加でボリュームアップ。 実践を見据えた本格的な入門書の改訂版! プログラミング初心者を対象としたPythonの総括的な入門書で、前提知識がなくても取り組むことができます。プログラミングとPythonの基礎から、データベース処理、Webプログラミング、ネットワークプログラミング、初歩の並列処理といった応用までわかりやすく丁寧に解説します。「入門Python 3」の5年ぶりの改訂版でPython3.9.0に対応、f文字列などの新機能が追加され大幅にボリュームアップしています。 プログラミング初心者向けPython入門書。5年ぶりの改訂版でPython3.9.0に対応。新機能追加でボリュームアップ。

Rによるやさしい統計学

山田 剛史
オーム社
おすすめ度
66
紹介文
第1部 基礎編(Rと統計学 1つの変数の記述統計 2つの変数の記述統計 母集団と標本 統計的仮説検定 ほか) 第2部 応用編(ベクトル・行列の基礎 データフレーム 外れ値が相関係数に及ぼす影響 統計解析で分かること・分からないこと 二項検定 ほか) 付録

インプット・アウトプットが10倍になる読書の方程式

羽田康祐 k_bird
フォレスト出版
おすすめ度
66
紹介文
速読・多読いらない!何を選び・どう読む?!ビジネス書に特化した、まったく新しい読書術。 速読・多読いらない!何を選び・どう読む?!ビジネス書に特化した、まったく新しい読書術。 ビジネス読書の本当の目的とは? 「視点読書」と「法則読書」の2つをマスターすることで、本当にビジネスに役立つアウトプットが生まれる! 外資系コンサルティングファーム✖大手広告代理~ハイブリットキャリアの読み方。 。

Excel で学ぶ 実践ビジネスデータ分析 ビジネス統計スペシャリスト・エクセル分析スペシャリスト対応

豊田裕貴
オデッセイコミュニケーションズ
おすすめ度
66

データマネジメント知識体系ガイド 第二版

DAMA International
日経BP
おすすめ度
65
紹介文
データを制するものはビジネスを制す データから価値を生むための知識を網羅 データを制するものはビジネスを制す データから価値を生むための知識を網羅 データは現実の世界を映し出す。外界が生きているのと同じようにデータも生きている。実在する商品、製品、サービス、人材、不動産に品質があるようにデータにも品質がある。高品質データは資産であり、モノやコトの状態、モノやコトの多様な関係を正確に描写する。データは企業活動を支えるインフラであり、価値を提供する。データを活用して高度な決定を下し、業務を自動化し、市場を把握し、未来を予測できる。 本書『データマネジメント知識体系ガイド第二版』はデータから価値を生み出す方法を様々な角度から解説したものである。国際的に著名で経験豊かなデータマネジメント・プロフェッショナルの知見が全17章に詰まっており、データのデザインからオペレーション、セキュリティと品質、メタデータ/マスターデータの管理、そしてデータガバナンスまで、やるべきことが詳述してある。 第一版の日本語版が2011年に発売されてから7年が経過したが、第二版は改訂版ではなく、全ての章が一から書き直されている。時代の要請に応えて書かれた「データ取扱倫理」「データ統合と相互運用性」「ビッグデータとデータサイエンス」、組織に焦点を当てた「データマネジメント成熟度アセスメント」「データマネジメント組織と役割期待」「データマネジメントと組織の変革」、以上6章が新章として追加され、全体で672ページと第一版の1.5倍以上になった。 初めに各章のイントロダクションを通読するのもよし、興味がある章を選んで熟読するのもよし。経営者、業務担当者、IT担当者、コンサルタント、それぞれの役割に応じたやるべきことが見えてくるはずである。 データを制するものはビジネスを制す データから価値を生むための知識を網羅 第1章 データマネジメント 第2章 データ取扱倫理 第3章 データガバナンス 第4章 データアーキテクチャ 第5章 データモデリングとデザイン 第6章 データストレージとオペレーション 第7章 データセキュリティ 第8章 データ統合と相互運用性 第9章 ドキュメントとコンテンツ管理 第10章 参照データとマスターデータ 第11章 データウェアハウジングとビジネスインテリジェンス 第12章 メタデータ管理 第13章 データ品質 第14章 ビッグデータとデータサイエンス 第15章 データマネジメント成熟度アセスメント 第16章 データマネジメント組織と役割期待 第17章 データマネジメントと組織の変革

入門 実践する統計学

藪 友良
東洋経済新報社
おすすめ度
65
紹介文
経済学、経営学、保険、スポーツ、医療、教育、心理学など多岐にわたる豊富な実用例を収録しました。これらの実用例を理解することで、単なる理論体系ではなく、「生きた」知識として統計学を身につけることができます。高等学校初級年程度の数学で内容を理解できるように工夫しています。直観的な理解を優先し、難しい証明は章末にまわし、滑らかな統計学の理解を可能としています。本書によって、上級の専門書に進むための基礎が身につき、入門書と上級書の橋渡しが可能となります。 統計学とは 基礎編(データの記述 相関 確率 確率変数と確率分布 主要な確率分布 母数の推定 仮説検定) 応用編(正規分布の派生分布 回帰分析の基礎 単回帰分析 重回帰分析) 付録

多変量解析法入門 (ライブラリ新数学大系)

靖, 永田
サイエンス社
おすすめ度
65
紹介文
入門的な統計的方法を習得した方々を対象とした多変量解析法の入門書。できるだけ簡単な例を用いて理論的な説明を2次程度の行列を用いて解説する。 多変量解析法とは 統計的方法の基礎知識 線形代数のまとめ 単回帰分析 重回帰分析 数量化1類 判別分析 数量化2類 主成分分析 数量化3類 多次元尺度構成法 クラスター分析 その他の方法

機械学習のエッセンス -実装しながら学ぶPython,数学,アルゴリズム- (Machine Learning)

加藤 公一
SBクリエイティブ
おすすめ度
65
紹介文
機械学習の原理を知るための、初めての入門書 本書は具体的なデータ分析の手法を説明する意図で書かれたものではありません。 実用的な目的ならscikit-learnやChainerなどの既存のフレームワークを使うべきですが、本書では機械学習のいくつかの有名なアルゴリズムを、自分でゼロから実装することを目標としています。こうすることにより、とかくブラックボックスになりがちな機械学習の仕組みを理解し、さらなる応用力と問題解決力を身につけることができるようになります。 また、処理系にはデファクトスタンダードであるPythonを使い、機械学習に必要な数学の知識もわかりやすく解説しています。 これから機械学習を始める学生さんや、いきなりプロジェクトに放り込まれていまいち理解できないままデータ分析の仕事をしているエンジニアの方にも最適です。 ●目次 はじめに 第01章 学習を始める前に  01 本書の目的  02 本書は何を含まないか  03 機械学習の初歩  04 実行環境の準備 第02章 Pythonの基本  01 プログラムの実行方法  02 基本的な文法  03 数値と文字列  04 複数行処理  05 制御構造  06 リスト、辞書、集合  07 関数定義  08 オブジェクト指向  09 モジュール  10 ファイル操作  11 例外処理 第03章 機械学習に必要な数学  01 基本事項の確認  02 線形代数  03 微積分 第04章 Pythonによる数値計算  01 数値計算の基本  02 NumPyの基本  03 配列の基本計算  04 疎行列  05 NumPy/SciPyによる線形代数  06 乱数  07 データの可視化  08 数理最適化  09 統計 第05章 機械学習アルゴリズム  01 準備  02 回帰  03 リッジ回帰  04 汎化と過学習  05 ラッソ回帰  06 ロジスティック回帰  07 サポートベクタマシン  08 k-Means法  09 主成分分析(PCA) INDEX はじめに 第01章 学習を始める前に  01 本書の目的  02 本書は何を含まないか  03 機械学習の初歩  04 実行環境の準備 第02章 Pythonの基本  01 プログラムの実行方法  02 基本的な文法  03 数値と文字列  04 複数行処理  05 制御構造  06 リスト、辞書、集合  07 関数定義  08 オブジェクト指向  09 モジュール  10 ファイル操作  11 例外処理 第03章 機械学習に必要な数学  01 基本事項の確認  02 線形代数  03 微積分 第04章 Pythonによる数値計算  01 数値計算の基本  02 NumPyの基本  03 配列の基本計算  04 疎行列  05 NumPy/SciPyによる線形代数  06 乱数  07 データの可視化  08 数理最適化  09 統計 第05章 機械学習アルゴリズム  01 準備  02 回帰  03 リッジ回帰  04 汎化と過学習  05 ラッソ回帰  06 ロジスティック回帰  07 サポートベクタマシン  08 k-Means法  09 主成分分析(PCA) INDEX

独習Python

山田 祥寛
翔泳社
おすすめ度
65
紹介文
プログラミング初学者に向けた独習シリーズに『独習Python』が新登場。山田祥寛氏によるPython入門書の決定版。 手を動かしておぼえるPythonプログラミング ――独学に最適な“標準教科書” プログラミングの初学者に向けた独習シリーズに『独習Python』が新登場。 プログラミング言語入門書の執筆で定評のある山田祥寛氏による、 Python入門書の決定版です。 独習シリーズの強みである、手を動かしておぼえる(書いて実行して結果を確認する) 特長を生かし、Pythonの基本的な言語仕様から、標準ライブラリ、ユーザー定義関数、 オブジェクト指向構文、モジュールまで、サンプルプログラムを例示しながら 詳細かつ丁寧に解説します。 プログラミングの基礎知識がない方でも、解説→例題(サンプル)→理解度チェック という3つのステップで、Pythonでプログラミングを行う際に必要な知識・概念・機能を 体系的に習得できます。 プログラミングの入門者、これからPythonで開発を始めたい初学者から、再入門者、 学生・ホビープログラマまで、「一からPython言語を学びたい」「Pythonプログラミング の基本をしっかり身につけたい」という方におすすめの一冊です。 第1章 イントロダクション 1.1 Pythonとは? 1.2 Pythonの歴史と現状 1.3 Pythonアプリを開発/実行するための基本環境 1.4 Pythonプログラミングの基本 1.5 Pythonの基本ルール 1.6 開発/学習の前に押さえておきたいテーマ 第2章 Pythonの基本 2.1 変数 2.2 データ型 第3章 演算子 3.1 算術演算子 3.2 代入演算子 3.3 比較演算子 3.4 論理演算子 3.5 ビット演算子 3.6 演算子の優先順位と結合則 第4章 制御構文 4.1 条件分岐 4.2 繰り返し処理 4.3 ループの制御 4.4 例外処理 第5章 標準ライブラリ[基本] 5.1 ライブラリの分類 5.2 文字列の操作 5.3 日付/時刻の操作 第6章 標準ライブラリ[コレクション] 6.1 シーケンス型 6.2 セット(集合)型 6.3 辞書(dict)型 第7章 標準ライブラリ[その他] 7.1 正規表現 7.2 ファイル操作 7.3 ファイルシステムの操作 7.4 HTTP経由でコンテンツを取得する 7.5 その他の機能 第8章 ユーザー定義関数 8.1 ユーザー定義関数の基本 8.2 変数の有効範囲(スコープ) 8.3 引数のさまざまな記法 8.4 関数呼び出しと戻り値 第9章 ユーザー定義関数[応用] 9.1 デコレーター 9.2 ジェネレーター 9.3 関数のモジュール化 9.4 非同期処理 9.5 ドキュメンテーション 第10章 オブジェクト指向構文 10.1 クラスの定義 10.2 カプセル化 10.3 継承 10.4 ポリモーフィズム 第11章 オブジェクト指向構文[応用] 11.1 例外処理 11.2 特殊メソッド 11.3 データクラス 11.4 イテレーター 11.5 メタクラス 付録A 「練習問題」「このの理解度チェック」解答

社会科学のための統計学入門 実例からていねいに学ぶ (KS専門書)

毛塚 和宏
講談社
おすすめ度
65
紹介文
もう数式はコワくない! 身近で面白い題材を使って,統計学の基礎知識・手法をていねいに伝授する.社会の「姿」はこうして暴け. データ集め(社会調査),データの整理,分析,…….社会調査に携わるすべての人が知っておくべき統計学の基礎を,懇切ていねいに解説する.親しみやすい題材に触れながら,調査研究に必要となる知識・手法を身につけよう.一見難しい数式も,その意味を言葉で説明しているので,数式アレルギーを克服できる! 【主な内容】 第0章 イントロダクション 第I部 コア 第1章 データを集める 第2章 データをまとめる 第3章 関連を捉える 第4章 関連を疑う 第5章 データから推測する 第6章 データから確かめる 第II部 理論 第7章 コイントスで社会を見る 第8章 集まったデータを表現する 第9章 推定が満たすべき条件 第III部 手法 第10章 社会の下流化は起こっているか 第11章 継承される格差を検討する 第12章 世界の男性の家事事情 第13章 年収と年齢の関係 第14章 ワイン評論家を出し抜く方法 第IV部 終わりに 第15章 統計学の応用とこれから

統計学のための数学入門30講 (科学のことばとしての数学)

靖, 永田
朝倉書店
おすすめ度
65
紹介文
第1部 基礎と1変数関数の微積分(基礎事項ア・ラ・カルト 和と積 順列・組合せと2項定理・多項定理 ほか) 第2部 線形代数(ベクトルと行列の加減 ベクトルと行列の積 いろいろな行列 ほか) 第3部 多変数関数の微積分(偏微分と微分 テイラーの公式と極値問題 ベクトル微分と条件付き極値問題 ほか)

無駄な仕事が全部消える超効率ハック――最小限の力で最大の成果を生み出す57のスイッチ

羽田 康祐 k_bird
フォレスト出版
おすすめ度
65
紹介文
個人の生産性を爆上げ!最小限の力で最大の成果を生み出す57のスイッチ。 いい加減なヤツほど生産性UPの裏技!! 学び、思考、発送、時間、段取り、コミュニケーション、資料作成、会議・・・・ ≪最小限の力で最大の成果を生み出す≫8カテゴリ・57のスイッチ!

scikit-learn データ分析 実践ハンドブック (Pythonライブラリ定番セレクション)

拓也, 毛利
秀和システム
おすすめ度
65
紹介文
実データ分析に特化したPythonライブラリであるscikit-learnの解説書 実データに合わせて最適な予測モデルを作ることのできるPythonライブラリのscikit-learn解説書です。本書は他の実装本とは異なり、アルゴリズムの解説に敢えて数式を採用し、実装で指定するハイパーパラメータと数式の関係が分かるよう工夫しました。また、ハイパーパラメータの値を増減し、そのときの予測の変化も紙面が許す限り記載しました。本書は不動産価格の予測やワイン品種の分類で使用する典型的なデータセットだけでなく、より実践的なデータ分析が学べるよう、タイタニック、気温、MovieLensのデータセットを採用しています。これらのデータセットを用いて、前処理から予測モデル作成までの分析例を実例で紹介します。 第1章 機械学習とは何か 1.1 機械学習とは何か 1.2 機械学習の種類 第2章 scikit-learnと開発環境 2.1 scikit-learnとは 2.2 scikit-learnのセットアップ 2.3 scikit-learnによる機械学習の基本的な実装 2.4 アルゴリズムチートシート 第3章 回帰 3.1 回帰のアルゴリズム 3.2 線形回帰 3.3 線形回帰の正則化 3.4 線形回帰の確率的勾配降下法 3.5 線形サポートベクトル回帰 3.6 ガウスカーネルのサポートベクトル回帰 3.7 ランダムフォレスト回帰 第4章 分類 4.1 分類のアルゴリズム 4.2 ロジスティック回帰 4.3 線形サポートベクトル分類 4.4 ガウスカーネルのサポートベクトル分類 4.5 ランダムフォレスト 第5章 クラスタリング 5.1 クラスタリングのアルゴリズム 5.2 K-means 5.3 混合ガウス分布(GMM)、変分混合ガウス分布(VBGMM) 第6章 次元削減 6.1 次元削減のアルゴリズム 6.2 主成分分析(PCA) 6.3 カーネルPCA 第7章 モデルの評価 7.1 モデルの評価 第8章 Preprocessing、実データ分析 8.1 はじめに 8.2 ロジスティック回帰を活用したタイタニックの予測モデルの作成 8.3 ランダムフォレストを活用した気温分析と消費の予測モデルの作成 8.4 Collaborative filteringを活用したレコメンデーションモデル 8.5 MovieLensを使ったモデル作り 第9章 scikit-learn API 9.1 regression(回帰) 9.2 classification(分類) 9.3 clustering(クラスタリング) 9.4 dimensionality reduction(次元削減)

予測にいかす統計モデリングの基本 改訂第2版 ベイズ統計入門から応用まで (KS理工学専門書)

樋口 知之
講談社
おすすめ度
65
紹介文
名著をリニューアル! あなたの課題に適したモデルをつくる、評価する、改良する、すべての段階に必要なことがこの1冊に。 ◆◆ロングセラー、10年ぶりの改訂◆◆ ・全ページをフルカラー化したので、図表もさらにわかりやすく! ・非定常時系列データ解析の基本を加筆(第8章を新設) データの見方や考え方から述べられた本当にほしかった入門書。 それぞれがもつ「予測したい」課題に自ら取り組むための基本を1冊にまとめた。 「モデリングが使えるということはわかった、これからは使いたい!」という人は必読。 統計のプロ中のプロが伝授する「匠の技」「匠の知恵」コラムも多数収録。 【推薦の言葉】 本書は予測のための統計的モデリングの方法を,基礎から具体的実践例に亘るまで明快に解説している特色ある著作である. 平易な記述でベイズの定理などの基礎から粒子フィルタやデータ同化などの先端的な内容までをカバーしている. 便利なブラックボックス型のAI予測では飽き足らず,自分が抱える具体的な課題に対して自らのアイデアを投入し,説明可能な予測をしてみようと思い立った人には必読の書である. ――北川 源四郎先生(東京大学特任教授、数理・データサイエンス教育強化拠点コンソーシアム 議長) 【まえがき(抜粋)】 統計学の強みは,生成モデルの構築に関する,さまざまな知見とノウハウの蓄積,またモデルに基づく意思決定の綿密な評価にある.ある種,モデリングに関する匠の技とも言える暗黙知に,統計学の存在感が増していくであろう.読者が本書を通じてこの暗黙知を習得されることを期待したい. 【目次】 〈基礎編〉 第1章 予測とは何かを考える 第2章 確率による記述:基礎体力をつける 第3章 統計モデル:予測機能を構造化する 第4章 計算アルゴリズム1:予測計算理論を学ぶ 〈展開編〉 第5章 計算アルゴリズム2:モデルを進化させる 第6章 粒子フィルタ:予測計算を実装する 第7章 乱数生成:不確実性をつくる 〈実践編〉 第8章 時系列解析の基本:傾向をつかむ 第9章 経験知の総結集:売上予測の精度を上げる 第10章 データ同化:シミュレーションの予測性能を向上させる 第11章 確率ロボティクス:お掃除ロボをつくる 〈基礎編〉 第1章 予測とは何かを考える  1.1 居酒屋の売上高の予測  1.2 期待感を数式で表す  1.3 パターンの表現 第2章 確率による記述:基礎体力をつける  2.1 確率の基礎  2.2 最適化問題から統計モデルへ 第3章 統計モデル:予測機能を構造化する  3.1 状態空間モデル  3.2 鎖状構造グラフィカルモデル  3.3 多次元ノイズの分布モデル 第4章 計算アルゴリズム1:予測計算理論を学ぶ  4.1 事後周辺分布  4.2 非線形フィルタリング  4.3 平滑化アルゴリズム  4.4 状態ベクトルの推定と予測誤差 〈展開編〉 第5章 計算アルゴリズム2:モデルを進化させる  5.1 状態ベクトルの拡大  5.2 学習によるモデルの改良 第6章 粒子フィルタ:予測計算を実装する  6.1 分布の近似  6.2 アルゴリズム  6.3 粒子フィルタの図説 第7章 乱数生成:不確実性をつくる  7.1 リサンプリングの実装  7.2 システムノイズの生成法  7.3 賢いリサンプリング  7.4 粒子フィルタの実装例 〈実践編〉 第8章 時系列解析の基本:傾向をつかむ  8.1 定常と非定常:非定常の特徴を目で確認する  8.2 定常化:原データにいろいろな操作を加える  8.3 非定常成分の抽出:シンプルな状態空間モデルを非定常データに適用する 第9章 経験知の総結集:売上予測の精度を上げる  9.1 観測モデル:データを徹底的に要素に分解する  9.2 勘と経験をとり込む  9.3 外生変数の影響を柔軟に表現する  9.4 状態空間モデルにまとめる  9.5 結果 第10章 データ同化:シミュレーションの予測性能を向上させる  10.1 シミュレーション計算  10.2 データ同化の状態空間モデルへの埋め込み  10.3 逐次データ同化 第11章 確率ロボティクス:お掃除ロボをつくる  11.1 自己位置推定問題  11.2 一般状態空間モデル表現  11.3 実際の適用

統計学辞典

啓, 竹内
東洋経済新報社
おすすめ度
65
紹介文
本辞典は、統計学の概念、法則、学説、制度、歴史などをなるべく平易に叙述するとともに、計算技術の著しい発達によるデータ解析の道具としての統計学の説明とその理論的背景について詳しく解説した。

独学プログラマー Python言語の基本から仕事のやり方まで

コーリー・アルソフ
日経BP
おすすめ度
65
紹介文
本書は「Pythonだけ」を学ぶ本ではありません。Pythonを使ってプログラミングを紹介していますが、伝えたい内容はPythonに限らない「プログラミング全般」の知識です。 本書の著者、コーリー・アルソフ(Cory Althoff)は、「独学プログラマー」です。本書は、彼が独学で、ゼロからプログラミングを学んだ体験に基づいて書かれました。 プログラミングを独学で身に付けるために、著者がPythonを通して学んだエッセンスが書かれています。彼の独学プログラマーとしての学び方は、Amazon.comでの本書の評価を見るとわかるように、多くの人に支持されています。 ――訳者あとがきより 第1部(Part1) 第1章 イントロダクション 第2章 さあ、はじめよう! 第3章 プログラミング入門 第4章 関数 第5章 コンテナ 第6章 文字列操作 第7章 ループ 第8章 モジュール 第9章 ファイル 第10章 知識を1つにまとめる 第11章 ハマったときの助け 第2部(Part2) 第12章 プログラミングパラダイム 第13章 オブジェクト指向プログラミングの4大要素 第14章 もっとオブジェクト指向プログラミング 第15章 知識を1つにまとめる 第3部(Part3) 第16章 Bash 第17章 正規表現 第18章 パッケージ管理 第19章 バージョン管理 第20章 知識を1つにまとめる 第4部(Part4) 第21章 データ構造 第22章 アルゴリズム 第5部(Part5)  第23章 プログラミングのベストプラクティス 第24章 プログラマーとしての最初の仕事 第25章 チームで働く 第26章 さらに学ぼう 第27章 次のステップ 第6部(Part6) 補章 より良いコードにするために 補章 継続して学ぶために 謝辞 訳者あとがき 索引 第1部(Part1) 第1章 イントロダクション 第2章 さあ、はじめよう! 第3章 プログラミング入門 第4章 関数 第5章 コンテナ 第6章 文字列操作 第7章 ループ 第8章 モジュール 第9章 ファイル 第10章 知識を1つにまとめる 第11章 ハマったときの助け 第2部(Part2) 第12章 プログラミングパラダイム 第13章 オブジェクト指向プログラミングの4大要素 第14章 もっとオブジェクト指向プログラミング 第15章 知識を1つにまとめる 第3部(Part3) 第16章 Bash 第17章 正規表現 第18章 パッケージ管理 第19章 バージョン管理 第20章 知識を1つにまとめる 第4部(Part4) 第21章 データ構造 第22章 アルゴリズム 第5部(Part5)  第23章 プログラミングのベストプラクティス 第24章 プログラマーとしての最初の仕事 第25章 チームで働く 第26章 さらに学ぼう 第27章 次のステップ 第6部(Part6) 補章 より良いコードにするために 補章 継続して学ぶために 謝辞 訳者あとがき 索引

問題解決力を高める「推論」の技術

羽田康祐 k_bird
フォレスト出版
おすすめ度
65
紹介文
外資系コンサルティングファームと大手広告代理店のハイブリッドキャリアが教える 答えなき時代の仮説と成果のつくり方。 外資系コンサルティングファームと大手広告代理店のハイブリッドキャリアが教える 答えなき時代の仮説と成果のつくり方。 帰納法・演繹法・アブダクションの 基礎だけであらゆる問題を解決! 生産性や実現可能性を高めるビジネス 「仮説」。さらに「問題解決力」。それ らに必須の推論の技術を解説します。 難しそうに感じるかもしれませんが、 必要なのは3つの推論の基礎だけ! 「推測力」とは◉仮説を立て、その質を高める能力 ◉ビジネス思考力の要となる能力 ◉分析力の向上に欠かせない能力 ◉コミュニケーションに必須の能力 ◉生産性の向上に役立つ能力 ◉提案力の向上に必要不可欠の能力

Pythonエンジニア ファーストブック

鈴木 たかのり
技術評論社
おすすめ度
65

AWSではじめるデータレイク: クラウドによる統合型データリポジトリ構築入門

上原 誠
テッキーメディア
おすすめ度
65
紹介文
新しいデータシステム「データレイク」をAWS(Amazon Web Services)で構築する方法を、クラウドのプロが充… 従来のデータベースを発展させた、クラウド時代のデータシステム「データレイク」をAWS(Amazon Web Services)上で実現するための指南書。クラウドのプロによる解説で概念と実践を充実解説。 「データレイク」は、大量データ分析/生成データの活用を視野に入れた新しいデータストアのかたちです。従来のデータベース/データウェアハウスの範囲に収まらない多様なデータを大量に保管し、高度な統計分析や機械学習に役立つ情報基盤を作ることが可能です。 本書ではデータレイクの概念や特徴、必要とされる機能などを基本から解説し、さらにAmazonが運営するパブリッククラウドサービスAWS(Amazon Web Services)で実現する方法を解説します。 従来では想定しえなかった大量のデータを確実に保管するため、データレイクの世界ではクラウドのようなサービス型インフラストラクチャの活用が注目されます。さらにAWSではオブジェクトストレージS3上のデータを直接分析するAmazon Athena、データウェアハウスのAmazon Redshift、機械学習を実現するAmazon SageMakerなど、データレイクを支えるさまざまな仕組みが存在します。 本書ではそれらの活用の指針を解説するとともに、後半ではシステムの構築例を具体的に解説していきます。ビジネスデータ分析とログなどの生成データ分析を例に、システム構築の流れを詳しく紹介し、機械学習や統計分析をビジネスの現場で活かせる仕組みの技術的なヒントを数多く提供します。 第1部 データレイクの概念と知識 序章 データレイ クを始めよう 第1章 データレイクの構築 第2章 データレイクの活用 第3章 データレイクの運用 第4章 データレイクのセキュリティ 第2部 データレイクの実践(基礎編) 第5章 ハンズオンの概要 ービジネスデータのデータレイクー 第6章 データを可視化する 第7章 サーバーレスSQLによるデータ分析 第8章 データを変換する 第9章 データを分析する(データウェアハウス) 第3部 データレイクの実践(応用編) 第10章 システムの概要 ーログデータのデータレイクー 第11章 ログを集める 第12章 ログの保管とカタログ化 第13章 ログを加工する 第14章 ログを分析する

Rで学ぶ確率統計学一変量統計編

正博, 神永
内田老鶴圃
おすすめ度
65

図解まるわかり データサイエンスのしくみ

増井 敏克
翔泳社
おすすめ度
65
紹介文
「図解まるわかり」シリーズ新刊。ビジネスパーソンの新たな基礎教養として注目される「データサイエンス」の基本が1冊でわかる。 分析手法からAIの基本まで、 知っておきたい知識を全部図解 【本書のポイント】 ・解説とイラストがセットで理解しやすい! ・グラフや値の種類、データ構造など、基礎知識から解説! ・技術関連の項目も図解。初心者にもわかりやすい! ・統計学やAIの基本などの周辺知識もしっかりカバー! ・情報社会におけるデータ活用の問題点や課題まで網羅! 【こんな方におすすめ】 ・データサイエンスの基本を知りたい人 ・業務でデータ分析に関わる人 ・AIの基礎や今後の課題など周辺知識まで知りたい人 ・現場の実態や出来事など、最新動向についても知りたい人 【内容紹介】 データを活用して、自社のビジネスやサービスに 生かそうという動きが活発化しています。 しかし、データの分析には幅広い知識が求められます。 本書では、データやグラフの種類、統計学の基本など、 基礎から周辺知識まで、データサイエンスを学ぶ際に 知っておきたいことを一通り解説しています。 見開きで1つのテーマを取り上げているので、 最初から順に読んで体系的な知識を得るのはもちろん、 気になるテーマやキーワードに注目しながら読むなど、 状況に合わせて活用してください。 【目次】 第1章 データサイエンスを支える技術~需要が高まる未来の必修科目~ 第2章 データの基本~データの表現方法と読み方~ 第3章 データの処理と活用〜データを分類し、予測する〜 第4章 知っておきたい統計学の知識~データから答えを導き出す~ 第5章 知っておきたいAIの知識〜よく使われる手法とそのしくみ〜 第6章 セキュリティとプライバシーの問題点~データ社会はどこに向かうのか?~ 第1章 データサイエンスを支える技術〜需要が高まる未来の必修科目〜 1-1 21世紀の資源 1-2 データが増えている理由 1-3 さまざまな知識を組み合わせて分析する 1-4 データから価値を見いだす職種 1-5 データはそのまま使えない 1-6 大量のデータは宝の山 1-7 人とコンピュータでは扱いやすいデータが異なる 1-8 データのためのデータを知る 1-9 データを1カ所にまとめる 1-10 効率のよい処理手順を考える 1-11 導き出したルールを使えるようにする 1-12 データを扱うプログラミング言語 1-13 誰でも無料で使えるデータ 1-14 楽しみながら分析手法を学ぶ 1-15 ITを中心に考える 1-16 分析されたデータの活用例 1-17 この商品を買っている人はこんな商品も買っています 1-18 データで値づけが変わる 1-19 小さいサイズから実際に試してみる 1-20 継続的に改善を進める 1-21 目標を決め、戦略的に進める 1-22 データに関わる人を把握する やってみよう データが使われている事例を調べてみよう 第2章 データの基本〜データの表現方法と読み方〜 2-1 データの種類 2-2 データを範囲で分ける 2-3 グラフを使い分ける 2-4 割合を表すグラフ 2-5 複数のデータを1つのグラフで表現する 2-6 データの基準を作る値 2-7 データの散らばり具合を把握する 2-8 1つの基準で判断する 2-9 不適切なデータを取り扱う 2-10 売上の8割は2割の商品で構成されている? 2-11 視覚的に表現する 2-12 誰でもデータを分析できる便利ツール 2-13 データを一元管理する 2-14 データの連携を考える 2-15 データの構造を可視化する 2-16 データベースを設計する 2-17 紙に印刷されたデータを取り込む 2-18 高い精度でデータを高速に取り込む やってみよう 伝えたい内容に合ったグラフを選んでみよう 第3章 データの処理と活用~データを分類し、予測する~ 3-1 取得するタイミングによって変わるデータ 3-2 プログラムが自動的に出力するデータ 3-3 長期間での変化を捉える 3-4 2つの軸の関係を把握する 3-5 見せかけの関係に騙されない 3-6 複数の軸で集計する 3-7 軸の数を減らして特徴を把握する 3-8 2点間の距離の考え方を知る 3-9 似たような角度を調べる 3-10 データ分析はかっこいい面だけではない 3-11 複数の軸の関係を明らかにする 3-12 高度な回帰分析を知る 3-13 分類を予測する 3-14 知っている知識から値を推定する 3-15 サイコロを振る操作を実現する 3-16 繰り返し予測して精度を高める 3-17 さまざまな分析手法を知る やってみよう アンケート結果を集計してみよう 第4章 知っておきたい統計学の知識〜データから答えを導き出す〜 4-1 統計学の種類 4-2 データを取り出す 4-3 起こりやすさを数値で表す 4-4 複数のことが同時に起きる確率を考える 4-5 結果から原因を考える 4-6 データの分布を知る 4-7 たくさんのデータを集めれば本来の値に近づく 4-8 関数で分布を表現する 4-9 取り出したデータから元の集団を推測する 4-10 分散がわからない状態で推定する 4-11 統計的に検証する 4-12 正しいと判断する基準を決める 4-13 検定結果を判断する 4-14 平均を検定する 4-15 分散を検定する やってみよう 身近な食品を使って検定してみよう 第5章 知っておきたいAIの知識〜よく使われる手法とそのしくみ〜 5-1 人のように賢いコンピュータを作る 5-2 人工知能を実現する手法 5-3 人工知能を評価する指標 5-4 学習の進行状況を把握する 5-5 脳を模倣した学習方法 5-6 少しずつ最適解に近づける 5-7 階層を深くし、大量のデータから学習 5-8 誤差を数値化する 5-9 精度を向上させる 5-10 複数のグループに分割する 5-11 任意の個数に分割する 5-12 木構造で学習する 5-13 複数のAIで多数決を取る 5-14 ルールを評価する指標 5-15 境界線からのマージンを最大化する 5-16 自動的に機械学習を実行する 5-17 さまざまな手法を組み合わせて解決法を見つける やってみよう 最新の論文を探してみよう 第6章 セキュリティとプライバシーの問題点〜データ社会はどこに向かうのか? 6-1 データを扱う上でのモラルを持つ 6-2 揺らぐデータの信頼性 6-3 誤った認識で揺らぐ精度 6-4 日本における個人情報の扱い 6-5 海外における個人情報の扱い 6-6 個人情報の活用を考える 6-7 データ流通と利活用を考える 6-8 データを扱うときのルールを決める 6-9 何のためにデータを集めるかを明示する 6-10 データが持つ権利を知る 6-11 外部のデータを自動的に取得する 6-12 保有するデータへのアクセスを管理する 6-13 内部からのデータの持ち出しを防ぐ 6-14 何度でも同じ結果が得られる やってみよう 使っているサービスのプライバシーポリシーを読んでみよう

データサイエンスのための統計学入門 ―予測、分類、統計モデリング、統計的機械学習とRプログラミング

Peter Bruce
オライリージャパン
おすすめ度
65
紹介文
50の重要な統計と機械学習の「コンセプト」について、多方面からの理解を促すよう構成。 50項目の基本的なコンセプトを過不足なく説明し、最低限の数式とコードで理解を深める! 50の重要な統計と機械学習の「コンセプト」について、簡潔かつ正確な説明と、それを裏付ける最低限の数式、クリアな可視化、実現するRコードを過不足なく提示することで、多方面からの理解を促します。1つの項目について、概念、数学的裏付け、プログラミングといった多方面からアプローチし、シンプルに説明しているので、概念と実例を結びつけることができ、知識を確実に自分のものにすることが可能です。実際に動かして概念を理解することができます。

Rで学ぶ確率統計学 多変量統計編

正博, 神永
内田老鶴圃
おすすめ度
64
紹介文
数理統計学とRの使い方を同時にマスター.既に刊行している「一変量統計編」の続刊.数理統計学とRをより実践的に活用できるよう工夫を凝らした書. 目 次: 第1章 分割表の検定(1) 1.1 統計で用いられるデータの種類 質的データ/量的データ 1.2 適合度検定 1.3 適合度検定をやってみる 1.4 カイ二乗統計量 1.5 尤度比検定 1.6 カイ二乗検定の数学的仕組み 1.7 章末問題 第2章 分割表の検定(2) 2.1 分割表の独立性の検定 2.2 2×2分割表 イエーツの補正/一般的な2×2分割表のカイ二乗値 2.3 母比率の差の検定 2標本の比率の検定の数学的原理 2.4 フィッシャーの正確検定 フィッシャーの正確検定の計算原理 2.5 独立性の検定が役に立つ場合 2.6 残差分析 2.7 章末問題 第3章 単回帰分析 3.1 散布図を近似する直線を求める 回帰直線の当てはまりのよさ/最小二乗法と最尤推定との関係 3.2 Rにおける決定係数 定数項(切片)を0とした場合 3.3 説明変数と被説明変数の取り方で回帰直線が変わること 3.4 外れ値の影響 3.5 章末問題 第4章 赤池情報量基準によるモデル選択 4.1 cars再考 4.2 AIC (赤池情報量基準) 4.3 AICについて カルバック=ライブラー情報量/正規分布に対する KL情報量 4.4 AICの導出の概略 4.5 KL情報量の性質についての補足 4.6 章末問題 第5章 線形モデル 5.1 線形モデルの定式化 5.2 最小二乗推定パラメータの性質 5.3 分散σ2の不偏推定量 5.4 母数の検定 5.5  ^α, ^β の分布を見る 5.6 章末問題 第6章 曲線の当てはめ 6.1 lmを用いた曲線当てはめがうまくいく場合 6.2 lmによる当てはめが使えない場合-非線形最小二乗法 6.3 nls関数に関するいくつかの注意 6.4 変数変換と直線回帰を組み合わせる方法 両対数グラフが直線的な場合/より複雑な変換を必要とする場合 6.5 章末問題 第7章 重回帰分析 (1) 7.1 ワインの価格を予想する 7.2 重回帰分析の原理 7.3 分析例 7.4 Excelファイルのデータを読み込む 7.5 章末問題 第8章 重回帰分析 (2) 8.1 多重共線性とは何か 8.2 多重共線性の数学的仕組み 8.3 多重共線性のシミュレーション例 8.4 正しく推定できる場合 8.5 交互作用 交互作用の例 8.6 ダミー変数 8.7 章末問題 第9章 一般化線形モデルの基礎 9.1 一般化線形モデルの定義 条件付き期待値/一般化線形モデルの概要 9.2 指数型分布族 指数型分布族の期待値と分散 9.3 フィッシャー情報行列 9.4 一般化線形モデルのパラメータ最尤推定 9.5 スコア関数の具体的な形 9.6 残差逸脱度 9.7 章末問題 第10章 二項選択モデル 10.1 二項選択モデルの考え方 10.2 ロジスティックモデルとプロビットモデル 10.3 ロジスティックおよびプロビット回帰分析の例 ロジットモデルとプロビットモデルの母数の推定値 10.4 より複雑なモデルへの適用 10.5 章末問題 第11章 計数データへの一般化線形モデルの適用 11.1 ポアソンモデル 11.2 ポアソンモデルの適用例 11.3 負の二項分布モデル 負の二項分布/warpbreaks 11.4 章末問題 第12章 多変量正規分布とその応用 12.1 多変量の正規分布 12.2 集中楕円 集中楕円を描いてみる 12.3 集中楕円と分散共分散行列の固有値の関係を確認する 相関係数の区間推定/二次元正規乱数の応用 12.4 相関のない二次元正規分布に対する t0の分布 相関係数の区間推定の数学的原理 12.5 章末問題 第13章 主成分分析 13.1 主成分分析の考え方 13.2 Rによる主成分分析 13.3 USArrestsを用いた分析例 13.4 章末問題 第14章 分散分析と多重比較入門 14.1 三群以上の比較問題 平均点に差があるか?/データの様子を調べる/Rによる一元配置分散分析 14.2 一元配置分散分析の数学的原理 全変動の分解公式/F分布 14.3 多重比較 ボンフェローニの方法/ホルムの方法/チューキーの方法 14.4 二元配置分散分析 14.5 章末問題

シリコンバレー一流プログラマーが教える Pythonプロフェッショナル大全

酒井 潤
KADOKAWA
おすすめ度
64
紹介文
現役シリコンバレーエンジニアが教える「最強のプログラミング」講義! 10万人が選んだ人気No.1オンライン講座が 超わかりやすくパワーアップして書籍化! 海外企業でも通用する 一流のプログラミング技術が学べます! ★基礎から応用、一流コードスタイルまで1冊で学べる★ 【応用編】ではニーズの高い実践的テクニックを中心に、 【入門編】では基礎から1歩ずつ、わかりやすく解説。 シリコンバレーのトップIT企業で活躍する著者が 世界標準のPythonスキルを一気に伝えます。 ★海外でも通用する 一流のプログラミング技術が身につく★ 知っていましたか?  アメリカのエンジニアの年収は日本の5~10倍です。 本書は「いつか海外で活躍したい」、 そんな夢の実現も強力にバックアップしてくれる 「海外進出の道しるべ」ともなる一冊です。 ★10万人が選んだ人気No.1講座の書籍化★ 本書のもととなったのは、オンライン講座Udemyで人気No.1を獲得したPython講座。 本格的な内容をわかりやすく伝える著者の講座は人気が高く、延べ20万人以上が受講しています(全講座計)。 本書はさらに内容を充実させてパワーアップ! 自分のペースでしっかり学べます。 独学の強い味方、「サンプルコード」の無料ダウンロードサービス付き。 ★エンジニアの成功戦略も教えます★ コラムでは、エンジニアのキャリア戦略の立て方、成功するポイント、独学のコツなども紹介。 文系出身、TOEIC300点代からスタートした著者が渾身のエールを送ります。 ★用語集、Pointなども充実★ コードを書くときの注意点、知っておきたい豆知識、 開発の現場で必要なことなどは 「Point」としてたっぷり掲載。 巻末には「用語集」も収録し、 徹底して実践的な内容となっています。 オンライン講座Udemyで9万人以上が選んだ人気No.1講座を完全書籍化! 超わかりやすくパワーアップして、基礎から応用、一流コードスタイルまで、世界で通用する「最強のプログラミング」が学べる! 学習を始める前に ~Pythonの環境設定 【入門編】 Lesson 1 Pythonの基本  1 変数の宣言と数値の計算をマスターしよう  2 文字列のさまざまな操作方法 Lesson 2 データ構造  1 複数データを並列にまとめる  2 変更できないリスト? いえ、タプルです  3 キーと値をセットで記憶する辞書型  4 データ同士の演算ができる集合 Lesson 3 制御フロー  1 読みやすいコードを書こう  2 条件に応じて処理を分岐させよう  3 繰り返し処理でデータを一気に処理しよう Lesson 4 関数と例外処理  1 何度も実行する処理の関数を作ろう  2 関数の応用をマスターしよう  3 内包表記でリストをシンプルに生成しよう  4 変数の有効範囲  5 例外処理 Lesson 5 モジュールとパッケージ  1 作成したパッケージをインポートしよう  2 Pythonのライブラリの使い方 Lesson 6 オブジェクトとクラス  1 クラスとメソッド  2 クラスをもっと活用してみよう Lesson 7 ファイル操作とシステム  1 ファイルの基本的な操作  2 ファイルの便利な活用方法  3 圧縮ファイルを扱おう  4 さらに高度なファイルに関する操作 【演習編】 Lesson 8 簡単なアプリケーションを作ってみよう 【応用編】 Lesson 9 コードスタイル  1 Pythonのコードスタイル  2 さらにくわしくPythonの書き方を知ろう Lesson 10 コンフィグとロギング  1 設定ファイルのさまざまな形式  2 ロギングの基本と適切な書き方  3 ログをメールで送信しよう  4 実行環境を切り替えて使う Lesson 11  Webとネットワーク  1 Webでよく使うファイル形式  2 Pythonで通信してみよう  3 PythonでWeb サーバーを作ろう  4 Webスクレイピングしてみよう Lesson 12 並列化  1 マルチスレッドで並列化しよう  2 マルチプロセスによる並列化  3 高水準のインターフェースを使って並列化しよう Lesson 13 データ解析  1 データ解析を始める前に  2 データをまとめて扱うnumpy  3 pandasで表形式のデータを扱う  4 matplotlibでグラフを描画する  5 scikit-learnで機械学習を行う  6 株価のデータ解析と予測

科学的論理思考のレッスン (【BOW BOOKS 009】)

高木敏行
中央経済社
おすすめ度
64
紹介文
流行のデータサイエンス、何を知っていたらいいのか? いざという時のビジネスパーソン必携書。 本書では、4種の科学的論理思考法である演繹推論、帰納推論、アブダクション、データ科学推論について紹介。いざという時のためのビジネスパーソン必携書。(発行=BOW&PARTNERS)

深層学習 (機械学習プロフェッショナルシリーズ)

岡谷 貴之
講談社
おすすめ度
64
紹介文
基礎から、SGD、自己符号化器、CNN、RNN、ボルツマンマシンまでと、盛りだくさん。軽快な語り口で、無理なく理解できる! いま最も注目されている機械学習手法である深層学習(ディープラーニング)を、トップ研究者が解説した。基礎から、SGD、自己符号化器、CNN、RNN、ボルツマンマシンまでと、盛りだくさん。軽快な語り口なので、無理なく理解できる! 【機械学習プロフェッショナルシリーズ】 本シリーズでは、発展著しい機械学習技術の数学的な基礎理論、実用的なアルゴリズム、それらの活用法を、全29巻にわたって刊行する。 ビッグデータ時代を牽引している若手・中堅の現役研究者が、入門的な内容から最先端の研究成果までをわかりやすく解説。 これからデータサイエンス分野で研究を始めようとしている大学生・大学院生、および、機械学習技術を基礎科学や産業に応用しようとしている研究者・技術者に向けた注目のシリーズである。 全29巻のうち第1期として、以下の4点を同時刊行! 『機械学習のための確率と統計』杉山 将・著 『深層学習』岡谷 貴之・著 『オンライン機械学習』海野 裕也/岡野原 大輔/得居 誠也/徳永 拓之・著 『トピックモデル』岩田 具治・著 第2期の刊行は2015年8月、第3期の刊行は2015年12月の予定(^o^)/ 【シリーズ編者】 杉山 将 東京大学大学院新領域創成科学研究科 教授 第1章 はじめに 第2章 順伝播型ネットワーク 第3章 確率的勾配降下法 第4章 誤差逆伝播法 第5章 自己符号化器 第6章 畳込みニューラルネット 第7章 再帰型ニューラルネット 第8章 ボルツマンマシン

Head First Python 第2版 ―頭とからだで覚えるPythonの基本

Paul Barry
オライリージャパン
おすすめ度
64
紹介文
イラストや写真を多用したビジュアル重視の紙面で初心者に直観的に理解できると人気のHead FirstシリーズのPython版 人気の入門書、Head Firstシリーズ待望のPythonバージョン! イラストや写真を多用したビジュアル重視の紙面で初心者に直観的に理解できると人気のHead FirstシリーズのPython版です。前半でPythonの基本を一通り説明してから、実際に独自のWebアプリケーションをステップバイステップで構築する作業通じて、データベース管理、例外処理、データ処理などの理解を深めていきます。手を動かしながら学べる入門書の決定版です。

RとStanではじめる 心理学のための時系列分析入門 (KS心理学専門書)

小森 政嗣
講談社
おすすめ度
64
紹介文
経済学向けの入門書にはない「心理学」のための具体例を紹介! コードも豊富ですぐ試せる。次世代の心理学研究者、必携の入門書! リアルタイムで変化する、状況・思考・感情を捉える! 経済学向けの入門書にはない「心理学」のための具体例を紹介! ●人々のSNS投稿から睡眠時間の周期を調べる ●気分と活動量の経時的な変化を捉える ●行動が変化する瞬間を見つけ出す もちろん、Rの基礎からサポート。 サンプルコードも豊富ですぐに試せる! 心理学研究者、必携の入門書! (まえがきより抜粋) 本書は、「心理学の研究テーマで時系列データの分析をしてみたい」と考えている方に向けた入門書です。人間の行動や認知を時系列的に捉えたデータを収集・分析してみたいものの、どんな分析方法があるのか見当がつかなかったり、時系列データ分析にはどのような注意点があるのかがわからなかったりする方々への、最初のガイドになるよう心がけました。 心理学の研究をしていれば,ある瞬間だけを切り出したデータではなく、日常生活の中で刻一刻と変化し続ける人間の行動や認知を捉えてみたい、と考えることがあると思います。私自身も、人の一生分の行動データをすべて集めることができたらどんなに楽しいだろう、と夢想することがあります。現在では、スマートフォンなどのデバイスを使えば、人間のその時々の状況や思考、感情、行動などをリアルタイムで記録することも難しくはなくなってきました。時系列データを収集するハードルは、かつてないほど下がっているといえるでしょう。 一方で、時系列データを分析するための方法論は、どこから手を付けていいのかわかりにくいものです。がんばってコツコツとデータを集めてみたものの、時系列のリッチな情報をうまく活用できず、そのままお蔵入りになってしまうこともしばしばです。 本書の目標は、せっかく測定した貴重な時系列データをお蔵入りにしてしまわないことです。そのために、本書では移動軌跡や体の動き、SNS の書き込みのように、できるだけ人間の具体的な行動のデータを取り上げました。 (目次) 第1章 心理学と時系列データ分析 第2章 時系列分析の基本操作 第3章 時系列の回帰分析 第4章 RStanによる状態空間モデル 第5章 時系列データ同士の関係の評価 第6章 多変量時系列データの要約 第1章 心理学と時系列データ分析 第2章 時系列分析の基本操作 第3章 時系列の回帰分析 第4章 RStanによる状態空間モデル 第5章 時系列データ同士の関係の評価 第6章 多変量時系列データの要約

マネー・ボール〔完全版〕 (ハヤカワ・ノンフィクション文庫)

マイケル・ルイス
早川書房
おすすめ度
64
紹介文
1990年代末、オークランド・アスレチックスは資金不足から戦力が低下し、成績も沈滞していた。新任ゼネラルマネジャーのビリー・ビーンは、かつて将来を嘱望されながら夢破れてグラウンドを去った元選手だ。彼は統計データを駆使した野球界の常識を覆す手法で球団を改革。チームを強豪へと変える-"奇跡"の勝利が感動を呼ぶ!ブラッド・ピット主演で映画化された傑作ノンフィクション、待望の全訳版。

ゼロから作るDeep Learning ―Pythonで学ぶディープラーニングの理論と実装

斎藤 康毅
オライリージャパン
おすすめ度
64
紹介文
ディープラーニングの本格的な入門書。外部のライブラリに頼らずPython 3によってゼロからディープラーニングを作成できる。 実際にシステムを作りながらディープラーニングを学ぶ! ディープラーニングの本格的な入門書。外部のライブラリに頼らずに、Python 3によってゼロからディープラーニングを作ることで、ディープラーニングの原理を楽しく学びます。ディープラーニングやニューラルネットワークの基礎だけでなく、誤差逆伝播法や畳み込みニューラルネットワークなども実装レベルで理解できます。ハイパーパラメータの決め方や重みの初期値といった実践的なテクニック、Batch NormalizationやDropout、Adamといった最近のトレンド、自動運転や画像生成、強化学習などの応用例、さらには、なぜディープラーニングは優れているのか? なぜ層を深くすると認識精度がよくなるのか? といった“Why”に関する問題も取り上げます。

プログラマーになりたい! 改訂新版

長岡 英史
日経BP
おすすめ度
64
紹介文
プログラマーを仕事にしたいなら、まずはひと通りの“開発”を体験してみませんか。スキルアップのための指針が必ず見つかります! ■ 開発の仕事をWebアプリケーションで実体験! 「プログラマーが足りない!」との指摘をよく耳にします。プログラマーやソフトウェアエンジニアを目指している人も多いことでしょう。でも、ゼロから目指すとなると未経験ということに…。何から勉強すればいいか、迷うこともあるのではないでしょうか。 そこで、まずは本書でソフトウェアの開発を“経験”してみませんか? 本書では、たとえプログラミング経験がない人でも、プログラムを作って、サーバーに転送し、誰にでも使ってもらえるようにWeb上のサービスとして公開するところまでできるよう、必要な作業やプロセスを解説しました。プログラミング経験がまったくなくても、本書の解説に沿って作業を進めていけば自分のサービスとしてアプリケーションを公開するところまでひと通りの開発を自分の手で実現できます。 本書を通じて開発したWebアプリケーションは、面接でアピールできる自分の実績になります。面接の場ではぜひ胸を張って「こういうアプリケーションを独力で公開しました」と見てもらってください。 プログラミングを学ぶ際の王道は、文法の基礎からコツコツと学んでいくこと。それはもちろん大事です。でも、それだけだといつになったら何らかのアプリケーションを作れるようになるのか、その道筋がわからず行き詰まってしまう人も少なくありません。 その点で、本書でコーディングからデプロイまで、アプリケーション開発を“実際にやってみる”ことにより、コツコツと学んだ基礎が実際の開発現場でどのように役立つのか、必要とされるのかを実感することができるでしょう。もし、基礎を学びながらモヤモヤとしたものを抱え、学習がはかどらなくなってしまっているのなら、いったん本書で全体像を把握してみることをお薦めします。全体を見渡すことで、基礎の重要性がわかると学習の効率も格段に上がるはず。 本書で取り上げた主なサービスやツールは、AWS(Amazon Web Services)、Django、Git、Herokuです。すべてクラウドで完結しているので、お手元の環境のOSやスペックに依存せず、Webを利用できる環境であれば誰でも同じように開発プロセスをトレースできます。 第1章 プログラマーと開発の仕事 第2章 Webアプリケーション開発の基本 第3章 Pythonの基礎の基礎 第4章 Webアプリ開発――開発環境の作成 第5章 Webアプリ開発――コーディング 第6章 Webアプリ開発――デプロイ 第7章 これからのスキルアップ戦略

退屈なことはPythonにやらせよう ―ノンプログラマーにもできる自動化処理プログラミング

Al Sweigart
オライリージャパン
おすすめ度
64
紹介文
手作業だと膨大に時間がかかる処理を一瞬でこなすPython 3プログラムの作り方について学べる入門書。 Pythonによる自動処理入門。とにかく、わかりやすい! ファイル名の変更や表計算のデータ更新といった作業は、日々の仕事の中で頻繁に発生します。ひとつふたつ修正するだけであれば問題はありません。しかし、それが数十、数百となってくると手に負えません。そのような単純な繰り返し作業はコンピュータに肩代わりしてもらうとすごくラクになります。本書では、手作業だと膨大に時間がかかる処理を一瞬でこなすPython 3プログラムの作り方について学びます。対象読者はノンプログラマー。本書で基本をマスターすれば、プログラミング未経験者でも面倒な単純作業を苦もなくこなす便利なプログラムを作れるようになります。さらに、章末の練習問題を解くことで、類似のタスクを自動処理するスキルをもっと高めることができます。

実践Data Scienceシリーズ データ分析のためのデータ可視化入門 (KS情報科学専門書)

キーラン・ヒーリー
講談社
おすすめ度
64
紹介文
全世界のRユーザーが絶賛したベストセラーがついに翻訳! ggplotとtidyverseの事前知識ゼロでもすぐに実践できる! ★全世界のRユーザーが絶賛したベストセラー“Data Visualization: A Practical Introduction”がついに翻訳!! ・データ可視化の奥深さを、すべての人に! ・ggplotとtidyverseの事前知識ゼロでも、すぐに実践できる! ・可視化の手順はもちろん、「データをどう見せるか」という意図まで踏み込んで解説! 【サポートページ】 https://github.com/uribo/kspub-dataviz 【推薦の言葉:原著刊行にあたって】 この本は,学生や実務家がデータを定量的可視化して研究結果を最大限に活用するために必要な実践的なスキルを提供します. ・Rとggplot2を使用したハンズ・オン形式の実践的な入門を提供します. ・tidyverseを使うことでRの作業をより簡単に,より一貫性のあるものにする方法を示します. ・データセット,コード,関数が含まれたパッケージを含んでいます. ――エリザベス・ブルッフ(Elizabeth Bruch) ミシガン大学 この本はデータの可視化法を読者に教えるだけでなく,データ可視化がなぜ優れた社会学において不可欠なものであるのか丁寧に考察しているすばらしい本です.どのレベルの学生であっても簡単に本書に取り組むことができるでしょう. ――ベッキー・ペッティ(Becky Petti) テキサス大学オースティン校 ヒーリーは定量的なデータ可視化のプロセスに対して独創的な入門書を作りました.このすばらしい一貫した論じ方は,解析の初心者にも上級者にも学びが大きいでしょう.このような本は他にはありません. ――トーマス・J・リーパー(Thomas J. Leeper) ロンドン・スクール・オブ・エコノミクス 【主な内容】 第1章 データを見る 第2章 さあ,始めよう! 第3章 プロットを作る 第4章 正しい数値の示し方 第5章 データの整形・ラベル・メモの追加 第6章 モデルデータの可視化 第7章 地図を描画する 第8章 プロットを整える 付録A 第1章 データを見る 1.1 なぜデータを見るのか 1.2 悪いグラフのどこが悪いのか 1.3 知覚とデータ可視化 1.4 視覚的タスクとグラフの復号化 1.5 データ表現のための表象の種類と形式 1.6 誠実さと適切な判断に関する問題 1.7 グラフに関する明確な思考 1.8 次の一手 第2章 さあ,始めよう! 2.1 プレーンテキストでのR Markdownを使った作業 2.2 RとRStudioを利用する 2.3 Rについて知っておくべきこと 2.4 自分自身,Rへの忍耐 2.5 Rにデータを読み込ませる 2.6 最初の図を作る 2.7 次の一手 第3章 プロットを作る 3.1 ggplotはどうやって動くのか 3.2 tidyデータ 3.3 マッピングがデータと表示物を結びつける 3.4 プロットをレイヤーごとに作り上げていく 3.5 審美的要素のマッピングとテーマの設定 3.6 審美的要素はgeomでもマッピングできる 3.7 保存しよう 3.8 次の一手 第4章 正しい数値の示し方 4.1 文法としては正しいが意味をなさない 4.2 グループ別データに対応する審美的要素 4.3 複数の図を並べるためのfacet_ 関数群 4.4 geomによるデータの変換 4.5 回りくどく度数分布表を描いてみる 4.6 ヒストグラムと密度プロット 4.7 不要な変換を避ける 4.8 次の一手 第5章 データの整形・ラベル・メモの追加 5.1 パイプを使ったデータの集計 5.2 グループ化・カテゴリ化された連続変数の取り扱い 5.3 図にテキストを直接描画する 5.4 特定のデータへのラベリング 5.5 図内への描画と書き込み 5.6 scale_関数・guides()関数・theme()関数 5.7 次の一手 第6章 モデルデータの可視化 6.1 複数の回帰直線を凡例付きで一度に図示する 6.2 モデルオブジェクトの中身を確認する 6.3 モデルから図に使えるデータを正しく抽出する 6.4 予測の図示 6.5 broomパッケージによるtidyなモデルオブジェクトの取り扱い 6.6 グループ化したデータの分析およびリスト列の取り扱い 6.7 限界効果の可視化 6.8 複雑な調査データの可視化 6.9 次の一手 第7章 地図を描画する 7.1 アメリカ合衆国の州単位での地図 7.2 階級区分に頼らないアメリカ合衆国の地図 7.3 地理的な空間配置を考慮したグラフ 7.4 複数の地図を1枚の図にまとめる 7.5 そのデータは本当に空間情報を含みますか 7.6 次の一手 第8章 プロットを整える 8.1 色を使いこなす 8.2 色とテキストを一緒に重ねる 8.3 テーマを使ってプロットの外観を変更する 8.4 テーマ要素を実務的に使う 8.5 ケーススタディ 8.6 次の一手 付録A

マンガでわかる統計学

信, 高橋
オーム社
おすすめ度
64
紹介文
トキメキ統計学 データの種類をたしかめよう! データ全体の雰囲気をつかもう!(数量データ編 カテゴリーデータ編) 基準値と偏差値 確率を求めよう! 2変数の関連を調べよう! 独立性の検定をマスターしよう! Excelで計算してみよう!

統計・確率の意味がわかる―数学の風景が見える

昭弘, 野崎
ベレ出版
おすすめ度
64

退屈なことはPythonにやらせよう 第2版 ―ノンプログラマーにもできる自動化処理プログラミング

Al Sweigart
オライリージャパン
おすすめ度
64
紹介文
日常業務でよく直面する面倒で退屈な作業を、Pythonと豊富なモジュールを使って自動化!ベストセラーの改訂版。 和書5万部突破のベストセラー書の改訂版! 一歩先行くハイパフォーマンスなビジネスパーソンからの圧倒的な支持を獲得し、自作RPA本の草分けとして大ヒットしたベストセラー書の改訂版。劇的な「業務効率化」「コスト削減」「生産性向上」を達成するには、単純な繰り返し作業の自動化は必須です。本書ではWordやExcel、PDF文書の一括処理、Webサイトからのダウンロード、メールやSMSの送受信、画像処理、GUI操作といった日常業務でよく直面する面倒で退屈な作業を、Pythonと豊富なモジュールを使って自動化します。今回の改訂では、GmailやGoogleスプレッドシートの操作、Pythonと各種モジュールの最新版への対応、演習等を増補しています。日本語版では、PyInstallerによるEXEファイルの作成方法を巻末付録として収録しました。

統計的学習の基礎 ―データマイニング・推論・予測―

Trevor Hastie
共立出版
おすすめ度
64
紹介文
 機械学習とは,コンピュータに学習能力を持たせるための方法論を研究する学問の名称であり,もともとは人工知能分野の一部として研究されていた。その後,機械学習は統計学と密接な関わりを持つようになり,「統計的学習」として独自の発展の道を歩み始めた。そして,1990年代から現在に至るまでの計算機やインターネットの爆発的な普及と相まって統計的学習の技術は目覚ましい発展を遂げ,いまや情報検索,オンラインショッピングなど,われわれの日常生活とは切り離すことのできない情報通信技術の根幹を支える重要な要素技術の一つとなった。  本書は,このような発展著しい統計的学習分野の世界的に著名な教科書である“The Elements of Statistical Learning” の全訳である。回帰や分類などの教師あり学習の入門的な話題から,ニューラルネットワーク,サポートベクトルマシンなどのより洗練された学習器,ブースティングやアンサンブル学習などの学習手法の高度化技術,さらにはグラフィカルモデルや高次元学習問題に対するスパース学習法などの最新の話題までを幅広く網羅しており,計算機科学などの情報技術を専門とする大学生・大学院生,および,機械学習技術を基礎科学や産業に応用しようとしている大学院生・研究者・技術者にとって最適な教科書である。 第1章 序章 第2章 教師あり学習の概要 2.1 導入 2.2 変数の種類と用語 2.3 予測のための二つの簡単なアプローチ:最小2乗法と最近傍法   2.3.1 線形モデルと最小2乗法   2.3.2 最近傍法   2.3.3 最小2 乗法から最近傍法へ 2.4 統計的決定理論 2.5 高次元での局所的手法 2.6 統計モデル,教師あり学習,関数近似   2.6.1 同時分布Pr(X,Y) のための統計モデル   2.6.2 教師あり学習   2.6.3 関数近似 2.7 構造化回帰モデル   2.7.1 なぜ問題が困難なのか 2.8 制限付き推定法   2.8.1 粗度に対する罰則とベイズ法   2.8.2 カーネル法と局所回帰   2.8.3 基底関数と辞書による方法 2.9 モデル選択と,バイアスと分散のトレードオフ 第3章 回帰のための線形手法 3.1 導入 3.2 線形回帰モデルと最小2乗法   3.2.1 例:前立腺癌   3.2.2 ガウス=マルコフ定理   3.2.3 単純な単回帰から重回帰へ   3.2.4 複数の目的変数 3.3 変数選択   3.3.1 最良変数組み合わせ選択   3.3.2 前向き/後向き漸次的選択法   3.3.3 前向き段階的回帰   3.3.4 例:前立腺癌(続き) 3.4 縮小推定   3.4.1 リッジ回帰   3.4.2 lasso   3.4.3 考察:部分集合選択,リッジ回帰,lasso   3.4.4 最小角回帰 3.5 入力に対して線形変換を行う方法   3.5.1 主成分回帰   3.5.2 部分最小2乗法 3.6 考察:選択法と縮小法の比較 3.7 複数の目的変数の縮小推定と変数選択 3.8 lasso と関連する解追跡アルゴリズムに関する詳細   3.8.1 逐次前向き段階的回帰   3.8.2 区分的線形解追跡アルゴリズム   3.8.3 ダンツィク選択器   3.8.4 グループlasso   3.8.5 lasso の性質について   3.8.6 総当たり座標最適化 3.9 計算上考慮すべき事柄 第4章 分類のための線形手法 4.1 導入 4.2 指示行列の線形回帰 4.3 線形判別分析   4.3.1 正則化判別分析   4.3.2 線形判別分析の計算   4.3.3 階数低減型線形判別分析 4.4 ロジスティック回帰   4.4.1 ロジスティック回帰モデルの当てはめ   4.4.2 例:南アフリカの心臓疾患データ   4.4.3 2 次近似と2 次推測   4.4.4 L1 正則化付きロジスティック回帰   4.4.5 ロジスティック回帰か線形判別分析か 4.5 分離超平面   4.5.1 ローゼンブラットのパーセプトロン学習アルゴリズム   4.5.2 最適分離超平面 第5章 基底展開と正則化 5.1 導入 5.2 区分的多項式とスプライン   5.2.1 3次自然スプライン   5.2.2 例:南アフリカの心臓疾患データ   5.2.3 例:音素認識 5.3 フィルタリングと特徴抽出 5.4 平滑化スプライン   5.4.1 自由度と平滑化行列 5.5 平滑化パラメータの自動選択   5.5.1 固定自由度   5.5.2 バイアスと分散のトレードオフ 5.6 ノンパラメトリックロジスティック回帰 5.7 多次元スプライン 5.8 正則化と再生核ヒルベルト空間   5.8.1 カーネルにより生成される関数空間   5.8.2 再生核ヒルベルト空間の例 5.9 ウェーブレット平滑化   5.9.1 ウェーブレット基底とウェーブレット変換   5.9.2 適応的ウェーブレットフィルタリング 第6章 カーネル平滑化法 6.1 1次元カーネル平滑化手法   6.1.1 局所線形回帰   6.1.2 局所多項式回帰 6.2 カーネル幅の選択 6.3 R^p における局所回帰 6.4 R^p における構造化局所回帰モデル   6.4.1 構造化カーネル   6.4.2 構造化回帰関数 6.5 局所尤度およびその他の手法 6.6 カーネル密度推定と識別   6.6.1 カーネル密度推定   6.6.2 カーネル密度分類器   6.6.3 単純ベイズ分類器 6.7 動径基底関数とカーネル 6.8 密度推定と識別のための混合モデル 6.9 計算上考慮すべき事柄 第7章 モデルの評価と選択 7.1 導入 7.2 バイアス,分散,モデルの複雑度 7.3 バイアス-分散分解   7.3.1 例:バイアスと分散のトレードオフ 7.4 訓練誤差の最善度 7.5 訓練標本外誤差の推定 7.6 有効パラメータ数 7.7 ベイズ法とベイズ情報量規準 7.8 最小記述長 7.9 バプニック=チェルボネンキス次元   7.9.1 例(続き) 7.10 交差確認   7.10.1 K分割交差確認   7.10.2 交差確認を実行する正しい方法と間違った方法   7.10.3 交差確認は本当に有効か 7.11 ブートストラップ法   7.11.1 例(続き) 7.12 条件付きテスト誤差か期待テスト誤差か 第8章 モデル推論と平均化 8.1 導入 8.2 ブートストラップと最尤推定法   8.2.1 平滑化の例   8.2.2 最尤推定による推論   8.2.3 ブートストラップ法vs.最尤推定 8.3 ベイズ法 8.4 ブートストラップ法とベイズ推論の関係 8.5 EM アルゴリズム   8.5.1 要素が二つの混合モデル   8.5.2 一般の場合のEM アルゴリズム   8.5.3 最大化-最大化手法としてのEM 8.6 事後確率分布から標本抽出するためのMCMC 8.7 バギング   8.7.1 例:模擬データによる木 8.8 モデルの平均と統合 8.9 確率的探索:バンピング 第9章 加法的モデル,木,および関連手法 9.1 一般化加法的モデル   9.1.1 加法的モデルの当てはめ   9.1.2 例:加法的ロジスティック回帰   9.1.3 まとめ 9.2 木に基づく方法   9.2.1 背景   9.2.2 回帰木   9.2.3 分類木   9.2.4 他の問題   9.2.5 例:スパムメール(続き) 9.3 抑制的規則導出法   9.3.1 例:スパムメール(続き) 9.4 多変量適応的回帰スプライン   9.4.1 例:スパムメール(続き)   9.4.2 例:試行データ   9.4.3 その他の話題 9.5 階層的エキスパート混合モデル 9.6 欠損データ 9.7 計算上考慮すべき事柄 第10章 ブースティングと加法的木 10.1 ブースティング法   10.1.1 本章の概要 10.2 ブースティングの加法的モデル当てはめ 10.3 前向き段階的加法的モデリング 10.4 指数損失とアダブースト 10.5 なぜ指数損失関数か 10.6 損失関数とロバスト性 10.7 データマイニングの「万能」手法 10.8 例:スパムデータ 10.9 ブースティング木 10.10 勾配ブースティングによる数値最適化   10.10.1 最急降下法   10.10.2 勾配ブースティング   10.10.3 勾配ブースティングの実装 10.11 ブースティングのための木の適切な大きさ 10.12 正則化   10.12.1 縮小法   10.12.2 部分標本化 10.13 説明性   10.13.1 予測変数の相対的重要性   10.13.2 部分依存図 10.14 具体例   10.14.1 カリフォルニアの住宅   10.14.2 ニュージーランドの魚   10.14.3 個人属性情報データ 第11章 ニューラルネットワーク 11.1 導入 11.2 射影追跡回帰 11.3 ニューラルネットワーク 11.4 ニューラルネットワークの当てはめ 11.5 ニューラルネットワークを訓練するときのいくつかの問題   11.5.1 初期値   11.5.2 過学習   11.5.3 入力のスケーリング   11.5.4 隠れユニットと隠れ層の数   11.5.5 複数の極小解 11.6 例:試行データ 11.7 例:郵便番号データ 11.8 考察 11.9 ベイズニューラルネットワークとNIPS 2003 チャレンジ   11.9.1 ベイズ,ブースティング,バギング   11.9.2 性能比較 11.10 計算上考慮すべき事柄 第12章 サポートベクトルマシンと適応型判別 12.1 導入 12.2 サポートベクトル分類器   12.2.1 サポートベクトル分類器の計算   12.2.2 例:混合分布(続き) 12.3 サポートベクトルマシンとカーネル   12.3.1 分類のためのSVM の計算   12.3.2 罰則化手法としてのSVM   12.3.3 関数推定と再生核   12.3.4 SVM と次元の呪い   12.3.5 SVM 分類器のための解追跡アルゴリズム   12.3.6 回帰のためのSVM   12.3.7 回帰とカーネル   12.3.8 考察 12.4 線形判別分析の一般化 12.5 適応型判別分析   12.5.1 FDA 推定値の計算 12.6 罰則付き判別分析 12.7 混合判別分析   12.7.1 例:波形データ 12.8 計算上考慮すべき事柄 第13章 プロトタイプ法と最近傍探索 13.1 導入 13.2 プロトタイプ法   13.2.1 K 平均クラスタリング   13.2.2 学習ベクトル量子化   13.2.3 混合ガウス分布 13.3 k 最近傍分類器   13.3.1 例:比較研究   13.3.2 例:k 最近傍法と画像シーンの分類   13.3.3 不変計量と接距離 13.4 適応的最近傍法   13.4.1 例   13.4.2 最近傍探索のための大域的な次元削減 13.5 計算上考慮すべき事柄 第14章 教師なし学習 14.1 導入 14.2 相関ルール   14.2.1 バスケット分析   14.2.2 アプリオリアルゴリズム   14.2.3 例:バスケット分析   14.2.4 教師あり学習としての教師なし学習   14.2.5 一般化相関ルール   14.2.6 教師あり学習法の選び方   14.2.7 例:バスケット分析(続き) 14.3 クラスタ分析   14.3.1 類似度行列   14.3.2 属性に基づく非類似度   14.3.3 オブジェクト間非類似度   14.3.4 クラスタリングアルゴリズム   14.3.5 組み合わせアルゴリズム   14.3.6 K 平均クラスタリング   14.3.7 ソフトなK 平均クラスタリングとしての混合ガウス分布   14.3.8 例:ヒト腫瘍マイクロアレイデータ   14.3.9 ベクトル量子化   14.3.10 K メドイドクラスタリング   14.3.11 実用上の問題   14.3.12 階層的クラスタリング 14.4 自己組織化マップ 14.5 主成分分析と主曲線・主曲面   14.5.1 主成分分析   14.5.2 主曲線と主曲面   14.5.3 スペクトラルクラスタリング   14.5.4 カーネル主成分分析   14.5.5 疎主成分分析 14.6 非負値行列分解   14.6.1 原型分析 14.7 独立成分分析と探索的射影追跡   14.7.1 隠れ変数と因子分析   14.7.2 独立成分分析   14.7.3 探索的射影追跡法   14.7.4 独立成分分析への直接的アプローチ 14.8 多次元尺度構成法 14.9 非線形次元削減と局所多次元尺度構成法 14.10 Google ページランクのアルゴリズム 第15章 ランダムフォレスト 15.1 導入 15.2 ランダムフォレストの定義 15.3 ランダムフォレストの詳細   15.3.1 抜取標本   15.3.2 変数重要度   15.3.3 類似度図   15.3.4 ランダムフォレストと過学習 15.4 ランダムフォレストの解析   15.4.1 分散と無相関効果   15.4.2 バイアス   15.4.3 適応型最近傍法 第16章 アンサンブル学習 16.1 導入 16.2 ブースティングと正則化軌跡   16.2.1 罰則付き回帰   16.2.2 「まばらなところに賭けろ」の法則   16.2.3 正則化軌跡,過学習,マージン 16.3 アンサンブルの学習   16.3.1 良いアンサンブルを学習する   16.3.2 規則のアンサンブル 第17章 無向グラフィカルモデル 17.1 導入 17.2 マルコフグラフとその性質 17.3 連続変数に対する無向グラフィカルモデル   17.3.1 グラフ構造が既知の場合のパラメータ推定   17.3.2 グラフ構造の推定 17.4 離散変数に対する無向グラフィカルモデル   17.4.1 グラフ構造が既知の場合のパラメータ推定   17.4.2 隠れ頂点   17.4.3 グラフ構造の推定   17.4.4 制限ボルツマンマシン 第18章 高次元の問題:p ≫ N 18.1 p がN よりもかなり大きい場合 18.2 対角線形判別分析と最近傍縮小重心 18.3 2次正則化を用いた線形分類器   18.3.1 正則化判別分析   18.3.2 2次正則化を用いたロジスティック回帰   18.3.3 サポートベクトル分類器   18.3.4 特徴選択   18.3.5 p ≫ N の場合の計算上の工夫 18.4 L_1 正則化を用いた線形分類器   18.4.1 lasso のタンパク質の質量分析への応用   18.4.2 関数型データに対する融合型lasso 18.5 特徴量が使えない場合の分類   18.5.1 例:文字列カーネルとタンパク質分類   18.5.2 内積カーネルとペア間距離に基づく分類器とその他のモデル   18.5.3 例:概要の分類 18.6 高次元回帰:教師あり主成分分析   18.6.1 潜在変数モデルとの関係   18.6.2 部分最小2 乗法との関係   18.6.3 特徴選択のための出力変数の前処理 18.7 特徴量評価と多重検定問題   18.7.1 誤り発見率   18.7.2 非対称閾値とマイクロアレイ有意性分析法   18.7.3 誤り発見率のベイズ的解釈

Pythonではじめる教師なし学習 ―機械学習の可能性を広げるラベルなしデータの利用

Ankur A. Patel
オライリージャパン
おすすめ度
64
紹介文
教師なし学習は今後発展すると考えられる。実践的な視点で、データ内のパターンを特定し、異常を検出し、特徴量抽出と選択を行う。 機械学習の手法の1つ、教師なし学習に絞って解説した実践書! 教師なし学習は、大きく3つに分類される機械学習の手法のうちの1つ。従来は、教師あり学習が主流でしたが、これからのデータ分析の形を考えると、教師なし学習も大きな一角を占めていくと考えられています。本書では、実践的な視点で、データ内に隠れている見つけにくいパターンを特定し、異常を検出し、自動的に特徴量抽出と選択を行っていきます。さらには、異なる機械学習手法の長所と短所を比較し、データに最適な手法の選び方についても、示していきます。

マンガでわかるベイズ統計学

信, 高橋
オーム社
おすすめ度
64
紹介文
ビッグデータ、機械学習で注目されているベイズ統計学がお馴染みの「マンガでわかる」シリーズの最新刊として登場。 ビッグデータ、機械学習で注目されているベイズ統計学がマンガでわかる!! 本書はマンガを使ってベイズ統計学の基礎から実際の利用例まで解説するものです。また一般的に統計学のことをさす数理統計学とベイズ統計学の違いもふれます。さらにコンピュータシミュレーションでよく使われるモンテカルロ法やエントロピーについても解説しますのでマンガとはいえ実践的な内容となっているものです。 第1章 ベイズ統計学とは 第2章 基礎知識 第3章 尤度関数 第4章 ベイズの定理 第5章 マルコフ連鎖モンテカルロ法 第6章 マルコフ連鎖モンテカルロ法の活用例 エピローグ

深層学習 改訂第2版 (機械学習プロフェッショナルシリーズ)

岡谷 貴之
講談社
おすすめ度
64
紹介文
ベストセラーの改訂版。最高最強のバイブルが大幅にパワーアップ! 深層学習のさまざまな課題とその対策についても詳しく解説。 ◆ベストセラーの改訂版。最高最強のバイブルが大幅にパワーアップ!!◆ ・トランスフォーマー、グラフニューラルネットワーク、生成モデルなどをはじめ、各手法を大幅に加筆。 ・深層学習のさまざまな課題と、その対策についても詳しく解説。 [本書まえがきより抜粋] ないもの(=理論)ねだりをしても仕方がありません.それでも皆が研究を進めるのは,そうすることに意義があるからです.なぜうまく働くのか,なぜそうすべきか,数学的な証明はなくても,正しい説明は必ずあるはずです.それを手にできれば,目の前の課題を解決するのに,また次に進むべき道を知るうえで役に立つでしょう. そこで本書では,それぞれの方法について,今の時点で最も納得できる説明をきちんと与えることにこだわりました.名前の通った方法であっても,理屈が成り立たない,あるいは役に立たない方法や考え方については,はっきりそう書きました.著者の主観といわれても仕方がない場合もあるかもしれませんが,そのほうが有益であると信じています. また,現在の深層学習の広がりを把握できるように,定番となった問題・方法に加えて,重要だと思われる問題については,必ずしもそれほど有名でない方法も含めてなるべく網羅するようにしました.その取捨選択には,深層学習が実践的技術であることを踏まえ,実用性を最も重視しました.そこには,この間に著者が企業の実務家たちと行ってきた共同研究での経験が反映されています. [主な内容] 第1章 はじめに 第2章 ネットワークの基本構造 第3章 確率的勾配降下法 第4章 誤差逆伝播法 第5章 畳み込みニューラルネットワーク 第6章 系列データのためのネットワーク 第7章 集合・グラフのためのネットワークと注意機構 第8章 推論の信頼性 第9章 説明と可視化 第10章 いろいろな学習方法 第11章 データが少ない場合の学習 第12章 生成モデル 1章 はじめに 1.1 研究の歴史 1.2 本書の構成 2章 ネットワークの基本構造 2.1 ユニットと活性化関数 2.2 順伝播型ネットワーク 2.3 学習の概要 2.4 問題の定式化:出力層と損失関数の設計 3章 確率的勾配降下法 3.1 確率的勾配降下法 3.2 汎化性能と過剰適合 3.3 正則化 3.4 学習率の選定と制御 3.5 SGDの改良 3.6 層出力の正規化 3.7 重みの初期化 3.8 その他 4章 誤差逆伝播法 4.1 勾配計算の煩わしさ 4.2 誤差逆伝播法 4.3 自動微分 4.4 勾配消失問題 4.5 残差接続 5章 畳み込みニューラルネットワーク 5.1 単純型細胞と複雑型細胞 5.2 畳み込み 5.3 畳み込み層 5.4 プーリング層 5.5 畳み込み層の出力の正規化 5.6 推論のためのCNNの構造 5.7 入出力間の幾何学的関係 5.8 畳み込み層の一般化 5.9 アップサンプリングと畳み込み 5.10 物体カテゴリ認識への適用例 6章 系列データのためのネットワーク 6.1 系列データ 6.2 リカレントニューラルネットワーク 6.3 ゲート機構 6.4 自己回帰モデル 6.5 1次元畳み込みネットワーク 6.6 逆伝播の計算 7章 集合・グラフのためのネットワークと注意機構 7.1 集合データを扱うネットワーク 7.2 注意機構 7.3 トランスフォーマー 7.4 グラフニューラルネットワーク 8章 推論の信頼性 8.1 推論の不確かさ 8.2 不確かさの数理モデル 8.3 不確かさの予測 8.4 分布外入力の検出 8.5 敵対的事例 8.6 品質保証の試み 9章 説明と可視化 9.1 はじめに 9.2 入力による出力の微分 9.3 入力の遮蔽・挿入 9.4 中間層出力の表示 9.5 寄与度の分解 9.6 寄与度の逆伝播 9.7 可視化手法の評価 9.8 影響関数 9.9 学習内容の可視化 10章 いろいろな学習方法 10.1 距離計量学習 10.2 事例集合(マルチインスタンス)学習 10.3 クラスラベルの誤り 10.4 クラス間不均衡 10.5 継続・追加学習 10.6 知識蒸留 10.7 枝刈り 10.8 計算の量子化 10.9 ネットワーク構造探索 11章 データが少ない場合の学習 11.1 はじめに 11.2 データ拡張 11.3 転移学習 11.4 半教師あり学習 11.5 自己教師学習 11.6 マルチタスク学習 11.7 ドメイン適応・汎化 11.8 少数事例学習 11.9 能動学習 12章 生成モデル 12.1 データの生成モデル 12.2 自己符号化器 12.3 変分自己符号化器 12.4 敵対的生成ネットワーク 12.5 正規化フロー 12.6 ボルツマンマシン

仕事ではじめる機械学習

有賀 康顕
オライリージャパン
おすすめ度
64
紹介文
機械学習やデータ分析の道具をどのようにビジネスに生かしていけば良いのか、「仕事で使う」という観点から整理。 機械学習を実際の業務で利用する時に知っておくべき全体像が分かる! 機械学習やデータ分析の道具をどのようにビジネスに生かしていけば良いのか、不確実性の高い機械学習プロジェクトの進め方などを「仕事で使う」という観点から整理します。 プロジェクトのはじめ方や、システム構成、学習のためのリソースの収集方法など、読者が「実際どうするの?」と気になるであろう点を中心にまとめています。「人工知能でいい感じの成果を出してくれ」とあいまいな指示をされたとき、本書で学んだことが活きてくるに違いありません。

PythonでExcel、メール、Webを自動化する本

中嶋英勝
SBクリエイティブ
おすすめ度
64
紹介文
プログラミング初心者でも全部できる! Excelシート間のコピペをはじめ、単純なパソコン仕事は小さなプログラムを書くことで自動で行うことができます。 こうしたプログラムを書けるようになることが、自分の仕事を効率化したい社会人にとって大きな武器になることは間違いありません。 本書ではプログラミング言語Pythonを使って、パソコン仕事の中心であるExcel作業を自動化する方法を紹介します。 Excelの自動化といえば「マクロ・VBA」が定番ですが、Pythonの強みは ・Excelアプリを起動しなくてよい ・メールやWebブラウザなども簡単に自動化できる という点にあります。 本書ではExcelとともにメール、Webの自動化もしっかり扱います。これにより、Webから抽出したデータをExcelファイルに保存してメールで送信、といった連携も行えるようになり、仕事での活用の幅が広がります。 プログラミング初心者である社会人が、実際に自分の仕事が自動化できるように、必要な情報をもれなく丁寧に解説することを心掛けました。本書を片手に「新しい仕事のやり方」を始めましょう! <本書の方針> ・オブジェクトなどの難しいプログラム理論は一切使いません。 ・一番単純な道具だけで、準備に時間をかけず、すぐ始められます。 ・実践的な例題で、実務で本当に使えるプログラムを紹介します。 第1章 Pythonプログラミングの基本 1-1 プログラムを書いて実行する方法を覚える 1-2 変数を使ったコードを書いてみよう 1-3 複数のデータはリストに入れる 1-4 複数のデータをループで処理する 1-5 データの状態に応じて処理を分ける 1-6 IDLEを使いやすく設定する 第2章 PythonでExcelファイルを操作する 2-1 Excelファイルの基本構造を理解しよう 2-2 ブックの開き方・保存方法を覚えよう 2-3 プログラムでセルの値を読み書きしよう 2-4 セルを1行ずつ読み書きする 2-5 シートの操作方法を覚えよう 2-6 複数のシートをまとめる 2-7 絶対に覚えておきたいプログラミングのコツ 第3章 PythonでCSVファイルを操作する 3-1 CSVファイルを読み込んでみよう 3-2 CSVファイルにデータを書き込んでみよう 3-3 Excelブックと相互に変換する 第4章 Excelファイルの転記・集計をPythonでおこなう 4-1 転記・集計を実現するExcelの三大関数とは 4-2 Excelのマスタを取り込む 4-3 Excelのマスタからデータを検索する 4-4 表のデータを別のブックに転記する 4-5 条件を満たすデータの個数や合計を求める 4-6 Pythonで自動化するメリットとは 第5章 帳票作成をPythonでおこなう 5-1 請求書作成の手順を整理する 5-2 顧客ごとの売上データの絞り込み 5-3 顧客ごとの請求書を作成する 5-4 請求書を印刷してPDFとして保存しよう 5-5 業務全体ではExcelと良いとこ取りを目指す 第6章 Pythonでもっと作業を自動化するには 6-1 Pythonの強みは豊富なライブラリ 6-2 PythonならメールもWebも自動化できる 第7章 Pythonで複数の人にまとめてメール送信する 7-1 メールサーバーとの交信方法 7-2 メールで送るメッセージを作成する 7-3 メールを自動送信する 第8章 PythonでWebから情報を収集する 8-1 Seleniumのインストール 8-2 ブラウザを操作してみる 8-3 Selenium IDEでブラウザ操作を記録 8-4 Webページから情報を読み取る 8-5 実際のWebページから情報を読み取る 8-6 Webからの情報収集を自動化する

仕事ではじめる機械学習 第2版

有賀 康顕
オライリージャパン
おすすめ度
64
紹介文
仕事で機械学習に携わる際に知っておきたい事を伝えるというコンセプトで、機械学習を使った実務に初めて関わる読者のための1冊。 大好評の機械学習実務者向け書籍が最新情報にアップデート! 2018年に発行された初版から3年ぶりの改訂となる本書は、「仕事で機械学習に携わる際に知っておきたい事」を伝えるというコンセプトはそのままに、3年の間に登場した新たな考え方、手法など最新の情報を踏まえて内容を全面的に見直しました。これまで同様、機械学習を使った実務に初めて関わる読者にとって頼りになる1冊となるでしょう。「バンディットアルゴリズム」を紹介する新章など、追加原稿も多数。 仕事で機械学習に携わる際に知っておきたい事を伝えるというコンセプトで、機械学習を使った実務に初めて関わる読者のための1冊。

確率思考の戦略論 USJでも実証された数学マーケティングの力

森岡 毅
KADOKAWA/角川書店
おすすめ度
64
紹介文
世界屈指のマーケター&アナリストがUSJに導入した秘伝の数式を公開。 世界屈指のマーケター&アナリストが、USJに導入した秘伝の数式を公開。 ビジネス戦略の成否は「確率」で決まっている。 その確率はある程度まで操作することができる。 八方塞りに思える状況でも、市場構造や消費者の本質を理解していると、 勝てなさそうに見える局面や相手に対しても勝つチャンスのある戦い方、 つまり勝つ確率の高い戦略を導き出すことができる。 その戦略を導き出すのが「数学マーケティング」である。 「ビジネス戦略とは確率論である」「成功確率はある程度操作できる」「需要予測はそのための有用な道具である」など、企業戦略に役立つ智慧と数式が詰まった上級者向けのマーケティング実践書。 序章  ビジネスの神様はシンプルな顔をしている   第1章 市場構造の本質               第2章 戦略の本質とは何か?              第3章 戦略はどうつくるのか?            第4章 数字に熱を込めろ!           第5章 市場調査の本質と役割    第6章 需要予測の理論と実際            第7章 消費者データの危険性          第8章 マーケティングを機能させる組織              解説1 確率理論の導入とプレファレンスの数学的説明   解説2 市場理解と予測に役立つ数学ツール       終章 2015年10月にUSJがTDLを超えた数学的論拠  

つくりながら学ぶ! Pythonによる因果分析 ~因果推論・因果探索の実践入門 (Compass Data Science)

小川雄太郎
マイナビ出版
おすすめ度
64
紹介文
ビジネスで実践できるデータ分析力をマスター! ビジネス現場ではデータ活用の重要性がますます高まっています。データに基づいた経営施策の実施とその効果検証のためには、一般的な統計指標(平均、標準偏差、相関)だけでなく「因果」にまで分析を広げる必要があります。 本書は因果分析の重要な2つの領域である「因果推論」および「因果探索」について、実際にプログラムを実装しながら学ぶ書籍です。因果推論や因果探索を学びたいビジネスパーソンや、初学者の方を対象としています。 ・因果推論とは「テレビCM放映で、商品購入量がどれくらい増えたのか?」「研修の実施で、社員スキルがどの程度向上したのか?」など、なんらかの施策を実施した際に、その施策の効果を推定する手法です。 ・因果探索とは「生活習慣と疾病の調査」「働き方改革に伴う社員調査」など、アンケート調査等で収集した各項目間の因果関係を明らかにする試みです。 本書は「因果推論、因果探索とはどのようなものか」「因果推論、因果探索を実施するには、具体的にどうしたら良いのか・分析プログラムをどう実装したら良いのか」「因果推論、因果探索が、どのように機械学習やディープラーニングと結びついているのか」が理解・習得できる内容となっています。 プログラミング言語Python、実行環境Google Colaboratory、機械学習ライブラリscikit-learn、PyTorchで実際に手を動かしながら実装し、習得していきます。 データに基づいた経営・ビジネスを実践するうえでスタンダードな手法となる因果分析をマスターしよう。 Part 1:因果推論 第1章 相関と因果の違いを理解しよう 第2章 因果効果の種類を把握しよう 第3章 グラフ表現とバックドア基準を理解しよう 第4章 因果推定を実装しよう 第5章 機械学習を用いた因果推論 Part 2:因果探索 第6章 LiNGAMの実装 第7章 ベイジアンネットワークの実装 第8章 ディープラーニングを用いた因果探索 第1部 因果推論 第1章 相関と因果の違いを理解しよう 1-1 因果推論が必要となる架空事例の紹介 1-2 相関と因果の違い、疑似相関とは 1-3 Google Colaboratoryを用いたPythonプログラミング:疑似相関の確認 第2章 因果効果の種類を把握しよう 2-1 反実仮想と様々な因果効果(ATE、ATT、ATU、CATE) 2-2 介入(doオペレータ)とは 2-3 本書で使用する数学記法の整理 2-4 調整化公式とは 第3章 グラフ表現とバックドア基準を理解しよう 3-1 構造方程式モデルとグラフ表現(因果ダイアグラムDAG) 3-2 バックドア基準、バックドアパス、d分離 3-3 ランダム化比較試験RCTによる因果推論 第4章 因果推論を実装しよう 4-1 回帰分析による因果推論の実装 4-2 傾向スコアを用いた逆確率重み付け法(IPTW)の実装 4-3 Doubly Robust法(DR法)による因果推論の実装 第5章 機械学習を用いた因果推論 5-1 ランダムフォレストによる分類と回帰のしくみ 5-2 Meta-Learners(T-Learner、S-Learner、X-Learner)の実装 5-3 Doubly Robust Learningの実装 第2部 因果探索 第6章 LiNGAMの実装 6-1 LiNGAM(Linear Non-Gaussian Acyclic Model)とは 6-2 独立成分分析とは 6-3 LiNGAMによる因果探索の実装 第7章 ベイジアンネットワークの実装 7-1 ベイジアンネットワークとは 7-2 ネットワークの当てはまりの良さを測る方法 7-3 変数間の独立性の検定 7-4 3タイプのベイジアンネットワークの探索手法 7-5 PCアルゴリズムによるベイジアンネットワーク探索の実装 第8章 ディープラーニングを用いた因果探索 8-1 因果探索とGAN(Generative Adversarial Networks)の関係 8-2 SAM(Structural Agnostic Model)の概要 8-3 SAMの識別器Dと生成器Gの実装 8-4 SAMの損失関数の解説と因果探索の実装 8-5 Google ColaboratoryでGPUを使用した因果探索の実行

マンガでわかる統計学 素朴な疑問からゆる~く解説 (サイエンス・アイ新書)

大上 丈彦
SBクリエイティブ
おすすめ度
64
紹介文
統計学というと「なんだか難しそうだな」と思うかもしれませんが、ポイントをしっかり押さえ、あまり本質的でないところにこだわらなければ、誰にでも確実に理解できます。「統計学ってなに?」という素朴な疑問から、マンガでゆるーく解説し、読み終わったときには、知らないうちに統計学が身についているという、いままでにない統計学の入門書。 第1章 平均・分散・標準偏差(統計処理をしてみよう 二峰性のヒストグラムとは ほか) 第2章 正規分布(正規分布で「近似」するぜ 標準正規分布 ほか) 第3章 いろいろな分布(二項分布とは 二項分布の例 ほか) 第4章 推測統計(推測統計学 「おおむね」正規分布に従う、とは? ほか) 第5章 仮説検定(仮説の検定 いろいろな検定)

回帰分析(新装版) (統計ライブラリー)

隆光, 佐和
朝倉書店
おすすめ度
64
紹介文
実用に供されることの多い回帰分析の方法を,豊富な実例と厳密な数学的証明をおりまぜて解説。 統計手法のうち,最も実用に供されることの多い回帰分析の方法を,豊富な実例と厳密な数学的証明をおりまぜて解説。〔内容〕回帰分析への誘い/ベクトルと行列/多変量正規分布/線形回帰モデル/仮説検定・区間推定・予測/説明変数の問題 1. 回帰分析への誘い  1.1 2変数回帰  1.2 最小2乗推定  1.3 本書のプラン 2. ベクトルと行列  2.1 ベクトルとベクトル空間  2.2 行列と行列式  2.3 2次形式の標準化  2.4 不等式と最大最小問題  2.5 ベクトルの微分とベクトル確率変数 3. 多変量正規分布  3.1 多変量正規分布  3.2 2次形式の分布 4. 線形回帰モデル  4.1 最小2乗推定  4.2 最小2乗推定量の性質  4.3 誤差分散σ2 の推定  4.4 回帰モデルの正準化  4.5 推定量の分布 5. 仮説検定,区間推定,予測  5.1 線形制約の検定  5.2 信頼領域の構成  5.3 区間予測 6. 標準的諸仮定からのズレ  6.1 誤差項の相関と分散不均一  6.2 仮説検定  6.3 正規分布からのズレ  6.4 残差の分析 7. 説明変数の問題  7.1 説明変数選択のための諸基準  7.2 多重共線性  7.3 変数変換と非線形性 8. 文献解題 9. 付 表 10. 索 引

はじめての統計学

鳥居 泰彦
日経BPマーケティング(日本経済新聞出版
おすすめ度
64
紹介文
数学が苦手な人でも理解して読み進めるように基礎的な知識を丁寧に解説した統計学の入門書。練習問題を解いていくうちに、統計学のエッセンスを身につけることができるワークブック。 学習のためのこころがけ 第1章 統計学はどのような学問か  1.1 統計学とは何か  1.2 統計学の考え方の基礎  1.3 統計学の分析概念(その1)-確率と確率分布-  1.4 統計学の分析概念(その2)-母集団と標本-  1.5 標本抽出  1.6 階級分けしたデータの作り方  補論  第1章の練習問題 第2章 標本分布の特性値  2.1 いろいろな形の分布  2.2 分布の特性値  第2章の結語  第2章の練習問題 第3章 確率と確率分布  3.1 このテーマの重要性  3.2 確率  3.3 確率変数と確率分布  3.4 二項分布(Bi-nomial distribution、Bernoulli distribution)  3.5 ポアソン分布(Poisson distribution)  第3章の練習問題 第4章 一様分布と正規分布  4.1 一様分布(Uniform distribution)別名:矩形分布(Rectan-gulardistribution)  4.2 正規分布(Normal distribbution)  第4章の練習問題 第5章 標本平均の分布と母平均の推定  5.1 統計的有意性  5.2 標本平均のXの分布  5.3 母平均のμの推定  第5章の練習問題 第6章 t分布と母平均の推定  6.1 t分布(Studentのt分布)  6.2 母平均μの推定(母標準偏差θが未知で、小標本の場合)(A-2)  6.3 母平均μの推定(母標準偏差は未知で、大標本の場合)(A-3)  6.4 母平均μの推定のまとめ 第6章の練習問題  第7章 χ2乗分布と母標準偏差の推定  7.1 χ2乗分布(カイ2乗分布)  7.2 母標準偏差の推定(B-1)  7.3 母数の推定の方法の総まとめ  補論    第7章の練習問題 第8章 仮説検定  8.1 統計的仮説検定の考え方  8.2 母平均μに関する仮説検定-対立仮説が不等式の場合-   8.3 応用  第8章の練習問題 第9章 相関分析  9.1 相関関係と相関分析  9.2 単純相関係数の計算(Raw dataのケース)  9.3 単純相関係数の計算(Classified dataのケース)  第9章の練習問題 第10章 回帰分析  10.1 回帰分析の概要  10.2 OLS(最小二乗法)  10.3 Classified data のOLS  10.4 もっとも詳しい回帰分析-回帰係数の有意性の検定-  第10章の練習問題
search