【2024年】「データ分析」のおすすめ 本 151選!人気ランキング
- AI・データ分析プロジェクトのすべて[ビジネス力×技術力=価値創出]
- Kaggleで勝つデータ分析の技術
- はじめてのパターン認識
- 図解ポケット 今日から使える! データサイエンスがよくわかる本
- 前処理大全[データ分析のためのSQL/R/Python実践テクニック]
- 統計学入門 (基礎統計学Ⅰ)
- 欠測データ処理: Rによる単一代入法と多重代入法 (統計学One Point 5)
- 経済・ファイナンスデータの計量時系列分析 (統計ライブラリー)
- 実践Data Scienceシリーズ RとStanではじめる ベイズ統計モデリングによるデータ分析入門
- Python実践データ分析100本ノック
本書は、AI・データ分析プロジェクトの成功には技術知識だけでなく「ビジネス力」が重要であることを強調しています。データサイエンティストのキャリアや業界の概要から始まり、プロジェクトの立ち上げ、実行、評価、収益化までのノウハウを網羅。具体的には、課題設定、案件獲得、データ分析手法の検討、レポーティングなどのプロセスを解説し、実務に役立つ情報を提供しています。著者は業界の専門家で、実践的な知識を基にした内容となっています。
本書は、データサイエンスにおけるコンペティション、特にKaggleに焦点を当て、実践的なデータ分析手法やテクニックを紹介しています。分析コンペに参加することで得られるスキルは、実務でも役立つため、特徴量の作成やモデルの評価、チューニングなどの具体的な内容が含まれています。著者たちは、データサイエンスの専門家であり、実績を持つKaggleの競技者です。この本は、コンペに挑戦したい人や実務でのモデル精度向上を目指す人にとって有益な情報源となるでしょう。
データ分析コンペKaggleに挑戦するならこれをまず読んでおけば大丈夫!Kaggleに参加しないにしてもデータ分析の本質やテクニックがギュッと詰まっているので実務に活かせる。高度な内容も登場するが分かりやすく解説してくれるので初心者でも読みやすい。それでいてベテランの人も多くの学びがある書籍。著者はKaggleの最上位グランドマスターの方々であり説得力がある。過去のコンペの事例も取り上げてくれるのでそんなアプローチあったのかぁと学びが深い。文句なしの星5つ!
この入門書は、パターン認識について基礎からわかりやすく解説しており、特にRを用いた実行例が含まれているため、実際の応用にも役立ちます。内容は識別規則や学習法、ベイズの識別規則、k最近傍法、サポートベクトルマシンなど多岐にわたり、最後には識別器の性能強化についても触れています。著者は筑波大学の名誉教授、平井有三氏です。
「はじめての」とついているが入門書ではなく結構難しい。ただ、機械学習の様々な手法が数式から学べるため中級者〜上級者には良いと思う。他の入門書で機械学習の概要を掴んだ後に読むべき本。
本書は、データサイエンスの基本概念から実際のビジネス活用事例までを豊富な図やイラストを用いて解説し、初心者でも理解しやすい内容になっています。データサイエンスの重要性が増す中、数学的な専門用語を避けながら、機械学習や先端テクノロジーとの関連も紹介。ビジネスパーソンや学生にとって、データサイエンスを学ぶための入門書として最適です。
文科と理科両方の学生のために,統計的なものの考え方の基礎をやさしく解説するとともに,統計学の体系的な知識を与えるように,編集・執筆された.豊富な実際例を用いつつ,図表を多くとり入れ,視覚的にもわかりやすく親しみながら学べるよう配慮した. 第1章 統計学の基礎(中井検裕,縄田和満,松原 望) 第2章 1次元のデータ(中井検裕) 第3章 2次元のデータ(中井研裕,松原 望) 第4章 確率(縄田和満,松原 望) 第5章 確率変数(松原 望) 第6章 確率分布(松原 望) 第7章 多次元の確率分布(松原 望) 第8章 大数の法則と中心極限定理(中井検裕) 第9章 標本分布(縄田和満) 第10章 正規分布からの標本(縄田和満) 第11章 推定(縄田和満) 第12章 仮説検定(縄田和満,松原 望) 第13章 回帰分析(縄田和満) 統計数値表 練習問題の解答
本書は、欠測データの解析における多重代入法の実用的な手法を解説しています。従来の書籍では理論中心でしたが、本書では具体的な応用事例や手順を示し、社会科学の分析手法(t検定、重回帰分析、ロジスティック回帰分析など)における欠測データ処理を詳述しています。Rコードと実データを用いて、読者が実際に手順を再現しながら学ぶことができるようになっています。著者は、統計科学や不完全データ処理法の専門家です。
この書籍は、時系列分析の基礎から応用までを詳しく解説しています。内容は、時系列分析の基礎概念、ARMA過程、予測手法、VARモデル、単位根過程、見せかけの回帰と共和分、GARCHモデル、状態変化を伴うモデルに分かれています。著者の沖本竜義は、経済学と統計学の専門家であり、実データへの応用に必要な知識を提供しています。
本書は「統計モデリングの世界」への入門書で、統計、確率、ベイズ推論、MCMCの基本をチュートリアル形式で学べる内容です。RやStanを用いたデータ分析の基礎から、一般化線形モデルや一般化線形混合モデル、状態空間モデルまでを体系的に解説しています。データサイエンスを学ぶ大学生やエンジニア向けの実践的なシリーズの一環として、すぐに実践できるスキルを身につけることができます。
本書は、数理モデルの多様な手法を解説し、データ分析における選択と理解を促進する入門書です。機械学習や統計モデルなど、自然科学と人文社会科学の手法を網羅し、初学者がデータ分析の全体像を把握できるように設計されています。特に、モデリング手法の選択や誤解しやすい点について丁寧に説明し、大学一年生でも理解できるレベルでありながら、より進んだ読者にも楽しめる内容となっています。著者は東京大学の特任講師で、幅広い分野での数理的解析に取り組んでいます。
データサイエンスを学ぶ上でこちらに一通り目を通しておくとベースが出来上がると思うのでオススメ。幅広く学べるがそこまで深く突っ込まないので気に入った領域は他の書籍で補完した方がよいかも!
本書は、機械学習アルゴリズムをオールカラーの図を用いてわかりやすく解説した入門書です。17種類のアルゴリズムを紹介し、各アルゴリズムの仕組みや使用方法、注意点を詳述しています。Pythonを用いたコードも掲載されており、実際に試しながら学ぶことができます。機械学習を学ぶ初心者や業務で利用している方にも役立つ内容となっています。
本書は最適化手法についての入門書であり、経営学やオペレーションズリサーチだけでなく、統計的最適化や機械学習の話題も扱っています。計算機技術の進歩により、複雑な最適化問題が解決可能になった背景を踏まえ、各手法の原理や数学的背景を詳しく解説しています。内容は例題を多く用いて分かりやすく、関連する話題や注意点も随所に挿入されています。目次には数学的準備、関数の極値、最適化手法、最小二乗法、統計的最適化、線形・非線形計画法、動的計画法が含まれています。著者は岡山大学の金谷健一教授です。
内容は少々難解だが、統計学や機械学習・データサイエンス分野のエッセンスが詰まっていて何度も読み返したい書籍。大学院生時代の授業の輪読して使用し、目からウロコの連続だった。ある程度基礎固めをした後に読んでほしい1冊
本書は、機械学習の有名なアルゴリズムをPythonを用いてゼロから実装することを目的としています。実用的なフレームワークを使用するのではなく、機械学習の仕組みを深く理解することで応用力や問題解決力を高めることを目指しています。内容は、Pythonの基本、機械学習に必要な数学、数値計算、そして具体的な機械学習アルゴリズムに関する解説を含んでおり、初心者や実務に携わるエンジニアに適しています。著者はシルバーエッグ・テクノロジーのチーフサイエンティストで、機械学習アルゴリズムの設計・実装に精通しています。
本書はデータ視覚化の重要性と技術を解説しており、単なるグラフ作成にとどまらず、データの意味を明確にし、オーディエンスに興味を持たせることを目的としています。筆者は日本人女性唯一のTableau ZEN MASTERであり、実践的なノウハウや事例を通じて、データ視覚化の基礎からプロフェッショナルなテクニックまでを紹介しています。主要な章では、視覚化の基本概念、プロっぽく見せるコツ、適切なチャートの選択、実際のダッシュボード作成事例、組織内でのデータ視覚化の浸透方法について詳しく説明しています。
この書籍は、データ分析における視点を磨き、質の高い研究を行うためのガイドです。内容は、無作為性や統計的推測、研究デザイン、データ解析の基礎について解説しています。目次は基礎編とアラカルト編に分かれ、平均値や頻度、イベント発生時間の比較方法も取り上げています。著者は丹後俊郎氏で、医学統計学の専門家です。
この書籍は、データ分析における「分析モデル」をテーマにしたもので、回帰分析や深層学習、強化学習などの実践的な分析手法を網羅的に解説しています。著者は、データ分析者がモデルの本質を理解し、データを最大限に活用できるようにすることを目的としています。内容は定型データから非定型データの扱い、強化学習、データから知見を得る方法まで多岐にわたり、各章で具体的な手法や技術が詳しく説明されています。著者は東京大学の博士号を持つデータサイエンティストで、データ分析の啓蒙活動にも従事しています。
本書は、データ分析に必要な知識を包括的に解説した教科書で、分析手法だけでなく、データの質や解釈方法にも焦点を当てています。実践的なデータの扱いや心理学的バイアス、サンプリング方法、数理モデリングのポイントなどを幅広くカバーし、数学に自信のない読者でも理解できるよう工夫されています。データサイエンティストや研究者、ビジネスマンにとって有益な内容で、興味深い事例も豊富に紹介されています。著者は東京大学の特任講師で、さまざまな分野の問題に取り組んでいます。
この書籍は、データ分析の基礎から応用までを学べる内容で、データ可視化や統計手法、仮説検定、重回帰分析など、一生使えるスキルを身につけることができます。著者はデータサイエンティストとしての豊富な経験を持ち、実務に役立つ知識を提供しています。目次にはデータ分析の全体像や具体的な手法が紹介されています。
本書は、Pythonのデータ処理ライブラリ「pandas」の実践的な使用法を約100のレシピ形式で紹介するもので、データ分析や科学計算に役立つ内容が含まれています。各レシピは手順や解説が整然とまとめられており、データ構造の基本から可視化技術まで幅広くカバーしています。著者はデータサイエンティストのTheo Petrouで、教育やデータ分析に関する豊富な経験を持っています。読者はデータサイエンスに興味のあるすべての人を対象としています。
本書は、統計学の基礎から応用までを扱った内容で、基礎編ではR言語を用いた記述統計や統計的仮説検定について解説し、応用編ではベクトルや行列、データフレーム、外れ値の影響などを取り上げています。著者は、教育心理学を専門とする学者たちで、各自が教育機関での実績を持っています。
この書籍は、数理モデルを用いて現象を理解するための基本的な統計モデルの考え方を、章ごとに異なる例題を通じて解説しています。前半では一般化線形モデル(GLM)の基礎を紹介し、後半では階層ベイズモデル化の手法をRとWinBUGSを用いて具体的に説明します。著者は久保拓弥氏で、生態学のデータ解析に関する統計学的方法を研究しています。
線形回帰分析を学んでそこから一般化線形回帰モデル、ベイズと拡張していく上で非常にオススメな本。初学者には少々難解な部分もあるが、統計学を学ぶ上で必ずどこかで読んで欲しい書籍。学生の時に読んだが、これを読むことでこれまで学んできた内容が整理され頭がクリアになった記憶がある。統計学を語るなら絶対読んで欲しい非常におすすめの書籍。
本書は確率についての基礎から応用までを扱っています。第1部では確率の定義や複数の確率変数、確率分布について説明し、第2部では推定や検定、擬似乱数の活用法を紹介しています。付録には数学の基礎事項や確率論の補足が含まれています。著者は数理工学の専門家で、機械学習や脳科学の研究に従事しています。
この文章は、永田靖著の書籍の目次と著者情報を紹介しています。書籍は3部構成で、基礎と1変数関数の微積分、線形代数、多変数関数の微積分について解説しています。著者は1957年生まれで、早稲田大学で教授を務めています。
この書籍は、ディープラーニングをゼロから実装することで学ぶ入門書です。Python 3を用いて、基礎から誤差逆伝播法や畳み込みニューラルネットワークなどの実装を通じて理解を深めます。また、ハイパーパラメータの設定やBatch Normalization、Dropout、Adamなどの最新技術、さらには自動運転や画像生成などの応用例についても触れています。著者は斎藤康毅氏で、コンピュータビジョンや機械学習の研究開発に従事しています。
ディープラーニングの概要は分かっているし機械学習はある程度理解しているつもりだけど、ディープラーニングの中身はちゃんと理解できていない人にぜひ読んで欲しい書籍。ディープラーニングは一旦これ1冊読んでおけば問題なし。複雑で難しい印象だったディープラーニングがこれを読むだけで一気に身近なものになる。
本書は、深層学習に関する改訂版のベストセラーで、トランスフォーマーやグラフニューラルネットワーク、生成モデルなどの手法を詳しく解説しています。著者は、理論的な証明がなくても納得できる説明を重視し、実用性を考慮した内容を提供。全12章で、基本構造から各種学習方法、データが少ない場合の対策まで幅広く網羅しています。著者は東北大学の教授であり、実務家との共同研究の経験も反映されています。
本書は、ビジネスにおけるデータ活用の重要性を背景に、因果分析の手法である「因果推論」と「因果探索」を学ぶための実践的なガイドです。因果推論は施策の効果を推定する手法であり、因果探索はデータから因果関係を明らかにする方法です。読者はPythonや機械学習ライブラリを用いて実際にプログラムを実装しながら、これらの手法を習得できます。内容は因果推論の基本から機械学習の応用、さらに因果探索の実装まで多岐にわたります。
本書では、一般的に信じられている通説(例:健診で健康になる、テレビが学力を下げる、偏差値の高い大学が収入を上げる)が経済学の研究によって否定される理由を解説しています。著者は「因果推論」の手法を用い、数式なしでわかりやすく説明することで、根拠のない通説にだまされない力を養うことを目指しています。各章では、様々な因果関係を証明する方法(ランダム化比較試験、自然実験、差の差分析など)を紹介しています。
この文章は、異常検知に関する書籍の目次と著者情報を紹介しています。目次では、異常検知の基本から正規分布や非正規データ、性能評価、次元削減、入力・出力データ、時系列データに関する異常検知までの各トピックが列挙されています。著者の井手剛は、機械工学と物理学の学位を持ち、IBMでの研究経験があります。
本書は、ビジネスにおけるデータ分析の重要性とそのバイアスを取り除くための手法を解説しています。特に、意思決定に影響を与えるデータの生成過程におけるバイアスの存在を指摘し、単純な比較が誤った結論を導く可能性について警鐘を鳴らします。著者は、RCT(ランダム化比較試験)を理想的な分析手法として紹介し、RCTが実施できない場合でも因果推論を用いて効果的な分析が可能であることを説明します。目次には、セレクションバイアスや回帰分析、傾向スコア、差分の差分法などの具体的な手法が含まれています。著者は経済学の専門家で、データサイエンスの分野でも活躍しています。
本書は、時系列データの分析方法を基礎から解説しています。探索的手法として移動平均、確率的手法として状態空間モデルを取り上げ、数式の意味やコードへの落とし込み方を丁寧に説明しています。初めて時系列分析を試みる人や、既に関わっている人にも興味深い内容となっており、応用的な話題もカバーしています。著者は牧山幸史、監修は石田基広です。
本書は、ネットワーク分析の理論と実践をRというフリーソフトを用いて学ぶためのガイドです。第2版では、統計的なネットワーク分析手法や社会ネットワーク、ソーシャルメディアの分析法に関する新しい章が追加され、複雑ネットワークやネットワーク描画の内容も改訂されています。著者は鈴木努で、社会学を専攻し、東北学院大学の准教授として勤務しています。
本書は、統計解析の基礎手法を幅広く解説した入門書であり、統計解析の全体像を把握することができます。目次には、データ整理、分布と期待値、検定・推定の考え方、分散分析、相関分析、回帰分析などが含まれています。
ビジネスや意思決定の場面で,データを活用したい方に手にとっていただきたいデータサイエンスの入門書。目的別の分析手法を幅広く… ビジネスや意思決定の場面で,データを活用したい方に向けたデータサイエンスの入門書。データの種類ごとの性質や収集時の注意点,目的別の分析手法からデータ可視化まで幅広く扱う。各章末には課題を設置し,最終章ではデータサイエンスの展望や限界についても言及。 第1章 データサイエンスとは 第2章 データ収集のための基礎知識 第3章 データ空間の構成法 第4章 データ生成のメカニズム 第5章 データの可視化手法 第6章 データ分析の手法 第7章 データ活用のフレームワーク 第8章 データの分析事例 第9章 データ分析上の注意点と応用知識
この書籍は、マーケティング調査や金融リスク、株・為替のボラティリティ、選挙の出口調査など、さまざまな分野でのデータ分析の基礎を解説しています。内容は、標準偏差や検定、区間推定などの基本的な統計手法から、観測データを用いた母集団の推定方法まで幅広くカバーしています。著者は帝京大学の助教授で、数理経済学を専門とする小島寛之氏です。
本書は、2018年に発行された機械学習に関する書籍の全面改訂版で、不確実性の高い機械学習プロジェクトを「仕事で使う」という視点から整理しています。新たに「ML Ops」や「機械学習モデルの検証」などの章が追加され、読者が直面する問題解決に役立つ内容となっています。著者は機械学習分野の専門家で、実践的な知識を提供しています。
機械学習の手法やテクニックにフォーカスした書籍ではなくて、機械学習を仕事に取り入れるためにはどうすればよいのか?どういうところに注意しなくてはいけないのかがまとめられた書籍。実務で機械学習を利用している人利用する可能性のある人は絶対に読むべき書籍。そもそも本当に機械学習を使う必要があるのかということをしっかり考える、機械学習ありきのプロジェクトは必ず失敗する。
本書は、データサイエンティストの思考過程を紙と鉛筆を使って学ぶことを目的としています。PythonやRなどのプログラミング言語を使わず、40問のクイズを通じてデータの読み解き方や説明の仕方を体験できます。デジタル時代に必要なデータリテラシーを身につけたい人や、データを使って論理的に考えたい人におすすめです。各章では、データを読む、説明する、分類する、法則を見つける、予測する力を育む内容が展開されています。
この書籍は、RとPythonの両方を学べるデータサイエンスの入門書です。プログラミング経験がなくても理解できるように、データサイエンスの基礎や環境構築について詳しく解説しています。内容は、データサイエンスの準備、機械学習の手法(回帰、分類、深層学習など)に分かれており、実践的なサンプルコードも提供されています。著者は東京大学と千葉工業大学の教授で、情報処理技術者試験委員を務めています。
本書は、ビジネスにおけるベイズ統計学の基本をわかりやすく解説した入門書です。中学数学の知識がなくても理解できるように工夫されており、特にIT業界や統計に興味があるビジネスパーソンに最適です。内容は、ベイズ推定の使い方や確率論の基礎、確率分布などを含み、実用的な視点から未来を予測するための統計学を学べます。著者は帝京大学の教授、小島寛之氏です。
本書は、多変量解析法の入門書であり、統計的方法を習得した人を対象に、簡単な例を用いて理論を2次行列で解説しています。主要な内容には、単回帰分析、重回帰分析、主成分分析、クラスター分析などが含まれています。著者は早稲田大学の教授で、統計学に関する多くの著作があります。
本書は、回帰分析、重回帰分析、ロジスティック回帰分析について解説しており、基礎知識から実践的な計算方法までをカバーしています。著者は高橋信氏で、統計学を基にした情報サービス業に従事しています。
『A First Course in Bayesian Statistical Methods』の日本語訳で、ベイズ統計の基礎と計算手法を学ぶ書籍です。確率論の基本から始まり、正規モデルや階層モデル、線形回帰モデルなどのベイズ法を詳述し、潜在変数モデルなどの応用も紹介しています。Rによる実装方法やサンプルコードも提供され、社会科学や医学、生物学など多様な分野での応用例が取り上げられています。著者はピーター・D・ホフ教授で、他に翻訳者として入江薫、菅澤飯之助、橋本真太郎が関わっています。
この文章は、統計学に関する書籍の目次と著者情報を紹介しています。目次には、一変量データや多変量データの記述、確率分布、推定方法、仮説検定などのテーマが含まれています。著者は神永正博と木下勉で、それぞれの学歴と職歴が簡潔に記載されています。神永は数学の博士で、木下は工学の博士です。
『Data Visualization: A Practical Introduction』の日本語訳が刊行され、全世界のRユーザーに支持されている。この本は、データ可視化の基本を初心者でも理解できるように解説しており、ggplotやtidyverseの知識がなくても実践的に学べる内容となっている。データの見せ方や可視化の手順に加え、実践的なスキルを提供。著者はデューク大学の教授であり、さまざまな専門家が推薦している。目次にはデータの整形や地図描画など、多岐にわたるテーマが含まれている。
本書は、近年注目されている統計モデリングについて解説しており、特にフリーソフトのStanを用いた実践的なアプローチを提供しています。Stanは高い記述力を持ち、階層モデルや状態空間モデルを簡単に記述できるため、データ解析に非常に有効です。著者は、ベイズ統計の理解を深めるための実践的な内容を重視し、StanとRを通じて統計モデリングの考え方を学ぶことができるとしています。目次には導入編、入門編、発展編があり、幅広いテーマを扱っています。著者は統計モデリングやデータサイエンスの専門家です。
本書では、統計学があらゆる学問の中で最強である理由を解説し、現代社会におけるその重要性や影響力を最新の事例を通じて探求しています。著者は、統計学の基本概念や手法(サンプリング、誤差、因果関係、ランダム化など)を紹介し、統計学の魅力とパワフルさを伝えます。著者は東京大学出身の専門家で、データを活用した社会イノベーションに取り組んでいます。
学生の時にこの書籍を読んで統計学に興味を持った。統計学の魅力について分かりやすく学べる書籍。専門的な内容はそれほどないのでスラスラ読める。統計学ってどんなことができるの?なんでそんなにすごいの?ということを知りたい人がまず最初に読むべき本。
本書は、機械学習の発展を背景にした統計的学習に関する教科書「The Elements of Statistical Learning」の全訳です。機械学習は人工知能の一分野から発展し、統計学と密接に関連しています。内容は、教師あり学習の基礎からニューラルネットワークやサポートベクトルマシン、ブースティングなどの高度な手法まで幅広くカバーしており、情報技術を学ぶ大学生や研究者に最適です。著者は各分野の専門家で構成されています。
Pythonをしっかり学びたい人向けの本格的な入門書です。基礎から応用まで幅広いトピックをカバーしており、実際に手を動かしながら理解を深められるよう工夫されています。独習スタイルに特化しているため、自分のペースで着実に学びたい人におすすめ。豊富なコード例や練習問題もあり、プログラミングの実力を着実に高めることができます。
本書は、教師なし学習の重要性と実践的手法を紹介する内容です。教師なし学習はラベル付けされていないデータから学習し、従来の教師あり学習に比べてコストが低く、現実世界での応用が期待されています。データの隠れたパターンを特定し、異常検出や特徴量抽出を行う方法を解説し、変分オートエンコーダ(VAE)、敵対的生成ネットワーク(GAN)、制限付きボルツマンマシン(RBM)などの生成モデルも紹介しています。著者はデータサイエンスの専門家で、実務経験を持つ人物です。
本書は、機械学習における特徴量エンジニアリングの基本から応用までを解説したもので、初心者にも適しています。内容は数値、テキスト、カテゴリ変数の取り扱いや、次元削減、非線形特徴量生成、深層学習による特徴量抽出など、多岐にわたります。豊富な図や例を用い、Pythonコードによる実行例も多数掲載されており、実務に活かせる知識が得られます。著者は機械学習の専門家であり、実践的な内容が特徴です。
例題を試しながら地理空間データ分析の基本を学べる!数字だけの分析ではなく、地理空間を組み合わせることで、より立体的で精度の高い予測、分析ができるため、注目を集める地理空間データ分析をPythonで行うための入門書です。既存の公開データ、Jupyter Notebookで提供されているサンプルコード、QGISというオープンソースのGISソフトを使い、手軽に試して結果を出力してみることができます。空間データ分析において重要ながらも見過ごされがちな、正確なマップをデザインするコツ、非定型データ型の処理のテクニックなどもフォローしています。
この書籍は、地域密着型アウトドアショップがデジタルマーケティングを活用して業績を向上させるストーリーを通じて、デジタルマーケティングの基礎を学ぶ内容です。デジタル化を成功させるための条件や、重要な要素(MEO・SEO、データ分析、ECサイト構築、SNS活用など)が解説されています。著者は上野佑馬で、データ分析やデジタルマーケティングの専門家です。
デジタルマーケティングとデータ分析について漫画で分かりやすく学べる。基本的な内容が網羅的に学べるのでデジタルマーケティング職についたばかりのビジネスパーソンや個人事業や中小企業でこれからデジタルに力を入れようとしている経営者にオススメ!
新しいデータシステム「データレイク」をAWS(Amazon Web Services)で構築する方法を、クラウドのプロが充… 従来のデータベースを発展させた、クラウド時代のデータシステム「データレイク」をAWS(Amazon Web Services)上で実現するための指南書。クラウドのプロによる解説で概念と実践を充実解説。 「データレイク」は、大量データ分析/生成データの活用を視野に入れた新しいデータストアのかたちです。従来のデータベース/データウェアハウスの範囲に収まらない多様なデータを大量に保管し、高度な統計分析や機械学習に役立つ情報基盤を作ることが可能です。 本書ではデータレイクの概念や特徴、必要とされる機能などを基本から解説し、さらにAmazonが運営するパブリッククラウドサービスAWS(Amazon Web Services)で実現する方法を解説します。 従来では想定しえなかった大量のデータを確実に保管するため、データレイクの世界ではクラウドのようなサービス型インフラストラクチャの活用が注目されます。さらにAWSではオブジェクトストレージS3上のデータを直接分析するAmazon Athena、データウェアハウスのAmazon Redshift、機械学習を実現するAmazon SageMakerなど、データレイクを支えるさまざまな仕組みが存在します。 本書ではそれらの活用の指針を解説するとともに、後半ではシステムの構築例を具体的に解説していきます。ビジネスデータ分析とログなどの生成データ分析を例に、システム構築の流れを詳しく紹介し、機械学習や統計分析をビジネスの現場で活かせる仕組みの技術的なヒントを数多く提供します。 第1部 データレイクの概念と知識 序章 データレイ クを始めよう 第1章 データレイクの構築 第2章 データレイクの活用 第3章 データレイクの運用 第4章 データレイクのセキュリティ 第2部 データレイクの実践(基礎編) 第5章 ハンズオンの概要 ービジネスデータのデータレイクー 第6章 データを可視化する 第7章 サーバーレスSQLによるデータ分析 第8章 データを変換する 第9章 データを分析する(データウェアハウス) 第3部 データレイクの実践(応用編) 第10章 システムの概要 ーログデータのデータレイクー 第11章 ログを集める 第12章 ログの保管とカタログ化 第13章 ログを加工する 第14章 ログを分析する
本書は、エステル・デュフロ教授らによるランダム化比較試験(RCT)の理論と実践を解説したもので、エビデンスに基づく政策形成(EBPM)におけるRCTの活用方法を探ります。監訳者の小林庸平氏が難解な部分をわかりやすく補足し、RCTの重要性や実施に際しての留意点を詳述。EBPMや経済学の実証研究に興味のある読者にとって必読の一冊です。
この書籍は、マルコフ連鎖モンテカルロ法(MCMC)を理解しやすく解説しており、R言語のコードや練習問題が豊富に含まれています。初学者向けの内容ながら、エルゴード性などの高度なトピックにも触れています。データサイエンス教育の一環として、統計学と情報学を融合した新しい教科書シリーズの一部であり、実践的な教育を目指しています。著者は、数理科学と統計科学の分野で活躍する専門家です。
この書籍は、バイオサイエンス領域における統計検定法を解説した手引書です。基本概念から正しい使い方を身近な例を通じて学べる内容で、カラー図や漫画を用いたビジュアルが特徴です。初学者から上級者まで、レベルに応じた読み方が可能です。目次には、統計学の序説、検定の原理、さまざまな群の差の検定、回帰と相関、統計の利用と解釈についての項目が含まれています。
本書は、AIの「説明可能性」をテーマに、なぜAIに説明が必要なのかを考察し、具体的な手法やツールを解説しています。説明可能なAI(XAI)の技術や活用方法、代表的なライブラリ(LIME、SHAPなど)の使い方を紹介し、AIの公平性、説明責任、透明性に対応するための知識を提供します。内容は課題設定、基礎知識、実践指南、将来展望の4部構成で、具体的な実践手順も付録として含まれています。
本書は点過程の時系列解析に関する入門書で、データが特定のイベントの発生時刻の集合として扱われる点過程の理論と実データ解析を体系的に解説しています。地震や神経細胞の活動、金融取引などの現象を分析するために点過程が広く使われており、その応用範囲が拡大しています。著者は確率・統計の基礎を持つ読者を想定し、必要な理論や計算をできるだけ分かりやすく説明しています。目次にはポアソン過程やHawkes過程、統計推定法などが含まれています。著者は時系列解析や統計地震学の専門家です。
本書『ビッグデータの正体』は、ビッグデータが私たちの生活や仕事、意識に与える影響を探る内容で、企業がどのように新たな価値を創造し、人々が物事の認知をどう変えるべきかを示しています。具体的には、グーグルやアマゾンのデータ活用法、電子書籍の進化、映画産業の予測能力などを例に挙げ、ビッグデータがもたらす変化を論じています。また、データの量が質を凌駕する時代や、因果関係から相関関係へのシフトについても触れています。著者はビッグデータの専門家であり、この分野の重要性を強調しています。
ビッグデータがどのように世界を変えるのかが学べる書籍。鳥インフルエンザが流行った時に、医療機関よりも早くGoogleが検索傾向から流行地を知り対策を取れたという話からはじまる様々なビッグデータの使い方・重要性が学べる。
本書は、データ活用に悩む企業向けに、データ基盤の構築やデータ分析組織の立ち上げに必要なノウハウを提供します。データを集めても活用できない理由や、データ基盤が機能しない原因を解説し、適切なデータ整備や組織の構築方法を提案。著者たちはデータ活用のプロフェッショナルであり、実践的な知識を惜しみなく披露します。データ基盤を効果的に機能させたい方にとって、必読の一冊です。
本書は、ビッグデータ時代におけるSQLの活用法を紹介するレシピ集です。目次には、分析力の重要性、使用するツールとデータ、データ加工、売上やユーザー行動のデータ抽出、分析技術の向上、行動を起こすための知識の活用方法が含まれています。著者は加嵜長門と田宮直人で、双方ともデータ解析およびビッグデータ活用の専門家です。
「統計検定準1級試験対応公式テキスト」は、統計学と機械学習の幅広いトピックをカバーし、実践的な例題を通じて学べる内容です。頻出項目に重点を置き、各トピックについて解説と例題が提供されています。統計的手法の辞典としても活用できる一冊です。目次には、確率、分布、統計的推定、検定法、回帰分析、多変量解析、時系列解析など、幅広いテーマが含まれています。
本書は、コンピュータに関わる全ての人を対象にした線形代数の参考書であり、専門的な知識を持たない読者にも理解しやすく線形代数の本質を伝えることを目的としています。内容は、ベクトルや行列から始まり、逆行列、固有値、コンピュータでの計算方法などを網羅しており、数学的な考え方を促進します。著者は東京大学出身の平岡和幸と堀玄です。
本書は「集合と位相」という数学の難解な分野について、その重要性や歴史を解説します。著者は数学者たちの創意工夫を通じて、数学の発展の過程を明らかにし、読者に理解を促します。目次には、フーリエ級数や積分の再定義、実数直線と点集合の関係、ボレルの測度、ルベーグの積分などが含まれています。著者は数学基礎論を専門とする藤田博司氏です。
本書は「時系列解析」の手法を解説し、過去のデータから未来を予測するだけでなく、事象の理解にも役立つことを強調しています。マーケティングやIoTの実際の応用に焦点を当て、Pythonのサンプルコードを用いて基礎理論を説明。ARモデルやカルマンフィルタ、異常検知などの手法を段階的に学べるように構成されています。各手法の必要性や克服方法を提示し、読者が自学で応用範囲を広げられるよう工夫されています。
本書は、機械学習システムをビジネスやシステムに組み込むためのデザインパターンを解説したもので、Pythonを用いた実装例や運用方法を紹介しています。対象はAIエンジニアやシステムエンジニアで、機械学習の実用化を目指す方々です。DockerやKubernetesを利用し、学習から運用までの流れを説明。著者はMLOpsエンジニアの澁井雄介氏で、過去の経験を基に実践的なノウハウを提供しています。サンプルコードはGitHubから入手可能です。
この書籍は、統計学における変数選択問題に焦点を当て、スパース正則化を用いた変数選択とモデル推定の手法を解説しています。特に高次元データに対するアプローチや、データの疎性構造を抽出する研究が進んでおり、これらはスパース推定と呼ばれています。内容は入門から発展的な部分まで幅広く、実用的な統計モデリングに重点を置き、具体的な数値例やRによる解析コードも提供しています。対象は学部生から大学院生、実務者までで、スパース推定技術の習得を目指しています。
フリーソフトjs-STAR_XRが拡張され,ベイズ仮説検定にも新たに対応。データ分析から結果の書き方まで懇切にガイド。 「できる」から「わかる」へと読者の理解を体験的に導く,好評〈全自動〉シリーズ第2弾! フリーソフトjs-STAR_XRが拡張され,帰無仮説検定の代替案として近年関心が高まるベイズ仮説検定に新たに対応。巻末には半期や全7回の授業用シラバスを収載。データ分析からレポートの書き方まで,前著同様懇切にガイドする。 はじめに1:ベイズファクタと統計分析の学習法 はじめに2:シミュレーションによる主体的で深い学び Chapter0 事前準備 0.1 フリーウェア及び関連ファイルの準備 0.2 R画面の設定 Chapter1 1×2表のベイズファクタ分析 【演習1a】 みんなが好きなもの 1.1 データ入力・分析 1.2 『結果の書き方』 レポート例01-1 1.3 統計的概念・手法の解説1 ●ベイズファクタとは何か ●確率分布の尺度設定 ●95%確信区間推定 ●真の比率の範囲検定 【演習1b】 統計的仮説検定のシミュレーション 1.4 シミュレーションの操作手順 ●シミュレーションの基本操作 ●シミュレーションの応用操作 1.5 統計的概念・手法の解説2 ●ベイズファクタ分析のメリット ●二項検定のp値とBF値の比較 Chapter2 1×2表・母比率不等のベイズファクタ分析 【演習2a】 鶏肉は低温調理がおいしい 2.1 シミュレーションの操作手順 2.2 統計的概念・手法の解説1 ●p値とBF値の検定の仕組み 【演習2b】 新型ウイルスは従来型よりも危険か 2.3 データ入力・分析 2.4 『結果の書き方』 レポート例02-1 2.5 統計的概念・手法の解説2 ●ベイズファクタの事前設定問題 Chapter3 1×J表のベイズファクタ分析と対応のある度数の検定 【演習3a】 お昼に食べたいメニューは何か 3.1 データ入力・分析 3.2 『結果の書き方』 レポート例03-1 3.3 統計的概念・手法の解説1 ●多項分布によるBF値の計算 ●確信区間を用いた多重比較 3.4 自動評価判定1×2:統計的グレード付与 【演習3b】 道徳性に評価グレードを与える 3.5 純肯定率とグレードの付け方 3.6 自動集計検定2×2:連関の探索 【演習3c】 道徳性の項目間の関連を探索する 3.7 対応のある度数の検定:Q検定とMcNemar検定 【演習3d】 不支持の理由は集計するとダメ? レポート例03-2 3.7 統計的概念・手法の解説2 ●CochranのQ検定 ●McNemar検定 Chapter4 i×J表のベイズファクタ分析 【演習4a】 感受性が低い人は感情知能が働かない? 4.1 データ入力・分析 4.2 『結果の書き方』 4.3 標本タイプの選択 ●ポアソンタイプ:N =無作為,行・列=無作為 ●同時多項タイプ:N =固定,行・列=無作為 ●独立多項タイプ:行=固定,列=無作為 ●独立多項タイプの列組み:行=無作為,列=固定 ●超幾何タイプ:行・列=固定(2×2表のみ) レポート例04-1 4.4 統計的概念・手法の解説1 ●i×J表の事前確率分布 4.5 データセットraceDollsの分析:BF値の警報は誤報か 【演習4b】 黒人・白人の子どもは同人種の人形を好むか レポート例04-2 4.6 統計的概念・手法の解説2 ●Fisherの正確検定とBF値の検定 ●2×2表のp値とBF値の比較 4.7 ステレオタイプ効果と学習意欲 【演習4c】 ステレオタイプ効果で学習時間を延ばす レポート例04-3 Chapter5 t検定のベイズファクタ分析 【演習5a】 トレーニング法は分散法がよいか集中法がよいか 5.1 データ入力・分析 5.2 『結果の書き方』 5.3 統計的概念・手法の解説1 ●t値と効果量δ(delta) ●t検定のベイズファクタ分析の仕組み ●p値とBF値の検定結果の不一致 ●BF値を用いたノンパラメトリック検定 ●t検定のp値とBF値の比較 5.4 シミュレーション学習①:正規分布をつくる 【課題1〉正規分布をつくる 5.5 シミュレーション学習②:データを再現する 【課題2〉データを再現する 5.6 時間データの対数変換による分析 【演習5b】 トレーニングは伸び盛りに! レポート例05-1 5.7 統計的概念・手法の解説2 ●効果量δの範囲検定 Chapter6 1要因分散分析デザインのベイズファクタ分析 【演習6a】 SD法で創造性を高める 6.1 データ入力・分析 6.2 『結果の書き方』 レポート例06-1 6.3 統計的概念・手法の解説1 ●多重比較の早見表の利用 ●ベイズファクタ分析の仕組み:分散分析デザイン ●平均の95%確信区間 ●分散分析A sデザインのp値とBF値の比較 6.4 小学校英語指導に必要な技能は何か 【演習6b】 英語指導にどんな技能が必要か 6.5 『結果の書き方』 レポート例06-2 6.6 統計的概念・手法の解説2 ●参加者内デザインのベイズファクタ分析 Chapter7 2要因・3要因分散分析デザインのベイズファクタ分析 【演習7a】 協同経験はルール意識を高めるか 7.1 データ入力・分析 7.2 『結果の書き方』 レポート例07-1 7.3 統計的概念・手法の解説1 ●Inclusion BF:BF値のモデル平均化 ●全体モデル平均化 7.4 アイディア・プロダクション法 【演習7b】 アイディアの発想に“ 書き送り法”を用いる 7.5 『結果の書き方』 3要因デザイン レポート例07-2 7.6 統計的概念・手法の解説2 ●3要因デザインのBF値の平均化 7.7 シミュレーション学習①:2要因データを再現する 【課題1】 データの再現 7.8 シミュレーション学習②:交互作用を判別する 【課題2】 交互作用の判別 ●シミュレーションによる交互作用問題の解答要領 7.9 シミュレーション学習③:N,SDを変えてみる 【課題3】 N,SDを変える Chapter8 相関係数のベイズファクタ分析 【演習8a】 気温とアイスクリーム,ホットコーヒーの売り上げは相関するか 8.1 データ入力・分析 8.2 『結果の書き方』 8.3 統計的概念・手法の解説1 ●p値有意・BF値有効となる最小相関係数の比較 ●相関係数の差の検定 8.4 相関係数のシミュレーション学習 【演習8b】 シミュレーション課題①:散布図をつくる 【演習8c】 シミュレーション課題②:相関係数を予想する ●散布図問題の解答例 【演習8d】 シミュレーション課題③:外れ値のある散布図をつくる 8.5 統計的概念・手法の解説2 ●相関係数と説明率 Chapter9 回帰モデルのベイズファクタ分析 【演習9a】 革新性を高める職場風土とは? 9.1 データ入力・分析 9.2 『結果の書き方』 9.3 統計的概念・手法の解説1 ●初期モデルの選び方と独立変数の上限数 ●交互作用モデルの探索:ベイズ ファクタ回帰分析 ●BF値による回帰モデルの選出率 9.4 交互作用の単純傾斜分析 【演習9b】 明るさ×温かさの交互作用を分析する 9.5 『結果の書き方』 ステップワイズ回帰分析 レポート例09-1:単純傾斜分析の結果 9.6 統計的概念・手法の解説2 ●交互作用モデルの探索:ステップワイズ回帰分析 ●ベイズ情報量規準とベイズファクタ Chapter10 各種ユーティリティ 10.1 乱数発生ユーティリティ&乱数コマンド ●一様乱数コマンド unif(ユニフ) ●正規乱数コマンド norm(ノゥム) 10.2 階級化集計ユーティリティ 10.3 数値変換ユーティリティ 【練習問題1】 困難度の異なるテスト得点を標準化する 【練習問題2】 2ポイント尺度を4ポイント尺度に変換 【練習問題3】 3ポイント尺度を5ポイント尺度に変換 10.4 逆転項目処理ユーティリティ 10.5 欠損値処理ユーティリティ 付録 統計分析の授業用シラバス(参考例) シラバス参考例1 統計分析入門 シラバス参考例2 統計分析演習 索引 Column 1 セルへの数値入力の基本と小技 Column 2 分析結果の保存 Column 3 ダイアグラムで連関・相関を視覚的に表示 Column 4 スタック形式によるデータ入力 Column 5 平均のグラフとボックスプロットの利用 Column 6 シミュレーションボタンの使い方
この入門書の改訂版は、Pythonを使った強化学習の実装をゼロから丁寧に解説しています。読者のフィードバックを反映し、特にPolicy GradientとA2Cに関する内容を見直しました。具体的には、強化学習の基本概念、解法、ニューラルネットワークの適用、弱点とその克服方法、活用領域について詳述しています。公開されたコードを用いて実践的に学ぶことができます。
強化学習の①理論②実装③応用が三拍子揃ってってバランスよく書かれた良書です。強化学習は理論部分の難易度が高く、最初に読む本を間違える(理論をちゃんと勉強してから実装や応用に進もうとする)と挫折してしまうリスクが高い分野ですが、本書を最初に読んでおけば間違いありません。書籍内で示されているサンプルコードも品質が高く、実務でもそのままプロダクション環境で使えるレベルです(※適用先ドメイン固有の例外処理などは追加実装する前提)。
本書は、初学者向けのKaggle入門書で、実際のコンペに参加できるレベルを目指した内容です。サンプルコードの詳細な解説や、優勝経験のある著者によるわかりやすい説明が特徴です。内容はKaggleの基本知識から、Titanicデータセットを用いた実践的な分析、さらには複雑なデータの扱い方やコンペ参加のアドバイスまで幅広くカバーしています。付録にはサンプルコードの詳細解説も含まれています。
Python(パイソン)は初心者が比較的修得しやすく、AI(人工知能)やパターン認識などの先端技術に活用されている優れたプログラミング言語です。 本書では、初心者を対象に、Pythonを使ったプログラミングの勘所をやさしく解説しました。 例題に取り組むことで、プログラミングとはどういうものかを理解し、プログラミング的思考を身につけてもらうことを目的に執筆しました。 読者の皆さんが、楽しみながらPythonの素晴らしさやプログラミングの醍醐味を感じていただけたら、著者として望外の喜びです。
Python業界の第一線で活躍する執筆陣によるデータ分析エンジニアに求められる技術が最速で身に付く入門書 データ分析エンジニアに求められる技術の基礎が最短で身に付く ビッグデータの時代といわれ始めて数年が経過しました。 デバイスの進化により多くの情報がデジタル化され、 それらのデータを活用しようとデータ分析エンジニアに注目が集まっています。 この書籍では、データ分析において、 デファクトスタンダードになりつつあるプログラミング言語Pythonを活用し、 データ分析エンジニアになるための基礎を身に付けることができます。 書籍ではデータ分析エンジニアになるために必須となる技術を身につけていきます。 ・データの入手や加工などのハンドリング ・データの可視化 ・プログラミング ・基礎的な数学の知識 ・機械学習の流れや実行方法 本書で学べること ・Pythonの基本的な文法 ・データフォーマットについて ・データの前処理技術 ・データの可視化技術 ・既存アルゴリズムでの機械学習の実装 対象読者 データ分析エンジニアを目指す方 目次(抜粋) 第1章 データ分析とは 第2章 Pythonと環境 第3章 数学の基礎 第4章 ツールの基礎 第5章 応用:データ収集と加工 はじめに 謝辞 本書の対象読者と構成について Chapter1 データ分析エンジニアの役割 1.1 データ分析の世界 1.2 機械学習の位置づけと流れ 1.3 データ分析に使う主なパッケージ Chapter2 Pythonと環境 2.1 実行環境構築 2.2 Pythonの基礎 2.3 Jupyter Notebook Chapter3 数学の基礎 3.1 数式を読むための基礎知識 3.2 線形代数 3.3 基礎解析 3.4 確率と統計 Chapter4 ライブラリによる分析の実践 4.1 NumPy 4.2 pandas 4.3 Matplotlib 4.4 scikit-learn Chapter5 応用:データ収集と加工 5.1 スクレイピング 5.2 自然言語の処理 5.3 画像データの処理 INDEX 奥付
機械学習の手法やテクニックにフォーカスした書籍ではなくて、機械学習を仕事に取り入れるためにはどうすればよいのか?どういうところに注意しなくてはいけないのかがまとめられた書籍。実務で機械学習を利用している人利用する可能性のある人は絶対に読むべき書籍。そもそも本当に機械学習を使う必要があるのかということをしっかり考える、機械学習ありきのプロジェクトは必ず失敗する。
本書は、Python初心者向けに基本的なプログラムや人工知能アプリの作成を対話形式で学べる内容です。著者は森巧尚で、イラストを交えながら基礎知識を解説し、最新の環境に対応しています。エラー対応法も掲載されており、安心して学習できるよう配慮されています。目次には、Pythonの基礎からアプリ作成、人工知能に関する章が含まれています。
本書は、プログラミング初心者向けにリニューアルされた「いちばんやさしいPythonの本」で、最新のPython 3に完全対応しています。イラストやサンプルが豊富で、オブジェクト指向やWebアプリ開発、データ処理の基本も学べます。新たに2章が追加され、プログラミングの楽しさと効率化の重要性を伝え、読者がスキルを身につける手助けをします。著者は東京大学の辻真吾氏で、Pythonの普及活動にも力を入れています。
Pythonの基礎をしっかりと学べる構成になっていて、プログラミング初心者にも取り組みやすい内容。基本的な文法から実際に使えるスクリプトまで、ステップバイステップで解説されているため、無理なく進められます。増補改訂版として新たなトピックも追加されており、実践的なスキルを習得したい人にぴったりです。
Pythonを学びはじめる際に最初に読む本として最適。非常に分かりやすく基礎の基礎から学べる。
数学的にマーケティングを学ぶのであれば絶対にこれ。というかこれくらいしか数学的観点でここまで詳しくマーケティングについて学べる書籍はない。森岡さんがどうやってUSJを立て直したのかが数学的な観点から学べる。「USJを変えたたった1つのこと」と合わせて読むことでマーケティングのいろはが身につくはず。
この書籍は、R言語を用いたデータ解析の入門書で、進化し続けるRの機能を活用する方法を紹介しています。初版以来、多くのRユーザーに支持されてきたロングセラーで、第2版では深層学習やネットワーク分析など新たな内容が追加されています。データマイニングの基礎から始まり、主成分分析やクラスター分析、ニューラルネットワークなど多岐にわたる分析手法を学ぶことができます。著者は金明哲で、統計科学の専門家です。