【2024年】「データサイエンス」のおすすめ 本 131選!人気ランキング
- AI・データ分析プロジェクトのすべて[ビジネス力×技術力=価値創出]
- Kaggleで勝つデータ分析の技術
- Python実践データ分析100本ノック
- 機械学習のエッセンス -実装しながら学ぶPython,数学,アルゴリズム- (Machine Learning)
- 実践Data Scienceシリーズ RとStanではじめる ベイズ統計モデリングによるデータ分析入門
- 図解ポケット 今日から使える! データサイエンスがよくわかる本
- 東京大学のデータサイエンティスト育成講座 ~Pythonで手を動かして学ぶデ―タ分析~
- データ分析のための数理モデル入門 本質をとらえた分析のために
- 見て試してわかる機械学習アルゴリズムの仕組み機械学習図鑑
- はじめてのパターン認識
本書は、AI・データ分析プロジェクトの成功には技術知識だけでなく「ビジネス力」が重要であることを強調しています。データサイエンティストのキャリアや業界の概要から始まり、プロジェクトの立ち上げ、実行、評価、収益化までのノウハウを網羅。具体的には、課題設定、案件獲得、データ分析手法の検討、レポーティングなどのプロセスを解説し、実務に役立つ情報を提供しています。著者は業界の専門家で、実践的な知識を基にした内容となっています。
本書は、データサイエンスにおけるコンペティション、特にKaggleに焦点を当て、実践的なデータ分析手法やテクニックを紹介しています。分析コンペに参加することで得られるスキルは、実務でも役立つため、特徴量の作成やモデルの評価、チューニングなどの具体的な内容が含まれています。著者たちは、データサイエンスの専門家であり、実績を持つKaggleの競技者です。この本は、コンペに挑戦したい人や実務でのモデル精度向上を目指す人にとって有益な情報源となるでしょう。
データ分析コンペKaggleに挑戦するならこれをまず読んでおけば大丈夫!Kaggleに参加しないにしてもデータ分析の本質やテクニックがギュッと詰まっているので実務に活かせる。高度な内容も登場するが分かりやすく解説してくれるので初心者でも読みやすい。それでいてベテランの人も多くの学びがある書籍。著者はKaggleの最上位グランドマスターの方々であり説得力がある。過去のコンペの事例も取り上げてくれるのでそんなアプローチあったのかぁと学びが深い。文句なしの星5つ!
本書は、機械学習の有名なアルゴリズムをPythonを用いてゼロから実装することを目的としています。実用的なフレームワークを使用するのではなく、機械学習の仕組みを深く理解することで応用力や問題解決力を高めることを目指しています。内容は、Pythonの基本、機械学習に必要な数学、数値計算、そして具体的な機械学習アルゴリズムに関する解説を含んでおり、初心者や実務に携わるエンジニアに適しています。著者はシルバーエッグ・テクノロジーのチーフサイエンティストで、機械学習アルゴリズムの設計・実装に精通しています。
本書は「統計モデリングの世界」への入門書で、統計、確率、ベイズ推論、MCMCの基本をチュートリアル形式で学べる内容です。RやStanを用いたデータ分析の基礎から、一般化線形モデルや一般化線形混合モデル、状態空間モデルまでを体系的に解説しています。データサイエンスを学ぶ大学生やエンジニア向けの実践的なシリーズの一環として、すぐに実践できるスキルを身につけることができます。
本書は、データサイエンスの基本概念から実際のビジネス活用事例までを豊富な図やイラストを用いて解説し、初心者でも理解しやすい内容になっています。データサイエンスの重要性が増す中、数学的な専門用語を避けながら、機械学習や先端テクノロジーとの関連も紹介。ビジネスパーソンや学生にとって、データサイエンスを学ぶための入門書として最適です。
本書は、東京大学での人気講義に基づき、データサイエンティストになるための基礎知識を提供します。Pythonを用いたプログラミングやデータ操作、確率・統計、機械学習の基本を学べる内容で、実践的な演習問題も豊富に含まれています。対象読者は、理系の大学生や社会人で、データサイエンスの入門から中級レベルを目指す人です。実際のデータを使いながらスキルを身につけることができることが特徴です。
本書は、数理モデルの多様な手法を解説し、データ分析における選択と理解を促進する入門書です。機械学習や統計モデルなど、自然科学と人文社会科学の手法を網羅し、初学者がデータ分析の全体像を把握できるように設計されています。特に、モデリング手法の選択や誤解しやすい点について丁寧に説明し、大学一年生でも理解できるレベルでありながら、より進んだ読者にも楽しめる内容となっています。著者は東京大学の特任講師で、幅広い分野での数理的解析に取り組んでいます。
データサイエンスを学ぶ上でこちらに一通り目を通しておくとベースが出来上がると思うのでオススメ。幅広く学べるがそこまで深く突っ込まないので気に入った領域は他の書籍で補完した方がよいかも!
本書は、機械学習アルゴリズムをオールカラーの図を用いてわかりやすく解説した入門書です。17種類のアルゴリズムを紹介し、各アルゴリズムの仕組みや使用方法、注意点を詳述しています。Pythonを用いたコードも掲載されており、実際に試しながら学ぶことができます。機械学習を学ぶ初心者や業務で利用している方にも役立つ内容となっています。
この入門書は、パターン認識について基礎からわかりやすく解説しており、特にRを用いた実行例が含まれているため、実際の応用にも役立ちます。内容は識別規則や学習法、ベイズの識別規則、k最近傍法、サポートベクトルマシンなど多岐にわたり、最後には識別器の性能強化についても触れています。著者は筑波大学の名誉教授、平井有三氏です。
「はじめての」とついているが入門書ではなく結構難しい。ただ、機械学習の様々な手法が数式から学べるため中級者〜上級者には良いと思う。他の入門書で機械学習の概要を掴んだ後に読むべき本。
本書は、機械学習の発展を背景にした統計的学習に関する教科書「The Elements of Statistical Learning」の全訳です。機械学習は人工知能の一分野から発展し、統計学と密接に関連しています。内容は、教師あり学習の基礎からニューラルネットワークやサポートベクトルマシン、ブースティングなどの高度な手法まで幅広くカバーしており、情報技術を学ぶ大学生や研究者に最適です。著者は各分野の専門家で構成されています。
本書は、深層学習に関する改訂版のベストセラーで、トランスフォーマーやグラフニューラルネットワーク、生成モデルなどの手法を詳しく解説しています。著者は、理論的な証明がなくても納得できる説明を重視し、実用性を考慮した内容を提供。全12章で、基本構造から各種学習方法、データが少ない場合の対策まで幅広く網羅しています。著者は東北大学の教授であり、実務家との共同研究の経験も反映されています。
この書籍は、データ分析における視点を磨き、質の高い研究を行うためのガイドです。内容は、無作為性や統計的推測、研究デザイン、データ解析の基礎について解説しています。目次は基礎編とアラカルト編に分かれ、平均値や頻度、イベント発生時間の比較方法も取り上げています。著者は丹後俊郎氏で、医学統計学の専門家です。
この書籍は、時系列分析の基礎から応用までを詳しく解説しています。内容は、時系列分析の基礎概念、ARMA過程、予測手法、VARモデル、単位根過程、見せかけの回帰と共和分、GARCHモデル、状態変化を伴うモデルに分かれています。著者の沖本竜義は、経済学と統計学の専門家であり、実データへの応用に必要な知識を提供しています。
本書は、時系列データの分析方法を基礎から解説しています。探索的手法として移動平均、確率的手法として状態空間モデルを取り上げ、数式の意味やコードへの落とし込み方を丁寧に説明しています。初めて時系列分析を試みる人や、既に関わっている人にも興味深い内容となっており、応用的な話題もカバーしています。著者は牧山幸史、監修は石田基広です。
この書籍は、RとPythonの両方を学べるデータサイエンスの入門書です。プログラミング経験がなくても理解できるように、データサイエンスの基礎や環境構築について詳しく解説しています。内容は、データサイエンスの準備、機械学習の手法(回帰、分類、深層学習など)に分かれており、実践的なサンプルコードも提供されています。著者は東京大学と千葉工業大学の教授で、情報処理技術者試験委員を務めています。
本書は、統計学の基礎から応用までを扱った内容で、基礎編ではR言語を用いた記述統計や統計的仮説検定について解説し、応用編ではベクトルや行列、データフレーム、外れ値の影響などを取り上げています。著者は、教育心理学を専門とする学者たちで、各自が教育機関での実績を持っています。
本書は、Pythonのデータ処理ライブラリ「pandas」の実践的な使用法を約100のレシピ形式で紹介するもので、データ分析や科学計算に役立つ内容が含まれています。各レシピは手順や解説が整然とまとめられており、データ構造の基本から可視化技術まで幅広くカバーしています。著者はデータサイエンティストのTheo Petrouで、教育やデータ分析に関する豊富な経験を持っています。読者はデータサイエンスに興味のあるすべての人を対象としています。
この文章は、統計学に関する書籍の目次と著者情報を紹介しています。目次には、一変量データや多変量データの記述、確率分布、推定方法、仮説検定などのテーマが含まれています。著者は神永正博と木下勉で、それぞれの学歴と職歴が簡潔に記載されています。神永は数学の博士で、木下は工学の博士です。
本書はデータ視覚化の重要性と技術を解説しており、単なるグラフ作成にとどまらず、データの意味を明確にし、オーディエンスに興味を持たせることを目的としています。筆者は日本人女性唯一のTableau ZEN MASTERであり、実践的なノウハウや事例を通じて、データ視覚化の基礎からプロフェッショナルなテクニックまでを紹介しています。主要な章では、視覚化の基本概念、プロっぽく見せるコツ、適切なチャートの選択、実際のダッシュボード作成事例、組織内でのデータ視覚化の浸透方法について詳しく説明しています。
本書は、欠測データの解析における多重代入法の実用的な手法を解説しています。従来の書籍では理論中心でしたが、本書では具体的な応用事例や手順を示し、社会科学の分析手法(t検定、重回帰分析、ロジスティック回帰分析など)における欠測データ処理を詳述しています。Rコードと実データを用いて、読者が実際に手順を再現しながら学ぶことができるようになっています。著者は、統計科学や不完全データ処理法の専門家です。
本書は、2018年に発行された機械学習に関する書籍の全面改訂版で、不確実性の高い機械学習プロジェクトを「仕事で使う」という視点から整理しています。新たに「ML Ops」や「機械学習モデルの検証」などの章が追加され、読者が直面する問題解決に役立つ内容となっています。著者は機械学習分野の専門家で、実践的な知識を提供しています。
機械学習の手法やテクニックにフォーカスした書籍ではなくて、機械学習を仕事に取り入れるためにはどうすればよいのか?どういうところに注意しなくてはいけないのかがまとめられた書籍。実務で機械学習を利用している人利用する可能性のある人は絶対に読むべき書籍。そもそも本当に機械学習を使う必要があるのかということをしっかり考える、機械学習ありきのプロジェクトは必ず失敗する。
この書籍は、R言語を用いたデータ解析の入門書で、進化し続けるRの機能を活用する方法を紹介しています。初版以来、多くのRユーザーに支持されてきたロングセラーで、第2版では深層学習やネットワーク分析など新たな内容が追加されています。データマイニングの基礎から始まり、主成分分析やクラスター分析、ニューラルネットワークなど多岐にわたる分析手法を学ぶことができます。著者は金明哲で、統計科学の専門家です。
本書は、機械学習を実践的に学ぶための教材で、scikit-learn、TensorFlow、Kerasを用いて、基礎から応用までの手法を体系的に解説しています。内容には、データ処理、モデル学習、深層学習、強化学習、コンピュータビジョン、自然言語処理などが含まれ、サンプルコードはすべてGitHubで公開され、Jupyter Notebookで試すことができます。第2版では新たに畳み込みニューラルネットワークやGANによる画像生成の説明も追加されています。機械学習を学びたいエンジニアにとって必携の一冊です。
本書は、ビジネスにおけるデータ分析の重要性とそのバイアスを取り除くための手法を解説しています。特に、意思決定に影響を与えるデータの生成過程におけるバイアスの存在を指摘し、単純な比較が誤った結論を導く可能性について警鐘を鳴らします。著者は、RCT(ランダム化比較試験)を理想的な分析手法として紹介し、RCTが実施できない場合でも因果推論を用いて効果的な分析が可能であることを説明します。目次には、セレクションバイアスや回帰分析、傾向スコア、差分の差分法などの具体的な手法が含まれています。著者は経済学の専門家で、データサイエンスの分野でも活躍しています。
この書籍は、マルコフ連鎖モンテカルロ法(MCMC)を理解しやすく解説しており、R言語のコードや練習問題が豊富に含まれています。初学者向けの内容ながら、エルゴード性などの高度なトピックにも触れています。データサイエンス教育の一環として、統計学と情報学を融合した新しい教科書シリーズの一部であり、実践的な教育を目指しています。著者は、数理科学と統計科学の分野で活躍する専門家です。
本書は、理解しやすいコードを書くための方法を紹介しています。具体的には、名前の付け方やコメントの書き方、制御フローや論理式の単純化、コードの再構成、テストの書き方などについて、楽しいイラストを交えて説明しています。著者はボズウェルとフォシェで、須藤功平氏による日本語版解説も収録されています。
本書は、ネットワーク分析の理論と実践をRというフリーソフトを用いて学ぶためのガイドです。第2版では、統計的なネットワーク分析手法や社会ネットワーク、ソーシャルメディアの分析法に関する新しい章が追加され、複雑ネットワークやネットワーク描画の内容も改訂されています。著者は鈴木努で、社会学を専攻し、東北学院大学の准教授として勤務しています。
本書は、ビッグデータ時代におけるSQLの活用法を紹介するレシピ集です。目次には、分析力の重要性、使用するツールとデータ、データ加工、売上やユーザー行動のデータ抽出、分析技術の向上、行動を起こすための知識の活用方法が含まれています。著者は加嵜長門と田宮直人で、双方ともデータ解析およびビッグデータ活用の専門家です。
この書籍は、データ分析における「分析モデル」をテーマにしたもので、回帰分析や深層学習、強化学習などの実践的な分析手法を網羅的に解説しています。著者は、データ分析者がモデルの本質を理解し、データを最大限に活用できるようにすることを目的としています。内容は定型データから非定型データの扱い、強化学習、データから知見を得る方法まで多岐にわたり、各章で具体的な手法や技術が詳しく説明されています。著者は東京大学の博士号を持つデータサイエンティストで、データ分析の啓蒙活動にも従事しています。
オークランド・アスレチックスのゼネラルマネジャー、ビリー・ビーンが統計データを活用して球団を改革し、資金不足から成績を向上させる様子を描いたノンフィクションの全訳版。ビーンの革新的な手法と生き様が感動を呼び、ブラッド・ピット主演で映画化された。著者はマイケル・ルイス。
「データサイエンティスト養成読本」の改訂版で、データサイエンティストに必要なスキルセットを最新の内容で解説しています。ソフトウェアや分析ツールの進化に対し、基本的なスキルは変わらないことを強調。内容はデータ分析のプロセスやビジネス成果を意識した分析方法、実践的なデータ分析入門、マーケティング分析の手法、基礎知識の習得など多岐にわたります。著者は里 洋平、和田 計也、早川 敦士など。
ビジネスや意思決定の場面で,データを活用したい方に手にとっていただきたいデータサイエンスの入門書。目的別の分析手法を幅広く… ビジネスや意思決定の場面で,データを活用したい方に向けたデータサイエンスの入門書。データの種類ごとの性質や収集時の注意点,目的別の分析手法からデータ可視化まで幅広く扱う。各章末には課題を設置し,最終章ではデータサイエンスの展望や限界についても言及。 第1章 データサイエンスとは 第2章 データ収集のための基礎知識 第3章 データ空間の構成法 第4章 データ生成のメカニズム 第5章 データの可視化手法 第6章 データ分析の手法 第7章 データ活用のフレームワーク 第8章 データの分析事例 第9章 データ分析上の注意点と応用知識
本書は、データ分析に必要な知識を包括的に解説した教科書で、分析手法だけでなく、データの質や解釈方法にも焦点を当てています。実践的なデータの扱いや心理学的バイアス、サンプリング方法、数理モデリングのポイントなどを幅広くカバーし、数学に自信のない読者でも理解できるよう工夫されています。データサイエンティストや研究者、ビジネスマンにとって有益な内容で、興味深い事例も豊富に紹介されています。著者は東京大学の特任講師で、さまざまな分野の問題に取り組んでいます。
この書籍は、マーケティング調査や金融リスク、株・為替のボラティリティ、選挙の出口調査など、さまざまな分野でのデータ分析の基礎を解説しています。内容は、標準偏差や検定、区間推定などの基本的な統計手法から、観測データを用いた母集団の推定方法まで幅広くカバーしています。著者は帝京大学の助教授で、数理経済学を専門とする小島寛之氏です。
本書は、データサイエンティストの思考過程を紙と鉛筆を使って学ぶことを目的としています。PythonやRなどのプログラミング言語を使わず、40問のクイズを通じてデータの読み解き方や説明の仕方を体験できます。デジタル時代に必要なデータリテラシーを身につけたい人や、データを使って論理的に考えたい人におすすめです。各章では、データを読む、説明する、分類する、法則を見つける、予測する力を育む内容が展開されています。
本書『Python Machine Learning: Machine Learning and Deep Learning with Python, scikit-learn, and TensorFlow 2, 3rd Edition』は、機械学習の理論とPythonによる実践を解説するベストセラーの第3版です。分類、回帰、深層学習、強化学習など幅広いトピックをカバーし、最新のPythonライブラリに対応しています。特に、敵対的生成ネットワークと強化学習の新章を追加し、従来の内容を刷新しました。機械学習の理解を深めるための実用的な一冊です。
文科と理科両方の学生のために,統計的なものの考え方の基礎をやさしく解説するとともに,統計学の体系的な知識を与えるように,編集・執筆された.豊富な実際例を用いつつ,図表を多くとり入れ,視覚的にもわかりやすく親しみながら学べるよう配慮した. 第1章 統計学の基礎(中井検裕,縄田和満,松原 望) 第2章 1次元のデータ(中井検裕) 第3章 2次元のデータ(中井研裕,松原 望) 第4章 確率(縄田和満,松原 望) 第5章 確率変数(松原 望) 第6章 確率分布(松原 望) 第7章 多次元の確率分布(松原 望) 第8章 大数の法則と中心極限定理(中井検裕) 第9章 標本分布(縄田和満) 第10章 正規分布からの標本(縄田和満) 第11章 推定(縄田和満) 第12章 仮説検定(縄田和満,松原 望) 第13章 回帰分析(縄田和満) 統計数値表 練習問題の解答
本書は最適化手法についての入門書であり、経営学やオペレーションズリサーチだけでなく、統計的最適化や機械学習の話題も扱っています。計算機技術の進歩により、複雑な最適化問題が解決可能になった背景を踏まえ、各手法の原理や数学的背景を詳しく解説しています。内容は例題を多く用いて分かりやすく、関連する話題や注意点も随所に挿入されています。目次には数学的準備、関数の極値、最適化手法、最小二乗法、統計的最適化、線形・非線形計画法、動的計画法が含まれています。著者は岡山大学の金谷健一教授です。
内容は少々難解だが、統計学や機械学習・データサイエンス分野のエッセンスが詰まっていて何度も読み返したい書籍。大学院生時代の授業の輪読して使用し、目からウロコの連続だった。ある程度基礎固めをした後に読んでほしい1冊
本書は確率についての基礎から応用までを扱っています。第1部では確率の定義や複数の確率変数、確率分布について説明し、第2部では推定や検定、擬似乱数の活用法を紹介しています。付録には数学の基礎事項や確率論の補足が含まれています。著者は数理工学の専門家で、機械学習や脳科学の研究に従事しています。
『A First Course in Bayesian Statistical Methods』の日本語訳で、ベイズ統計の基礎と計算手法を学ぶ書籍です。確率論の基本から始まり、正規モデルや階層モデル、線形回帰モデルなどのベイズ法を詳述し、潜在変数モデルなどの応用も紹介しています。Rによる実装方法やサンプルコードも提供され、社会科学や医学、生物学など多様な分野での応用例が取り上げられています。著者はピーター・D・ホフ教授で、他に翻訳者として入江薫、菅澤飯之助、橋本真太郎が関わっています。
この書籍は、データ分析の基礎から応用までを学べる内容で、データ可視化や統計手法、仮説検定、重回帰分析など、一生使えるスキルを身につけることができます。著者はデータサイエンティストとしての豊富な経験を持ち、実務に役立つ知識を提供しています。目次にはデータ分析の全体像や具体的な手法が紹介されています。
『Data Visualization: A Practical Introduction』の日本語訳が刊行され、全世界のRユーザーに支持されている。この本は、データ可視化の基本を初心者でも理解できるように解説しており、ggplotやtidyverseの知識がなくても実践的に学べる内容となっている。データの見せ方や可視化の手順に加え、実践的なスキルを提供。著者はデューク大学の教授であり、さまざまな専門家が推薦している。目次にはデータの整形や地図描画など、多岐にわたるテーマが含まれている。
この書籍は、数理モデルを用いて現象を理解するための基本的な統計モデルの考え方を、章ごとに異なる例題を通じて解説しています。前半では一般化線形モデル(GLM)の基礎を紹介し、後半では階層ベイズモデル化の手法をRとWinBUGSを用いて具体的に説明します。著者は久保拓弥氏で、生態学のデータ解析に関する統計学的方法を研究しています。
線形回帰分析を学んでそこから一般化線形回帰モデル、ベイズと拡張していく上で非常にオススメな本。初学者には少々難解な部分もあるが、統計学を学ぶ上で必ずどこかで読んで欲しい書籍。学生の時に読んだが、これを読むことでこれまで学んできた内容が整理され頭がクリアになった記憶がある。統計学を語るなら絶対読んで欲しい非常におすすめの書籍。
本書は、ビジネスにおけるデータ活用の重要性を背景に、因果分析の手法である「因果推論」と「因果探索」を学ぶための実践的なガイドです。因果推論は施策の効果を推定する手法であり、因果探索はデータから因果関係を明らかにする方法です。読者はPythonや機械学習ライブラリを用いて実際にプログラムを実装しながら、これらの手法を習得できます。内容は因果推論の基本から機械学習の応用、さらに因果探索の実装まで多岐にわたります。
この書籍は、ディープラーニングをゼロから実装することで学ぶ入門書です。Python 3を用いて、基礎から誤差逆伝播法や畳み込みニューラルネットワークなどの実装を通じて理解を深めます。また、ハイパーパラメータの設定やBatch Normalization、Dropout、Adamなどの最新技術、さらには自動運転や画像生成などの応用例についても触れています。著者は斎藤康毅氏で、コンピュータビジョンや機械学習の研究開発に従事しています。
ディープラーニングの概要は分かっているし機械学習はある程度理解しているつもりだけど、ディープラーニングの中身はちゃんと理解できていない人にぜひ読んで欲しい書籍。ディープラーニングは一旦これ1冊読んでおけば問題なし。複雑で難しい印象だったディープラーニングがこれを読むだけで一気に身近なものになる。
この書籍は、ディープラーニングを手を動かしながら学べる入門書で、最新のトレンドや無料クラウドGPUの活用法を解説しています。20以上の実例を通じて、機械学習や深層学習の基礎から応用までを学べる内容です。目次には、学習の地図、基礎知識、実践事例、Colaboratoryの使い方が含まれています。著者はIT企業での技術マネージャーとしての経験を持つ増田知彰氏です。
この書籍は、数理統計学の基礎概念と理論を数学的かつ言葉で丁寧に解説した新装改訂版です。新たに40題の練習問題が追加され、解答例はサポートサイトで提供されます。統計検定®1級試験の学習にも適しており、幅広い話題を統一的な視点で理解できる内容となっています。著者は竹村彰通で、経済学やデータサイエンスの専門家です。
本書は一般化線形モデルについての統一的な枠組みを提供するもので、回帰分析や生存分析など様々な統計手法を扱っています。1993年に翻訳された「統計モデル入門」の第2版で、特に医学分野での高度な統計手法の需要に応える内容となっています。目次にはモデルの当てはめ、推定、推測、ロジスティック回帰、生存時間解析などの章が含まれています。著者はそれぞれ異なる専門背景を持つ大学教授たちです。
本書は、データ活用に悩む企業向けに、データ基盤の構築やデータ分析組織の立ち上げに必要なノウハウを提供します。データを集めても活用できない理由や、データ基盤が機能しない原因を解説し、適切なデータ整備や組織の構築方法を提案。著者たちはデータ活用のプロフェッショナルであり、実践的な知識を惜しみなく披露します。データ基盤を効果的に機能させたい方にとって、必読の一冊です。
本書は、ウェブサービスの開発においてユーザ体験を向上させるための手法を学ぶための書籍です。A/Bテストや線形モデル、メタヒューリスティクス、バンディットアルゴリズム、ベイズ最適化などの数理的手法を紹介し、Pythonによるサンプルコードと図を用いて機械学習と統計学の基礎を解説しています。ウェブ最適化や機械学習に興味がある読者に適した内容です。著者はUXエンジニアの飯塚修平氏で、ウェブ最適化の研究に従事しています。
本書は、プログラミング初心者向けにリニューアルされた「いちばんやさしいPythonの本」で、最新のPython 3に完全対応しています。イラストやサンプルが豊富で、オブジェクト指向やWebアプリ開発、データ処理の基本も学べます。新たに2章が追加され、プログラミングの楽しさと効率化の重要性を伝え、読者がスキルを身につける手助けをします。著者は東京大学の辻真吾氏で、Pythonの普及活動にも力を入れています。
Pythonの基礎をしっかりと学べる構成になっていて、プログラミング初心者にも取り組みやすい内容。基本的な文法から実際に使えるスクリプトまで、ステップバイステップで解説されているため、無理なく進められます。増補改訂版として新たなトピックも追加されており、実践的なスキルを習得したい人にぴったりです。
Pythonを学びはじめる際に最初に読む本として最適。非常に分かりやすく基礎の基礎から学べる。
『Python実践データ分析100本ノック 第2版』は、実際のデータ分析現場で遭遇する「汚いデータ」を扱うためのノウハウを提供する実践的な問題集です。データ加工から機械学習、最適化問題まで幅広くカバーし、ビジネスで即戦力となる応用力を養成します。内容は基礎編、実践編、発展編に分かれ、各章で具体的な課題を解決する形式で学びます。著者はデータ分析や機械学習の専門家であり、最新技術を取り入れた内容になっています。
本書は、ディープラーニングの実用化に向けた最新の動向と事例を紹介するもので、国内35社の具体例を通じてその活用方法や課題を解説しています。東京大学の松尾豊氏による技術的発展のロードマップを基に、業務効率化や新規事業創出に役立つ情報を提供。各章では、単純作業の自動化から異常検知、ロボットや自動運転技術、さらには創作業務への応用まで幅広くカバーしています。また、ビジネス活用に関するQ&Aも含まれ、企業の導入に役立つ内容となっています。
名著をリニューアル! あなたの課題に適したモデルをつくる、評価する、改良する、すべての段階に必要なことがこの1冊に。 ◆◆ロングセラー、10年ぶりの改訂◆◆ ・全ページをフルカラー化したので、図表もさらにわかりやすく! ・非定常時系列データ解析の基本を加筆(第8章を新設) データの見方や考え方から述べられた本当にほしかった入門書。 それぞれがもつ「予測したい」課題に自ら取り組むための基本を1冊にまとめた。 「モデリングが使えるということはわかった、これからは使いたい!」という人は必読。 統計のプロ中のプロが伝授する「匠の技」「匠の知恵」コラムも多数収録。 【推薦の言葉】 本書は予測のための統計的モデリングの方法を,基礎から具体的実践例に亘るまで明快に解説している特色ある著作である. 平易な記述でベイズの定理などの基礎から粒子フィルタやデータ同化などの先端的な内容までをカバーしている. 便利なブラックボックス型のAI予測では飽き足らず,自分が抱える具体的な課題に対して自らのアイデアを投入し,説明可能な予測をしてみようと思い立った人には必読の書である. ――北川 源四郎先生(東京大学特任教授、数理・データサイエンス教育強化拠点コンソーシアム 議長) 【まえがき(抜粋)】 統計学の強みは,生成モデルの構築に関する,さまざまな知見とノウハウの蓄積,またモデルに基づく意思決定の綿密な評価にある.ある種,モデリングに関する匠の技とも言える暗黙知に,統計学の存在感が増していくであろう.読者が本書を通じてこの暗黙知を習得されることを期待したい. 【目次】 〈基礎編〉 第1章 予測とは何かを考える 第2章 確率による記述:基礎体力をつける 第3章 統計モデル:予測機能を構造化する 第4章 計算アルゴリズム1:予測計算理論を学ぶ 〈展開編〉 第5章 計算アルゴリズム2:モデルを進化させる 第6章 粒子フィルタ:予測計算を実装する 第7章 乱数生成:不確実性をつくる 〈実践編〉 第8章 時系列解析の基本:傾向をつかむ 第9章 経験知の総結集:売上予測の精度を上げる 第10章 データ同化:シミュレーションの予測性能を向上させる 第11章 確率ロボティクス:お掃除ロボをつくる 〈基礎編〉 第1章 予測とは何かを考える 1.1 居酒屋の売上高の予測 1.2 期待感を数式で表す 1.3 パターンの表現 第2章 確率による記述:基礎体力をつける 2.1 確率の基礎 2.2 最適化問題から統計モデルへ 第3章 統計モデル:予測機能を構造化する 3.1 状態空間モデル 3.2 鎖状構造グラフィカルモデル 3.3 多次元ノイズの分布モデル 第4章 計算アルゴリズム1:予測計算理論を学ぶ 4.1 事後周辺分布 4.2 非線形フィルタリング 4.3 平滑化アルゴリズム 4.4 状態ベクトルの推定と予測誤差 〈展開編〉 第5章 計算アルゴリズム2:モデルを進化させる 5.1 状態ベクトルの拡大 5.2 学習によるモデルの改良 第6章 粒子フィルタ:予測計算を実装する 6.1 分布の近似 6.2 アルゴリズム 6.3 粒子フィルタの図説 第7章 乱数生成:不確実性をつくる 7.1 リサンプリングの実装 7.2 システムノイズの生成法 7.3 賢いリサンプリング 7.4 粒子フィルタの実装例 〈実践編〉 第8章 時系列解析の基本:傾向をつかむ 8.1 定常と非定常:非定常の特徴を目で確認する 8.2 定常化:原データにいろいろな操作を加える 8.3 非定常成分の抽出:シンプルな状態空間モデルを非定常データに適用する 第9章 経験知の総結集:売上予測の精度を上げる 9.1 観測モデル:データを徹底的に要素に分解する 9.2 勘と経験をとり込む 9.3 外生変数の影響を柔軟に表現する 9.4 状態空間モデルにまとめる 9.5 結果 第10章 データ同化:シミュレーションの予測性能を向上させる 10.1 シミュレーション計算 10.2 データ同化の状態空間モデルへの埋め込み 10.3 逐次データ同化 第11章 確率ロボティクス:お掃除ロボをつくる 11.1 自己位置推定問題 11.2 一般状態空間モデル表現 11.3 実際の適用
最適化、確率・統計などの基本的な計算から、ハミルトニアンモンテカルロ法、階層ベイズ、状態空間モデルの原理までを丁寧に解説! ◆◆数式とコードの距離が近いJuliaで一生モノの考え方を身につけよう!◆◆ 線形代数、微積分、最適化、確率・統計の基本的な計算から、 ハミルトニアンモンテカルロ法、階層ベイズ、状態空間モデルの原理までをていねいに解説! [サポートページ] https://github.com/sammy-suyama/JuliaBayesBook [主な内容] 第1章 Juliaの基礎 1.1 Juliaとは 1.2 基本文法 1.3 パッケージの利用 1.4 グラフの描画 第2章 数値計算の基礎 2.1 ベクトル・行列計算 2.2 統計量の計算 2.3 統計量と確率分布のパラメータ 2.4 微分計算 2.5 関数の最適化 2.6 最適化によるカーブフィッティング 2.7 積分計算 第3章 確率計算の基礎 3.1 表を使った確率計算 3.2 式を使った確率計算 3.3 連続値における周辺分布と条件付き分布 3.4 確率的試行のシミュレーション 第4章 確率分布の基礎 4.1 確率分布とは 4.2 Juliaでの確率分布の扱い(Distributions.jl) 4.3 離散型確率分布 4.4 連続型確率分布 4.5 統計モデルの設計 第5章 統計モデリングと推論 5.1 ベルヌーイモデル 5.2 線形回帰 5.3 ロジスティック回帰モデル 第6章 勾配を利用した近似推論手法 6.1 なぜ勾配を利用するのか 6.2 ラプラス近似 6.3 ハミルトニアンモンテカルロ法 第7章 発展的な統計モデル 7.1 ポアソン回帰 7.2 階層ベイズモデル 7.3 状態空間モデル 第1章 Juliaの基礎 1.1 Juliaとは 1.2 基本文法 1.3 パッケージの利用 1.4 グラフの描画 第2章 数値計算の基礎 2.1 ベクトル・行列計算 2.2 統計量の計算 2.3 統計量と確率分布のパラメータ 2.4 微分計算 2.5 関数の最適化 2.6 最適化によるカーブフィッティング 2.7 積分計算 第3章 確率計算の基礎 3.1 表を使った確率計算 3.2 式を使った確率計算 3.3 連続値における周辺分布と条件付き分布 3.4 確率的試行のシミュレーション 第4章 確率分布の基礎 4.1 確率分布とは 4.2 Juliaでの確率分布の扱い(Distributions.jl) 4.3 離散型確率分布 4.4 連続型確率分布 4.5 統計モデルの設計 第5章 統計モデリングと推論 5.1 ベルヌーイモデル 5.2 線形回帰 5.3 ロジスティック回帰モデル 第6章 勾配を利用した近似推論手法 6.1 なぜ勾配を利用するのか 6.2 ラプラス近似 6.3 ハミルトニアンモンテカルロ法 第7章 発展的な統計モデル 7.1 ポアソン回帰 7.2 階層ベイズモデル 7.3 状態空間モデル
プログラミングをはじめるならPythonで決まり! やさしい説明で確かな力がしっかり身につく!トコトン親切な入門書 プログラミングを最初に学ぶなら、シンプルでわかりやすいPython(パイソン)が最適! Pythonは簡潔な文法で、話題のAIやデータ分析、仕事の自動化まで高度なことが実現できるプログラミング言語です。 本書は、初心者の方へ画面に打ち込む最初の1文字から丁寧に解説したPythonの入門書を、さらに分かりやすく改訂しました。 つまずきやすい点も丁寧に、一歩ずつ説明しているので挫折させません。 楽しいサンプルでプログラムの基本をやさしく学びながら、Webスクレイピングや、アプリ作成まで習得できます。 対象読者 ・はじめてプログラミングを学ぶ方 ・Pythonの基礎知識を身につけたい方 Chapter1 イントロダクション Chapter2 Pythonプログラミングをはじめよう Chapter3 プログラミングの基本編 仕組みを使おう Chapter4 プログラミングの応用編 効率的に作ろう Chapter5 プログラムからファイルを読み書き Chapter6 さまざまな機能を取り込もう Chapter7 アプリケーションを作ろう 付録 Appendix1 トラブルシューティング エラー Appendix2 本書の次のステップ
最短経路で平易に理解できる、今までにない入門書!「モデルの構築→推論の導出」という一貫した手順でアルゴリズムの作り方を解説。 最短経路で平易に理解できる、今までにない入門書! ベイズ主義機械学習(ベイズ学習)の基本原理にのっとり、「モデルの構築→推論の導出」という一貫した手順でアルゴリズムの作り方を解説。どこまでも分かりやすい! 【主な内容】 1 機械学習とベイズ学習 2 基本的な確率分布 3 ベイズ推論による学習と予測 4 混合モデルと近似推論 5 応用モデルの構築と推論 【機械学習スタートアップシリーズ】 本シリーズは、「機械学習ブーム」の先駆けとして2015年から刊行されている『機械学習プロフェッショナルシリーズ』の弟分的な存在を目指す、注目の新シリーズです。 「機械学習をもっと身近に、機械学習をもっとわかりやすく!」を合言葉に、より丁寧な記述で、基本的なテーマを解説していきます。 まず、以下の2点を同時に刊行いたします(^o^)/ 『これならわかる深層学習入門』瀧 雅人・著 『ベイズ推論による機械学習入門』須山 敦志・著/杉山 将・監修 第1章 機械学習とベイズ学習 機械学習とは/機械学習の代表的なタスク/機械学習の 2 つのアプローチ/確率の基本計算/グラフィカルモデル/ベイズ学習のアプローチ 第2章 基本的な確率分布 期待値/離散確率分布/連続確率分布 第3章 ベイズ推論による学習と予測 学習と予測/離散確率分布の学習と予測/1次元ガウス分布の学習と予測/多次元ガウス分布の学習と予測/線形回帰の例 第4章 混合モデルと近似推論 混合モデルと事後分布の推論/確率分布の近似手法/ポアソン混合モデルにおける推論/ガウス混合モデルにおける推論 第5章 応用モデルの構築と推論 線形次元削減/非負値行列因子分解/隠れマルコフモデル/トピックモデル/テンソル分解/ロジスティック回帰/ニューラルネットワーク
本書は、日本ディープラーニング協会が監修し、ディープラーニングをビジネスに活用するための実践的な知識と事例を紹介しています。特に「ディープラーニングビジネス活用アワード」の受賞プロジェクト6件を詳細にケーススタディとして取り上げています。事例には、キユーピーのAI食品原料検査装置や楽天の自動翻訳プロジェクトなどが含まれ、効果を4つのカテゴリ(商品開発、消費者対応、働き方改革、社会課題解決)に分けて説明しています。また、松尾豊理事長による「ディープラーニング技術年表」も収録されており、技術的なアドバイスが提供されています。
広がるAI化格差と5年先を見据えた企業戦略 ▼技術から利用動向、制度政策に至るまで、国内と海外の人工知能の最新動向がすべてわかるAI白書の2020年版 DX(デジタルトランスフォーメーション)のための重要な技術であるAIの社会実装が進む一方、そのAI化で格差が広がっています。また、5Gのサービス開始、EU一般データ保護規則、米中間の対立など、AIを取り巻く環境は目まぐるしく変化しています。 第1章では、石角友愛氏(パロアルトインサイトCEO)と中島秀之 AI白書編集委員長(札幌市立大学理事長・学長)の対談、北野宏明 AI白書編集委員(ソニーコンピュータサイエンス研究所代表取締役社長・所長)と片岡 晃 IPA社会基盤センター長の対談を通じて、AIをめぐる日本の課題とビジネス戦略について解説。第2章「技術動向」では、AIに関する技術の概要と最新動向を整理し、第3章「利用動向」では国内外でのAI活用事例を紹介。さらに、AIの社会実装を支える環境として、第4章で「制度政策」、第5章で社会実装に係る課題解決の方向性(AI人材育成及びスタートアップエコシステム)について記載しています。 『AI白書2019』に最新情報を加え、大幅にアップデートしています。AIの基礎的な技術解説から、国内外の多様な導入事例、制度・政策面での取り組み、中国のAI動向データ、企業経営者の意識調査結果まで、AIにまつわる幅広い話題を網羅して収録。AIを実装し、DXを推進するにあたってのひとつの指針として、本書をご活用いただけます。 DX(デジタルトランスフォーメーション)のための重要な技術であるAIの社会実装。そのAI化で格差が広がっている。AIの技術や利用動向、制度政策、スタートアップエコシステムに至るまで、AIのすべてを解説 □第1章「2020年のAIとビジネス」 生産性やDXといった日本の課題、AI時代のビジネス戦略をテーマにした対談、など □第2章「技術動向」 AIを支える技術と最新動向、ディープラーニング、開発基盤、標準化・オープンプラットフォーム・信頼性、各国の研究開発の現状、など □第3章「利用動向」 日本と世界の分野別の利用動向、AI利用動向アンケート調査、AI導入予算・AI市場規模、中国のAI最新動向、など □第4章「制度政策動向」 AIに関する原則・ガイドライン、制度改革(モビリティ、データ流通、知的財産)、各国の政策動向、など □第5章「AI実装を推進するAI人材育成と地域スタートアップエコシステム」 スタートアップエコシステム、AI人材の育成、社会実装の課題と現状、など
この書籍は、人気のオンライン講座を基にしたPythonプログラミングの学習書で、基礎から応用までを網羅しています。著者はシリコンバレーで活躍するエンジニアで、海外でも通用するプログラミング技術を伝授。独学をサポートする無料サンプルコードやエンジニアのキャリア戦略も紹介されており、実践的な内容が充実しています。12万人以上が受講した講座を元にしたこの一冊は、海外での活躍を目指す人にとっての道しるべとなるでしょう。
フリーソフトjs-STAR_XRが拡張され,ベイズ仮説検定にも新たに対応。データ分析から結果の書き方まで懇切にガイド。 「できる」から「わかる」へと読者の理解を体験的に導く,好評〈全自動〉シリーズ第2弾! フリーソフトjs-STAR_XRが拡張され,帰無仮説検定の代替案として近年関心が高まるベイズ仮説検定に新たに対応。巻末には半期や全7回の授業用シラバスを収載。データ分析からレポートの書き方まで,前著同様懇切にガイドする。 はじめに1:ベイズファクタと統計分析の学習法 はじめに2:シミュレーションによる主体的で深い学び Chapter0 事前準備 0.1 フリーウェア及び関連ファイルの準備 0.2 R画面の設定 Chapter1 1×2表のベイズファクタ分析 【演習1a】 みんなが好きなもの 1.1 データ入力・分析 1.2 『結果の書き方』 レポート例01-1 1.3 統計的概念・手法の解説1 ●ベイズファクタとは何か ●確率分布の尺度設定 ●95%確信区間推定 ●真の比率の範囲検定 【演習1b】 統計的仮説検定のシミュレーション 1.4 シミュレーションの操作手順 ●シミュレーションの基本操作 ●シミュレーションの応用操作 1.5 統計的概念・手法の解説2 ●ベイズファクタ分析のメリット ●二項検定のp値とBF値の比較 Chapter2 1×2表・母比率不等のベイズファクタ分析 【演習2a】 鶏肉は低温調理がおいしい 2.1 シミュレーションの操作手順 2.2 統計的概念・手法の解説1 ●p値とBF値の検定の仕組み 【演習2b】 新型ウイルスは従来型よりも危険か 2.3 データ入力・分析 2.4 『結果の書き方』 レポート例02-1 2.5 統計的概念・手法の解説2 ●ベイズファクタの事前設定問題 Chapter3 1×J表のベイズファクタ分析と対応のある度数の検定 【演習3a】 お昼に食べたいメニューは何か 3.1 データ入力・分析 3.2 『結果の書き方』 レポート例03-1 3.3 統計的概念・手法の解説1 ●多項分布によるBF値の計算 ●確信区間を用いた多重比較 3.4 自動評価判定1×2:統計的グレード付与 【演習3b】 道徳性に評価グレードを与える 3.5 純肯定率とグレードの付け方 3.6 自動集計検定2×2:連関の探索 【演習3c】 道徳性の項目間の関連を探索する 3.7 対応のある度数の検定:Q検定とMcNemar検定 【演習3d】 不支持の理由は集計するとダメ? レポート例03-2 3.7 統計的概念・手法の解説2 ●CochranのQ検定 ●McNemar検定 Chapter4 i×J表のベイズファクタ分析 【演習4a】 感受性が低い人は感情知能が働かない? 4.1 データ入力・分析 4.2 『結果の書き方』 4.3 標本タイプの選択 ●ポアソンタイプ:N =無作為,行・列=無作為 ●同時多項タイプ:N =固定,行・列=無作為 ●独立多項タイプ:行=固定,列=無作為 ●独立多項タイプの列組み:行=無作為,列=固定 ●超幾何タイプ:行・列=固定(2×2表のみ) レポート例04-1 4.4 統計的概念・手法の解説1 ●i×J表の事前確率分布 4.5 データセットraceDollsの分析:BF値の警報は誤報か 【演習4b】 黒人・白人の子どもは同人種の人形を好むか レポート例04-2 4.6 統計的概念・手法の解説2 ●Fisherの正確検定とBF値の検定 ●2×2表のp値とBF値の比較 4.7 ステレオタイプ効果と学習意欲 【演習4c】 ステレオタイプ効果で学習時間を延ばす レポート例04-3 Chapter5 t検定のベイズファクタ分析 【演習5a】 トレーニング法は分散法がよいか集中法がよいか 5.1 データ入力・分析 5.2 『結果の書き方』 5.3 統計的概念・手法の解説1 ●t値と効果量δ(delta) ●t検定のベイズファクタ分析の仕組み ●p値とBF値の検定結果の不一致 ●BF値を用いたノンパラメトリック検定 ●t検定のp値とBF値の比較 5.4 シミュレーション学習①:正規分布をつくる 【課題1〉正規分布をつくる 5.5 シミュレーション学習②:データを再現する 【課題2〉データを再現する 5.6 時間データの対数変換による分析 【演習5b】 トレーニングは伸び盛りに! レポート例05-1 5.7 統計的概念・手法の解説2 ●効果量δの範囲検定 Chapter6 1要因分散分析デザインのベイズファクタ分析 【演習6a】 SD法で創造性を高める 6.1 データ入力・分析 6.2 『結果の書き方』 レポート例06-1 6.3 統計的概念・手法の解説1 ●多重比較の早見表の利用 ●ベイズファクタ分析の仕組み:分散分析デザイン ●平均の95%確信区間 ●分散分析A sデザインのp値とBF値の比較 6.4 小学校英語指導に必要な技能は何か 【演習6b】 英語指導にどんな技能が必要か 6.5 『結果の書き方』 レポート例06-2 6.6 統計的概念・手法の解説2 ●参加者内デザインのベイズファクタ分析 Chapter7 2要因・3要因分散分析デザインのベイズファクタ分析 【演習7a】 協同経験はルール意識を高めるか 7.1 データ入力・分析 7.2 『結果の書き方』 レポート例07-1 7.3 統計的概念・手法の解説1 ●Inclusion BF:BF値のモデル平均化 ●全体モデル平均化 7.4 アイディア・プロダクション法 【演習7b】 アイディアの発想に“ 書き送り法”を用いる 7.5 『結果の書き方』 3要因デザイン レポート例07-2 7.6 統計的概念・手法の解説2 ●3要因デザインのBF値の平均化 7.7 シミュレーション学習①:2要因データを再現する 【課題1】 データの再現 7.8 シミュレーション学習②:交互作用を判別する 【課題2】 交互作用の判別 ●シミュレーションによる交互作用問題の解答要領 7.9 シミュレーション学習③:N,SDを変えてみる 【課題3】 N,SDを変える Chapter8 相関係数のベイズファクタ分析 【演習8a】 気温とアイスクリーム,ホットコーヒーの売り上げは相関するか 8.1 データ入力・分析 8.2 『結果の書き方』 8.3 統計的概念・手法の解説1 ●p値有意・BF値有効となる最小相関係数の比較 ●相関係数の差の検定 8.4 相関係数のシミュレーション学習 【演習8b】 シミュレーション課題①:散布図をつくる 【演習8c】 シミュレーション課題②:相関係数を予想する ●散布図問題の解答例 【演習8d】 シミュレーション課題③:外れ値のある散布図をつくる 8.5 統計的概念・手法の解説2 ●相関係数と説明率 Chapter9 回帰モデルのベイズファクタ分析 【演習9a】 革新性を高める職場風土とは? 9.1 データ入力・分析 9.2 『結果の書き方』 9.3 統計的概念・手法の解説1 ●初期モデルの選び方と独立変数の上限数 ●交互作用モデルの探索:ベイズ ファクタ回帰分析 ●BF値による回帰モデルの選出率 9.4 交互作用の単純傾斜分析 【演習9b】 明るさ×温かさの交互作用を分析する 9.5 『結果の書き方』 ステップワイズ回帰分析 レポート例09-1:単純傾斜分析の結果 9.6 統計的概念・手法の解説2 ●交互作用モデルの探索:ステップワイズ回帰分析 ●ベイズ情報量規準とベイズファクタ Chapter10 各種ユーティリティ 10.1 乱数発生ユーティリティ&乱数コマンド ●一様乱数コマンド unif(ユニフ) ●正規乱数コマンド norm(ノゥム) 10.2 階級化集計ユーティリティ 10.3 数値変換ユーティリティ 【練習問題1】 困難度の異なるテスト得点を標準化する 【練習問題2】 2ポイント尺度を4ポイント尺度に変換 【練習問題3】 3ポイント尺度を5ポイント尺度に変換 10.4 逆転項目処理ユーティリティ 10.5 欠損値処理ユーティリティ 付録 統計分析の授業用シラバス(参考例) シラバス参考例1 統計分析入門 シラバス参考例2 統計分析演習 索引 Column 1 セルへの数値入力の基本と小技 Column 2 分析結果の保存 Column 3 ダイアグラムで連関・相関を視覚的に表示 Column 4 スタック形式によるデータ入力 Column 5 平均のグラフとボックスプロットの利用 Column 6 シミュレーションボタンの使い方
流行のデータサイエンス、何を知っていたらいいのか? いざという時のビジネスパーソン必携書。 本書では、4種の科学的論理思考法である演繹推論、帰納推論、アブダクション、データ科学推論について紹介。いざという時のためのビジネスパーソン必携書。(発行=BOW&PARTNERS)
Python業界の第一線で活躍する執筆陣によるデータ分析エンジニアに求められる技術が最速で身に付く入門書 データ分析エンジニアに求められる技術の基礎が最短で身に付く ビッグデータの時代といわれ始めて数年が経過しました。 デバイスの進化により多くの情報がデジタル化され、 それらのデータを活用しようとデータ分析エンジニアに注目が集まっています。 この書籍では、データ分析において、 デファクトスタンダードになりつつあるプログラミング言語Pythonを活用し、 データ分析エンジニアになるための基礎を身に付けることができます。 書籍ではデータ分析エンジニアになるために必須となる技術を身につけていきます。 ・データの入手や加工などのハンドリング ・データの可視化 ・プログラミング ・基礎的な数学の知識 ・機械学習の流れや実行方法 本書で学べること ・Pythonの基本的な文法 ・データフォーマットについて ・データの前処理技術 ・データの可視化技術 ・既存アルゴリズムでの機械学習の実装 対象読者 データ分析エンジニアを目指す方 目次(抜粋) 第1章 データ分析とは 第2章 Pythonと環境 第3章 数学の基礎 第4章 ツールの基礎 第5章 応用:データ収集と加工 はじめに 謝辞 本書の対象読者と構成について Chapter1 データ分析エンジニアの役割 1.1 データ分析の世界 1.2 機械学習の位置づけと流れ 1.3 データ分析に使う主なパッケージ Chapter2 Pythonと環境 2.1 実行環境構築 2.2 Pythonの基礎 2.3 Jupyter Notebook Chapter3 数学の基礎 3.1 数式を読むための基礎知識 3.2 線形代数 3.3 基礎解析 3.4 確率と統計 Chapter4 ライブラリによる分析の実践 4.1 NumPy 4.2 pandas 4.3 Matplotlib 4.4 scikit-learn Chapter5 応用:データ収集と加工 5.1 スクレイピング 5.2 自然言語の処理 5.3 画像データの処理 INDEX 奥付
経済学向けの入門書にはない「心理学」のための具体例を紹介! コードも豊富ですぐ試せる。次世代の心理学研究者、必携の入門書! リアルタイムで変化する、状況・思考・感情を捉える! 経済学向けの入門書にはない「心理学」のための具体例を紹介! ●人々のSNS投稿から睡眠時間の周期を調べる ●気分と活動量の経時的な変化を捉える ●行動が変化する瞬間を見つけ出す もちろん、Rの基礎からサポート。 サンプルコードも豊富ですぐに試せる! 心理学研究者、必携の入門書! (まえがきより抜粋) 本書は、「心理学の研究テーマで時系列データの分析をしてみたい」と考えている方に向けた入門書です。人間の行動や認知を時系列的に捉えたデータを収集・分析してみたいものの、どんな分析方法があるのか見当がつかなかったり、時系列データ分析にはどのような注意点があるのかがわからなかったりする方々への、最初のガイドになるよう心がけました。 心理学の研究をしていれば,ある瞬間だけを切り出したデータではなく、日常生活の中で刻一刻と変化し続ける人間の行動や認知を捉えてみたい、と考えることがあると思います。私自身も、人の一生分の行動データをすべて集めることができたらどんなに楽しいだろう、と夢想することがあります。現在では、スマートフォンなどのデバイスを使えば、人間のその時々の状況や思考、感情、行動などをリアルタイムで記録することも難しくはなくなってきました。時系列データを収集するハードルは、かつてないほど下がっているといえるでしょう。 一方で、時系列データを分析するための方法論は、どこから手を付けていいのかわかりにくいものです。がんばってコツコツとデータを集めてみたものの、時系列のリッチな情報をうまく活用できず、そのままお蔵入りになってしまうこともしばしばです。 本書の目標は、せっかく測定した貴重な時系列データをお蔵入りにしてしまわないことです。そのために、本書では移動軌跡や体の動き、SNS の書き込みのように、できるだけ人間の具体的な行動のデータを取り上げました。 (目次) 第1章 心理学と時系列データ分析 第2章 時系列分析の基本操作 第3章 時系列の回帰分析 第4章 RStanによる状態空間モデル 第5章 時系列データ同士の関係の評価 第6章 多変量時系列データの要約 第1章 心理学と時系列データ分析 第2章 時系列分析の基本操作 第3章 時系列の回帰分析 第4章 RStanによる状態空間モデル 第5章 時系列データ同士の関係の評価 第6章 多変量時系列データの要約
本書は、金融、流通、製造、インフラなど8業界36業種におけるAI導入事例を解説し、活用分野や親和性について鳥瞰図で示しています。豊富な実例を通じてビジネスアイデアの創出を促し、実装やトライアルのノウハウも提供。各業種ごとに具体的な解説があり、AIの実用性や将来可能性を探る手助けとなります。購入者特典として鳥瞰図のダウンロードも可能です。著者はAIとデータ分析の専門家で、実績豊富です。
ビジネスパーソンにAIの書籍を1冊オススメするなら間違いなくこれを選ぶ。データサイエンティスト協会の理事も努めビジネス・アカデミックの両面からデータサイエンスにBETしている安宅さんが語るAIのあり方。我々日本人がこれからの時代において世界でプレゼンスを発揮するためにはどうすればよいかを教えてくれる書籍で非常に感銘を受けた。どんよりとした日本の停滞感に対して少しでも希望を見出すことのできる書籍。安宅さんの書籍はどれも素晴らしいが絶対にこれは読んで欲しい。
人工知能とは何か? 機械学習・ディープラーニングとは何かを、高クオリティなマンガとともに、くわしく・やさしく解説していきます。 人工知能がどのように発展してきたのか、私たちの未来をどのように変えていくのか、そして人工知能とどのように向き合っていくのかをテーマにストーリーを構成。人工知能という難しそうなテーマを、より身近に感じられるようになる一冊です。 Chapter1 人工知能の正体 ・「人間の脳」と「人工知能」 ・人工知能の定義 Chapter2 人工知能の歴史 ・人工知能の誕生-第1次AIブーム- ・コンピュータとの対話-第2次AIブーム- Chapter3 人工知能の新時代① ・第3次AIブームの始まり ・機械学習の広がりと課題 Chapter4 人工知能の新時代② ・ディープラーニングとは何か ・ディープラーニングによるブレイクするー Chapter5 人工知能と心 ・心と身体性 ・人工知能と創造性 Chapter6 人工知能が変えていく未来 ・AIを牽引する企業たち ・「眼を持つ機械」の活用 Chapter7 人工知能が人類にもたらすもの ・人工知能と倫理的課題 ・「シンギュラリティ」とその先の未来
本書は、統計解析の基礎手法を幅広く解説した入門書であり、統計解析の全体像を把握することができます。目次には、データ整理、分布と期待値、検定・推定の考え方、分散分析、相関分析、回帰分析などが含まれています。
機械学習の手法やテクニックにフォーカスした書籍ではなくて、機械学習を仕事に取り入れるためにはどうすればよいのか?どういうところに注意しなくてはいけないのかがまとめられた書籍。実務で機械学習を利用している人利用する可能性のある人は絶対に読むべき書籍。そもそも本当に機械学習を使う必要があるのかということをしっかり考える、機械学習ありきのプロジェクトは必ず失敗する。
数学的にマーケティングを学ぶのであれば絶対にこれ。というかこれくらいしか数学的観点でここまで詳しくマーケティングについて学べる書籍はない。森岡さんがどうやってUSJを立て直したのかが数学的な観点から学べる。「USJを変えたたった1つのこと」と合わせて読むことでマーケティングのいろはが身につくはず。
本書は、人工知能(AI)を学びたい初心者向けの入門書であり、特にエンジニアでない中高生や文系の大学生、ビジネスパーソンに向けて分かりやすくAIの基礎知識とビジネス活用法を解説しています。著者は人気講師で、初心者にも理解しやすい内容に配慮しています。書籍は3部構成で、基礎編ではAIの基本を、ビジネス編では業界別の活用事例と注意点、技術編ではAIの仕組みと最新技術を紹介しています。これにより、AIの本質や活用方法についての理解を深めることができます。