【2025年】「データマイニング」のおすすめ 本 148選!人気ランキング
- データマイニング入門―Rで学ぶ最新データ解析―
- Rによるやさしい統計学
- はじめてのパターン認識
- Kaggleで勝つデータ分析の技術
- 統計的学習の基礎 ―データマイニング・推論・予測―
- Rによるデータマイニング入門
- 実践Data Scienceシリーズ RとStanではじめる ベイズ統計モデリングによるデータ分析入門
- 見て試してわかる機械学習アルゴリズムの仕組み機械学習図鑑
- パターン認識と機械学習 上
- パターン認識と機械学習 下 (ベイズ理論による統計的予測)
本書は、統計学の基礎から応用までを扱った内容で、基礎編ではR言語を用いた記述統計や統計的仮説検定について解説し、応用編ではベクトルや行列、データフレーム、外れ値の影響などを取り上げています。著者は、教育心理学を専門とする学者たちで、各自が教育機関での実績を持っています。
この入門書は、パターン認識について基礎からわかりやすく解説しており、特にRを用いた実行例が含まれているため、実際の応用にも役立ちます。内容は識別規則や学習法、ベイズの識別規則、k最近傍法、サポートベクトルマシンなど多岐にわたり、最後には識別器の性能強化についても触れています。著者は筑波大学の名誉教授、平井有三氏です。
「はじめての」とついているが入門書ではなく結構難しい。ただ、機械学習の様々な手法が数式から学べるため中級者〜上級者には良いと思う。他の入門書で機械学習の概要を掴んだ後に読むべき本。
本書は、データサイエンスにおけるコンペティション、特にKaggleに焦点を当て、実践的なデータ分析手法やテクニックを紹介しています。分析コンペに参加することで得られるスキルは、実務でも役立つため、特徴量の作成やモデルの評価、チューニングなどの具体的な内容が含まれています。著者たちは、データサイエンスの専門家であり、実績を持つKaggleの競技者です。この本は、コンペに挑戦したい人や実務でのモデル精度向上を目指す人にとって有益な情報源となるでしょう。
データ分析コンペKaggleに挑戦するならこれをまず読んでおけば大丈夫!Kaggleに参加しないにしてもデータ分析の本質やテクニックがギュッと詰まっているので実務に活かせる。高度な内容も登場するが分かりやすく解説してくれるので初心者でも読みやすい。それでいてベテランの人も多くの学びがある書籍。著者はKaggleの最上位グランドマスターの方々であり説得力がある。過去のコンペの事例も取り上げてくれるのでそんなアプローチあったのかぁと学びが深い。文句なしの星5つ!
本書は、機械学習の発展を背景にした統計的学習に関する教科書「The Elements of Statistical Learning」の全訳です。機械学習は人工知能の一分野から発展し、統計学と密接に関連しています。内容は、教師あり学習の基礎からニューラルネットワークやサポートベクトルマシン、ブースティングなどの高度な手法まで幅広くカバーしており、情報技術を学ぶ大学生や研究者に最適です。著者は各分野の専門家で構成されています。
本書は「統計モデリングの世界」への入門書で、統計、確率、ベイズ推論、MCMCの基本をチュートリアル形式で学べる内容です。RやStanを用いたデータ分析の基礎から、一般化線形モデルや一般化線形混合モデル、状態空間モデルまでを体系的に解説しています。データサイエンスを学ぶ大学生やエンジニア向けの実践的なシリーズの一環として、すぐに実践できるスキルを身につけることができます。
本書は、機械学習アルゴリズムをオールカラーの図を用いてわかりやすく解説した入門書です。17種類のアルゴリズムを紹介し、各アルゴリズムの仕組みや使用方法、注意点を詳述しています。Pythonを用いたコードも掲載されており、実際に試しながら学ぶことができます。機械学習を学ぶ初心者や業務で利用している方にも役立つ内容となっています。
この書籍は、データ分析における視点を磨き、質の高い研究を行うためのガイドです。内容は、無作為性や統計的推測、研究デザイン、データ解析の基礎について解説しています。目次は基礎編とアラカルト編に分かれ、平均値や頻度、イベント発生時間の比較方法も取り上げています。著者は丹後俊郎氏で、医学統計学の専門家です。
この書籍は、時系列分析の基礎から応用までを詳しく解説しています。内容は、時系列分析の基礎概念、ARMA過程、予測手法、VARモデル、単位根過程、見せかけの回帰と共和分、GARCHモデル、状態変化を伴うモデルに分かれています。著者の沖本竜義は、経済学と統計学の専門家であり、実データへの応用に必要な知識を提供しています。
本書は、時系列データの分析方法を基礎から解説しています。探索的手法として移動平均、確率的手法として状態空間モデルを取り上げ、数式の意味やコードへの落とし込み方を丁寧に説明しています。初めて時系列分析を試みる人や、既に関わっている人にも興味深い内容となっており、応用的な話題もカバーしています。著者は牧山幸史、監修は石田基広です。
本書は、AI・データ分析プロジェクトの成功には技術知識だけでなく「ビジネス力」が重要であることを強調しています。データサイエンティストのキャリアや業界の概要から始まり、プロジェクトの立ち上げ、実行、評価、収益化までのノウハウを網羅。具体的には、課題設定、案件獲得、データ分析手法の検討、レポーティングなどのプロセスを解説し、実務に役立つ情報を提供しています。著者は業界の専門家で、実践的な知識を基にした内容となっています。
「データサイエンティスト養成読本」の改訂版で、データサイエンティストに必要なスキルセットを最新の内容で解説しています。ソフトウェアや分析ツールの進化に対し、基本的なスキルは変わらないことを強調。内容はデータ分析のプロセスやビジネス成果を意識した分析方法、実践的なデータ分析入門、マーケティング分析の手法、基礎知識の習得など多岐にわたります。著者は里 洋平、和田 計也、早川 敦士など。
この書籍は、RとPythonの両方を学べるデータサイエンスの入門書です。プログラミング経験がなくても理解できるように、データサイエンスの基礎や環境構築について詳しく解説しています。内容は、データサイエンスの準備、機械学習の手法(回帰、分類、深層学習など)に分かれており、実践的なサンプルコードも提供されています。著者は東京大学と千葉工業大学の教授で、情報処理技術者試験委員を務めています。
本書は、データ分析に必要な知識を包括的に解説した教科書で、分析手法だけでなく、データの質や解釈方法にも焦点を当てています。実践的なデータの扱いや心理学的バイアス、サンプリング方法、数理モデリングのポイントなどを幅広くカバーし、数学に自信のない読者でも理解できるよう工夫されています。データサイエンティストや研究者、ビジネスマンにとって有益な内容で、興味深い事例も豊富に紹介されています。著者は東京大学の特任講師で、さまざまな分野の問題に取り組んでいます。
この書籍は、数理モデルを用いて現象を理解するための基本的な統計モデルの考え方を、章ごとに異なる例題を通じて解説しています。前半では一般化線形モデル(GLM)の基礎を紹介し、後半では階層ベイズモデル化の手法をRとWinBUGSを用いて具体的に説明します。著者は久保拓弥氏で、生態学のデータ解析に関する統計学的方法を研究しています。
線形回帰分析を学んでそこから一般化線形回帰モデル、ベイズと拡張していく上で非常にオススメな本。初学者には少々難解な部分もあるが、統計学を学ぶ上で必ずどこかで読んで欲しい書籍。学生の時に読んだが、これを読むことでこれまで学んできた内容が整理され頭がクリアになった記憶がある。統計学を語るなら絶対読んで欲しい非常におすすめの書籍。
本書は、機械学習の有名なアルゴリズムをPythonを用いてゼロから実装することを目的としています。実用的なフレームワークを使用するのではなく、機械学習の仕組みを深く理解することで応用力や問題解決力を高めることを目指しています。内容は、Pythonの基本、機械学習に必要な数学、数値計算、そして具体的な機械学習アルゴリズムに関する解説を含んでおり、初心者や実務に携わるエンジニアに適しています。著者はシルバーエッグ・テクノロジーのチーフサイエンティストで、機械学習アルゴリズムの設計・実装に精通しています。
本書は最適化手法についての入門書であり、経営学やオペレーションズリサーチだけでなく、統計的最適化や機械学習の話題も扱っています。計算機技術の進歩により、複雑な最適化問題が解決可能になった背景を踏まえ、各手法の原理や数学的背景を詳しく解説しています。内容は例題を多く用いて分かりやすく、関連する話題や注意点も随所に挿入されています。目次には数学的準備、関数の極値、最適化手法、最小二乗法、統計的最適化、線形・非線形計画法、動的計画法が含まれています。著者は岡山大学の金谷健一教授です。
内容は少々難解だが、統計学や機械学習・データサイエンス分野のエッセンスが詰まっていて何度も読み返したい書籍。大学院生時代の授業の輪読して使用し、目からウロコの連続だった。ある程度基礎固めをした後に読んでほしい1冊
本書は、近年注目されている統計モデリングについて解説しており、特にフリーソフトのStanを用いた実践的なアプローチを提供しています。Stanは高い記述力を持ち、階層モデルや状態空間モデルを簡単に記述できるため、データ解析に非常に有効です。著者は、ベイズ統計の理解を深めるための実践的な内容を重視し、StanとRを通じて統計モデリングの考え方を学ぶことができるとしています。目次には導入編、入門編、発展編があり、幅広いテーマを扱っています。著者は統計モデリングやデータサイエンスの専門家です。
この文章は、統計学に関する書籍の目次と著者情報を紹介しています。目次には、一変量データや多変量データの記述、確率分布、推定方法、仮説検定などのテーマが含まれています。著者は神永正博と木下勉で、それぞれの学歴と職歴が簡潔に記載されています。神永は数学の博士で、木下は工学の博士です。
本書は、データ活用に悩む企業向けに、データ基盤の構築やデータ分析組織の立ち上げに必要なノウハウを提供します。データを集めても活用できない理由や、データ基盤が機能しない原因を解説し、適切なデータ整備や組織の構築方法を提案。著者たちはデータ活用のプロフェッショナルであり、実践的な知識を惜しみなく披露します。データ基盤を効果的に機能させたい方にとって、必読の一冊です。
本書は、プログラミング初心者向けにリニューアルされた「いちばんやさしいPythonの本」で、最新のPython 3に完全対応しています。イラストやサンプルが豊富で、オブジェクト指向やWebアプリ開発、データ処理の基本も学べます。新たに2章が追加され、プログラミングの楽しさと効率化の重要性を伝え、読者がスキルを身につける手助けをします。著者は東京大学の辻真吾氏で、Pythonの普及活動にも力を入れています。
Pythonの基礎をしっかりと学べる構成になっていて、プログラミング初心者にも取り組みやすい内容。基本的な文法から実際に使えるスクリプトまで、ステップバイステップで解説されているため、無理なく進められます。増補改訂版として新たなトピックも追加されており、実践的なスキルを習得したい人にぴったりです。
Pythonを学びはじめる際に最初に読む本として最適。非常に分かりやすく基礎の基礎から学べる。
本書は、深層学習に関する改訂版のベストセラーで、トランスフォーマーやグラフニューラルネットワーク、生成モデルなどの手法を詳しく解説しています。著者は、理論的な証明がなくても納得できる説明を重視し、実用性を考慮した内容を提供。全12章で、基本構造から各種学習方法、データが少ない場合の対策まで幅広く網羅しています。著者は東北大学の教授であり、実務家との共同研究の経験も反映されています。
この書籍は、地域密着型アウトドアショップがデジタルマーケティングを活用して業績を向上させるストーリーを通じて、デジタルマーケティングの基礎を学ぶ内容です。デジタル化を成功させるための条件や、重要な要素(MEO・SEO、データ分析、ECサイト構築、SNS活用など)が解説されています。著者は上野佑馬で、データ分析やデジタルマーケティングの専門家です。
デジタルマーケティングとデータ分析について漫画で分かりやすく学べる。基本的な内容が網羅的に学べるのでデジタルマーケティング職についたばかりのビジネスパーソンや個人事業や中小企業でこれからデジタルに力を入れようとしている経営者にオススメ!
本書は、機械学習システムをビジネスやシステムに組み込むためのデザインパターンを解説したもので、Pythonを用いた実装例や運用方法を紹介しています。対象はAIエンジニアやシステムエンジニアで、機械学習の実用化を目指す方々です。DockerやKubernetesを利用し、学習から運用までの流れを説明。著者はMLOpsエンジニアの澁井雄介氏で、過去の経験を基に実践的なノウハウを提供しています。サンプルコードはGitHubから入手可能です。
『ゼロから作るDeep Learning』の続編である本書は、自然言語処理や時系列データ処理に焦点を当て、ディープラーニングの技術を実装レベルで学ぶことができます。具体的には、word2vec、RNN、LSTM、GRU、seq2seq、Attentionなどの最新技術を取り上げ、分かりやすく解説しています。著者は、人工知能の研究開発に従事する斎藤康毅氏です。
ゼロから分かるディープラーニングシリーズはどれも非常に分かりやすい。こちらの自然言語処理編は前作を読みディープラーニングの基本を理解してより高度なアーキテクチャを学びたいと思った時にオススメ。レベルは少々上がっているがそれでも分かりやすく学べる。RNNやLSTMなどが学べる
本書は、ビジネスにおけるデータ分析の重要性とそのバイアスを取り除くための手法を解説しています。特に、意思決定に影響を与えるデータの生成過程におけるバイアスの存在を指摘し、単純な比較が誤った結論を導く可能性について警鐘を鳴らします。著者は、RCT(ランダム化比較試験)を理想的な分析手法として紹介し、RCTが実施できない場合でも因果推論を用いて効果的な分析が可能であることを説明します。目次には、セレクションバイアスや回帰分析、傾向スコア、差分の差分法などの具体的な手法が含まれています。著者は経済学の専門家で、データサイエンスの分野でも活躍しています。
この書籍は、マルコフ連鎖モンテカルロ法(MCMC)を理解しやすく解説しており、R言語のコードや練習問題が豊富に含まれています。初学者向けの内容ながら、エルゴード性などの高度なトピックにも触れています。データサイエンス教育の一環として、統計学と情報学を融合した新しい教科書シリーズの一部であり、実践的な教育を目指しています。著者は、数理科学と統計科学の分野で活躍する専門家です。
本書は、ネットワーク分析の理論と実践をRというフリーソフトを用いて学ぶためのガイドです。第2版では、統計的なネットワーク分析手法や社会ネットワーク、ソーシャルメディアの分析法に関する新しい章が追加され、複雑ネットワークやネットワーク描画の内容も改訂されています。著者は鈴木努で、社会学を専攻し、東北学院大学の准教授として勤務しています。
本書は、ビッグデータ時代におけるSQLの活用法を紹介するレシピ集です。目次には、分析力の重要性、使用するツールとデータ、データ加工、売上やユーザー行動のデータ抽出、分析技術の向上、行動を起こすための知識の活用方法が含まれています。著者は加嵜長門と田宮直人で、双方ともデータ解析およびビッグデータ活用の専門家です。
この入門書は、フリー環境でテキストマイニングの基本手法や最新技術(ウェブスクレイピング、トピックモデルなど)を学べる内容です。初心者向けに、データ収集・分析方法や可視化技術を紹介し、RStudioを使用して直感的に操作できるように工夫されています。目次には、テキスト解析やアンケート分析、文体比較など多様なテーマが含まれています。著者は石田基広氏で、大学で教鞭をとる専門家です。
本書は、ウェブサービスの開発においてユーザ体験を向上させるための手法を学ぶための書籍です。A/Bテストや線形モデル、メタヒューリスティクス、バンディットアルゴリズム、ベイズ最適化などの数理的手法を紹介し、Pythonによるサンプルコードと図を用いて機械学習と統計学の基礎を解説しています。ウェブ最適化や機械学習に興味がある読者に適した内容です。著者はUXエンジニアの飯塚修平氏で、ウェブ最適化の研究に従事しています。
この文章は、奥村学と高村大也による書籍の目次と著者情報を紹介しています。目次には、必要な数学的知識、文書および単語の数学的表現、クラスタリング、分類、系列ラベリング、実験の仕方などが含まれています。著者は共に東京工業大学での学歴と職歴を持ち、情報工学や自然言語処理に関する専門知識を有しています。
『テキストデータの統計科学入門』が全面改訂され、テキストのクリーニングや加工、分析、予測モデル作成、分散表現によるテキスト分類などを具体的なツールを用いて解説。Rのコードも多数収録。
この書籍は、テキストデータの活用に関する実践的なガイドを提供し、研究者が成果を出すための視点を示しています。内容はテキストマイニングの基本、辞書構築、機械学習による文書類似検索、大量データの処理技術、確率統計の応用、顧客の声やSNS分析、特許文書のテキストマイニング、テキストと画像情報の統合に関する章で構成されています。新しい研究トピックを通じて、テキストマイニングの進化の方向性も展望しています。
本書は、政治や企業の発言が金融市場に与える影響を受けて、テキストデータを分析し資産運用や市場分析に活用するための金融テキストマイニングについて解説しています。内容は、テキストの前処理、時系列データの処理、評価指標、因果関係の抽出、パターン認識手法など多岐にわたり、自然言語処理や機械学習を駆使した実践的なアプローチを紹介しています。著者は東京大学の専門家たちで構成されています。
本書は、自然言語処理を初歩から学べる入門書で、プログラミング経験のある開発者を対象としています。自然言語処理の基本概念や技術、タスク(自動翻訳、質問応答など)を基礎から解説し、Pythonを用いて実装を学ぶことができます。また、機械学習や深層学習の基礎もカバーしており、日本語のデータセットを使用して実践的な学習が可能です。自然言語処理をしっかり学びたい方に最適な一冊です。
この書籍は、R言語を用いたデータ解析の入門書で、進化し続けるRの機能を活用する方法を紹介しています。初版以来、多くのRユーザーに支持されてきたロングセラーで、第2版では深層学習やネットワーク分析など新たな内容が追加されています。データマイニングの基礎から始まり、主成分分析やクラスター分析、ニューラルネットワークなど多岐にわたる分析手法を学ぶことができます。著者は金明哲で、統計科学の専門家です。
この書籍は、データサイエンティストに必要な時系列データ分析について詳しく解説しています。フリーソフトウェアRを使用し、視覚的かつ対話的にデータ分析を行う方法を紹介しています。内容は、時系列データの基本から観察・要約、自己回帰モデルの理解、ARCH/GARCHモデルの応用、投資への実践的な応用まで多岐にわたります。著者は一橋大学の准教授と株式会社QUICKのソリューションマネージャーです。
著者の音部大輔は、マーケティング部門の育成や指揮を経験した専門家で、本書では戦略を効果的に使うための2つの重要な要素「目的」と「資源」を解説しています。目次には戦略の定義や構成要素、効用、組み立て方、管理方法、戦略的思考についての章が含まれています。著者は多様な企業でのブランドマネジメントやマーケティング組織の育成に携わり、2016年には資生堂ジャパンのCMOとしてCNET JapanのCMO Awardを受賞しました。
有名マーケター音部さんの書籍ということで期待して手に取ったが、抽象度が高く具体的に実践レベルで活用できるイメージが湧かなかった。出来れば具体的な内容がほしかった。
本書『Python Machine Learning: Machine Learning and Deep Learning with Python, scikit-learn, and TensorFlow 2, 3rd Edition』は、機械学習の理論とPythonによる実践を解説するベストセラーの第3版です。分類、回帰、深層学習、強化学習など幅広いトピックをカバーし、最新のPythonライブラリに対応しています。特に、敵対的生成ネットワークと強化学習の新章を追加し、従来の内容を刷新しました。機械学習の理解を深めるための実用的な一冊です。
『A First Course in Bayesian Statistical Methods』の日本語訳で、ベイズ統計の基礎と計算手法を学ぶ書籍です。確率論の基本から始まり、正規モデルや階層モデル、線形回帰モデルなどのベイズ法を詳述し、潜在変数モデルなどの応用も紹介しています。Rによる実装方法やサンプルコードも提供され、社会科学や医学、生物学など多様な分野での応用例が取り上げられています。著者はピーター・D・ホフ教授で、他に翻訳者として入江薫、菅澤飯之助、橋本真太郎が関わっています。
この文章は、永田靖著の書籍の目次と著者情報を紹介しています。書籍は3部構成で、基礎と1変数関数の微積分、線形代数、多変数関数の微積分について解説しています。著者は1957年生まれで、早稲田大学で教授を務めています。
マスとデジタル施策を横並びで評価する手法を演習形式で学び、統計リテラシーを高める「ビジネス専門書」 『これからのマーケターは、グラフの見た目よりも「因果推論」に注意すべきである』 「統計学が最強の学問である」著者の西内 啓氏推薦! マーケティング施策の意思決定をいかにして「データドリブン」にするか? Excelを用いた演習でマーケティングROIの最適化を導く分析手法を習得しながら、統計や因果推論の知識について知る。 データ解析にもとづくマーケティングに必須の「知識」と「生きたノウハウ」が同時に身につくビジネス実践書です。 『もともと統計学には無縁だった筆者は、広告会社でTVCMなどのマス広告とデジタルアドの全体最適、予算配分の最適を目指すため、時系列データ解析によってオフライン施策とオンライン施策を横並びで評価できるマーケティング・ミックス・モデリング(MMM)を知りました。 それを学ぶために得た知識や分析スキルを共有するために、ExcelでMMMに付帯する分析手順を行いながら学べる書籍を作りました。それは本来、専門家によって提供される高度な分析サービスです。本書では統計学に初めてチャレンジ する方がそれを習得することを目指したものです。 本書は統計やデータマイニングを学びたくなったマーケターが難解な数式やプログラムコードを書くような「専門書」で学ぶ前の、基礎的なデータ分析の感覚を共有する「ビジネス専門書」を目指しました。』(著者の言葉より)
ビジネスや意思決定の場面で,データを活用したい方に手にとっていただきたいデータサイエンスの入門書。目的別の分析手法を幅広く… ビジネスや意思決定の場面で,データを活用したい方に向けたデータサイエンスの入門書。データの種類ごとの性質や収集時の注意点,目的別の分析手法からデータ可視化まで幅広く扱う。各章末には課題を設置し,最終章ではデータサイエンスの展望や限界についても言及。 第1章 データサイエンスとは 第2章 データ収集のための基礎知識 第3章 データ空間の構成法 第4章 データ生成のメカニズム 第5章 データの可視化手法 第6章 データ分析の手法 第7章 データ活用のフレームワーク 第8章 データの分析事例 第9章 データ分析上の注意点と応用知識
文科と理科両方の学生のために,統計的なものの考え方の基礎をやさしく解説するとともに,統計学の体系的な知識を与えるように,編集・執筆された.豊富な実際例を用いつつ,図表を多くとり入れ,視覚的にもわかりやすく親しみながら学べるよう配慮した. 第1章 統計学の基礎(中井検裕,縄田和満,松原 望) 第2章 1次元のデータ(中井検裕) 第3章 2次元のデータ(中井研裕,松原 望) 第4章 確率(縄田和満,松原 望) 第5章 確率変数(松原 望) 第6章 確率分布(松原 望) 第7章 多次元の確率分布(松原 望) 第8章 大数の法則と中心極限定理(中井検裕) 第9章 標本分布(縄田和満) 第10章 正規分布からの標本(縄田和満) 第11章 推定(縄田和満) 第12章 仮説検定(縄田和満,松原 望) 第13章 回帰分析(縄田和満) 統計数値表 練習問題の解答
この書籍は、ディープラーニングをゼロから実装することで学ぶ入門書です。Python 3を用いて、基礎から誤差逆伝播法や畳み込みニューラルネットワークなどの実装を通じて理解を深めます。また、ハイパーパラメータの設定やBatch Normalization、Dropout、Adamなどの最新技術、さらには自動運転や画像生成などの応用例についても触れています。著者は斎藤康毅氏で、コンピュータビジョンや機械学習の研究開発に従事しています。
ディープラーニングの概要は分かっているし機械学習はある程度理解しているつもりだけど、ディープラーニングの中身はちゃんと理解できていない人にぜひ読んで欲しい書籍。ディープラーニングは一旦これ1冊読んでおけば問題なし。複雑で難しい印象だったディープラーニングがこれを読むだけで一気に身近なものになる。
本書は、2018年に発行された機械学習に関する書籍の全面改訂版で、不確実性の高い機械学習プロジェクトを「仕事で使う」という視点から整理しています。新たに「ML Ops」や「機械学習モデルの検証」などの章が追加され、読者が直面する問題解決に役立つ内容となっています。著者は機械学習分野の専門家で、実践的な知識を提供しています。
機械学習の手法やテクニックにフォーカスした書籍ではなくて、機械学習を仕事に取り入れるためにはどうすればよいのか?どういうところに注意しなくてはいけないのかがまとめられた書籍。実務で機械学習を利用している人利用する可能性のある人は絶対に読むべき書籍。そもそも本当に機械学習を使う必要があるのかということをしっかり考える、機械学習ありきのプロジェクトは必ず失敗する。
本書はデータ視覚化の重要性と技術を解説しており、単なるグラフ作成にとどまらず、データの意味を明確にし、オーディエンスに興味を持たせることを目的としています。筆者は日本人女性唯一のTableau ZEN MASTERであり、実践的なノウハウや事例を通じて、データ視覚化の基礎からプロフェッショナルなテクニックまでを紹介しています。主要な章では、視覚化の基本概念、プロっぽく見せるコツ、適切なチャートの選択、実際のダッシュボード作成事例、組織内でのデータ視覚化の浸透方法について詳しく説明しています。
本書は、教師なし学習の重要性と実践的手法を紹介する内容です。教師なし学習はラベル付けされていないデータから学習し、従来の教師あり学習に比べてコストが低く、現実世界での応用が期待されています。データの隠れたパターンを特定し、異常検出や特徴量抽出を行う方法を解説し、変分オートエンコーダ(VAE)、敵対的生成ネットワーク(GAN)、制限付きボルツマンマシン(RBM)などの生成モデルも紹介しています。著者はデータサイエンスの専門家で、実務経験を持つ人物です。
機械学習の手法やテクニックにフォーカスした書籍ではなくて、機械学習を仕事に取り入れるためにはどうすればよいのか?どういうところに注意しなくてはいけないのかがまとめられた書籍。実務で機械学習を利用している人利用する可能性のある人は絶対に読むべき書籍。そもそも本当に機械学習を使う必要があるのかということをしっかり考える、機械学習ありきのプロジェクトは必ず失敗する。
本書は、欠測データの解析における多重代入法の実用的な手法を解説しています。従来の書籍では理論中心でしたが、本書では具体的な応用事例や手順を示し、社会科学の分析手法(t検定、重回帰分析、ロジスティック回帰分析など)における欠測データ処理を詳述しています。Rコードと実データを用いて、読者が実際に手順を再現しながら学ぶことができるようになっています。著者は、統計科学や不完全データ処理法の専門家です。
本書は、エステル・デュフロ教授らによるランダム化比較試験(RCT)の理論と実践を解説したもので、エビデンスに基づく政策形成(EBPM)におけるRCTの活用方法を探ります。監訳者の小林庸平氏が難解な部分をわかりやすく補足し、RCTの重要性や実施に際しての留意点を詳述。EBPMや経済学の実証研究に興味のある読者にとって必読の一冊です。
オークション等の注目のトピックスを盛り込み,解説をさらに丁寧に初学者にわかりやすく,新たに2色刷としてさらに読みやすく一新。 基礎から新しい研究成果までをカバーし,楽しみながらゲーム理論のエッセンスとその考え方を学べるスタンダードテキストの新版。オークション等の注目トピックスを盛り込み,さらに丁寧な解説でわかりやすく,新たに2色刷としてさらに読みやすく一新。 第1章 ゲーム理論とは何だろうか? 第2章 選択と意思決定 第3章 戦略ゲーム 第4章 ナッシュ均衡点 第5章 利害の対立と協力 第6章 ダイナミックなゲーム 第7章 繰り返しゲーム 第8章 不確実な相手とのゲーム 第9章 交渉ゲーム 第10章 グループ形成と利得分配 第11章 進化ゲーム 第12章 ゲーム実験
本書は、機械学習を実践的に学ぶための教材で、scikit-learn、TensorFlow、Kerasを用いて、基礎から応用までの手法を体系的に解説しています。内容には、データ処理、モデル学習、深層学習、強化学習、コンピュータビジョン、自然言語処理などが含まれ、サンプルコードはすべてGitHubで公開され、Jupyter Notebookで試すことができます。第2版では新たに畳み込みニューラルネットワークやGANによる画像生成の説明も追加されています。機械学習を学びたいエンジニアにとって必携の一冊です。
学生の時にこの書籍を読んで統計学に興味を持った。統計学の魅力について分かりやすく学べる書籍。専門的な内容はそれほどないのでスラスラ読める。統計学ってどんなことができるの?なんでそんなにすごいの?ということを知りたい人がまず最初に読むべき本。
技術面での今後の発展可能性を示した 第1章 テキストマイニングとは何か 1.1 分析の技術としてのテキストマイニング 1.2 類似技術との比較—単なる検索や分類整理と何が違うか— 1.3 テキストマイニングの基本的な仕組み 1.4 テキストマイニングの自然言語処理 1.5 テキストマイニングにおけるマイニング処理 1.6 第1章のまとめ 第2章 テキストマイニングの適用例と効果 2.1 テキストマイニングの適用対象 2.2 コールセンターにおけるコンタクト履歴への適用例 2.3 インバウンドコールセンター(PCヘルプセンター)のコンタクト履歴のテキストマイニング 2.4 アウトバウンドセールスセンターのコンタクト履歴のテキストマイニング 2.5 第2章のまとめ 第3章 テキストマイニングの理想的な使い方 3.1 経営戦略としてのテキストマイニング 3.2 テキストマイニングの位置付け —誰が何のために行うのか— 3.3 情報の適切な共有 3.4 データを活かすことを意識したデータ収集 3.5 テキストマイニングの適用形態 3.6 第3章のまとめ 第4章 テキストマイニングに対する疑問への回答 4.1 どんなデータでも結果が必ず出るものか? 4.2 テキストマイニングの効果をどう判断すべきか? 4.3 テキストマイニングの結果はあてになるか? 4.4 辞書のメンテナンスが大変だからつかいこなせないというのは本当か? 4.5 テキストマイニングの分析に適正やコツがあるか? 4.6 テキストマイニングは文書の意味をどこまで把握できるのか? 第5章 テキストマイニングの今後 5.1 感情・評価・態度の分析技術 5.2 発話内容の分析技術(自動音声認識結果のテキストマイニング) 5.3 どうなるべきか—テキストマイニングの活用動向— 参考文献 索 引
この書籍は、ディープラーニングを手を動かしながら学べる入門書で、最新のトレンドや無料クラウドGPUの活用法を解説しています。20以上の実例を通じて、機械学習や深層学習の基礎から応用までを学べる内容です。目次には、学習の地図、基礎知識、実践事例、Colaboratoryの使い方が含まれています。著者はIT企業での技術マネージャーとしての経験を持つ増田知彰氏です。
本書は点過程の時系列解析に関する入門書で、データが特定のイベントの発生時刻の集合として扱われる点過程の理論と実データ解析を体系的に解説しています。地震や神経細胞の活動、金融取引などの現象を分析するために点過程が広く使われており、その応用範囲が拡大しています。著者は確率・統計の基礎を持つ読者を想定し、必要な理論や計算をできるだけ分かりやすく説明しています。目次にはポアソン過程やHawkes過程、統計推定法などが含まれています。著者は時系列解析や統計地震学の専門家です。
自然科学・工学・医学等への応用をめざしつつ,さまざまな統計学的考え方を紹介し,その基礎をわかりやすく解説する.シリーズIと同様に,豊富に実際例を用いつつ,図表を多くとり入れて,視覚的にもわかりやすく統計学を親しみながら学べるよう編集した. 第1章 確率の基礎(矢島美寛) 第2章 線形モデルと最小二乗法(廣津千尋) 第3章 実験データの分析(藤野和建) 第4章 最尤法(廣津千尋) 第5章 適合度検定(廣津千尋) 第6章 検定と標本の大きさ(竹村彰通) 第7章 分布の仮定(竹内 啓,藤野和建) 第8章 質的データの統計的分析(縄田和満) 第9章 ベイズ決定(松原 望) 第10章 確率過程の基礎(矢島美寛) 第11章 乱数の性質(伏見正則)
「統計検定準1級試験対応公式テキスト」は、統計学と機械学習の幅広いトピックをカバーし、実践的な例題を通じて学べる内容です。頻出項目に重点を置き、各トピックについて解説と例題が提供されています。統計的手法の辞典としても活用できる一冊です。目次には、確率、分布、統計的推定、検定法、回帰分析、多変量解析、時系列解析など、幅広いテーマが含まれています。
序 新自由主義の探究 マックス・ウェーバーにおける「暴力Gewalt」概念 新聞記事にみる近代東京・都市公園の話題変遷 近代日本社会におけるSelf-Starvationの歴史 婦人運動とウーマン・リブとの架橋 安全保障技術研究推進制度の助成を受けた研究者のネットワーク可視化
Now in its third edition, this classic book is widely considered the leading text on Bayesian methods, lauded for its accessible, practical approach to analyzing data and solving research problems. Bayesian Data Analysis, Third Edition continues to take an applied approach to analysis using up-to-date Bayesian methods. The authors-all leaders in the statistics community-introduce basic concepts from a data-analytic perspective before presenting advanced methods. Throughout the text, numerous worked examples drawn from real applications and research emphasize the use of Bayesian inference in practice. New to the Third Edition Four new chapters on nonparametric modeling Coverage of weakly informative priors and boundary-avoiding priors Updated discussion of cross-validation and predictive information criteria Improved convergence monitoring and effective sample size calculations for iterative simulation Presentations of Hamiltonian Monte Carlo, variational Bayes, and expectation propagation New and revised software code The book can be used in three different ways. For undergraduate students, it introduces Bayesian inference starting from first principles. For graduate students, the text presents effective current approaches to Bayesian modeling and computation in statistics and related fields. For researchers, it provides an assortment of Bayesian methods in applied statistics. Additional materials, including data sets used in the examples, solutions to selected exercises, and software instructions, are available on the book's web page. FUNDAMENTALS OF BAYESIAN INFERENCE Probability and Inference Single-Parameter Models Introduction to Multiparameter Models Asymptotics and Connections to Non-Bayesian Approaches Hierarchical Models FUNDAMENTALS OF BAYESIAN DATA ANALYSIS Model Checking Evaluating, Comparing, and Expanding Models Modeling Accounting for Data Collection Decision Analysis ADVANCED COMPUTATION Introduction to Bayesian Computation Basics of Markov Chain Simulation Computationally Efficient Markov Chain Simulation Modal and Distributional Approximations REGRESSION MODELS Introduction to Regression Models Hierarchical Linear Models Generalized Linear Models Models for Robust Inference Models for Missing Data NONLINEAR AND NONPARAMETRIC MODELS Parametric Nonlinear Models Basic Function Models Gaussian Process Models Finite Mixture Models Dirichlet Process Models APPENDICES A: Standard Probability Distributions B: Outline of Proofs of Asymptotic Theorems C: Computation in R and Stan Bibliographic Notes and Exercises appear at the end of each chapter.
ジェフ・ベゾスが全社員にまず読ませる書籍ということで読んでみたが、内容はありきたりのものでそれほど目新しさがなかった。とりあえず適切なKPIを設定してそれをトラッキングできるようにせよ!ということ。