【2023最新】「自然言語処理」のおすすめ本!人気ランキング

この記事では、「自然言語処理」のおすすめ本をランキング形式で紹介していきます。インターネット上の口コミや評判をベースに集計し独自のスコアでランク付けしています。

ゼロから作るDeep Learning ❷ ―自然言語処理編

斎藤 康毅
オライリージャパン
おすすめ度
100
紹介文
大ベストセラーの続編。さらに作る、さらに深くDeep Learningに迫る! 大ベストセラーの続編。さらに作る、さらに深くDeep Learningに迫る! コンピュータの専門書としては異例の大ヒットを記録した『ゼロから作るDeep Learning』の続編。第二弾の本書では、自然言語処理や時系列データ処理に焦点を当て、ディープラーニングを使ってさまざまな問題に挑みます。word2vecやRNN(リカレントニューラルネットワーク)、LSTMやGRU、seq2seqやAttention……ディープラーニングを支えるこれら最先端の技術を実装レベルでマスターできます。前作同様、平坦な言葉で分かりやすくをモットーに、高度に見える技術の裏側をじっくり説明し、実際に作ることで理解を深めます。最後までコンセプトは変わらない。ゼロから作る!

自然言語処理〔改訂版〕 (放送大学教材)

禎夫, 黒橋
放送大学教育振興会
おすすめ度
92

深層学習による自然言語処理 (機械学習プロフェッショナルシリーズ)

坪井 祐太
講談社
おすすめ度
84
紹介文
応用(機械翻訳、文書要約、対話、質問応答)に焦点を当て、深層学習の利用方法を解説。「実装上の工夫」など実践的な内容が充実! ◆自然言語処理の応用(機械翻訳、文書要約、対話、質問応答)に焦点を当て、深層学習の利用方法を解説。◆「実装上の工夫」など、本書でしか読めない実践的な内容が充実! ◆自然言語処理の応用(機械翻訳、文書要約、対話、質問応答)に焦点を当て、深層学習の利用方法を解説。 ◆「実装上の工夫」など、本書でしか読めない実践的な内容が充実!  ■おもな内容 第1章 自然言語処理のアプローチ 第2章 ニューラルネットの基礎 第3章 言語処理における深層学習の基礎 第4章 言語処理特有の深層学習の発展 第5章 応用 第6章 汎化性能を向上させる技術 第7章 実装 第8章 おわりに ■機械学習プロフェッショナルシリーズ 本シリーズでは、発展著しい機械学習技術の数学的な基礎理論、実用的なアルゴリズム、それらの活用法を、全29巻にわたって刊行する。 ビッグデータ時代を牽引している若手・中堅の現役研究者が、入門的な内容から最先端の研究成果までをわかりやすく解説。 これからデータサイエンス分野で研究を始めようとしている大学生・大学院生、および、機械学習技術を基礎科学や産業に応用しようとしている研究者・技術者に向けた注目のシリーズである。 第7期として、以下の3点を刊行! 統計的因果探索 清水 昌平・著 画像認識    原田 達也・著 深層学習による自然言語処理 坪井 祐太/海野 裕也/鈴木 潤・著 ■シリーズ編者 杉山 将 理化学研究所 革新知能統合研究センター センター長/東京大学大学院新領域創成科学研究科 教授 第1章 自然言語処理のアプローチ 伝統的な自然言語処理/深層学習への期待/テキストデータの特徴/他分野への広がり 第2章 ニューラルネットの基礎 教師あり学習/順伝播型ニューラルネット/活性化関数/勾配法/誤差逆伝播法/再帰ニューラルネット/ゲート付再帰ニューラルネット/木構造再帰ニューラルネット/畳み込みニューラルネット 第3章 言語処理における深層学習の基礎 準備:記号の世界とベクトルの世界の橋渡し/言語モデル/分散表現/系列変換モデル 第4章 言語処理特有の深層学習の発展 注意機構/記憶ネットワーク/出力層の高速化 第5章 応用 機械翻訳/文書要約/対話/質問応答 第6章 汎化性能を向上させる技術 汎化誤差の分解/推定誤差低減に効く手法/最適化誤差低減に効く手法/超パラメータ選択 第7章 実装 GPUとGPGPU/RNNにおけるミニバッチ化/無作為抽出/メモリ使用量の削減/誤差逆伝播法の実装 第8章 おわりに

機械学習・深層学習による自然言語処理入門 ~scikit-learnとTensorFlowを使った実践プログラミング~ (Compass Data Science)

中山光樹
マイナビ出版
おすすめ度
82
紹介文
「日本語」のデータで、「今の自然言語処理」をイチから学ぶ! 本書は、自然言語処理について初歩から学べる書籍です。プログラミングについては、なんらかのプログラミング言語を使ったことのある開発者を対象に書いています。 自然言語とは、私たち人間が日常的に読み書きしたり、話したりするのに使っている言語のことです。そして、自然言語で書かれたテキストデータをコンピュータで処理するための技術を自然言語処理と呼びます。自然言語処理によって実行できるタスクの代表的な例としては、自動翻訳や質問応答、対話などがあります。 本書では、この自然言語処理について、今まで学習したことがない人でも学べるように、基礎から解説しています。自然言語をコンピュータで処理するために、事前にどのような処理をしておくのか、どのように単語や文章を解析するのか、自動翻訳などのタスクを実行させるためにどのような処理を行うのか、などについて、やさしく説明していきます。 基礎からはじめて、単語分散表現やテキスト分類、系列ラベリング、系列変換、アテンションといった、自然言語処理では欠かせない技術について、理論を解説した上で、Pythonを使って実装し、手を動かしながら理解できるようにしています。 また、現在の自然言語処理は、機械学習や深層学習とも切り離せません。ですので本書では、これらの技術についても基礎から説明し、Pythonを使って処理を実装していきます。基礎的な実装のみではなく、RNN、LSTM、CNNさまざまなモデルを使っての実装、特徴量エンジニアリングや正則化、ハイパーパラメータチューニングなど、実際の処理で必要になるところまで、詳しく解説しています。 本書の特徴として、ほとんどの実装で日本語のデータを使っている点があります。機械学習を用いた自然言語処理手法を日本語に対して適用しようとすると、途端にデータセットの壁に当たります。このような状況を踏まえ、本書では、日本語のデータセットで自然言語処理の様々なタスクを試せるようにしています。 これから、プログラムでの実装も合わせて自然言語処理をしっかり学習したいという方にとっては、最適の1冊です。 Contents Chapter 1 自然言語処理の基礎 1-1 本章の概要 1-2 自然言語処理とは? 1-2-1 自然言語と人工言語 1-2-2 自然言語処理 1-3 自然言語処理のタスク 1-3-1 自然言語処理の基礎技術 1-3-2 自然言語処理の応用技術 1-4 自然言語処理の難しさ 1-4-1 おさらい Chapter 2 機械学習 2-1 本章の概要 2-2 機械学習とは? 2-3 教師あり学習 2-3-1 分類 2-3-2 回帰 2-4 教師なし学習 2-4-1 クラスタリング 2-4-2 次元削減 2-5 強化学習 2-6 機械学習パイプライン 2-4 開発環境の構築 2-7-1 Minicondaのインストール 2-7-2 仮想環境の構築 2-7-3 パッケージのインストール 2-7-4 エディタのインストール 2-7-5 おさらい Chapter 3 コーパス 3-1 本章の概要 3-2 コーパスとは? 3-3 コーパスの読み込み 3-3-1 ファイル読み書きの基礎 3-3-2 CSVとTSVの読み込み 3-3-3 JSONの読み込み 3-3-4 ディレクトリの走査 3-4 コーパスの作成 3-4-1 プロジェクト構成 3-4-2 APIキーの取得 3-4-3 コードの実装 3-4-4 アノテーションツール 3-4-5 おさらい Chapter 4 テキストの前処理 4-1 本章の概要 4-2 前処理の種類と実装 4-2-1 テキストのクリーニング 4-2-2 単語分割 4-2-3 単語の正規化 4-2-4 ストップワードの除去 4-2-5 単語の ID化 4-2-6 パディング 4-3 前処理の実践 4-3-1 プロジェクト構成 4-3-2 データセットの準備 4-3-3 モデルの学習・評価用関数の定義 4-3-4 モデルの学習と評価 4-3-5 おさらい Chapter 5 特徴エンジニアリング 5-1 本章の概要 5-2 特徴エンジニアリングとは? 5-2-1 質的変数の処理 5-2-2 量的変数の処理 5-3 テキストのベクトル表現 5-3-1 N-gramベクトル 5-4 ベクトル表現の実践 5-4-1 プロジェクト構成 5-4-2 データセットの準備 5-4-3 モデルの学習・評価用関数の定義 5-4-4 モデルの学習と評価 5-5 特徴量のスケーリング 5-5-1 正規化 5-5-2 標準化 5-5-3 正規化と標準化の可視化 5-6 特徴選択 5-6-1 特徴選択とは 5-7 特徴選択の実践 5-7-1 プロジェクト構成 5-7-2 モデルの学習と評価 5-7-3 おさらい Chapter 6 機械学習アルゴリズム 6-1 本章の概要 6-2 ロジスティック回帰 6-2-1 分類問題の定式化 6-2-2 分類確率の導入 6-2-3 ロジスティック回帰の学習 6-3 ロジスティック回帰によるテキスト分類 6-3-1 プロジェクト構成 6-3-2 ロジスティック回帰によるテキスト分類の実践 6-4 交差検証 6-5 汎化性能 6-6 学習曲線 6-7 正則化 6-8 ハイパーパラメータチューニング 6-8-1 おさらい Chapter 7 ニューラルネットワーク 7-1 本章の概要 7-2 ニューラルネットワークとは? 7-3 バイアス 7-4 活性化関数 7-5 Kerasによるニューラルネットワークの実装 7-5-1 プロジェクト構成 7-5-2 データセットの準備 7-5-3 モデルの定義 7-5-4 損失関数と最適化関数 7-5-5 コールバック 7-5-6 モデルの学習 7-5-7 モデルを使った予測 7-5-8 モデルの保存と読み込み 7-5-9 実践 7-5-10 おさらい Chapter 8 単語分散表現 8-1 本章の概要 8-2 単語の分散表現とは? 8-2-1 one-hotエンコーディング 8-2-2 分散表現 8-3 単語分散表現を学習するモデルの仕組み 8-3-1 基礎的な考え方 8-3-2 word2vec 8-3-3 Skip-gram 8-3-4 ネガティブサンプリングによる高速化 8-4 モデルの実装 8-4-1 プロジェクト構成 8-4-2 データセットの準備 8-4-3 モデルの定義 8-4-4 予測用クラスの実装 8-4-5モデルの学習 8-5 gensimを使った単語分散表現の学習 8-5-1 プロジェクト構成 8-5-2 モデルの学習 8-5-3 単語分散表現の使用 8-6 学習済み単語分散表現の利用 8-6-1 学習済み単語分散表現のダウンロード 8-6-2 単語分散表現の読み込み 8-7 単語分散表現の評価 8-7-1 おさらい Chapter 9 テキスト分類 9-1 本章の概要 9-2 テキスト分類とは? 9-3 リカレントニューラルネットワーク 9-4 RNNによるテキスト分類器の実装 9-4-1 プロジェクト構成 9-4-2 データセットの準備 9-4-3 モデルの定義 9-4-4 予測用クラスの実装 9-4-5 テキスト分類の評価 9-4-6 モデルの学習と評価 9-5 LSTM 9-6 LSTMによるテキスト分類器の構築 9-6-1 モデルの定義 9-6-2 モデルの学習 9-7 畳み込みニューラルネットワーク 9-8 CNNによるテキスト分類器の実装 9-8-1 モデルの定義 9-8-2 モデルの学習 9-9学習済み単語分散表現の使い方 9-9-1 単語分散表現の準備 9-9-2 モデルの定義 9-9-3 モデルの学習 9-9-4 おさらい Chapter 10 系列ラベリング 10-1本章の概要 10-2系列ラベリングとは? 10-3固有表現認識 10-4 LSTMによる固有表現認識器の実装 10-4-1 プロジェクト構成 10-4-2 データセットの準備 10-4-3 モデルの定義 10-4-4 予測用クラスの実装 10-4-5 固有表現認識の評価 10-4-6 モデルの学習と評価 10-5 双方向 LSTM 10-6 双方向 LSTMによる固有表現認識器の実装 10-6-1 モデルの定義 10-6-2 モデルの学習と評価 10-7 BERT 10-8 BERTによる固有表現認識器の実装 10-8-1 プロジェクト構成 10-8-2 パッケージのインストール 10-8-3 データセットの準備 10-8-4 モデルの定義 10-8-5 評価用コードの実装 10-8-6 モデルの学習と評価 10-8-7 おさらい Chapter 11 系列変換 11-1 本章の概要 11-2 系列変換とは? 11-3 系列変換モデルの定式化 11-3-1 エンコーダの埋め込み層 11-3-2 エンコーダの RNN層 11-3-3 デコーダの埋め込み層 11-3-4 デコーダの RNN層 11-3-5 デコーダの出力層 11-4 系列変換モデルの実装 11-4-1 プロジェクト構成 11-4-2 データセットの準備 11-4-3 モデルの定義 11-4-4 予測用クラスの実装 11-4-5 評価 11-4-6 モデルの学習と評価 11-5 アテンション 11-6 アテンションの実装 11-6-1 予測用クラスの実装 11-6-2 モデルの学習と評価 11-6-3 おさらい Chapter 12 機械学習とクラウド 12-1本章の概要 12-2 Colaboratoryを使った環境構築 12-2-1 基本的な使い方 12-2-2 GPUの使い方 12-2-3 パッケージのインストール方法 12-3機械学習の自動化 ~AutoML~ 12-3-1 モデル選択 12-3-2 ニューラルアーキテクチャサーチ 12-4 Cloud AutoML 12-4-1 APIの有効化 12-4-2 データセットのアップロード 12-4-3 モデルの学習 12-4-4 クリーンアップ 12-5自然言語処理 API 12-5-1 APIキーの取得 12-5-2 コードの実装 12-5-3 API呼び出し 12-5-4 おさらい

言語処理のための機械学習入門 (自然言語処理シリーズ)

高村 大也
コロナ社
おすすめ度
77
紹介文
1 必要な数学的知識 2 文書および単語の数学的表現 3 クラスタリング 4 分類 5 系列ラベリング 6 実験の仕方など

ゼロから作るDeep Learning ―Pythonで学ぶディープラーニングの理論と実装

斎藤 康毅
オライリージャパン
おすすめ度
75
紹介文
ディープラーニングの本格的な入門書。外部のライブラリに頼らずPython 3によってゼロからディープラーニングを作成できる。 実際にシステムを作りながらディープラーニングを学ぶ! ディープラーニングの本格的な入門書。外部のライブラリに頼らずに、Python 3によってゼロからディープラーニングを作ることで、ディープラーニングの原理を楽しく学びます。ディープラーニングやニューラルネットワークの基礎だけでなく、誤差逆伝播法や畳み込みニューラルネットワークなども実装レベルで理解できます。ハイパーパラメータの決め方や重みの初期値といった実践的なテクニック、Batch NormalizationやDropout、Adamといった最近のトレンド、自動運転や画像生成、強化学習などの応用例、さらには、なぜディープラーニングは優れているのか? なぜ層を深くすると認識精度がよくなるのか? といった“Why”に関する問題も取り上げます。

自然言語処理の基礎

学, 奥村
コロナ社
おすすめ度
72
紹介文
1 自然言語処理概論 2 辞書とコーパス 3 形態素解析 4 構文解析 5 意味解析 6 文脈解析 7 自然言語処理の応用

人工知能は人間を超えるか ディープラーニングの先にあるもの (角川EPUB選書)

松尾 豊
KADOKAWA/中経出版
おすすめ度
69
紹介文
人工知能は人間を超えるのか、その日は、いつやってくるのか? グーグルやフェイスブックが開発にしのぎを削る人工知能。日本トップクラスの研究者の一人である著者が、最新技術「ディープラーニング」とこれまでの知的格闘を解きほぐし、知能とは何か、人間とは何かを問い直す。 グーグルやフェイスブックが開発にしのぎを削る人工知能。日本トップクラスの研究者の一人である著者が、最新技術「ディープラーニング」とこれまでの知的格闘を解きほぐし、知能とは何か、人間とは何かを問い直す。

入門 自然言語処理

Steven Bird
オライリージャパン
おすすめ度
69
紹介文
自然言語処理の概念から実践までを詳説

Javaで学ぶ自然言語処理と機械学習

徹, 杉本
オーム社
おすすめ度
65
紹介文
自然言語処理における機械学習の利用について、Javaによるプログラム例を多数掲載し、わかりやすく解説。 自然言語処理における機械学習の利用について、理論と実践をバランスよく学ぶ! 本書は、自然言語処理における機械学習の利用について、Javaによるプログラム例を多数掲載し、わかりやすく解説しています。 自然言語処理や機械学習の基本を丁寧に解説されるだけでなく、サンプルプログラムを拡張する演習問題や豊富な実装例が掲載されているため、理論と実践をバランスよく身につけることができます。 1章 自然言語処理の概要 2章 機械学習の基礎 3章 自然言語テキストの解析 4章 自然言語の意味理解 5章 自然言語処理の応用 付録 Javaについて

自然言語処理と深層学習 C言語によるシミュレーション

小高 知宏
オーム社
おすすめ度
65
紹介文
人工知能研究における自然言語処理分野でよく用いられる機械学習の理論を解説し、深層学習へと導く内容。 自然言語処理と深層学習が一緒に学べる!! 本書は、人工知能研究における主軸の一つである「自然言語処理」について、わかりやすく解説するものです。人工知能研究における自然言語処理分野でよく用いられる機械学習の理論をわかりやすく解説し、それらの知識を前提として深層学習とは何かを示します。単に概念を羅列するのではなく、豊富な実装例や演習問題を通して、自然言語処理の理論と実践をバランスよく学べるように紹介していきます。 第1章 自然言語処理と深層学習 第2章 テキスト処理による自然言語処理 第3章 自然言語文解析への深層学習の適用 第4章 文生成と深層学習 付 録

はじめてのディープラーニング -Pythonで学ぶニューラルネットワークとバックプロパゲーション- (Machine Learning)

我妻 幸長
SBクリエイティブ
おすすめ度
65
紹介文
知識ゼロからはじめるディープラーニング EラーニングサイトUdemyの人気講師が教えるディープラーニングの基礎。ディープラーニングの本命であるニューラルネットワークと、ニューラルネットワークを学習させる際に用いられるアルゴリズムであるバックプロパゲーション(誤差逆伝播法)を初学者にもわかりやすく解説。また画像認識や自然言語処理の分野で高い効率性を発揮する畳み込みニューラルネットワークについてもコード付きで解説することにより、入門書であるにもかかわらず本格的AI開発の入り口まで学ぶことができます。 [本書の特徴] ・はじめてPythonに触れる方のために、Python本体と数値演算ライブラリNumPyによるプログラミングの基礎を解説しています。 ・文系エンジニアのために、微分や線形代数など、ニューラルネットワークの理解に必要な数学の知識を解説しています。 ・サンプルプログラムはフレームワークを使わずにPythonのみで記述しています。このため数式をコード化する際の原理が初心者にもわかりやすくなっています。 ・サンプルプログラムはSBクリエイティブ株式会社のサイトからダウンロード可能です。 ・Python3、Jupyter Notebook対応 第01章 ディープラーニングとは 第02章 Pythonの概要 第03章 ディープラーニングに必要な数学 第04章 ニューラルネットワーク 第05章 バックプロパゲーション 第06章 最小限の実装によるディープラーニング 第07章 畳み込みニューラルネットワーク(CNN) 第08章 ディープラーニングの応用

PythonとKerasによるディープラーニング

Francois Chollet
マイナビ出版
おすすめ度
65
紹介文
AIの大衆化―多くの人々がディープラーニングを利用できるよう実践解説! AIの大衆化―多くの人々がディープラーニングを利用できるよう実践解説! PythonベースのディープラーニングフレームワークKerasの開発者である筆者が、1人でも多くの人々がディープラーニングを利用できるよう実践解説します。 本書はディープラーニングを一から学習したいと考えている人のために書かれています。数学的な表記を避け、代わりにコードを使って定量的な概念を説明することで、機械学習とディープラーニングの基本的な考えについて実践的な知識を養っていきます。 サンプルコードはPythonベースのディープラーニングフレームワークであるKerasに基づいており、バックエンドエンジンとしてTensorFlowを使用しています。 Part 1では、ディープラーニングを大まかに紹介。機械学習とニューラルネットワークを囲む状況といくつかの定義を示し、取り組みを開始するために必要な概念を説明します。 第1章:人工知能(AI)、機械学習、ディープラーニングの基本的なコンテキストと予備知識を提供。 第2章:ディープラーニングに取り組むために必要な基本概念(テンソル、テンソル演算、勾配降下法、バックプロパゲーション)を紹介。 第3章:ディープラーニングフレームワークであるKerasの紹介。分類タスクと回帰タスクを処理する単純なニューラルネットワークの訓練と内部で何が起きているのかが理解できる。 第4章:機械学習の一般的なワークフローとよくある落とし穴・解決法を詳解。 Part 2では、ディープラーニングの実践的な応用例としてコンピュータビジョンと自然言語処理を詳しく見ていきます。サンプルの多くは、ディープラーニングを実務で使用するときに遭遇する問題を解決するためのテンプレートとして利用できます。 第5章:画像分類に焦点を合わせ、コンピュータビジョンの実践的な例を幅広く取り上げる。 第6章:テキストや時系列といったシーケンスデータを処理するための手法を実際に試してみる。 第7章:最先端のディープラーニングモデルを構築するための高度な手法を紹介。 第8章:画像やテキストを作成する能力を持つディープラーニングモデルであり、驚くほど芸術的な結果をもたらすことがあるジェネレーティブモデルの紹介。 第9章:本書の総括。ディープラーニングの限界とその未来を予測。 本書を最後まで読めば、ディープラーニングとは何か、適用できるのはどのような状況か、その制限についてしっかり理解できるはずです。コンピュータビジョンから自然言語処理、画像分類、時系列予測、感情分析、画像/ テキスト生成に至るまで、現実の幅広い問題にKerasを使用できるようになり、最高の短期集中コースとして活用できます。 まえがき 謝辞 監訳者より 本書について カバーについて Part 1 ディープラーニングの基礎 1章 ディープラーニングとは何か 1.1 AI、機械学習、ディープラーニング 1.2 ディープラーニングの前史:機械学習 1.3 なぜディープラーニングなのか、なぜ今なのか 2章 予習:ニューラルネットワークの数学的要素 2.1 初めてのニューラルネットワーク 2.2 ニューラルネットワークでのデータ表現 2.3 ニューラルネットワークの歯車:テンソル演算 2.4 ニューラルネットワークのエンジン:勾配ベースの最適化 2.5 最初の例を振り返る 3章 入門:ニューラルネットワーク 3.1 ニューラルネットワークの構造 3.2 Kerasの紹介 3.3 ディープラーニングマシンのセットアップ 3.4 二値分類の例:映画レビューの分類 3.5 多クラス分類の例:ニュース配信の分類 3.6 回帰の例:住宅価格の予測 4章 機械学習の基礎 4.1 機械学習の4 つの手法 4.2 機械学習モデルの評価 4.3 データ前処理、特徴エンジニアリング、表現学習 4.4 過学習と学習不足 4.5 機械学習の一般的なワークフロー Part 2 ディープラーニングの実践 5章 コンピュータビジョンのためのディープラーニング 5.1 畳み込みニューラルネットワークの紹介 5.2 小さなデータセットでCNNを一から訓練する 5.3 学習済みのCNNを使用する 5.4 CNNが学習した内容を可視化する 6章 テキストとシーケンスのためのディープラーニング 6.1 テキストデータの操作 6.2 リカレントニューラルネットワークを理解する 6.3 リカレントニューラルネットワークの高度な使い方 6.4 畳み込みニューラルネットワークでのシーケンス処理 7章 高度なディープラーニングのベストプラクティス 7.1 Sequential モデルを超えて:Keras Functional API 7.2 Keras のコールバックとTensorBoardを使ったディープラーニングモデルの調査 7.3 モデルを最大限に活用するために 8章 ジェネレーティブディープラーニング 8.1 LSTM によるテキスト生成 8.2 DeepDream 8.3 ニューラルネットワークによるスタイル変換 8.4 変分オートエンコーダによる画像の生成 8.5 速習:敵対的生成ネットワーク 9章 本書のまとめ 9.1 主な概念の復習 9.2 ディープラーニングの限界 9.3 ディープラーニングの未来 9.4 目まぐるしく変化する分野に後れずについていくには 9.5 最後に 付録A Kerasとその依存ファイルをUbuntu にインストールする A.1 Pythonの科学ライブラリをインストールする A.2 GPUのサポートをセットアップする A.3 Theanoをインストールする(オプション) A.4 Kerasをインストールする 付録B AWSのGPUインスタンスでJupyter Notebookを実行する B.1 Jupyter NotebookをAWSで実行する理由 B.2 Jupyter NotebookをAWSで実行しない理由 B.3 AWS GPUインスタンスのセットアップ B.4 Kerasをインストールする B.5 ローカルポートフォワーディングを設定する B.6 ローカルブラウザからJupyter Notebookを使用する

詳解ディープラーニング 第2版 ~TensorFlow/Keras・PyTorchによる時系列データ処理~ (Compass Booksシリーズ)

巣籠 悠輔
マイナビ出版
おすすめ度
65
紹介文
ディープラーニング実装入門書の決定版! ニューラルネットワークの理論とディープラーニングの実装について丁寧に解説。実装には、Python(3.x)とディープラーニング向けライブラリKeras(2.x)、TensorFlow(2.x)、PyTorch(1.x)を用います。 本書では、自然言語処理をはじめとした時系列データ処理のためのディープラーニング・アルゴリズムに焦点を当てているのも大きな特徴の1つです。本書の[第1版](2017年)以降に次々と登場している新しい手法やモデルを丁寧に説明、記事も大幅にボリュームアップしました。 [本書の構成] 1章 数学の準備:ニューラルネットワークのアルゴリズムを理解するための数学の知識、偏微分と線形代数の基本を学びます。アルゴリズムが複雑になってもこの2つを押さえておけばきちんと理解できます。 2章 Pythonの準備:ディープラーニングのアルゴリズムを実装するため、Python環境の構築およびPythonの基本から代表的なライブラリの使い方までを解説します。 3章 ニューラルネットワーク:ニューラルネットワークとは何か、どういった手法かを解説します。単純パーセプトロン、ロジスティック回帰、多クラスロジスティック回帰、多層パーセプトロンを扱います。 4章 ディープニューラルネットワーク:ディープラーニングはニューラルネットワークのモデルの発展形です。ニューラルネットワークから「ディープ」ニューラルネットワークになるうえで発生する課題とそれを解決するテクニックについて解説します。 5章 リカレントニューラルネットワーク:ニューラルネットワークに「時間」という概念を取り込むとどのようなモデルになるのか。通常のディープラーニングのモデルではうまく扱うことができない時系列データの扱いに特化したモデルであるリカレントニューラルネットワーク(RNN)とその手法LSTM、GRUについて取り上げます。 6章 リカレントニューラルネットワークの応用:時系列データの扱いに関しては、自然言語処理で新しいモデルが考えられてきました。本章では、Encoder-Decoder、Attention、Transformerについて学んでいきます。 付録 ライブラリ内部の処理を理解するためのグラフの知識と、Pythonのデコレータ @tf.function の実装例、Keras、TensorFlow、PyTorchによるモデルの保存・読み込みについて解説します。 はじめに 1章 数学の準備 1.1 偏微分 1.2 線形代数 1.3 まとめ 1章の参考文献 2章 Python の準備 2.1 Python 2とPython 3 2.2 Anaconda ディストリビューション 2.3 Python の基本 2.4 NumPy 2.5 ディープラーニング向けライブラリ 2.6 まとめ 3章 ニューラルネットワーク 3.1 ニューラルネットワークとは 3.2 回路としてのニューラルネットワーク 3.3 単純パーセプトロン 3.4 ロジスティック回帰 3.5 多クラスロジスティック回帰 3.6 多層パーセプトロン 3.7 モデルの評価 3.8 まとめ 4章 ディープニューラルネットワーク 4.1 ディープラーニング向けライブラリの導入(Keras/TensorFlow/PyTorch) 4.2 ディープラーニングへの準備 4.3 活性化関数の工夫 4.4 ドロップアウトの導入 4.5 学習の効率化に向けて 4.6 学習率の設定 4.7 重みの初期値の設定 4.8 バッチ正規化 4.9 まとめ 4章の参考文献 5章 リカレントニューラルネットワーク 5.1 基本のアプローチ 5.2 LSTM 5.3 GRU 5.4 双方向リカレントニューラルネットワーク 5.5 埋め込み層における計算 5.6 まとめ 5章の参考文献 6章 リカレントニューラルネットワークの応用 6.1 Encoder-Decoder 6.2 Attention 6.3 Transformer 6.4 まとめ 6章の参考文献 付録 A.1 計算グラフ A.2 @tf.function A.3 モデルの保存と読み込み(Keras、TensorFlow、PyTorch) 索引

AIの衝撃 人工知能は人類の敵か (講談社現代新書)

小林 雅一
講談社
おすすめ度
65
紹介文
AIが暴走して人類を滅亡させる? グーグルの全産業征服計画の全貌と日本衰退の危機とは? いまこそ人間の存在価値が問われている 脳科学とコンピュータの融合が私たちの常識を覆す! 自動運転車、ドローン、ロボット兵器、雇用・産業構造、医療・介護、芸術……。「自ら学んで成長する能力」を身につけた次世代ロボットは、人間社会をどのように変えるのか。はたして、AIに脅かされる職種とは? AIが「人類を滅亡させる」のは本当か?  いまそこにある「日本衰退」の危機とは? 人間の存在価値が問われる時代の必読書! (講談社現代新書) 脳科学とコンピュータの融合が私たちの常識を覆す! 自動運転車、ドローン、ロボット兵器、 雇用・産業構造、医療・介護、芸術…… 「自ら学んで成長する能力」を身につけた 次世代ロボットは、 人間社会をどのように変えるのか -------------------------------------------------- AIが「人類を滅亡させる」のは本当か? いまそこにある「日本衰退」の危機とは? 「ルンバ」などのお掃除ロボット、 グーグルが先鞭をつけた自動運転車は、 掃除機や自動車などの姿を借りた次世代ロボットであり、 おそらく今後、あらゆる製品で同じようなことが起こる。 つまり、家電や自動車をはじめとする多くの既存製品が、 一種の知性(AI)を帯びたロボット的な製品へと 生まれ変わるのだ。 AIと次世代ロボット技術は、今後、 私たちを取り巻く全ての産業を塗り替えてしまう。 日本の産業界がそれに気づかず、 この分野でグーグルなどに後れを取ると、一体どうなるのか。 これを今こそ、日本の産業界はよく考えないといけない―。 -------------------------------------------------- 【本書のおもな内容】 第1章 最新AIの驚異的実力と人類滅亡の危惧 ――機械学習の光と陰 第2章 脳科学とコンピュータの融合から何が生まれるのか ――AIの技術と歴史 第3章 日本の全産業がグーグルに支配される日 ――2045年「日本衰退」の危機 第4章 人間の存在価値が問われる時代 ――将棋電王戦と「インダストリー4.0」 第1章 最新AIの驚異的実力と人類滅亡の危惧 ――機械学習の光と陰 第2章 脳科学とコンピュータの融合から何が生まれるのか ――AIの技術と歴史 第3章 日本の全産業がグーグルに支配される日 ――2045年「日本衰退」の危機 第4章 人間の存在価値が問われる時代 ――将棋電王戦と「インダストリー4.0」

わかりやすいパターン認識

健一郎, 石井
オーム社
おすすめ度
65
紹介文
認識と学習の基本的な考え方をわかりやすく解説。 第1章 パターン認識とは 第2章 学習と識別関数 第3章 誤差評価に基づく学習 第4章 識別部の設計 第5章 特徴の評価とベイズ誤り確率 第6章 特徴空間の変換 第7章 部分空間法 第8章 学習アルゴリズムの一般化 第9章 学習アルゴリズムとベイズ決定則

深層学習教科書 ディープラーニング G検定(ジェネラリスト)公式テキスト 第2版

猪狩 宇司
翔泳社
おすすめ度
65
紹介文
大好評!デジタル時代の必携リテラシー、G検定の「公式テキスト」の改訂版! 【本書の特徴】 ・大ベストセラー、ディープラーニング G検定 公式テキストの改訂版。 ・改訂された新シラバスに完全準拠。 ・試験運営団体である「日本ディープラーニング協会」が監修。 ・章末問題を大増量。分かりやすい解説付き。 ・ディープラーニングに関する入門書としても最適。 【対象読者】 ・ G検定を受験しようと思っている人 ・ディープラーニングについて概要を学びたい人 ・ディープラーニングを事業活用しようと思っている人・DX推進を検討している人 【G検定とは】 ・内容:ディープラーニングを事業に活かすための知識を有しているかを検定する ・試験方式:知識問題(多肢選択式)、オンライン実施(自宅受験) ・日程:年3回(詳細は公式サイトにて公表) 【目次】 試験の概要 第1章 人工知能(AI)とは 第2章 人工知能をめぐる動向 第3章 人工知能分野の問題 第4章 機械学習の具体的手法 第5章 ディープラーニングの概要 第6章 ディープラーニングの手法 第7章 ディープラーニングの社会実装に向けて Appendix 事例集 産業への応用 第1章 人工知能(AI)とは 1-1.人工知能(AI)とは 1-2.人工知能研究の歴史 第2章 人工知能をめぐる動向 2-1.探索・推論 2-2.知識表現 2-3.機械学習・深層学習 第3章 人工知能分野の問題 3-1.人工知能分野の問題 第4章 機械学習の具体的手法 4-1.代表的な手法 4-2.モデルの評価 第5章 ディープラーニングの概要 5-1.ニューラルネットワークとディープラーニング 5-2.ディープラーニングのアプローチ 5-3.ディープラーニングを実現するには 5-4.活性化関数 第6章 ディープラーニングの手法 6-1.畳み込みニューラルネットワーク 6-2.深層生成モデル 6-3.画像認識分野での応用 6-4.音声処理と自然言語処理分野 6-5.深層強化学習 6-6.モデルの解釈性の問題とその対応 第7章 ディープラーニングの社会実装に向けて 7-1.AIと社会 7-2.AIプロジェクトを計画する 7-3.データを集める 7-4.データを加工・分析・学習させる 7-5.実装・運用・評価する 7-6.クライシス・マネジメントをする Appendix 事例集 産業への応用 A-1.製造業領域における応用事例 A-2.モビリティ領域における応用事例 A-3.医療領域における応用事例 A-4.介護領域における応用事例 A-5.インフラ領域における応用事例 A-6.サービス・小売・物流領域における応用事例 A-7.農林水産業領域における応用事例 A-8.その他領域における応用事例

Natural Language Understanding

Allen, James
Addison Wesley
おすすめ度
61
紹介文
This long-awaited revision offers a comprehensive introduction to natural language understanding with developments and research in the field today. Building on the effective framework of the first edition, the new edition gives the same balanced coverage of syntax, semantics, and discourse, and offers a uniform framework based on feature-based context-free grammars and chart parsers used for syntactic and semantic processing. Thorough treatment of issues in discourse and context-dependent interpretation is also provided. In addition, this title offers coverage of two entirely new subject areas. First, the text features a new chapter on statistically-based methods using large corpora. Second, it includes an appendix on speech recognition and spoken language understanding. Also, the information on semantics that was covered in the first edition has been largely expanded in this edition to include an emphasis on compositional interpretation. 0805303340B04062001 1. Introduction to Natural Language Understanding. The Study of Language. Applications of Natural Language Understanding. Evaluating Language Understanding Systems. The Different Levels of Language Analysis. Representations and Understanding. The Organization of Natural Language Understanding Systems. 2. Linguistic Background: An Outline of English Syntax. Words. The Elements of Simple Noun Phrases. Verb Phrases and Simple Sentences. Noun Phrases Revisited. Adjective Phrases. Adverbial Phrases. 3. Grammars and Parsing. Grammars and Sentence Structure. What Makes a Good Grammar. A Top-Down Parser. A Bottom-Up Chart Parser. Top-Down Chart Parsing. Finite State Models and Morphological Processing. Grammars and Logic Programming. 4. Features and Augmented Grammars. Feature Systems and Augmented Grammars. Some Basic Feature Systems for English. Morphological Analysis and the Lexicon. A Simple Grammar Using Features. Parsing with Features. Augmented Transition Networks. Definite Clause Grammars. Generalized Feature Systems and Unification Grammars. 5. Grammars for Natural Language. Auxiliary Verbs and Verb Phrases. Movement Phenomena in Language. Handling Questions in Context-Free Grammars. Noun Phrases and Relative Clauses. The Hold Mechanism in ATN. Gap Threading. 6. Toward Efficient Parsing. Human Preferences in Parsing. Encoding Uncertainty: Shift-Reduce Parsers. A Deterministic Parser. Techniques for Efficient Encoding of Ambiguity. Partial Parsing. 7. Ambiguity Resolution: Statistical Methods. Basic Probability Theory. Estimating Probabilities. Part-of-Speech Tagging. Obtaining Lexical Probabilities. Probabilistic Context-Free Grammars. Best-First Parsing. A Simple Context-Dependent Best-First Parser. 8. Semantics and Logical Form. Semantics and Logical Form. Word Senses and Ambiguity. The Basic Logical Form Language. Encoding Ambiguity in Logical Form. Verbs and States in Logical Form. Case Relations. Speech Acts and Embedded Sentences. Defining Semantic Structure: Model Theory. 9. Linking Syntax and Semantics. Semantic Interpretation and Compositionality. A Simple Grammar and Lexicon with Semantic Interpretation. Prepositional Phrases and Verb Phrases. Lexicalized Semantic Interpretation and Semantic Roles. Handling Simple Questions. Semantic Interpretation Using Feature Unification Generating Sentences from Logical Form. 10. Ambiguity Resolution. Selectional Restrictions. Semantic Filtering Using Selectional Restrictions. Semantic Networks. Statistical Word Sense Disambiguation. Statistical Semantic Preferences. Combining Approaches to Disambiguation. 11. Other Strategies for Semantic Interpretation. Grammatical Relations. Semantic Grammars. Template Matching. Semantically-Directed Parsing Techniques. 12. Scoping and the Interpretation of Noun Phrases. Scoping Phenomena. Definite Descriptions and Scoping. A Method for Scoping While Parsing. Co-Reference and Binding Constraints. Adjective Phrases. Relational Nouns and Nominalizations. Other Problems in Semantics. 13. Knowledge Representation and Reasoning. Knowledge Representation. A Representation Based on FOPC. Frames: Representing Stereotypical Information. Handling Natural Language Quantification. Time and Aspectual Classes of Verbs. Automating Deduction in Logic-Based Representations. Procedural Semantics and Question Answering. Hybrid Knowledge Representations. 14. Local Discourse Context and Reference. Defining Local Discourse Context and Discourse Entities. A Simple Model of Anaphora Based on History Lists. Pronouns and Centering. Definite Descriptions. Definite Reference and Sets. Ellipsis. Surface Anaphora. 15. Using World Knowledge. Using World Knowledge: Establishing Coherence. Matching Against Expectations. Reference and Matching Expectations. Using Knowledge About Action and Casualty. Scripts: Understanding Stereotypical Situations. Using Hierarchical Plans. Action-Effect-Based Reasoning. Using Knowledge About Rational Behavior. 16. Discourse Structure. The Need for Discourse Structure. Segmentation and Cue Phrases. Discourse Structure and Reference. Relating Discourse Structure and Inference. Discourse Structure, Tense, and Aspect. Managing the Attentional Stack. An Example. 17. Defining a Conversational Agent. What's Necessary to Build a Conversational Agent? Language as Multi-Agent Activity. Representing Cognitive State: Beliefs. Representing Cognitive State: Desires, Intentions, and Plans. Speech Acts and Communicative Acts. Planning. Communicative Acts. Communicative Acts and the Recognition of Intention. The Source of Intention in Dialogue. Recognizing Illocutionary Acts. Discourse and Level Planning. Appendices. An Introduction to Logic and Model Theoretic Semantics. Symbolic Computation. Spoken Language. 0805303340T04062001

ディープラーニング活用の教科書

日本ディープラーニング協会
日経BP
おすすめ度
61
紹介文
急速に広がるディープラーニング活用の今と未来がわかる!国内の事例を体系的に取り上げ先駆者が解説 AIは研究から実用フェーズへ―― 急速に広がるディープラーニング活用の今と未来がわかる! 国内35社の事例を体系的に取り上げ、先駆者が苦労したポイントを解説 <日本ディープラーニング協会監修> 活用を検討する企業でよく生じる疑問にも答えます。 次世代の新規事業や業務改善の企画に欠かせない1冊! インターネットに遅れること20年、ディープラーニングは、 「汎用目的技術」の1つとして、あらゆる産業を変えていくとみられています。 汎用目的技術とは、古くは動物の家畜化、車輪、印刷の発明から、鉄道、電気、 自動車、インターネットまで「原理は単純で汎用的でさまざまなことに利用できる」 技術のことをいいます。 本書は、ディープラーニングが与えるインパクトを事例を基に解説します。 第1章では、東京大学大学院工学系研究科 特任准教授の松尾豊氏が描く「ディープラーニングをベースにしたAIの技術的発展」(ロードマップ)を解説。 第2~5章ではこのロードマップを基に国内の先進事例を分類して紹介していきます。 カツ丼の盛り付けを判定、泳ぐマグロの数を数える、クリーニング衣類を判別、文章の校閲、河川の護岸の傷判定、送電線の異常検知、道路下の空洞を探る、タクシーの乗客数予測、テレビCMの効果を予測、お弁当の盛り付け、重機で自動掘削、白黒映像の色付け、仮想アイドル画像の生成、プロ並みアナウンサー、人の話し方をまねる……続々登場する、こうしたディープラーニングの驚異の活用法が分かります。 第1章 ディープラーニングの発展予測 第2章 [Step1] 人の「眼」となり単純作業から解放する 第3章 [Step2] 「五感」を担い行動予測や異常検知を実現 第4章 [Step3] 現実社会に柔軟に対応 「ロボット」「自動運転」の時代 第5章 「創作」業務へも広がる活用範囲 第6章 ビジネス活用Q&A     ──向く分野/向かない分野、データ、人材、投資などの悩みに回答

最短コースでわかる PyTorch &深層学習プログラミング

赤石 雅典
日経BP
おすすめ度
61
紹介文
人気のAIフレームワーク「PyTorch」で、ディープラーニングプログラミングができるようになる本です。 人気のAIフレームワーク「PyTorch」で、ディープラーニングプログラミングができるようになる本です。ディープラーニングのアルゴリズムが原理からわかります。 初心者でも他書に頼らず、本書1冊でマスターできます! (本書掲載のコードは、2023年3月にリリースされたPyTorch 2.0でも、そのまま動作します) 本書は、次のような読者を想定しています。 1. 企業でディープラーニングプログラムを業務で利用している、あるいはこれから利用しようとしているITエンジニアや研究者 Keras/Tensorflowを使った経験がある方は、まずPyTorch独特の「ポリシー」につまずきがちです。 PyTorchは「多値分類モデルにおける損失関数」の考え方が独特で、それを分かりやすく解説します。 2. 理工系の大学・大学院の学生で研究の一環としてディープラーニングのプログラムを開発する必要がある方 今後、論文で公開されている実装コードを試すには、PyTorchの知識が必須になってきます。 本書では、ディープラーニングに必要な数学をイメージとして解説するので、公開コードを深く理解し、応用できるようになります。 3. まだPythonもKeras/TensorFlowも知らないが、ディープラーニングプログラミングをこれから勉強してみたいという方 初心者に向けて、PyTorchプログラミングを理解するのに必要な、Pythonの基本文法と、NumPy、Matplotlibの必要最小限の機能を、巻末の講座として用意しました。 目的がディープラーニングだけなら、本書の講座で書いた概念・機能だけを理解すれば十分で、ディープラーニングを学ぶためのスタートラインに立てます。 本書は、新しい概念は一気には詰め込まず、できるだけ細分化して一歩一歩確実に進めます。 機械学習の基本から、「CNN」などを使った画像認識ディープラーニングモデルの開発・チューニングまでをじっくり学べます。 人気のAIフレームワーク「PyTorch」で、ディープラーニングプログラミングができるようになる本です。 初心者でも他書に頼らず、本書1冊でマスターできます! 序章 初めての画像認識 ◆基礎編 1 章 ディープラーニングのためのPython のツボ 2 章 PyTorch の基本機能 3 章 初めての機械学習 4 章 予測関数の定義 ◆機械学習 実践編 5 章 線形回帰 6 章 2 値分類 7 章 多値分類 8 章 MNIST を使った数字認識 ◆画像認識 実践編 9 章 CNN による画像認識 10 章 チューニング技法 11 章 事前学習済みモデルの利用 12 章 カスタムデータの画像分類 講座 Python入門、NumPy入門、Matplotlib入門

ディープラーニング活用の教科書 実践編

日本ディープラーニング協会
日経BP
おすすめ度
60
紹介文
ディープラーニング活用なくしてビジネスの飛躍的成長なし ◆日本ディープラーニング協会推薦図書◆ 日本ディープラーニング協会 監修 ディープラーニングをビジネスに生かす知識を問われる 同協会のG検定(ジェネラリスト) 推薦図書 松尾豊・同協会理事長による「ディープラーニング技術年表」収録 ディープラーニングは確かに実際のビジネスに溶け込み、商品やサービスでの活用が始まっています。 それによって業績を向上させた企業もあれば、社会課題の解決に結びつけている会社も実在します。 その最先端の実践的な事例を紹介しました。本書に「実践編」と付したのはこうした理由からです。 本書の最大の特徴の1つが、「ディープラーニングビジネス活用アワード」の受賞6プロジェクト全てを子細なケーススタディで紹介していることです。 日本ディープラーニング協会と一緒に、2019年春から準備を進めてきたものです。 エントリーはやや大手企業に偏重したきらいはありましたが、まさに腕自慢の実力派ぞろいでした。 大賞のキユーピーの食品加工で原料を検査する「AI食品原料検査装置」に始まって、楽天の自動翻訳プロジェクトである「Rakuten Translate」、 荏原環境プラントが進める「ごみ焼却プラント運転自動化プロジェクト」、水処理など流体向けAI分析のAnyTechの「水質判定AI『DeepLiquid』」、 保育園向けITサービスのユニファの「写真自動判定システムによる保育士の業務負荷軽減」、パッケージデザインのプラグの「パッケージデザインの好意度スコアを予測するAIサービス」の6事例を本書にまとめました。 できるだけ載せないようにしたケースもあります。 ディープラーニングといえば画像認識とばかりに、熟練工の目の代替として活用する事例は少なくない。 ただその点だけを極めても、効果の最大値は当該人件費の削減分にしかなりません。 結果として幼稚園児の笑顔が増える、あるいは静脈産業の支えになる、 といった大きな社会的意義をディープラーニングには持たせたい。そんな思いで作りました。 受賞6事例を含めた計26事例を、本書ではディープラーニング活用の効果で4つに分けました。 まず「商品開発・業界構造を変える」。 次が「消費者のデマンドに応える」。 そして「働き方を改革する」。 最後が「不正・異常を検知、社会課題を解決する」。 また資料的価値が高い、日本ディープラーニング協会理事長の松尾豊氏がまとめた「ディープラーニング技術年表」そして「インターネットでいうと1998年」も収録。 全編にわたって同協会の理事が一文字ずつ、とりわけ技術的な側面からアドバイスしてくれた貴重な書である。ぜひご覧になっていただきたい。 ディープラーニング活用なくしてビジネスの飛躍的成長なし ◆日本ディープラーニング協会推薦図書◆ はじめに 【第1章】 ディープラーニングで付加価値高め こうして稼ぐ       ―日本ディープラーニング協会 松尾豊理事長に聞く― 【第2章】 商品開発・業界構造を変える  ●キューピー   食品原料の異物を画像認識で検査 食の安全守るため装置は同業に外販も  ●プラグ   パッケージデザインの消費者調査をAIで代替 商品開発のやり方 ガラリ変わる可能性  ●AnyTech   水処理施設からチョコレートまで 「流体」の品質・状態を簡単チェック  ●NTTドコモ   店頭の商品を自動で認識 来店客の属性把握しPOSデータと連動で棚割り提案へ  ●フジクラ   半導体部品をディープラーニングで検査 AIプラットフォーム構築し全社のIoT基盤に  ●日本たばこ産業   コンビニのたばこ陳列を精度99%で認識 1013人超参加のコンテストで実現  ●トレタ   飲食店で売れ筋メニューが分析可能に ディープラーニングによるラベリング技術とは  ●Sports Technology Lab   スポーツ選手の動きをディープラーニングで分析 チーム強化から選手移籍まで  ●ソフトバンク   5G×ディープラーニング 高品質画像でもリアルタイムぼかし加工 【第3章】 消費者のデマンドに応える  ●楽天   ストレスなく外国語を話したい 海外動画配信サービスで培った翻訳技術を活用  ●ヤフー   安いガソリン、空いてる駐車場を近くで探したい ディープラーニングとドラレコで  ●SMBC日興証券   株式ポートフォリオの組み替え方を知りたい 資産総額13倍になるカラクリ 【第4章】 働き方を改革する  ●荏原環境プラント   ごみ焼却施設で「熟練運転員の目」を代替 5倍の効率化を実現 静脈産業を途絶えさせない  ●ユニファ   子供の「NG写真」をディープラーニングで自動排除 保育園の課題解決を支援  ●NTTデータジェトロニクス   社食食堂のレジで自動精算 人件費の削減、そして社員の満足度を高めて社内活性化へ  ●モノフル   トラックの人手不足問題に一石 ナンバーをAIで読み取り効率化  ●三菱総合研究所   財務諸表の数字を読み取り自動でリポート作成 シンクタンクの“夢”に一歩近づく  ●ディー・エヌ・エー(DeNA)   交通事故の削減支援をサービス化 AIとデータサイエンスのタッグで  ●イシダ   ディープラーニングでパスタをつかむ AIと機械の“せめぎ合い”から生まれた新技術  ●AVILEN   鉄加工の図面を自動で読み解く 各種フォーマットの図面に対応 【第5章】 不正・異常を検知、社会課題を解決する  ●リコー   カメラ+AIで路面の老朽化診断 事務機器からの多角化で数千万円の受注  ●日本気象協会   降雨予測のメッシュと時間を詳細化 スパコンを使わず実現、ダム管理などに活用  ●日本取引所自主規制法人   株の不正取引“見せ玉”に待った 証券取引所の不正検知にAI導入世界初  ●misosil   SNS広告でインフルエンサーの不正を暴く フォロワー水増しをAIで発見  ●トプコン   眼底画像から健康状態を読み解く デバイスのデータを加工する「センシングAI」とは?  ●Ollo   月額3万円で顔認証システムが導入可能 エッジデバイスでの高速・高精度化を実現 【第6章】 先端技術の動向を知る おわりに

PyTorchではじめるAI開発

坂本 俊之
シーアンドアール研究所
おすすめ度
60
紹介文
 本書では、Pytorchを使い、実際の製品やサービスの開発時に役に立つ手法を紹介するようにしています。  本書で紹介する「AI開発」では、必ずしもすべての章で、ニューラルネットワークの構造(ニューロン同士の接続の仕方)を一から新しく作成するようなことはしませんが、ModelZOOやGitHub上で公開されているモデルも、積極的に採用するようにしています。また、利用できる学習済みのモデルが公開されている際には、それをダウンロードして使用するようにします。  本書では、章によって、異なるAIを開発しますが、その際には、公開されているモデルをそのまま流用して「広義のAI」のみを作成したり、あるいは公開済みのモデルを転移学習・ファインチューニングしたりと、その都度、もっとも近道であると思われるスキームを利用して、「AI開発」を行います。  本書では次のような機能を解説しています。 ・CHAPTER 02・・・画像認識 ・CHAPTER 03・・・異常検出 ・CHAPTER 04・・・物体検出 ・CHAPTER 05・・・セグメンテーション ・CHAPTER 06・・・顔認証 ・CHAPTER 07・・・線画イラスト変換 ・CHAPTER 08・・・OCRの文字認識 ・CHAPTER 09・・・OCRの文章認識  本書では次のような機能を解説しています。 ・CHAPTER 02・・・画像認識 ・CHAPTER 03・・・異常検出 ・CHAPTER 04・・・物体検出 ・CHAPTER 05・・・セグメンテーション ・CHAPTER 06・・・顔認証 ・CHAPTER 07・・・線画イラスト変換 ・CHAPTER 08・・・OCRの文字認識 ・CHAPTER 09・・・OCRの文章認識

BERT入門ーープロ集団に学ぶ新世代の自然言語処理 (AI/Data Science実務選書)

佐藤 大輔
リックテレコム
おすすめ度
60
紹介文
◆Attention機構、Transformerアルゴリズム、BERTモデルを徹底解説◆ BERTの登場により、自然言語処理(NLP)におけるAIのビジネス適用が劇的に進展し、続々と新しい技術が生まれています。主流となったBERTをきちんと理解すれば、新世代のNLPにキャッチアップできます。 本書では、技術開発はもちろん実務経験も豊富なNLPの専門家集団が、Attention機構、Transformerアルゴリズム、BERTモデルを徹底解説。プロフェッショナルチームが仕組みを詳しく、現場で使えるコードをやさしく手引きします。 ■第1章 NLPの基礎知識 1..1 NLPとは? 1.2 機械学習とは? ■第2章NLPの技術解説 2.1 Bag of Words 2.2 ニューラルネット時代の自然言語処理 ■第3章 BERTの技術解説 3.1 Attention 3.2 Transformer 3.3 BERT 3.4 BERT以降のモデル ■第4章 BERTの環境構築 4.1 Python 4.2 Colaboratory 4.3 環境構築とデータセットの準備 ■第5章 代表タスクを通じて理解する 5.1 BERT の代表的な使われ方 5.2 文書分類タスク 5.3 NER(固有表現抽出)タスク 5.4 質問応答タスク 5.5 単語・文のベクトル化 ■第6章 練習問題 6.1 文書分類タスク 6.2 情報抽出タスク ■第7章 ビジネス適用における課題と解決 7.1 データアセスメント 7.2 不均衡データへの対応 7.3 根拠抽出 7.4 ドメイン特化モデル

業界別! AI活用地図 8業界36業種の導入事例が一目でわかる (AI&TECHNOLOGY)

本橋 洋介
翔泳社
おすすめ度
59
紹介文
さまざまな業界で導入が進められているAIについて、どのような分野で活用されているのかが鳥瞰図で一目でわかる AIの導入事例が一目でわかる! 金融、流通、製造、インフラなど全8業界36業種のAIの導入について、どのような分野で活用されているのか、 どのような事項との親和性が高いかといったことについて鳥瞰図で解説。豊富な実例も掲載しており、ビジネスのアイデア創出にも応用できます。 また、「こんな応用可能性があります」にとどめず、実際に実装したりトライアルをするときのノウハウも掲載しています。 本書掲載の鳥瞰図はご購入者特典としてDLして活用できます。 【本書に掲載されている業種】 〈流通〉 コンビニ・スーパーマーケット 百貨店業 郵便・運送業 〈製造〉 自動車製造業 食品・飲料製造業 化粧品・日用品製造業 金属製造業・化学工業 重工業 建設業 繊維工業(アパレル) 電機製造業 〈金融〉 銀行業 保険業 証券業 〈サービス〉 ホテル業 旅行代理業 外食業 テーマパーク 放送局 〈インフラ〉 通信業 鉄道業 航空業 空港 道路・交通インフラ管理業 エネルギー業(ガス・電気) 石油および天然ガス生産・販売業 〈公共〉 学校・学習塾 警察・警備 消防・防災 〈ヘルスケア〉 病院 介護サービス業 製薬業 〈その他〉 農業 水産業 スタジアム・(プロ/アマ)スポーツ ゲーム業 Chapter 1 流通  コンビニ・スーパーマーケット  百貨店業  郵便・運送業  詳細解説:商品需要予測に基づく在庫管理 Chapter 2 製造  自動車製造業  食品・飲料製造業  化粧品・日用品製造業  金属製造業・化学工業  重工業  建設業  繊維工業(アパレル)  電機製造業  詳細解説:査定自動化・見積り自動化 Chapter 3 金融  銀行業  保険業  証券業  詳細解説:不正検知 Chapter 4 サービス  ホテル業  旅行代理業  外食業  テーマパーク  放送局  詳細解説:キャンペーン企画・価格設定 Chapter 5 インフラ  通信業  鉄道業  航空業  空港  道路・交通インフラ管理業  エネルギー業(ガス・電気)  石油および天然ガス生産・販売業  詳細解説:劣化予測・メンテナンス計画作成 Chapter 6 公共  学校・学習塾  警察・警備  消防・防災  詳細解説:画像データによる異常検知・品質評価 Chapter 7 ヘルスケア  病院  介護サービス業  製薬業  詳細解説:センサーデータによる異常検知 Chapter 8 その他  農業  水産業  スタジアム・(プロ/アマ)スポーツ  ゲーム業  詳細解説:見込み顧客分析・離反分析

PyTorch自然言語処理プログラミング word2vec/LSTM/seq2seq/BERTで日本語テキスト解析! (impress top gearシリーズ)

新納 浩幸
インプレス
おすすめ度
59
紹介文
ディープラーニング技術を使った自然言語処理においてword2vec、LSTM、seq2seq、BERTは、重要な技術です。本書では、機械学習フレームワークのPyTorchを利用することで、それらのディープラーニング技術を使ったプログラムをより容易に実装する方法を解説します。本書で作成するプログラムは、「文章内の単語の品詞を分類する」「日英の機械翻訳を行う」「質問に対する回答を返す」ことなどを目的にしています。本書は、そうした自然言語処理システムの実装を試してみたいという方にとって格好の一冊です。

PyTorch実践入門 ~ ディープラーニングの基礎から実装へ

Eli Stevens
マイナビ出版
おすすめ度
59
紹介文
PyTorchによるディープラーニング実装の決定版! ディープラーニングの重要な基礎概念と、PyTorchを用いたディープラーニングの実装方法について、細部まで掘り下げて解説。限られたデータでニューラルネットワークを訓練する方法、訓練済みモデルのデプロイ方法など『ディープラーニング・プロジェクトのベストプラクティス』を提示します。 ・ディープラーニングのメカニズムを解説 ・Jupyter Notebook上でサンプルコードを実行 ・PyTorchを用いたモデル訓練の実施 ・実データを使用するプロジェクトをベースに実践的解説 ・本番環境へのさまざまなモデルデプロイ方法 PyTorchで実際にどのように組み込まれて実現されているのか、細部まで掘り下げた解説をしていますのでディープラーニングの活用を目指している開発者や詳しく知りたい方におすすめです。 Manning Publications『Deep Learning with PyTorch』の翻訳書 第1部 PyTorchの基礎 第1章 ディープラーニングとPyTorchの概要 第2章 訓練済みモデルの利用方法 第3章 PyTorchにおけるテンソルの扱い方 第4章 さまざまなデータをPyTorchテンソルで表現する方法 第5章 ディープラーニングの学習メカニズム 第6章 ニューラルネットワーク入門 第7章 画像分類モデルの構築 第8章 畳み込み(Convolution) 第2部 ディープラーニングの実践プロジェクト:肺がんの早期発見 第9章 肺がん早期発見プロジェクトの解説 第10章 LUNAデータをPyTorchデータセットに変換 第11章 結節候補を画像分類するモデルの構築 第12章 評価指標とデータ拡張を用いたモデルの改善 第13章 セグメンテーションを用いた結節の発見 第14章 結節・腫瘍解析システムの全体を構築 第3部 デプロイメント(Deployment) 第15章 本番環境にモデルをデプロイする方法 第1部 PyTorchの基礎 第1章 ディープラーニングとPyTorchの概要 第2章 訓練済みモデルの利用方法 第3章 PyTorchにおけるテンソルの扱い方 第4章 様々なデータをPyTorchテンソルで表現する方法 第5章 ディープラーニングの学習メカニズム 第6章 ニューラルネットワーク入門 第7章 画像分類モデルの構築 第8章 畳み込み 第2部 ディープラーニングの実践プロジェクト:肺がんの早期発見 第9章 肺がん早期発見プロジェクトの解説 第10章 LUNAデータをPyTorchデータセットに変換 第11章 結節候補を画像分類するモデルの構築 第12章 評価指標とデータ拡張を用いたモデルの改善 第13章 セグメンテーションを用いた結節の発見 第14章 結節・腫瘍解析システムの全体を構築 第3部 デプロイメント 第15章 本番環境にモデルをデプロイする方法

Probabilistic Machine Learning: An Introduction (Adaptive Computation and Machine Learning series)

Murphy, Kevin P.
The MIT Press
おすすめ度
59

ビジネスの構築から最新技術までを網羅 AIの教科書

伊本 貴士
日経BP
おすすめ度
59
紹介文
これからAIを学ぶ人に向けた入門書。ビジネスへの活用法から最新技術までをカバーした、「最初に手にすべきAI本」 本書は、これから人工知能(AI)を学びたいと考える人に向けたAIの入門書です。エンジニアではない人、すなわち中高生や文系学部の大学生、文系出身のビジネスパーソンや経営者などでも理解できるように、分かりやすくAIの本質や基礎知識を解説しました。AIのビジネスへの活用法からAIの最新技術までをカバーした、「最初に手にすべきAI本」です。 著者は、日本経済新聞社や日経BPのセミナーでAIやIoTの講座を教える人気講師。フジテレビの「ホンマでっか!?TV」に評論家として出演もしています。語り口が初心者にも分かりやすいと定評のある著者が、必要最低限のポイントに絞り、できる限り専門用語を使わないように配慮しながら書き上げました。 初心者でも人工知能の本質を短時間で理解できるようにするために、それぞれの状況や理解度に応じて学習できるように3部に分けて構成しています。 第1部(第1章)は「基礎編」です。ここでは、今後、人工知能が中心となる社会で生きていくために必要最低限の知識についてまとめました。人工知能は何が得意で、何が不得意なのか、そして社会をどう変えていくのかについて解説しています。 第2部(第2~4章)は「ビジネス編」です。ここでは、ビジネスに人工知能を活用するに当たり、各業界の活用事例や今後どのような使われ方をするのかについて書いています。 また、人工知能を活用する際の注意事項を中心に、プロジェクト推進方法や国などの支援状況についても解説しています。 第3部は「技術編」です。ここでは、人工知能の仕組みについて解説しています。今後、データサイエンスや人工知能に関する知識は、エンジニアや人工知能のプロジェクトに関わる人にとっては必須の知識です。 本書を読めば、AIに関する一般向けの本にありがちな曖昧すぎてよく分からない、なぜそこにAIを使う必要があるのか理解できないといった疑問を解消できると思います。 第1章【基礎編】人工知能(AI)の世界 第2章【ビジネス編】産業別に見た人工知能事例と未来予想図 第3章【ビジネス編】人工知能活用に関する国の施策 第4章【ビジネス編】人工知能プロジェクトの進め方と注意点 第5章【技術編】機械学習 ~これまでの人工知能と歴史~ 第6章【技術編】ディープラーニング ~現在の人工知能~ 第7章【技術編】人工知能開発と運用管理 第8章【技術編】人工知能の最新技術 ~これからの人工知能~ 第9章 人工知能開発に関するいろいろなFAQ

The Oxford Handbook Of Computational Linguistics (Oxford Handbooks)

Mitkov, Ruslan
Oxford University Press, USA
おすすめ度
59

動かしながら学ぶPyTorchプログラミング入門

勇哉, 斎藤
オーム社
おすすめ度
59
紹介文
手を動かしアプリを動かしながら学ぶをコンセプトにしたPyTorchの入門書。「解説」と「コード作成」を柱とした構成。 手を動かして学ぶ!! 「手を動かしアプリを動かしながら学ぶ」をコンセプトにしたPyTorchの入門書です。「解説」と「コード作成」を柱とした構成で、主な特徴は次の通りです。 ・最低限の知識でアプリ開発までを実現できる。 ・実用性のあるアプリを作りながら学ぶ。 ・実用性のあるアプリにより学習モチベーションが上がる。 第4章では実用性のある「株価の予測」アプリを開発します。アプリづくりの面白さを通し、読者に楽しみながらPyTorchを学んでいただくものです。

BERTによる自然言語処理入門: Transformersを使った実践プログラミング

ストックマーク株式会社
オーム社
おすすめ度
59
紹介文
自然言語処理の発展に大きな役割を果たし、応用上も有用であるBERTの入門書。BERTを自分で使えるようになることが目標。 自然言語処理の標準モデル、BERTを使いこなせるようになる! BERTはGoogleが2018年末に発表した自然言語処理モデルです。「文脈」を考慮した処理が特徴的であり、言語理解を評価する11個のタスクについて最高精度を達成し、今や標準的なモデルとしての地位を確立しています。 本書は、自然言語処理の近年における発展に大きな役割を果たし、かつ応用上も有用であるBERTの入門書です。前半で自然言語処理や機械学習について概説したのち、BERTによって実際にさまざまなタスクを解いていきます。具体的には、文章分類・固有表現抽出・文章校正・類似文章検索・データの可視化を扱います。データセットの処理から、ファインチューニング(BERTを特定の言語タスクに特化させるための学習)、性能の評価までの一連の流れを体験することで、BERTを自分で使えるようになることを目標とします。 なお、BERTで処理を行うためのライブラリとして、深層学習の言語モデルを扱ううえでよく使用されるTransformersを、学習や性能評価を効率的に行うためのライブラリとしてPyTorch Lightningを用います。本書ではTransformersやPyTorch Lightningを用いたことがない読者を想定して、その使い方を一から体系的かつ丁寧に解説します。 ▼本書の環境 言語:Python 深層学習フレームワーク:PyTorch ライブラリ:Transformers, PyTorch Lightning 計算環境:Google Colaboratory ▼本書の特徴 ・BERTで実際にさまざまなタスクを解くことができます。 ・使用するデータセットを日本語で統一しています。 ・ライブラリの使い方を一から体系的に説明します。 自然言語処理の発展に大きな役割を果たし、応用上も有用であるBERTの入門書。BERTを自分で使えるようになることが目標。

いちばんやさしい機械学習プロジェクトの教本 人気講師が教える仕事に AI を導入する方法 (「いちばんやさしい教本」シリーズ)

韮原祐介
インプレス
おすすめ度
59

いまこそ知りたいAIビジネス

石角 友愛
ディスカヴァー・トゥエンティワン
おすすめ度
58

世界のトップ企業50はAIをどのように活用しているか?

バーナード・マー
ディスカヴァー・トゥエンティワン
おすすめ度
58

統計学が最強の学問である[ビジネス編]――データを利益に変える知恵とデザイン

西内 啓
ダイヤモンド社
おすすめ度
58

AI白書 2020

独立行政法人情報処理推進機構 AI白書編集委員会
KADOKAWA
おすすめ度
58
紹介文
広がるAI化格差と5年先を見据えた企業戦略 ▼技術から利用動向、制度政策に至るまで、国内と海外の人工知能の最新動向がすべてわかるAI白書の2020年版 DX(デジタルトランスフォーメーション)のための重要な技術であるAIの社会実装が進む一方、そのAI化で格差が広がっています。また、5Gのサービス開始、EU一般データ保護規則、米中間の対立など、AIを取り巻く環境は目まぐるしく変化しています。 第1章では、石角友愛氏(パロアルトインサイトCEO)と中島秀之 AI白書編集委員長(札幌市立大学理事長・学長)の対談、北野宏明 AI白書編集委員(ソニーコンピュータサイエンス研究所代表取締役社長・所長)と片岡 晃 IPA社会基盤センター長の対談を通じて、AIをめぐる日本の課題とビジネス戦略について解説。第2章「技術動向」では、AIに関する技術の概要と最新動向を整理し、第3章「利用動向」では国内外でのAI活用事例を紹介。さらに、AIの社会実装を支える環境として、第4章で「制度政策」、第5章で社会実装に係る課題解決の方向性(AI人材育成及びスタートアップエコシステム)について記載しています。 『AI白書2019』に最新情報を加え、大幅にアップデートしています。AIの基礎的な技術解説から、国内外の多様な導入事例、制度・政策面での取り組み、中国のAI動向データ、企業経営者の意識調査結果まで、AIにまつわる幅広い話題を網羅して収録。AIを実装し、DXを推進するにあたってのひとつの指針として、本書をご活用いただけます。 DX(デジタルトランスフォーメーション)のための重要な技術であるAIの社会実装。そのAI化で格差が広がっている。AIの技術や利用動向、制度政策、スタートアップエコシステムに至るまで、AIのすべてを解説 □第1章「2020年のAIとビジネス」 生産性やDXといった日本の課題、AI時代のビジネス戦略をテーマにした対談、など □第2章「技術動向」 AIを支える技術と最新動向、ディープラーニング、開発基盤、標準化・オープンプラットフォーム・信頼性、各国の研究開発の現状、など □第3章「利用動向」 日本と世界の分野別の利用動向、AI利用動向アンケート調査、AI導入予算・AI市場規模、中国のAI最新動向、など □第4章「制度政策動向」 AIに関する原則・ガイドライン、制度改革(モビリティ、データ流通、知的財産)、各国の政策動向、など □第5章「AI実装を推進するAI人材育成と地域スタートアップエコシステム」 スタートアップエコシステム、AI人材の育成、社会実装の課題と現状、など

日本語入力を支える技術 ~変わり続けるコンピュータと言葉の世界 (WEB+DB PRESS plus)

徳永 拓之
技術評論社
おすすめ度
58
紹介文
膨大な変換候補の中からいかに最適解を導くか。 第1章 日本語と日本語入力システムの歩み 第2章 日本語入力システムの概観 第3章 かな漢字変換エンジンに用いられるデータ構造 第4章 かな漢字変換システムの実装 第5章 統計・機械学習のアルゴリズムとその応用 第6章 日本語入力のこれから 付録

Big Data Analytics Methods: Modern Analytics Techniques for the 21st Century: the Data Scientists Manual to Data Mining, Deep Learning & Natural Language Processing

Ghavami, Peter
Amazon Digital Services
おすすめ度
58

仕事ではじめる機械学習

有賀 康顕
オライリージャパン
おすすめ度
58
紹介文
機械学習やデータ分析の道具をどのようにビジネスに生かしていけば良いのか、「仕事で使う」という観点から整理。 機械学習を実際の業務で利用する時に知っておくべき全体像が分かる! 機械学習やデータ分析の道具をどのようにビジネスに生かしていけば良いのか、不確実性の高い機械学習プロジェクトの進め方などを「仕事で使う」という観点から整理します。 プロジェクトのはじめ方や、システム構成、学習のためのリソースの収集方法など、読者が「実際どうするの?」と気になるであろう点を中心にまとめています。「人工知能でいい感じの成果を出してくれ」とあいまいな指示をされたとき、本書で学んだことが活きてくるに違いありません。

Speech and Language Processing (Prentice Hall Series in Artificial Intelligence)

Jurafsky, Daniel
Prentice Hall
おすすめ度
58
紹介文
For undergraduate or advanced undergraduate courses in Classical Natural Language Processing, Statistical Natural Language Processing, Speech Recognition, Computational Linguistics, and Human Language Processing. An explosion of Web-based language techniques, merging of distinct fields, availability of phone-based dialogue systems, and much more make this an exciting time in speech and language processing. The first of its kind to thoroughly cover language technology -- at all levels and with all modern technologies -- this text takes an empirical approach to the subject, based on applying statistical and other machine-learning algorithms to large corporations. The authors cover areas that traditionally are taught in different courses, to describe a unified vision of speech and language processing. Emphasis is on practical applications and scientific evaluation. An accompanying Website contains teaching materials for instructors, with pointers to language processing resources on the Web. The Second Edition offers a significant amount of new and extended material.Supplements: Click on the "Resources" tab to View Downloadable Files: *Solutions (available 8/15/08)*Power Point Lecture Slides (available 8/15/08) For additional resourcse visit the author website: http://www. cs.colorado.edu/~martin/slp.html E): the Phrase-Based Translation Model 25.5 Alignment in MT 25.5.1 IBM Model 1 25.5.2 HMM Alignment 25.6 Training Alignment Models 25.6.1 EM for Training Alignment Models 25.7 Symmetrizing Alignments for Phrase-Based MT 25.8 Decoding for Phrase-Based Statistical MT 25.9 MT Evaluation 25.9.1 Using Human Raters 25.9.2 Automatic Evaluation: BLEU 25.10 Advanced: Syntactic Models for MT 25.11 Advanced: IBM Model 3 and Fertitlity 25.11.1 Training for Model 3 25.12 Advanced: Log-linearModels for MT ... 903 25.13 Summary Bibliographical and Historical Notes Exercises Bibliography Author Index Subject Index

生成 Deep Learning ―絵を描き、物語や音楽を作り、ゲームをプレイする

David Foster
オライリージャパン
おすすめ度
58
紹介文
生成型ディープラーニングの解説。人間にしかできないと思われていた創造的な作業を機械に行わせる技術の基礎から応用までを学ぶ。 生成型ディープラーニングの基礎から応用までを網羅! 生成型ディープラーニングの解説書。「絵を描く」「曲を作る」といった、これまで人間にしかできないと思われていた創造的な作業を機械に行わせるという、いま最もホットな技術の基礎から応用までをJupyterノートブック環境で実際に試しながら学びます。第I部は基礎編です。機械学習プログラミング、変分オートエンコーダ、GANやVAEなど、生成モデルの作成において重要な基礎技術を学びます。第II部は応用編です。CycleGAN、エンコーダ―デコーダモデル、MuseGANなどのモデルを作成し、作画、作文、作曲といった創造的なタスクに取り組みます。さらには、実環境を用いずにゲームプレイAIの学習を可能にする、世界モデルを使った強化学習にも取り組みます。最後に生成モデリングの未来として、StyleGAN、BigGAN、BERT、GPT-2、MuseNetなどのアーキテクチャを紹介します。

データ解析のための統計モデリング入門――一般化線形モデル・階層ベイズモデル・MCMC (確率と情報の科学)

久保 拓弥
岩波書店
おすすめ度
58
紹介文
現象を数理モデルで表現・説明するのに慣れていない人のために、章ごとに異なる例題を解決していく過程を通して、統計モデルの基本となる考えかたを紹介する。前半では、応用範囲のひろい統計モデルのひとつである一般化線形モデルの基礎を、後半では、実際のデータ解析に使えるように、階層ベイズモデル化する方法を、RとWinBUGSの具体例を用いて説明する。 第1章 データを理解するために統計モデルを作る 第2章 確率分布と統計モデルの最尤推定 第3章 一般化線形モデル(GLM)-ポアソン回帰 第4章 GLMのモデル選択-AICとモデルの予測の良さ 第5章 GLMの尤度比検定と検定の非対称性 第6章 GLMの応用範囲をひろげる-ロジスティック回帰など 第7章 一般化線形混合モデル(GLMM)-個体差のモデリング 第8章 マルコフ連鎖モンテカルロ(MCMC)法とベイズ統計モデル 第9章 GLMのベイズモデル化と事後分布の推定 第10章 階層ベイズモデル-GLMMのベイズモデル化 第11章 空間構造のある階層ベイズモデル

文系AI人材になる: 統計・プログラム知識は不要

竜司, 野口
東洋経済新報社
おすすめ度
58
紹介文
AIに仕事を奪われる前に、AIを使って自分の仕事をつくるための一冊。文系ビジネスマンに生き抜く自信をつけさせる一冊。 AI社会になって、ボクは職を失わないだろうか? 文系のワタシが、AIでキャリアアップするには? そんな不安や疑問を解消するのが本書です。 英数国理社×AI時代に対応した、AI活用の現場から生まれた実践トレーニング本。 ・専門用語は必要最低限に ・豊富な業種別事例は「自社での活用」を考えるヒントに。 ・AIとの「共働きスキル」を身につける。 AIを活用したビジネスプランを豊富に紹介。本書は、AIを、機能別に4分類、役割別に2分類し、合計4×2=8分類にわけている。その分類を用いて、事例を解説しているので、非常に理解しやすく、自分の仕事への適用・応用を検討しやすい。AIとお共働きスキルを身につけよう。 はじめに 文系AI人材になろう! 第1章 AI社会で職を失わないために 「AI失職」を恐れず「AI職」に就く準備を  「AIとの共働き」スキルを身につけよう  5つの「共働きスタイル」 第2章 文系のための AIキャリア  AIは「作る」から「使う」へ 上手に活用する「文系 AI人材」が重要に 「文系AI人材」の仕事内容とは?  「文系AI人材」になるための4つのステップ 第3章 AIのキホンは丸暗記で済ます  AI/機械学習/ディープラーニングの違い 学習方式の3分類--教師あり/教師なし/強化学習 活用タイプ別AIは4×2=8分類 「識別系AI」はこう使う 「予測系AI」はこう使う 「会話系AI」はこう使う 「実行系AI」はこう使う 出る順でAI基礎用語を丸暗記する 第4章 AIの作り方をザックリ理解する  AIは特徴づかみの名人 「予測系AI」の作り方を理解する  「識別系AI」の作り方を理解する 「会話系AI」の作り方を理解する  「実行系AI」の作り方を理解する 第5章 AI企画力を磨く  AI企画の「100本ノック」 「変化量と実現性」を担保する  AI企画の「解像度を上げる5W1H」  第6章 AI事例をトコトン知る――業種別×活用タイプ別の45事例集  第7章 文系AI人材が社会を変える  AIによる「消費者、会社、働き手」への変化 AI社会を牽引するアマゾン AI×各業界で変革を作るソフトバンク 日本の銀行で起きているAIによる変化 文系AI人材が社会をリードする おわりに

はじめてのパターン認識

平井 有三
森北出版
おすすめ度
58
紹介文
パターン認識にはじめて触れる読者に向け,基礎からわかりやすく解説した入門書です.パターン認識の概念がよく理解できるとともに,Rによる実行例など,実際に応用する際にも役立つ内容が盛り込まれています. 第1章 はじめに 第2章 識別規則と学習法の概要 第3章 ベイズの識別規則 第4章 確率モデルと識別関数 第5章 k最近傍法(kNN法) 第6章 線形識別関数 第7章 パーセプトロン型学習規則 第8章 サポートベクトルマシン 第9章 部分空間法 第10章 クラスタリング 第11章 識別器の組み合わせによる性能強化

機械学習エンジニアのためのTransformers ―最先端の自然言語処理ライブラリによるモデル開発

Lewis Tunstall
オライリージャパン
おすすめ度
58
紹介文
Hugging Face Transformersを使った自然言語処理の解説書。大規模モデルを学習しスケールする方法を紹介。 Hugging Faceの開発者による解説書! 「Hugging Face Transformers」を使った自然言語処理の解説書。2017年の登場以来、Transformerと呼ばれるアーキテクチャを使った大規模なモデルが急速に普及しています。本書では、Hugging Faceの開発者らが、「Hugging Face Transformers」を使って、これらの大規模モデルを学習しスケールする方法をわかりやすく紹介します。テキスト分類、固有表現認識、テキスト生成、要約、質問応答といったタスクだけでなく、蒸留、量子化、枝刈り、ONNX Runtimeといったモデルの高速化技術、ラベル付きデータが少ないときに使えるゼロショット学習や少数事例学習、その他、多言語転移やドメイン適応といった類書では扱っていない技術についても解説しています。 Hugging Face Transformersを使った自然言語処理の解説書。大規模モデルを学習しスケールする方法を紹介。

図解即戦力 機械学習&ディープラーニングのしくみと技術がこれ1冊でしっかりわかる教科書

株式会社アイデミー
技術評論社
おすすめ度
58
紹介文
機械学習・ディープラーニングについて学ぶための、図解形式の解説書です。エンジニア1年生、機械学習関連企業への就職・転職を考えている人が、機械学習・ディープラーニングの基本と関連する技術、しくみ、開発の基礎知識などを一通り学ぶことができます。 1章 人工知能の基礎知識 人工知能とは 機械学習(ML)とは ディープラーニング(DL)とは 人工知能と機械学習が普及するまで 2章 機械学習の基礎知識 教師あり学習のしくみ 教師なし学習のしくみ 強化学習のしくみ 統計と機械学習の違い 機械学習と特徴量 得意な分野、苦手な分野 機械学習の活用事例 3章 機械学習のプロセスとコア技術 機械学習の基本ワークフロー データの収集 データの整形 モデルの作成と学習 バッチ学習とオンライン学習 テストデータによる予測結果の検証 学習結果に対する評価基準 ハイパーパラメータとモデルのチューニング 能動学習 相関と因果 フィードバックループ 4章 機械学習のアルゴリズム 回帰分析 サポートベクターマシン 決定木 アンサンブル学習 アンサンブル学習の応用 ロジスティック回帰 ベイジアンモデル 時系列分析と状態空間モデル k近傍(k-NN) 法とk平均(k-means)法 次元削減と主成分分析 最適化と遺伝的アルゴリズム 5章 ディープラーニングの基礎知識 ニューラルネットワークとその歴史 ディープラーニングと画像認識 ディープラーニングと自然言語処理 6章 ディープラーニングのプロセスとコア技術 誤差逆伝播法によるニューラルネットワークの学習 ニューラルネットワークの最適化 勾配消失問題 転移学習 7章 ディープラーニングのアルゴリズム 畳み込みニューラルネットワーク(CNN) 再帰型ニューラルネットワーク(RNN) 強化学習とディープラーニング オートエンコーダ GAN(敵対的生成ネットワーク) 物体検出 8章 システム開発と開発環境 人工知能プログラミングにおける主要言語 機械学習用ライブラリとフレームワーク ディープラーニングのフレームワーク GPUプログラミングと高速化 機械学習サービス

シン・ニホン AI×データ時代における日本の再生と人材育成 (NewsPicksパブリッシング)

安宅和人
NewsPicksパブリッシング
おすすめ度
58
紹介文
◎読者が選ぶビジネス書グランプリ2021 総合グランプリ受賞!! ◎ビジネス書大賞2020 特別賞(ソーシャルデザイン部門)受賞!! ◎ITエンジニア本大賞2021 ビジネス書部門 ベスト10! ◎累計17万5千部突破! 30万部超の名著『イシューからはじめよ』から9年――。 渾身の力で投げ込む、ファクトベースの現状分析と新たなる時代の展望! AI×データの発展により、時代は多面的に「確変モード」に突入した。 目まぐるしく動く社会の中、本書は以下の問いをひとつなぎにして答える。 ・現在の世の中の変化をどう見たらいいのか ・日本の現状をどう考えるべきか ・企業はどうしたらいいのか ・すでに大人の人はこれからどうサバイバルしていけばいいのか ・この変化の時代、子どもにはどんな経験を与え、育てればいいのか ・若者は、このAIネイティブ時代をどう捉え、生きのびていけばいいのか ・国としてのAI戦略、知財戦略はどうあるべきか? ・AI時代の人材育成は何が課題で、どう考えたらいいのか ・日本の大学など高等教育機関、研究機関の現状をどう考えたらいいのか ビジネス・教育・政策…全領域にファクトベースで斬り込む、著者渾身の書き下ろし! 意志なき悲観論でも、現実を直視しない楽観論でもない、建設的(Constructive)な、「残すに値する未来のつくり方」。 読者コメント 「久々にすっごい面白い本に出会った。これからの時代の生き方の教養書として面白い」 「これからの日本が進むべき道を豊富なデータと精緻なロジックで導き出している」 「新人教育やマネジメント教育に必須の本だと思う。これから日本で生きる全てのビジネスパーソンが何を目指し、何をすべきかが詳細に書かれている」 「安宅さんの『日本を何とかしたい』という熱い思いが伝わってきて、ビジネス書なのに感動しました。個人的に今年のベスト本になる予感」 「一気に読んだ。『未来をつくる人』をどう育てるか、についても多くのページが割かれている。子育て中の方にもおすすめ」 ●目次 1章 データ×AIが人類を再び解き放つ -- 時代の全体観と変化の本質 2章 「第二の黒船」にどう挑むか -- 日本の現状と勝ち筋 3章 求められる人材とスキル 4章 「未来を創る人」をどう育てるか 5章 未来に賭けられる国に -- リソース配分を変える 6章 残すに値する未来

Pythonスタートブック [増補改訂版]

辻 真吾
技術評論社
おすすめ度
58

実践 自然言語処理 ―実世界NLPアプリケーション開発のベストプラクティス

Sowmya Vajjala
オライリージャパン
おすすめ度
58
紹介文
自然言語処理の本格的な実践書。NLPシステムを構築、反復、スケールしながら様々なビジネスシーンに適用し調整する方法を解説。 さまざまな自然言語処理タスクを実装し実際のビジネスシーンへ適用する! 自然言語処理(Natural Language Processing:NLP)の本格的な実践書。過去10年間で起きたブレークスルーにより、NLPは小売、医療、金融、法律など、さまざまな分野での利用が増えてきました。急速に利用が拡大する中で、産業界でNLPを使ったシステムを構築するのに必要な知識を学べる講座や書籍は不足していました。本書を読むことで、NLPの要素技術やSNS、Eコマース、医療、金融といった具体的なビジネスへの適用方法に加えて、NLPシステムを開発するためのベストプラクティスを詳しく学べます。 NLPの本格的な実践書。NLPシステムを構築、反復、スケールしながらさまざまなビジネスシーンに適用し調整する方法を解説。

リーダブルコード ―より良いコードを書くためのシンプルで実践的なテクニック (Theory in practice)

Dustin Boswell
オライリージャパン
おすすめ度
58
紹介文
コードは理解しやすくなければならない。本書はこの原則を日々のコーディングの様々な場面に当てはめる方法を紹介する。名前の付け方、コメントの書き方など表面上の改善について。コードを動かすための制御フロー、論理式、変数などループとロジックについて。またコードを再構成するための方法。さらにテストの書き方などについて、楽しいイラストと共に説明する。日本語版ではRubyやgroongaのコミッタとしても著名な須藤功平氏による解説を収録。 理解しやすいコード 第1部 表面上の改善(名前に情報を詰め込む 誤解されない名前 美しさ コメントすべきことを知る コメントは正確で簡潔に) 第2部 ループとロジックの単純化(制御フローを読みやすくする 巨大な式を分割する 変数と読みやすさ) 第3部 コードの再構成(無関係の下位問題を抽出する 一度に1つのことを コードに思いを込める 短いコードを書く) 第4部 選抜テーマ(テストと読みやすさ 「分/時間カウンタ」を設計・実装する) 付録 あわせて読みたい

相対化する知性 人工知能が世界の見方をどう変えるのか

西山 圭太
日本評論社
おすすめ度
58
紹介文
人工知能と人間が共存する社会において、知性をどう認識し、人間はどのように生きればよいのか。3名の著者がこの問題を論じる。 人工知能と人間が共存する社会において、知性をどう認識し、人間はどのように生きればよいのか。3名の著者がこの問題を論じる。 第1部 人工知能とは  1章 人工知能のこれまで  2章 ディープラーニングとは何か  3章 ディープラーニングによる今後の技術進化  4章 消費インテリジェンス  5章 人間を超える人工知能 第2部 人工知能と世界の見方  1章 人工知能が「世界の見方」を変える  2章 認知構造はどう変わろうとしているのか  3章 強い同型論  4章 強い同型論で知能を説明する  5章 我々の「世界の見方」はどこからきてどこに向かうのか 第3部 人工知能と人間社会  1章 人工知能と人間社会  2章 自由主義の政治哲学が直面する課題  3章 人工知能とイノベーションの正義論  4章 世代間資産としての正義システム  5章 自由の根拠としての可謬性

マンガでわかる! 人工知能 AIは人間に何をもたらすのか (Informatics&IDEA)

松尾 豊
SBクリエイティブ
おすすめ度
58
紹介文
人工知能とは何か? 機械学習・ディープラーニングとは何かを、高クオリティなマンガとともに、くわしく・やさしく解説していきます。 人工知能がどのように発展してきたのか、私たちの未来をどのように変えていくのか、そして人工知能とどのように向き合っていくのかをテーマにストーリーを構成。人工知能という難しそうなテーマを、より身近に感じられるようになる一冊です。 Chapter1 人工知能の正体 ・「人間の脳」と「人工知能」 ・人工知能の定義 Chapter2 人工知能の歴史 ・人工知能の誕生-第1次AIブーム- ・コンピュータとの対話-第2次AIブーム- Chapter3 人工知能の新時代① ・第3次AIブームの始まり ・機械学習の広がりと課題 Chapter4 人工知能の新時代② ・ディープラーニングとは何か ・ディープラーニングによるブレイクするー Chapter5 人工知能と心 ・心と身体性 ・人工知能と創造性 Chapter6 人工知能が変えていく未来 ・AIを牽引する企業たち ・「眼を持つ機械」の活用 Chapter7 人工知能が人類にもたらすもの ・人工知能と倫理的課題 ・「シンギュラリティ」とその先の未来

漫画でわかる デジタルマーケティング×データ分析

上野 佑馬(ウマたん)
ビジネス教育出版社
おすすめ度
58
紹介文
個人の地域密着型アウトドアショップがデジタルマーケティングで業績を飛躍的にアップさせていくストーリーに乗せて、DMの基礎を… 個人の地域密着型アウトドアショップがデジタルマーケティングで業績を飛躍的にアップさせていくストーリーに乗せて、DMの基礎を学ぶ

自然言語処理の基本と技術 (仕組みが見えるゼロからわかる)

奥野 陽
翔泳社
おすすめ度
58
紹介文
人間の言葉をコンピュータに理解させ、利用する「自然言語処理」の、技術的、ビジネス的基礎知識をコンパクトに図解した一冊です Webやクラウド上の膨大な文字情報の中から、「意味のある」情報だけを取り出して活用したい、文脈を読んで最適な文章を自動的に作成して欲しい… そんな夢のような技術がすでに一歩ずつ現実のものとなろうとしています。 ハードウェア&ソフトウェアの高度化、高速化に伴い「自然言語処理」と呼ばれる「人間の言葉をコンピュータに理解させ、活用させる、結果を返させる」テクノロジーが実用化のレベルまで到達しつつあるのです。 本書は、この未来に不可欠となるに違いない自然言語処理の、技術的、ビジネス的基礎知識をくまなくコンパクトに図解した一冊です。 著者陣もそれぞれの分野の第一線で活躍するエキスパート揃い! 世界を大きく変えるであろうテクノロジーに一歩近付いてみませんか? 自然言語処理の概要 自然言語処理の基礎知識 日本語入力と自然言語処理 機械翻訳 情報検索 Webと自然言語処理 自然言語処理のこれから

AIにできること、できないこと、ビジネス社会を生きていくための4つの力

藤本 浩司
日本評論社
おすすめ度
58
紹介文
現在のAI技術では何ができて何ができないのか、その実態を技術者が平易に語る。実際にAIをビジネスで活用している事例も紹介。 “AI、そこが知りたかった!  これだけ読めばモヤモヤが消える。しかも面白い。  もっとも早くからAIに携わってきた「稼げる研究者集団」が  これまでになかった「4つの力」という分かりやすいアプローチで解説。  「稼げるAI」を操る人間になりたいビジネスパーソン必読の書だ。”                幸田真音(作家) 『人工知能』著者 --------------------------------------------------------- ○ AIの本質を捉えて、AIにできること、できないことの違いがつかめる! ○ AIの実態を踏まえて、ビジネスへと活かすための要点が分かる! ○ AIに仕事を奪われないために、人は何を身につけるべきかが分かる! AIを活かすために、AIにできること、できないことを知ろう! 古くからAI研究に携わり、数多くの有名大企業でのAI導入実績を持つ テンソル・コンサルティング株式会社の社員が 現在のAIに何ができて何ができないのかを、分かりやすく、かつ面白く解説している。 仕事でAIに直接関わっているビジネスパーソンはもちろん、 AIの今後がなんとなく気になっている社会人から、 子供の将来に不安を感じている保護者の方にいたるまで、 幅広い層に読みやすくてすっきり分かる、目からウロコの指南書である。 1章 そもそもAIとはなにか     世間で言われるAIとは?     AIの歴史     活躍するAI  2章 AIの実態    AIに知性はあるのか?    今のAIの作り方    AIにできること、できないこと    AIは理解しているのか?    コラム:新しい概念の獲得 3章 AIの中身    ディープラーニングの中身    活躍するAIの中身    AIに対する疑問    コラム:重なった画像の理解 4章 AIのビジネスでの活用    役立つAIの設計指針    ビジネス活用に必要な要素    AIと人間の間違え方の違い    データサイエンティストの重要性    ビジネスでの活用事例    コラム:人間の優れた技能 5章 未来    AI分野以外の動向    AIに仕事を奪われないためには?    AIが人間を超えるまでには?    AIが人間に置き換わった未来

C++で学ぶディープラーニング

藤田 毅
マイナビ出版
おすすめ度
58
紹介文
本書は、ディープラーニング(深層学習)の基礎を学ぶ初級者やソフトウェアエンジニアの方を対象に、ディープラーニングのベースとなっているニューラルネットワークからその派生技術や応用まで、実際に動くC++のソースコードを参照しながら学ぶ内容となっています。前半はニューラルネットワークに関する必須知識を扱い、後半ではニューラルネットワークの派生技術や応用に言及し、徐々に高度な内容となっていきます。 【本書の内容】 Chapter1「ディープラーニング概論」……ディープラーニングの概要と、ニューラルネットワーク構築時に最低限必要なC++プログラミングの知識をまとめます。 Chapter2「ニューラルネットワークのための行列演算と並列プログラミング」……並列プログラミングの重要性とその知識や行列演算を解説します。 Chapter3「ニューラルネットワーク」……パーセプトロンと呼ばれるニューラルネットワークの最小単位となるユニット、パーセプトロンを重ねたニューラルネットワークの基本形である層状パーセプトロン(MLP)を説明します。 Chapter4「誤差逆伝播」……ニューラルネットワークのパラメーター学習方法である、誤差逆伝播法を詳しく解説します。 Chapter5「C++によるニューラルネットワークの実装」……多層パーセプトロンを用いた手書き数字の画像認識を、実際にコーディングしながら動かすことで、ディープラーニングを体験します。本章では、ニューラルネットワークの基礎が詰まったベーシックな分類モデルを構築することで、処理全体の流れを把握することを目的とします。 Chapter6「学習の最適化と過学習」……機械学習全般で発生する過学習にフォーカスし、ニューラルネットワークでの過学習を抑えるテクニックを紹介します。本章以降から、単なるニューラルネットワークではなく、ディープラーニングの範疇となります。 Chapter7「事前学習」……ディープラーニングがブレイクするきっかけとなった技術の1つであるオートエンコーダーを解説します。 Chapter8「畳み込みニューラルネットワーク」……現在ディープラーニングの花形といわれる畳み込みニューラルネットワークを解説します。主に画像認識で利用され、近年はめざましい成果をあげている技術です。 Chapter9「再帰型ニューラルネットワーク」……再帰型ニューラルネットワークと呼ばれる、自己の出力を入力とする再帰構造となったニューラルネットワークを使い、自然言語処理への応用例を紹介します。統計的機械翻訳や自動応答、音声認識などの分野で、近年のAIの大きな進化の推進役となっている技術です。 本書では開発言語としてC++を採用しています。C++でほぼすべてをスクラッチから実装しており、最終的に完成するコードはディープラーニングのC++フレームワークとして機能します。サンプルコードはダウンロード可能。

自然言語処理 (IT Text)

真家, 天野
オーム社
おすすめ度
58
紹介文
第1章 自然言語処理の基礎 第2章 形態論:辞書と形態素解析 第3章 統語論と統語解析 第4章 意味論と意味解析 第5章 コーパスと統計処理 第6章 自然言語処理システム

人工知能プログラミングのための数学がわかる本

石川 聡彦
KADOKAWA
おすすめ度
58
紹介文
【東京大学特任准教授 松尾 豊氏 推薦】 大人気「10秒で始める人工知能プログラミング学習サービス」の代表者がおくる、 人工知能プログラミングに必要な数学を、やさしく学ぶ参考書が登場! キホンのキホンからおさらいするから、ニガテな人でも大丈夫! 後半では、Pythonのコードを動かしてさらに理解を深められます! ■本書の目的 ・人工知能関連の書籍に現れる数式への抵抗感をなくし、専門書を読むための数学基礎力をつけます。 ・いくつかの人工知能のアルゴリズムを理解し、数式の意味を理解できるようにします。 ■本書の特長 ・ゼロからおさらいするので、誰でも読めます。 ・人工知能プログラミングに必要な分野に特化しています。 ・演習問題や例題で、理解を深められます。 ■本書の対象読者 ・人工知能アルゴリズムを用いてモデリングをしているが、その根底のアルゴリズムはブラックボックスであり、数学を復習したい方。 ・人工知能アルゴリズムを体系的に学びたいが、数学を忘れており、専門書に現れる数式が理解できない方。 ・人工知能アルゴリズムに興味があるが、ハードルが高いと感じている方。 ■目次 CHAPTER 1 数学基礎 中学1 年から高校の数学を復習し、機械学習で使う数学の「入門レベル」を固めます。 CHAPTER 2 微分 微分の概念や表現方法を学びます。機械学習では「ディープラーニング(深層学習)」「ニューラルネットワーク」「最小2 乗法」「勾配降下法」「誤差逆伝播法」などで微分を活用します。 CHAPTER 3 線形代数 高校の範囲に大学1 年で学ぶ線形代数を加え、ベクトル・行列・線形変換を学びます。線形代数は膨大なデータや複雑なシステムを扱うのに役立ちます。 CHAPTER 4 確率・統計 確率・統計は「傾向を知り、限られたデータから全体像を予測する」ために、機械学習で活用されます。分散・尤度・正規分布などの難しい用語もやさしく学びます。 CHAPTER 5 実践編1 回帰モデルで住宅価格を推定してみよう 「データから住宅価格を推定する」ことを題材に、線形回帰モデルを理解します。 CHAPTER 6 実践編2 自然言語処理で文学作品の作者を当てよう 「文学作品を分析する」ことを題材に、自然言語を数学的に表現する方法などを学びます。 CHAPTER 7 実践編3 ディープラーニングで手書き数字認識をしてみよう 「手書きの数字を認識させる」ことを題材に、ディープラーニングの一種であるDNNを、画像認識から学びます。 東京大学特任准教授 松尾 豊氏 推薦! 人工知能プログラミングに必要な数学を、ゼロから抜け漏れなく、体系的に学ぶ! 数学を復習したいエンジニアに! CHAPTER1 数学基礎 CHAPTER2 微分 CHAPTER3 線形代数 CHAPTER4 確率・統計 CHAPTER5 実践編1 回帰モデルで住宅価格を推定してみよう CHAPTER6 実践編2 自然言語処理で文学作品の作者を当てよう CHAPTER7 実践編3 ディープラーニングで手書き数字認識をしてみよう

最短コースでわかる ディープラーニングの数学

赤石 雅典
日経BP
おすすめ度
58
紹介文
AIのブラックボックスを開けよう! 「ディープラーニング」の動作原理を「本当に」理解できる本です。 AIのブラックボックスを開けよう! ディープラーニングの本質を理解するために必要な「数学」を 「最短コース」で学べます! 「ディープラーニング」の動作原理を「本当に」理解できる本です。 本書では、ディープラーニングの理解には欠かせない数学を 高校1年生レベルから、やさしく解説します。 (微分、ベクトル、行列、確率など) 最短コースで理解できるように、 解説する数学の分野は必要最低限のものだけに絞り、 その相関関係を★特製の綴込マップ★にまとめました。 また、数学を使ってイチから記述したコードを Jupyter Notebook形式で提供しますので 実際に動かしながら学ぶことができます。 「ディープラーニング」の動作原理を「本当に」理解できる本です。 AIのブラックボックスを開けよう! 「ディープラーニング」の動作原理を「本当に」理解できる本です。 【導入編】 1章 機械学習入門 【理論編】 2章 微分・積分 3章 ベクトル・行列 4章 多変数関数の微分 5章 指数関数・対数関数 6章 確率・統計 【実践編】 7章 線形回帰モデル(回帰) 8章 ロジスティック回帰モデル(2値分類) 9章 ロジスティック回帰モデル(多値分類) 10章 ディープラーニングモデル 【発展編】 11章 実用的なディープラーニングを目指して ★巻頭綴じ込み★最短コースマップ

パターン認識と機械学習 上

C.M. ビショップ
丸善出版
おすすめ度
58

はじめての自然言語処理

土屋 誠司
森北出版
おすすめ度
58
紹介文
かな漢字入力・機械翻訳・情報検索など、なくてはならない身の回りの応用から期待高まる未来の技術まで、それらの背後にある理論と仕 人の言葉をコンピュータに理解させるには? 使い慣れた「言葉」も,コンピュータで扱おうとした途端にその奥深さがみえてくる.かな漢字入力・機械翻訳・情報検索など,なくてはならない身の回りの応用から期待高まる未来の技術まで,それらの背後にある理論と仕組みをコンパクトに解説.自然言語処理の難しさと面白さを存分に味わえる,初学者に格好の入門書! 第1章 コンピュータが言葉を理解するために 第2章 言葉を理解するために必要ないくつかの知識 第3章 文字の羅列から単語を見つける:形態素解析 第4章 文法として正しい単語の並びになっているかをチェックする:構文解析 第5章 どんな内容が書かれているのかを解釈する:意味解析 第6章 自然言語処理を使った便利なアプリケーション

自然言語処理ことはじめ―言葉を覚え会話のできるコンピュータ

荒木 健治
森北出版
おすすめ度
58
紹介文
本書はコンピュータが言葉を覚えて話せるようになったら面白いと考えている人に、これまでどのような研究が行われどこまでできていてどこからができないのかを、著者のこれまで行ってきた研究を例に取り簡単に説明したものである。 第1章 言葉をコンピュータで扱う方法 第2章 コンピュータが言葉を覚える方法 第3章 コンピュータで文章から単語を取り出す方法 第4章 コンピュータが読みを漢字に変換する方法 第5章 コンピュータで文の構造を解析する方法 第6章 コンピュータで文の意味を理解する方法 第7章 コンピュータで翻訳する方法 第8章 コンピュータが対話できるようになる仕組み 第9章 コンピュータはどこまで赤ちゃんに近づけたのか?

やさしく学ぶ 機械学習を理解するための数学のきほん ~アヤノ&ミオと一緒に学ぶ 機械学習の理論と数学、実装まで~

立石 賢吾
マイナビ出版
おすすめ度
58
紹介文
数学がニガテでも大丈夫! 機械学習をやさしく学ぼう 「機械学習に興味があるけど、どの資料を見ても数式が出てきて、分からない・・・」 本書は、そんな方にぴったりの本です。 機械学習を勉強中のプログラマ「アヤノ」と、友達の「ミオ」の会話を通じて、楽しく学んでいきます。本書では、 ・そもそも機械学習がどうして注目を集めているのか? ・機械学習でできることにはどんなことがあるのか? ・どんな時に、回帰や分類、クラスタリングをすると有効なのか? といった基本的なところから、 ・ある問題に対して、どのように解決方法を考えればいいのか ・その解決方法を数式にするとどんな形になるのか ・実際にプログラムの形にするとどうなるのか まで、丁寧に、じっくりと説明していきます。 とくに、数式については、高校で習った数学を忘れている方でも分かるように、つまづきやすいところや理解しにくいところを重点的に解説します。 ※プログラムはPython 3で実装します Chapter1 ふたりの旅の始まり Chapter2 回帰について学ぼう ~広告費からクリック数を予測する Chapter3 分類について学ぼう ~画像サイズに基づいて分類する Chapter4 評価してみよう ~作ったモデルを評価する Chapter5 実装してみよう ~Pythonでプログラミングする

自然言語処理概論 (ライブラリ情報学コア・テキスト)

禎夫, 黒橋
サイエンス社
おすすめ度
58
紹介文
はじめに 系列の解析 構文の解析 意味の解析 文脈の解析 ニューラルネットワークの利用 情報抽出と知識獲得 情報検索 トピックモデル 機械翻訳 対話システム まとめ

Python 1年生 体験してわかる!会話でまなべる!プログラミングのしくみ

森 巧尚
翔泳社
おすすめ度
58
紹介文
Python初心者でも安心して学べる超入門書の登場! 【本書の概要】 Web開発やデータ分析などの分野で近年、ユーザー数が増えてきているPython。 最近では、Pythonに触れる方も多くなってきています。 本書はそうしたPython初心者の方に向けて、 簡単なサンプルを作りながら、対話形式でプログラミングのしくみを学ぶ書籍です。 【対象読者】 Pythonのついて、何も知らない超初心者 【1年生シリーズ・3つのポイント】 ・対話形式で解説し、イラストを交えながら、基礎知識を解説します。 ・初めての方でも安心して学習できるよう基本文法もしっかり解説します。 ・平易でサンプルを用意していますので、安心してプログラムを体験できます。 【本書のポイント】 ヤギ博士とフタバちゃんと一緒に 基本的なプログラムから、面白い人工知能アプリの作成まで 体験して、プログラミングのしくみを学ぶことができます。 【著者】 森 巧尚(もり よしなお) iPhoneアプリやWebコンテンツの制作、執筆活動、関西学院大学非常勤講師など、 プログラミングにまつわる幅広い活動を行っている。 近著に『やさしくはじめるiPhoneアプリ作りの教科書』(マイナビ出版)、 『楽しく学ぶ アルゴリズムとプログラミングの図鑑』(マイナビ出版) 、 『なるほど!プログラミング』(SBクリエイティブ)などがある。 第1章 Python で何ができるの? 第2章 Python を触ってみよう 第3章 プログラムの基本を知ろう 第4章 アプリを作ってみよう 第5章 人工知能(チノ)くんと遊んでみよう

自然言語処理教科書 (I・O BOOKS)

赤間 世紀
工学社
おすすめ度
58

独習Python

山田 祥寛
翔泳社
おすすめ度
58
紹介文
プログラミング初学者に向けた独習シリーズに『独習Python』が新登場。山田祥寛氏によるPython入門書の決定版。 手を動かしておぼえるPythonプログラミング ――独学に最適な“標準教科書” プログラミングの初学者に向けた独習シリーズに『独習Python』が新登場。 プログラミング言語入門書の執筆で定評のある山田祥寛氏による、 Python入門書の決定版です。 独習シリーズの強みである、手を動かしておぼえる(書いて実行して結果を確認する) 特長を生かし、Pythonの基本的な言語仕様から、標準ライブラリ、ユーザー定義関数、 オブジェクト指向構文、モジュールまで、サンプルプログラムを例示しながら 詳細かつ丁寧に解説します。 プログラミングの基礎知識がない方でも、解説→例題(サンプル)→理解度チェック という3つのステップで、Pythonでプログラミングを行う際に必要な知識・概念・機能を 体系的に習得できます。 プログラミングの入門者、これからPythonで開発を始めたい初学者から、再入門者、 学生・ホビープログラマまで、「一からPython言語を学びたい」「Pythonプログラミング の基本をしっかり身につけたい」という方におすすめの一冊です。 第1章 イントロダクション 1.1 Pythonとは? 1.2 Pythonの歴史と現状 1.3 Pythonアプリを開発/実行するための基本環境 1.4 Pythonプログラミングの基本 1.5 Pythonの基本ルール 1.6 開発/学習の前に押さえておきたいテーマ 第2章 Pythonの基本 2.1 変数 2.2 データ型 第3章 演算子 3.1 算術演算子 3.2 代入演算子 3.3 比較演算子 3.4 論理演算子 3.5 ビット演算子 3.6 演算子の優先順位と結合則 第4章 制御構文 4.1 条件分岐 4.2 繰り返し処理 4.3 ループの制御 4.4 例外処理 第5章 標準ライブラリ[基本] 5.1 ライブラリの分類 5.2 文字列の操作 5.3 日付/時刻の操作 第6章 標準ライブラリ[コレクション] 6.1 シーケンス型 6.2 セット(集合)型 6.3 辞書(dict)型 第7章 標準ライブラリ[その他] 7.1 正規表現 7.2 ファイル操作 7.3 ファイルシステムの操作 7.4 HTTP経由でコンテンツを取得する 7.5 その他の機能 第8章 ユーザー定義関数 8.1 ユーザー定義関数の基本 8.2 変数の有効範囲(スコープ) 8.3 引数のさまざまな記法 8.4 関数呼び出しと戻り値 第9章 ユーザー定義関数[応用] 9.1 デコレーター 9.2 ジェネレーター 9.3 関数のモジュール化 9.4 非同期処理 9.5 ドキュメンテーション 第10章 オブジェクト指向構文 10.1 クラスの定義 10.2 カプセル化 10.3 継承 10.4 ポリモーフィズム 第11章 オブジェクト指向構文[応用] 11.1 例外処理 11.2 特殊メソッド 11.3 データクラス 11.4 イテレーター 11.5 メタクラス 付録A 「練習問題」「このの理解度チェック」解答

自然言語処理 (放送大学教材)

黒橋 禎夫
放送大学教育振興会
おすすめ度
58
紹介文
自然言語処理の概要と歴史 文字列・テキスト処理の基礎 系列の解析 コーパスに基づく自然言語処理 意味の解析 構文の解析 文脈の解析 情報抽出と知識獲得 情報検索 対話システム 機械翻訳 まとめ

詳細! Python 3 入門ノート

大重 美幸
ソーテック社
おすすめ度
58
紹介文
Pythonプログラミングを全力で学ぶならこの1冊!Pythonをこれから学ぶビギナーから、基礎力を得て現場で実践したい方まで、確実なスキルアップをはかれます。 1 準備:Python3をはじめよう(Python3の準備 プログラムを試してみよう) 2 基礎:Pythonの基本構文を学ぶ(値と変数 標準ライブラリ 条件分岐、繰り返し、例外処理 リスト タプル セット(集合) 辞書 ユーザ定義関数 関数の高度な利用 クラス定義) 3 応用:科学から機械学習まで(テキストファイルの読み込みと書き出し グラフを描く NumPyの配列 機械学習を試そう)

独学プログラマー Python言語の基本から仕事のやり方まで

コーリー・アルソフ
日経BP
おすすめ度
58
紹介文
本書は「Pythonだけ」を学ぶ本ではありません。Pythonを使ってプログラミングを紹介していますが、伝えたい内容はPythonに限らない「プログラミング全般」の知識です。 本書の著者、コーリー・アルソフ(Cory Althoff)は、「独学プログラマー」です。本書は、彼が独学で、ゼロからプログラミングを学んだ体験に基づいて書かれました。 プログラミングを独学で身に付けるために、著者がPythonを通して学んだエッセンスが書かれています。彼の独学プログラマーとしての学び方は、Amazon.comでの本書の評価を見るとわかるように、多くの人に支持されています。 ――訳者あとがきより 第1部(Part1) 第1章 イントロダクション 第2章 さあ、はじめよう! 第3章 プログラミング入門 第4章 関数 第5章 コンテナ 第6章 文字列操作 第7章 ループ 第8章 モジュール 第9章 ファイル 第10章 知識を1つにまとめる 第11章 ハマったときの助け 第2部(Part2) 第12章 プログラミングパラダイム 第13章 オブジェクト指向プログラミングの4大要素 第14章 もっとオブジェクト指向プログラミング 第15章 知識を1つにまとめる 第3部(Part3) 第16章 Bash 第17章 正規表現 第18章 パッケージ管理 第19章 バージョン管理 第20章 知識を1つにまとめる 第4部(Part4) 第21章 データ構造 第22章 アルゴリズム 第5部(Part5)  第23章 プログラミングのベストプラクティス 第24章 プログラマーとしての最初の仕事 第25章 チームで働く 第26章 さらに学ぼう 第27章 次のステップ 第6部(Part6) 補章 より良いコードにするために 補章 継続して学ぶために 謝辞 訳者あとがき 索引 第1部(Part1) 第1章 イントロダクション 第2章 さあ、はじめよう! 第3章 プログラミング入門 第4章 関数 第5章 コンテナ 第6章 文字列操作 第7章 ループ 第8章 モジュール 第9章 ファイル 第10章 知識を1つにまとめる 第11章 ハマったときの助け 第2部(Part2) 第12章 プログラミングパラダイム 第13章 オブジェクト指向プログラミングの4大要素 第14章 もっとオブジェクト指向プログラミング 第15章 知識を1つにまとめる 第3部(Part3) 第16章 Bash 第17章 正規表現 第18章 パッケージ管理 第19章 バージョン管理 第20章 知識を1つにまとめる 第4部(Part4) 第21章 データ構造 第22章 アルゴリズム 第5部(Part5)  第23章 プログラミングのベストプラクティス 第24章 プログラマーとしての最初の仕事 第25章 チームで働く 第26章 さらに学ぼう 第27章 次のステップ 第6部(Part6) 補章 より良いコードにするために 補章 継続して学ぶために 謝辞 訳者あとがき 索引

統計的自然言語処理の基礎

Manning,Christopher D.
共立出版
おすすめ度
58
紹介文
 統計的自然言語処理を徹底的に論じた教科書  原著が刊行されたのは18年ほど前になるので,本書の内容の一部は歴史的な記録となっており,現在の状況に照らして異なる含意を読み取るべき言及もある。そのような若干の注意書きを要するとはいえ,本書の重要性,今日性は高い。  学問的基礎の記述の豊かさに加えて,マルコフモデルや確率文脈自由文法など,統計的自然言語処理の基盤となる概念について,丁寧な式の導出を含めたわかりやすい説明がなされている。そのような理論的基盤と合わせて,n-グラムモデルにおけるスムージングや分類学習における過学習など,実際に研究を進める上では重要でありながら,えてして短めの注意書きになりがちな部分についても,十分な量が割かれている。  「今」の自然言語処理研究をその基礎から正しく理解し,その上に新たな積み上げを行うための基盤を提供してくれる良書となっている。 [原著名:Foundations of Statistical Natural Language Processing] I編 前提知識 1章 導  入 1.1 言語に対する合理主義的方法論と経験主義的方法論 1.2 科学的意義 1.3 言語の曖昧性:なせ自然言語処理は困難なのか 1.4 汚れ仕事 1.5 さらに学ぶために 1.6 練習問題 2章 数学的基礎 2.1 確率論の基礎 2.2 情報理論の要点 2.3 さらに学ぶために 3章 言語学の要点 3.1 品詞と形態論 3.2 句構造 3.3 意味論と語用論 3.4 その他の分野 3.5 さらに学ぶために 3.6 練習問題 4章 コーパスに基づく研究 4.1 準備 4.2 テキストの観察 4.3 データのマークアップ 4.5 練習問題 II編 語 5章 連  語 5.1 頻度 5.2 平均と分散 5.3 仮説検定 5.4 相互情報量 5.5 連語とは何か 5.6 さらに学ぶために 6章 統計的推論:スパースなデータ上のn-グラムモデル 6.1 ビン:同値類の形成 6.2 統計的推定 6.3 推定値を組み合わせる 6.4 結論 6.5 さらに学ぶために 6.6 練習問題 7章 語義の曖昧性解消 7.1 方法論に関する準備 7.2 教師あり曖昧性解消 7.3 辞書に基づく曖昧性解消 7.4 教師なし曖昧性解消 7.5 単語の意味とは何か? 7.6 さらに学ぶために 7.7 練習問題 8章 語彙獲得 8.1 評価指標 8.2 動詞の下位範疇化 8.3 付加の曖昧性 8.4 選択選好 8.5 意味的類似性 8.6 統計的自然言語処理における語彙獲得の役割 8.7 さらに学ぶために III編 文  法 9章 マルコフモデル 9.1 マルコフモデル 9.2 隠れマルコフモデル 9.3 HMMについての三つの基本的な問題 9.4 HMM:実装,性質,変種 9.5 さらに学ぶために 10章 品詞のタグ付け 10.1 タグ付けのための情報源 10.2 マルコフモデルによるタグ付け器 10.3 隠れマルコフモデルによるタグ付け器 10.4 変換に基づくタグの学習 10.5 別の方法,英語以外の言語 10.6 タグ付けの正解率とタグ付け器の適用先 10.7 さらに学ぶために 10.8 練習問題 11章 確率文脈自由文法 11.1 PCFGのいくつかの特徴 11.2 PCFGの三つの基本的な問題 11.3 系列の確率 11.4 内側外側アルゴリズムの問題点 11.5 さらに学ぶために 11.6 練習問題 12章 確率的構文解析 12.1 いくつかの概念 12.2 いくつかのアプローチ 12.3 さらに学ぶために 12.4 練習問題 IV編 応用と技法 13章 統計的アライメントと機械翻訳 13.1 テキストアライメント 13.2 語のアライメント 13.3 統計的機械翻訳 13.4 さらに学ぶために 14章 クラスタリング 14.1 階層的クラスタリング 14.2 非階層的クラスタリング 14.2.1 K平均法 14.2.2 EMアルゴリズム 14.3 さらに学ぶために 14.4 練習問題 15章 情報検索におけるいくつかの話題 15.1 情報検索に関する背景知識 15.2 ベクトル空間モデル 15.3 タームの分布のモデル 15.4 潜在意味インデキシング 15.5 談話分割 15.6 さらに学ぶために 15.7 練習問題 16章 テキスト分類 16.1 決定木 16.2 最大エントロピーモデル 16.3 パーセプトロン 16.4 k最近傍分類 16.5 さらに学ぶために 簡易統計表 参考文献 訳者あとがき 索  引

トピックモデルによる統計的潜在意味解析 (自然言語処理シリーズ)

佐藤一誠
コロナ社
おすすめ度
58
紹介文
1 統計的潜在意味解析とは(潜在的意味・トピックと潜在的共起性 潜在意味解析の歴史 ほか) 2 Latent Dirichlet Allocation(多項分布とDirichlet分布 LDAの生成過程 ほか) 3 学習アルゴリズム(統計的学習アルゴリズム サンプリング近似法 ほか) 4 潜在意味空間における回帰と識別(潜在意味空間における回帰問題 潜在意味空間における分類問題 ほか) 5 拡張モデル(相関構造のモデリング 系列データのモデリング-統語構造のモデリング ほか)

Excelでわかるディープラーニング超入門

涌井 良幸
技術評論社
おすすめ度
58
紹介文
「なぜディープラーニングが形を区別できるのか」が見えてくる!Excelと対話しながらしくみを解き明かす画期的な超入門書!初めてのAI学習に最適!難しい数学計算はExcelに任せてディープラーニングのしくみを動かしながら理解できる! 1章 初めてのディープラーニング(畳み込みニューラルネットワークのしくみは簡単 AIとディープラーニング) 2章 Excelの確認とその応用(利用するExcel関数はたったの7個 Excelの参照形式 ほか) 3章 ニューロンモデル(神経細胞の働き 神経細胞の働きを数式表現 ほか) 4章 ニューラルネットワークのしくみ(読み物としてのニューラルネットワークのしくみ ニューラルネットワークが手書き文字を識別 ほか) 5章 畳み込みニューラルネットワークのしくみ(読み物としての畳み込み-ニューラルネットワークのしくみ 畳み込みニューラルネットワークが手書き数字を識別 ほか) 付録

構文解析 (自然言語処理シリーズ)

鶴岡 慶雅
コロナ社
おすすめ度
58
紹介文
1 はじめに 2 品詞解析と機械学習 3 句構造解析 4 依存構造解析 5 文法理論、深い構文解析 6 構文解析の応用 7 構文解析ツール 8 ツリーバンク

高校数学からはじめるディープラーニング 初歩からわかる人工知能が働くしくみ (ブルーバックス)

金丸 隆志
講談社
おすすめ度
58
紹介文
ディープラーニングの動作する数学の仕組みを解説。どの分野が必要かを知り、基本を理解し、どのように効いているかを学びます。 本書は、ディープラーニングを支え、ベースとなっている数学に焦点をあて、どのような仕組みで、どのように効いて、なぜ機能するのかの解説をしていきます。「ブラックボックス」と思われがちなディープラーニングの中身を理解していきます。 高校数学の知識を前提としながらも、必要な数学を復習しつつ、高校で習わない偏微分に関しては基本から必要な部分を解説して、ディープラーニングを支える数学の知識を学んでいきます。 「ディープラーニングという言葉は聞くが、どんなものなのか分からないので理解したい」「ブラックボックスと言われるディープラーニングの仕組みを知りたい」「ディープラーニングを学びたいけれど、数学の勉強のどこから手を付けていいか分からない」といった読者の興味に応える一冊です。 数学を学びながら、それがディープラーニングにどのように効いているのか分かることが重要です。その点を実感として理解することができれば、ディープラーニングの仕組みの本質が理解できたことにつながっていきます。そのためのディープラーニングの主要な概念の解説もしていきます。

深層学習 (機械学習プロフェッショナルシリーズ)

岡谷 貴之
講談社
おすすめ度
58
紹介文
基礎から、SGD、自己符号化器、CNN、RNN、ボルツマンマシンまでと、盛りだくさん。軽快な語り口で、無理なく理解できる! いま最も注目されている機械学習手法である深層学習(ディープラーニング)を、トップ研究者が解説した。基礎から、SGD、自己符号化器、CNN、RNN、ボルツマンマシンまでと、盛りだくさん。軽快な語り口なので、無理なく理解できる! 【機械学習プロフェッショナルシリーズ】 本シリーズでは、発展著しい機械学習技術の数学的な基礎理論、実用的なアルゴリズム、それらの活用法を、全29巻にわたって刊行する。 ビッグデータ時代を牽引している若手・中堅の現役研究者が、入門的な内容から最先端の研究成果までをわかりやすく解説。 これからデータサイエンス分野で研究を始めようとしている大学生・大学院生、および、機械学習技術を基礎科学や産業に応用しようとしている研究者・技術者に向けた注目のシリーズである。 全29巻のうち第1期として、以下の4点を同時刊行! 『機械学習のための確率と統計』杉山 将・著 『深層学習』岡谷 貴之・著 『オンライン機械学習』海野 裕也/岡野原 大輔/得居 誠也/徳永 拓之・著 『トピックモデル』岩田 具治・著 第2期の刊行は2015年8月、第3期の刊行は2015年12月の予定(^o^)/ 【シリーズ編者】 杉山 将 東京大学大学院新領域創成科学研究科 教授 第1章 はじめに 第2章 順伝播型ネットワーク 第3章 確率的勾配降下法 第4章 誤差逆伝播法 第5章 自己符号化器 第6章 畳込みニューラルネット 第7章 再帰型ニューラルネット 第8章 ボルツマンマシン

文脈解析- 述語項構造・照応・談話構造の解析 - (自然言語処理シリーズ)

笹野 遼平
コロナ社
おすすめ度
58
紹介文
「述語項構造解析」、「共参照・照応解析」、「談話構造解析」という自然言語テキストの文脈理解に関連した三つの解析についてまとめた専門書。この三つのトピックを対象に、解析手法そのものよりも、それぞれの解析がどのような問題を解こうとしているかや、関連する言語資源がどのような考えの下で作成されているかを中心に解説。 1 はじめに 2 述語項構造解析(述語項構造とは 述語項構造の定義 ほか) 3 共参照・照応解析(共参照と照応 共参照・照応解析 ほか) 4 談話構造解析(談話とは 談話の構成単位 ほか) 付録(統計的仮説検定の基礎と性質 自然言語処理における検定 ほか)

岩波データサイエンス Vol.2

岩波データサイエンス刊行委員会
岩波書店
おすすめ度
58
紹介文
特集 統計的自然言語処理-ことばを扱う機械(ことばのモデル入門 言葉の個性をとらえるトピックモデル 創発する記号-ことばを知るロボット Pythonでword2vec 単語の意味をコンピュータに教える 自然言語の意味に対する2つのアプローチ-記号表現と分散表現 人間の翻訳、機械の翻訳 機械翻訳の現在と将来 自然言語処理のためのソフトウェア) 話題 ナンプレと魔方陣-作る・解く・数える(ナンプレの自動生成 ナンプレと統計物理-物理の研究者がナンプレを素人的に考えてみた 稀な事象のサンプリングと魔方陣 レプリカ交換モンテカルロ法とマルチカノニカル法 比熱の正体はフィッシャー情報量) 連載(正定値行列の情報幾何‐1 確率と論理を融合した確率モデリングへの道‐2) その他・小説(計算機で作る面白いナンプレ2 掌編小説・海に溺れて(2)対話)

イラストで学ぶ ディープラーニング 改訂第2版 (KS情報科学専門書)

山下 隆義
講談社
おすすめ度
58
紹介文
深層学習ベストセラーがさらにパワーアップ。リカレントニューラルネットワーク、GAN、深層強化学習の「章」が新たに加わった。 おお!もう第2版! 深層学習ベストセラーがさらにパワーアップ。リカレントニューラルネットワーク、GAN、深層強化学習の「章」が新たに加わり、ツールの最新事情も反映された。50ページ以上増強されたお得な一冊! いまの姿を的確に、時代を見据えた、きちんとした大改訂。 ResNet、SENet、Faster R-CNN、YOLO、GAN、DCGAN、CGAN、CycleGAN DQN、Actor-Critic、A3C、Caffe、Chainer、TensorFlow、Keras、PyTorch ・リカレントニューラルネットワーク、GAN、深層強化学習の「章」が新たに加わった。 ・物体検出、セグメンテーション、可視化への活用も充実し、フレームワークの最新事情も反映。 ・50ページ以上増強されたお得な一冊! 主な内容 1章 序論 2章 ニューラルネットワーク 3章 畳み込みニューラルネットワーク 4章 汎化性能を向上させる方法 5章 畳み込みニューラルネットワークの活用 6章 リカレントニューラルネットワーク 7章 オートエンコーダ 8章 敵対的生成ネットワーク 9章 深層強化学習 10章 ディープラーニングのフレームワーク 序論 ニューラルネットワーク 畳み込みニューラルネットワーク 汎化性能を向上させる方法 畳み込みニューラルネットワークの活用 リカレントニューラルネットワーク オートエンコーダ 敵対的生成ネットワーク 深層強化学習 ディープラーニングのフレームワーク

深層学習

Ian Goodfellow
KADOKAWA
おすすめ度
58
紹介文
深層学習の世界的名著、ついに刊行 AI研究の一分野として注目を集める深層学習(ディープラーニング)に関する教科書として世界的な評価を受けている解説書。深層学習の理解に必要な数学、ニューラルネットワークの基礎から、CNN(畳み込みニューラルネットワーク)やRNN(回帰結合型ニューラルネットワーク)などのすでに確立した手法、さらに深層学習の研究まで、深層学習の基礎を理論を含めてしっかり学習したい人に最適な内容になっている。近年の深層学習研究をリードする著名な研究者たちが執筆した入門者必読の書である。 本書は、深層学習に関する数学的バックグラウンドやコンセプトから産業への応用まで、包括的に解説した唯一の書籍です。 第1章 はじめに 第I部 応用数学と機械学習の基礎 第2章 線形代数 第3章 確率と情報理論 第4章 数値計算 第5章 機械学習の基礎 第II部 深層ネットワーク:現代的な実践 第6章 深層順伝播型ネットワーク 第7章 深層学習のための正則化 第8章 深層モデルの訓練のための最適化 第9章 畳み込みネットワーク 第10章 系列モデリング:回帰結合型ニューラルネットワークと再帰型ネットワーク 第11章 実用的な方法論 第12章 アプリケーション 第III部 深層学習の研究 第13章 線形因子モデル 第14章 自己符号化器 第15章 表現学習 第16章 深層学習のための構造化確率モデル 第17章 モンテカルロ法 第18章 分配関数との対峙 第19章 近似推論 第20章 深層生成モデル

Pythonによるテキストマイニング入門

長承, 山内
オーム社
おすすめ度
58
紹介文
Pythonを使ったテキストマイニングの入門書。テキストマイニングについては概要からに実例に至るまで一から解説を行っている。 Python 3を使ったテキストマイニングの入門書! 本書は、Pythonを使ったテキストマイニングの入門書です。Pythonのインストールから基本文法、ライブラリパッケージの使用方法などについてもていねいに解説していますので、Pythonに触れたことがない方でも問題なく使用できます。また、テキストマイニングも、概要から実例に至るまで一から解説していますので、Python・テキストマイニング両方の知識が全くない方にとって最適な入門書となっています。 第1章 テキストマイニングの概要 第2章 テキストデータの構造 第3章 Python の概要と実験の準備 第4章 出現頻度の統計の実際 第5章 テキストマイニングの様々な処理例 付録 Python, Jupyter notebook のインストール

Pythonで動かして学ぶ 自然言語処理入門

柳井 孝介
翔泳社
おすすめ度
58
紹介文
本書は、Pythonでプログラミングをした経験のある読者が、 各種オープンソースソフトウェア(OSS)やライブラリを利用して、 自然言語処理を行うWebアプリケーションを作って動かし、自然言語処理を体験するための書籍です。 またその中で、自然言語処理に関連するさまざまな概念や手法、 簡単な理論についても学ぶことができ、本格的な学習の 前段階としても最適です。 本書の構成としては大きく2つの部に分かれており、 それぞれ以下のような内容を解説しています。 第1部:データの準備 ●テキストデータの収集 ●データベースへの格納 ●検索エンジンへの登録 第2部:データの解析 ●文法構造を調べる ●意味づけ ●知識データとの連係 全13章を順に追いながらWebアプリケーションを作っていくことで、 自然言語処理に関連するさまざまなテーマを学ぶことができます。 第0章 自然言語処理とは 第1部 データを準備しよう 第1章 実行環境を整えよう  1.1 実行環境の概要  1.2 実行環境の構成  1.3 Windows 10にUbuntuをインストールする  1.4 Linuxコマンドの使い方  1.5 Ubuntuへのソフトウェアのインストール方法  1.6 Pythonプログラムを実行してみる 第2章 テキストデータを収集しよう  2.1 データ収集とは  2.2 Webページのスクレイピング  2.3 テキストデータを抽出する  2.4 テキストデータのクレンジング  2.5 データ収集のプログラム 第3章 データベースに格納しよう  3.1 データベースを使った検索エンジン  3.2 データベースと検索エンジンの用途  3.3 データベースを使ってみる  3.4 Solrの設定とデータ登録  3.5 Solrを使った検索 第2部 テキストデータを解析しよう 第4章 構文解析をしよう  4.1 構文解析とは  4.2 構文解析の用途  4.3 係り受け構造とは  4.4 CaboChaのセットアップ  4.5 PythonからCaboChaを呼び出そう  4.6 係り受け構造の解析結果のSQLiteへの格納 第5章 テキストにアノテーションを付ける  5.1 アノテーションとは  5.2 アノテーションの用途  5.3 アノテーションのデータ構造  5.4 正規表現のパターンによるテキストデータの解析  5.5 精度指標:RecallとPrecision  5.6 アノテーションのSQLiteへの格納  5.7 正規表現の改良  5.8 チャンクを使わない抽出アルゴリズムを考える 第6章 アノテーションを可視化する  6.1 アノテーションを表示するWebアプリ  6.2 アノテーションを可視化する必要性  6.3 アノテーションツールbrat  6.4 Webアプリケーション  6.5 bratをWebアプリケーションに組み込もう  6.6 SQLiteからアノテーションを取得して表示する 第7章 単語の頻度を数えよう  7.1 テキストマイニングと単語の頻度  7.2 統計的手法の用途  7.3 単語の重要度とTF-IDF  7.4 文書間の類似度  7.5 言語モデルとN-gramモデル  7.6 クラスタリングとLDA 第8章 知識データを活用しよう  8.1 知識データと辞書  8.2 エンティティ  8.3 知識データを活用することでできること  8.4 SPARQLによるDBpediaからの情報の呼び出し  8.5 WordNetからの同義語・上位語の取得  8.6 Word2Vecを用いた類語の取得 第3部 テキストデータを活用するWebアプリケーションを作ろう 第9章 テキストを検索しよう  9.1 Solrを使った検索Webアプリケーション  9.2 検索の用途  9.3 転置インデックス  9.4 プログラムからのSolrの検索  9.5 Solrへのアノテーションデータの登録  9.6 検索結果のWebアプリケーションでの表示  9.7 検索時の同義語展開  9.8 アノテーションでの検索 第10章 テキストを分類しよう  10.1 テキスト分類とは  10.2 テキスト分類の用途  10.3 特徴量と特徴量抽出  10.4 ルールベースによるテキスト分類  10.5 教師あり学習によるテキスト分類  10.6 ディープラーニングによるテキスト分類  10.7 分類結果のWebアプリケーションでの表示 第11章 評判分析をしよう  11.1 評判分析とは  11.2 評判分析技術の用途  11.3 辞書を用いた特徴量抽出  11.4 TRIEを用いた辞書内語句マッチ  11.5 教師あり学習による評判分析  11.6 評判分析の結果を表示するWebアプリケーション 第12章 テキストからの情報抽出  12.1 情報抽出とは  12.2 情報抽出技術の用途  12.3 関係のアノテーション  12.4 正規表現を用いた関係抽出  12.5 係り受け構造を用いた関係抽出  12.6 抽出した関係をSolrに登録  12.7 抽出した関係を表示するWebアプリケーション 第13章 系列ラベリングに挑戦しよう  13.1 系列ラベリングとその特徴  13.2 系列ラベリングの用途  13.3 CRF(条件付き確率場)  13.4 系列ラベリング用の学習データ  13.5 CRF++を用いた学習  13.6 CRF++の出力のアノテーションへの変換  13.7 CRF++で付けたアノテーションをSolrで検索する 付録  A.1 Wikipediaのダンプデータを使う  A.2 PDF、Wordファイル、Excelファイルを使う

言語研究のためのプログラミング入門: Pythonを活用したテキスト処理

仁彦, 淺尾
開拓社
おすすめ度
58
紹介文
本書は、言語研究者の関心に即したプログラミングの入門書です。近年、注目を集めているPythonを取り上げ、英語や日本語の言語分析のための具体的な処理例が多数収録されています。フィールドワークでも実験研究でもコーパス研究でも、電子テキストを使ったあらゆるタイプの研究者にすぐに実践できるテクニックを紹介しています。本書を通じてプログラミング処理が持つ威力を実感し、自分の研究に活用してください。

つくりながら学ぶ! PyTorchによる発展ディープラーニング

小川雄太郎
マイナビ出版
おすすめ度
58
紹介文
ディープラーニングの発展・応用手法を実装しながら学ぼう 本書ではディープラーニングの発展・応用手法を実装しながら学習していきます。ディープラーニングの実装パッケージとしてPyTorchを利用します。扱うタスク内容とディープラーニングモデルは次の通りで「ビジネスの現場でディープラーニングを活用するためにも実装経験を積んでおきたいタスク」という観点で選定しました。 [本書で学習できるタスク] 転移学習、ファインチューニング:少量の画像データからディープラーニングモデルを構築 物体検出(SSD):画像のどこに何が映っているのかを検出 セマンティックセグメンテーション(PSPNet):ピクセルレベルで画像内の物体を検出 姿勢推定(OpenPose):人物を検出し人体の各部位を同定しリンク GAN(DCGAN、Self-Attention GAN):現実に存在するような画像を生成 異常検知(AnoGAN、Efficient GAN):正常画像のみからGANで異常画像を検出 自然言語処理(Transformer、BERT):テキストデータの感情分析を実施 動画分類(3DCNN、ECO):人物動作の動画データをクラス分類 本書は第1章から順番に様々なタスクに対するディープラーニングモデルの実装に取り組むことで高度かつ応用的な手法が徐々に身につく構成となっています。各ディープラーニングモデルは執筆時点でState-of-the-Art(最高性能モデル)の土台となっており、実装できるようになればその後の研究・開発に役立つことでしょう。 ディープラーニングの発展・応用手法を楽しく学んでいただければ幸いです。 実装環境 ・読者のPC(GPU環境不要)、AnacondaとJupyter Notebook、AWSを使用したGPUサーバー ・AWSの環境:p2.xlargeインスタンス、Deep Learning AMI(Ubuntu)マシンイメージ(OS Ubuntu 16.04|64ビット、NVIDIA K80 GPU、Python 3.6.5、conda 4.5.2、PyTorch 1.0.1) 第1章 画像分類と転移学習(VGG) 1.1 学習済みのVGGモデルを使用する方法 1.2 PyTorchによるディープラーニング実装の流れ 1.3 転移学習の実装 1.4 Amazon AWSのクラウドGPUマシンを使用する方法 1.5 ファインチューニングの実装 第2章 物体検出(SSD) 2.1 物体検出とは 2.2 Datasetの実装 2.3 DataLoaderの実装 2.4 ネットワークモデルの実装 2.5 順伝搬関数の実装 2.6 損失関数の実装 2.7 学習と検証の実施 2.8 推論の実施 第3章 セマンティックセグメンテーション(PSPNet) 3.1 セマンティックセグメンテーションとは 3.2 DatasetとDataLoaderの実装 3.3 PSPNetのネットワーク構成と実装 3.4 Featureモジュールの解説と実装 3.5 Pyramid Poolingモジュールの解説と実装 3.6 Decoder、AuxLossモジュールの解説と実装 3.7 ファインチューニングによる学習と検証の実施 3.8 セマンティックセグメンテーションの推論 第4章 姿勢推定(OpenPose) 4.1 姿勢推定とOpenPoseの概要 4.2 DatasetとDataLoaderの実装 4.3 OpenPoseのネットワーク構成と実装 4.4 Feature、Stageモジュールの解説と実装 4.5 TensorBoardXを使用したネットワークの可視化手法 4.6 OpenPoseの学習 4.7 OpenPoseの推論 第5章 GANによる画像生成(DCGAN、Self-Attention GAN) 5.1 GANによる画像生成のメカニズムとDCGANの実装 5.2 DCGANの損失関数、学習、生成の実装 5.3 Self-Attention GANの概要 5.4 Self-Attention GANの学習、生成の実装 第6章 GANによる異常検知(AnoGAN、Efficient GAN) 6.1 GANによる異常画像検知のメカニズム 6.2 AnoGANの実装と異常検知の実施 6.3 Efficient GANの概要 6.4 Efficient GANの実装と異常検知の実施 第7章 自然言語処理による感情分析(Transformer) 7.1 形態素解析の実装(Janome、MeCab+NEologd) 7.2 torchtextを用いたDataset、DataLoaderの実装 7.3 単語のベクトル表現の仕組み(word2vec、fastText) 7.4 word2vec、fastTextで日本語学習済みモデルを使用する方法 7.5 IMDb(Internet Movie Database)のDataLoaderを実装 7.6 Transformerの実装(分類タスク用) 7.7 Transformerの学習・推論、判定根拠の可視化を実装 第8章 自然言語処理による感情分析(BERT) 8.1 BERTのメカニズム 8.2 BERTの実装 8.3 BERTを用いたベクトル表現の比較(bank:銀行とbank:土手) 8.4 BERTの学習・推論、判定根拠の可視化を実装 第9章 動画分類(3DCNN、ECO) 9.1 動画データに対するディープラーニングとECOの概要 9.2 2D Netモジュール(Inception-v2)の実装 9.3 3D Netモジュール(3DCNN)の実装 9.4 Kinetics動画データセットをDataLoaderに実装 9.5 ECOモデルの実装と動画分類の推論実施

直感 Deep Learning ―Python×Kerasでアイデアを形にするレシピ

Antonio Gulli
オライリージャパン
おすすめ度
58
紹介文
機械学習ライブラリKerasの解説書。画像識別、画像生成、自然言語処理、感情識別、自動ゲームプレイなどの幅広いサンプルを例示 人気フレームワークKerasの解説書! 直感的かつ短いコードでアイデアを形にできるKerasはTensorFlowのラッパーとして大人気のライブラリです。本書でもTensorFlowをバックエンドとして使用し、自然言語処理、画像識別、画像生成、音声合成、テキスト生成、強化学習、AIゲームプレイなどさまざまなモデルをPythonとKerasで実装します。対象読者は、各種のディープラーニングを素早く実装したいプログラマー、データサイエンティスト。ディープラーニングを支える技術の速習にも好適です。数式はなるべく使わずにコードと図で説明します。ニューラルネットワークおよびPython 3の基本を理解している人であれば誰でも始めることができます。

形態素解析の理論と実装 (実践・自然言語処理シリーズ)

工藤 拓
近代科学社
おすすめ度
58
紹介文
AIブームでニーズが急上昇!形態素解析の理論と実装を,技術者向けて網羅的に解説!! C++11による実装方法も掲載 あの工藤 拓が具体的に解説 !! 本書は,汎用形態素解析システムMeCabを開発した著者が、言語において意味を成す最小の要素である「形態素」の解析方法について,技術者向けにその理論や実装方法を網羅的,体系的に解説する.実装や高速化なども扱う点がユニークであるが、辞書やコーパスなどの言語資源の構築・利用といった形態素解析では外せないテーマもきちんと解説している. 本書を読めば,解析ツールを「ブラックボックス」として使っている人も中身を理解したうえで拡張・改良できる道筋ができ,ひいては独自の辞書の作成を目指せるようになる.C++11を使った具体的な実装方法も掲載.AI・自然言語処理関係の技術者,研究者には必携の書である. 汎用形態素解析システムMeCabを開発した著者が、言語において意味を成す最小の要素である形態素の解析方法について,技術者向けにその理論や実装方法を網羅的,体系的に解説.AI・自然言語処理関係の技術者,研究者必携 1.形態素解析の概要 2.言語資源 3.テキスト処理の基礎 4.辞書引きアルゴリズム 5.最小コスト法 6.点予測 7.未知語処理 8.評価 9.高度な解析

[第3版]Python機械学習プログラミング 達人データサイエンティストによる理論と実践 (impress top gear)

Sebastian Raschka
インプレス
おすすめ度
58
紹介文
本書は、機械学習コンセプト全般をカバーし、理論的背景とPythonコーディングの実際を解説しています。初歩的な線形回帰から始め、ディープラーニング(CNN/RNN)、敵対的生成ネットワーク、強化学習などを取り上げ、scikit-learnやTensorFlowなどPythonライブラリの新版を使ってプログラミング。第3版では13~16章の内容をほとんど刷新したほか、敵対的生成ネットワークと強化学習の章を新たに追加。機械学習プログラミングの本格的な理解と実践に向けて大きく飛躍できる一冊です。

恋するプログラム―Rubyでつくる人工無脳 (プレミアムブックス版)

秋山 智俊
マイナビ出版
おすすめ度
58

Pythonではじめる機械学習 ―scikit-learnで学ぶ特徴量エンジニアリングと機械学習の基礎

Andreas C. Muller
オライリージャパン
おすすめ度
58
紹介文
バックグラウンドに数学的な知識がなくても理解できるように書かれた、Pythonを使った機械学習の入門書。 数学の知識がなくても読み進められる、理論だけでなく実践面も重視した機械学習の入門書! バックグラウンドに数学的な知識がなくても理解できるように書かれた、Pythonを使った機械学習の入門書。Pythonの機械学習用ライブラリの大定番、scikit-learnの開発に関わる著者が、scikit-learnを使った機械学習の方法を、ステップバイステップで解説します。最初に実践について述べて後から理論を補強するスタイルで、理解しやすいように工夫されています。理論面と実践面のバランスが良く、モデルの評価と改善について多くの紙面を割くなど、類書にはない特徴を備えています。

プロを目指す人のためのRuby入門 言語仕様からテスト駆動開発・デバッグ技法まで (Software Design plusシリーズ)

伊藤 淳一
技術評論社
おすすめ度
58
紹介文
Railsをやる前に、Rubyを知ろう。みなさんが「Rubyをちゃんと理解しているRailsプログラマ」になれるように、Rubyの基礎知識から実践的な開発テクニックまで、丁寧に解説します。 本書を読み進める前に Rubyの基礎を理解する テストを自動化する 配列や繰り返し処理を理解する ハッシュやシンボルを理解する 正規表現を理解する クラスの作成を理解する モジュールを理解する 例外処理を理解する yieldとProcを理解する Rubyのデバッグ技法を身につける Rubyに関するその他のトピック

Pythonで動かして学ぶ!あたらしい機械学習の教科書 第2版

伊藤 真
翔泳社
おすすめ度
58
紹介文
大学で学ぶ数学の基礎知識とPythonコードを紐づけて機械学習の基本を学べる! 数学の基礎知識とPythonコードを紐づけて機械学習の基本を学べる! 【本書の目的】 現在、人工知能関連のプロダクト・サービスが数多く見受けられるようになりました。 人工知能関連の開発に機械学習の基礎知識は必須です。 本書はそうした機械学習の基礎知識を学びたいエンジニアに向けた書籍です。 【本書の特徴】 本書は機械学習の基本について、数学の知識をもとに、 実際にPythonでプログラムしながら学ぶことができる書籍です。 ・最新のPython 3.7に対応 ・学習内容を「要点整理」で復習 ・数式とコードをつなげたわかりやすい解説 【読者が得られること】 本書を読み終えた後には、機械学習のしくみとプログラミング手法を理解できます。 【対象読者】 機械学習の基礎を学びたい理工学生・エンジニア 【目次】 第1章 機械学習の準備 第2章 Pythonの基本 第3章 グラフの描画 第4章 機械学習に必要な数学の基本 第5章 教師あり学習:回帰 第6章 教師あり学習:分類 第7章 ニューラルネットワーク・ディープラーニング 第8章 ニューラルネットワーク・ディープラーニングの応用(手書き数字の認識) 第9章 教師なし学習 第10章 要点のまとめ 第1章 機械学習の準備  1.1 機械学習について  1.2 Pythonのインストール  1.3 Jupyter Notebook  1.4 KerasとTensorFlowのインストール 第2章 Pythonの基本  2.1 四則演算  2.2 変数  2.3 型  2.4 print文  2.5 list(リスト、配列変数)  2.6 tuple(タプル)  2.7 if文  2.8 for文  2.9 ベクトル  2.10 行列  2.11 行列(ndarray)の四則演算  2.12 スライシング  2.13 条件を満たすデータの書き換え  2.14 Help  2.15 関数  2.16 ファイル保存 第3章 グラフの描画  3.1 2次元のグラフを描く  3.2 3次元のグラフを描く 第4章 機械学習に必要な数学の基本  4.1 ベクトル  4.2 和の記号  4.3 積の記号  4.4 微分  4.5 偏微分  4.6 行列  4.7 指数関数と対数関数 第5章 教師あり学習:回帰  5.1 1次元入力の直線モデル  5.2 2次元入力の面モデル  5.3 D次元線形回帰モデル  5.4 線形基底関数モデル  5.5 オーバーフィッティングの問題  5.6 新しいモデルの生成  5.7 モデルの選択  5.8 まとめ 第6章 教師あり学習:分類  6.1 1次元入力2クラス分類  6.2 2次元入力2クラス分類  6.3 2次元入力3クラス分類 第7章 ニューラルネットワーク・ディープラーニング  7.1 ニューロンモデル  7.2 ニューラルネットワークモデル  7.3 Kerasでニューラルネットワークモデル 第8章 ニューラルネットワーク・ディープラーニングの応用(手書き数字の認識)  8.1 MNISTデータベース  8.2 2層フィードフォワードネットワークモデル  8.3 ReLU活性化関数  8.4 空間フィルター  8.5 畳み込みニューラルネットワーク  8.6 プーリング  8.7 ドロップアウト  8.8 集大成のMNIST認識ネットワークモデル 第9章 教師なし学習  9.1 2次元入力データ  9.2 K-means法  9.3 混合ガウスモデル 第10章 要点のまとめ  要点のまとめ

現場で使える Ruby on Rails 5速習実践ガイド

大場寧子
マイナビ出版
おすすめ度
58
紹介文
Railsアプリの基本から実践的なノウハウまでこの1冊で! 本書は、Ruby on Rails(以下Rails)を使ってWebアプリケーションを開発するための解説書です。 RailsでどのようにWebアプリケーションを作るのかという基本的なところから、現場のニーズに合わせてどのように機能を追加していくのか、テストはどのように行うのか、複数人で開発していく場合の方法といった実践的なトピックまで、幅広くカバーしています。 本書を読んだ方が単にRailsでWebアプリケーションを作れるようになるだけでなく、「Railsらしいアプリケーションコード」を書けるようになり、そして開発チームの仲間とともに実現したいことを実現できるように、という視点で必要な情報をまとめた1冊です。 なお、本書の対応バージョンはRuby 2.5/Rails5.2です。Rails5.2から導入されたActive Storageやcredentials.yml.encについても解説しています。macOS/Windows 10(64ビット版)対応。 ■読者対象について Ruby以外の言語でのWebアプリケーションの開発や、オブジェクト指向プログラミングについては知識・経験があるものの、RubyやRailsについては初めて学ぶ方を主な対象にしています。 ただし、Webアプリケーションやオブジェクト指向が初めての方にも理解しやすいように説明するように努めています。 ■構成と内容について 本書の構成は以下の通りです。 <入門編> Chapter 1 RailsのためのRuby入門 Chapter 2 Railsアプリケーションをのぞいてみよう Chapter 3 タスク管理アプリケーションを作ろう <レベルアップ編> Chapter 4 現実の複雑さに対応する Chapter 5 テストをはじめよう Chapter 6 Railsの全体像を理解する Chapter 7 機能を追加してみよう <発展編> Chapter 8 RailsとJavaScript Chapter 9 複数人でRailsアプリケーションを開発する Chapter 10 Railsアプリケーションと長く付き合うために 章ごとの内容は以下の通りです。 Chapter1では、Railsのアプリケーションのコードを読み書きするために最低限必要となるようなRubyの基礎知識を解説していきます。 Chapter2では、RubyやRailsが動作する環境を構築するとともに、簡単なサンプルアプリケーションを作成し、中身の構成を解説していきます。 Chapter3では、シンプルなタスク管理アプリケーションの作成を通じて、CRUDと呼ばれるソフトウェアの基本的な機能をRailsで実装する方法について学んでいきます。 Chapter4では、Chapter3で作成したアプリケーションに、いくつかの機能を追加していきます。具体的には「データ内容の制限」「検証」「コールバック」「フィルタ」「ログイン機能の追加」「関連」「検索」について解説していきます。 Chapter5では、Railsにあらかじめ用意されている「自動テスト」という仕組みについて、利用方法や注意事項を解説します。 Chapter6では、Railsの備える機能や、Railsを取り巻く世界の全体像を改めて一望し、これまで取り上げる機会のなかったいくつかの重要な要素について解説していきます。 Chapter7では、Railsアプリケーションで比較的よくある具体的な機能を実現するやり方を、Chapter4までで作成したアプリケーションへの機能追加という形で紹介していきます。 Chapter8では、Railsを利用する際のJavaScriptの扱い方について解説していきます。モダンなJavaScriptについても扱っています。 Chapter9では、複数人で開発を行う場合に重要になってくる知識や、注意すべきポイントについて解説していきます。 Chapter10では、Railsアプリケーションと長く付き合っていくために特に重要なテーマとして、「バージョンアップに対してどのように取り組むべきか」「Railsアプリケーションコードが複雑になっていくことにどうに立ち向かい、メンテナンスしやすい状態の維持を図るのか」について扱います。

scikit-learn、Keras、TensorFlowによる実践機械学習 第2版

Aurélien Géron
オライリージャパン
おすすめ度
58
紹介文
『scikit-learnとTensorFlowによる実践機械学習』の改訂。教師なし学習、言語、強化学習などを追加。 『scikit-learnとTensorFlowによる実践機械学習』待望の改訂版! 初版でカバーできなかった教師なし学習、ディープラーニングに関する画像、言語、強化学習などについて詳述。またTensorFlow上で動くニューラルネットワークライブラリのKerasの解説が加わり、各章でKerasを使った解説がなされています。TensorFlowのコンポーネントに関する記述が追加されています。Githubにjupyter notebookで試せるコードを掲載しており、試しながら学べます。

Kaggleで勝つデータ分析の技術

門脇 大輔
技術評論社
おすすめ度
58
紹介文
データサイエンスの認知の高まりとともに、データ分析に関するコンペティションが多数開催されるようになってきました。最も有名なコンペティションプラットフォームであるKaggleにおけるプレイヤー数は10万人を超え、多くのエンジニアが自分の腕を試すためにコンペティションに参加しています。分析コンペでは、実際のデータを扱うため、機械学習の解説書にはあまり載っていないような手法やテクニックが数多く活用されています。これらを理解し自身で使えるようにしておくことはコンペだけでなく、実務でのモデル構築において非常に役に立ちます。 そこでこれらのテクニックや事例を多くの人に知っていただくために、現時点で最新のものを整理して本書にまとめました。特徴量の作り方、バリデーション、パラメータチューニングなどについて、一般的な書籍ではあまり言及されない暗黙知やポイントについて記述しています。分析コンペにこれから参加してみたい方、あるいはもっと上を目指したい方だけでなく、実務で予測モデルの精度を上げたいという方にも参考になる情報が多いでしょう。 第1章 分析コンペとは? 1.1 分析コンペって何? 1.1.1 何をするものか 1.1.2 予測結果の提出と順位表(Leaderboard) 1.1.3 チームでの参加 1.1.4 入賞賞金・特典 1.2 分析コンペのプラットフォーム 1.2.1 Kaggle 1.2.2 Rankings(ランキング・称号制度) 1.2.3 Kernel 1.2.4 Discussion 1.2.5 Datasets 1.2.6 API 1.2.7 Newsfeed 1.2.8 開催された分析コンペの種類と具体例 1.2.9 分析コンペのフォーマット 1.3 分析コンペに参加してから終わるまで 1.3.1 分析コンペに参加 1.3.2 規約に同意 1.3.3 データをダウンロード 1.3.4 予測値の作成 1.3.5 予測値の提出 1.3.6 Public Leaderboardをチェック 1.3.7 最終予測値を選ぶ 1.3.8 Private Leaderboardをチェック 1.4 分析コンペに参加する意義 1.4.1 賞金を得る 1.4.2 称号やランキングを得る 1.4.3 実データを用いた分析の経験・技術を得る 1.4.4 データサイエンティストとのつながりを得る 1.4.5 就業機会を得る 1.5 上位を目指すためのポイント 1.5.1 タスクと評価指標 1.5.2 特徴量の作成 1.5.3 モデルの作成 1.5.4 モデルの評価 1.5.5 モデルのチューニング 1.5.6 アンサンブル 1.5.7 分析コンペの流れ Column  計算リソース 第2章 タスクと評価指標 2.1 分析コンペにおけるタスクの種類 2.1.1 回帰タスク 2.1.2 分類タスク 2.1.3 レコメンデーション 2.1.4 その他のタスク 2.2 分析コンペのデータセット 2.2.1 テーブルデータ 2.2.2 外部データ 2.2.3 時系列データ 2.2.4 画像や自然言語などのデータ 2.3 評価指標 2.3.1 評価指標(evaluation metrics)とは 2.3.2 回帰における評価指標 2.3.3 二値分類における評価指標?正例か負例かを予測値とする場合 2.3.4 二値分類における評価指標?正例である確率を予測値とする場合 2.3.5 多クラス分類における評価指標 2.3.6 レコメンデーションにおける評価指標 2.4 評価指標と目的関数 2.4.1 評価指標と目的関数の違い 2.4.2 カスタム評価指標とカスタム目的関数 2.5 評価指標の最適化 2.5.1 評価指標の最適化のアプローチ 2.5.2 閾値の最適化 2.5.3 閾値の最適化をout-of-foldで行うべきか? Column out-of-foldとは? 2.5.4 予測確率とその調整 2.6 評価指標の最適化の例 2.6.1 balanced accuracyの最適化 2.6.2 mean-F1における閾値の最適化 2.6.3 quadratic weighted kappaにおける閾値の最適化 2.6.4 カスタム目的関数での評価指標の近似によるMAEの最適化 2.6.5 MCCのPR-AUCによる近似とモデル選択 2.7 リーク(data leakage) 107 2.7.1 予測に有用な情報が想定外に漏れている意味でのリーク 2.7.2 バリデーションの枠組みの誤りという意味でのリーク 第3章 特徴量の作成 3.1 本章の構成 3.2 モデルと特徴量 3.2.1 モデルと特徴量 3.2.2 ベースラインとなる特徴量 3.2.3 決定木の気持ちになって考える 3.3 欠損値の扱い 3.3.1 欠損値のまま取り扱う 3.3.2 欠損値を代表値で埋める 3.3.3 欠損値を他の変数から予測する 3.3.4 欠損値から新たな特徴量を作成する 3.3.5 データ上の欠損の認識 3.4 数値変数の変換 3.4.1 標準化(standardization) Column データ全体の数値を利用して変換を行うときに、学習データのみを使うか、テストデータも使うか 3.4.2 Min-Maxスケーリング 3.4.3 非線形変換 3.4.4 clipping 3.4.5 binning 3.4.6 順位への変換 3.4.7 RankGauss 3.5 カテゴリ変数の変換 3.5.1 one-hot encoding 3.5.2 label encoding 3.5.3 feature hashing 3.5.4 frequency encoding 3.5.5 target encoding 3.5.6 embedding 3.5.7 順序変数の扱い 3.5.8 カテゴリ変数の値の意味を抽出する 3.6 日付・時刻を表す変数の変換 3.6.1 日付・時刻を表す変数の変換のポイント 3.6.2 日付・時刻を表す変数の変換による特徴量 3.7 変数の組み合わせ 3.8 他のテーブルの結合 3.9 集約して統計量をとる 3.9.1 単純な統計量をとる 3.9.2 時間的な統計量をとる 3.9.3 条件を絞る 3.9.4 集計する単位を変える 3.9.5 ユーザ側でなく、アイテム側に注目する 3.10 時系列データの扱い 3.10.1 時系列データとは? 3.10.2 予測する時点より過去の情報のみを使う 3.10.3 ワイドフォーマットとロングフォーマット 3.10.4 ラグ特徴量 3.10.5 時点と紐付いた特徴量を作る 3.10.6 予測に使えるデータの期間 3.11 次元削減・教師なし学習による特徴量 3.11.1 主成分分析(PCA) 3.11.2 非負値行列因子分解(NMF) 3.11.3 Latent Dirichlet Allocation(LDA) 3.11.4 線形判別分析(LDA) 3.11.5 t-SNE、UMAP 3.11.6 オートエンコーダ 3.11.7 クラスタリング 3.12 その他のテクニック 3.12.1 背景にあるメカニズムから考える 3.12.2 レコード間の関係性に注目する 3.12.3 相対値に注目する 3.12.4 位置情報に注目する 3.12.5 自然言語処理の手法 3.12.6 自然言語処理の手法の応用 3.12.7 トピックモデルの応用によるカテゴリ変数の変換 3.12.8 画像特徴量を扱う手法 3.12.9 decision tree feature transformation 3.12.10 匿名化されたデータの変換前の値を推測する 3.12.11 データの誤りを修正する 3.13 分析コンペにおける特徴量の作成の例 3.13.1 Kaggleの「Recruit Restaurant Visitor Forecasting」 3.13.2 Kaggleの「Santander Product Recommendation」 3.13.3 Kaggleの「Instacart Market Basket Analysis」 3.13.4 KDD Cup 2015 3.13.5 分析コンペにおけるその他のテクニックの例 第4章 モデルの作成 4.1 モデルとは何か? 4.1.1 モデルとは何か? 4.1.2 モデル作成の流れ 4.1.3 モデルに関連する用語とポイント 4.2 分析コンペで使われるモデル 4.3 GBDT(勾配ブースティング木) 4.3.1 GBDTの概要 4.3.2 GBDTの特徴 4.3.3 GBDTの主なライブラリ 4.3.4 GBDTの実装 4.3.5 xgboostの使い方のポイント 4.3.6 lightgbm 4.3.7 catboost Column xgboostのアルゴリズムの解説 4.4 ニューラルネット 4.4.1 ニューラルネットの概要 4.4.2 ニューラルネットの特徴 4.4.3 ニューラルネットの主なライブラリ 4.4.4 ニューラルネットの実装 4.4.5 kerasの使い方のポイント 4.4.6 参考になるソリューション - 多層パーセプトロン 4.4.7 参考になるソリューション - 最近のニューラルネットの発展 4.5 線形モデル 4.5.1 線形モデルの概要 4.5.2 線形モデルの特徴 4.5.3 線形モデルの主なライブラリ 4.5.4 線形モデルの実装 4.5.5 線形モデルの使い方のポイント 4.6 その他のモデル 4.6.1 k近傍法(k-nearest neighbor algorithm、kNN) 4.6.2 ランダムフォレスト(Random Forest、RF) 4.6.3 Extremely Randomized Trees(ERT) 4.6.4 Regularized Greedy Forest(RGF) 4.6.5 Field-aware Factorization Machines(FFM) 4.7 モデルのその他のポイントとテクニック 4.7.1 欠損値がある場合 4.7.2 特徴量の数が多い場合 4.7.3 目的変数に1対1で対応するテーブルでない場合 4.7.4 pseudo labeling Column 分析コンペ用のクラスやフォルダの構成 第5章 モデルの評価 5.1 モデルの評価とは? 5.2 バリデーションの手法 5.2.1 hold-out法 5.2.2 クロスバリデーション 5.2.3 stratified k-fold 5.2.4 group k-fold 5.2.5 leave-one-out 5.3 時系列データのバリデーション手法 5.3.1 時系列データのhold-out法 5.3.2 時系列データのクロスバリデーション(時系列に沿って行う方法) 5.3.3 時系列データのクロスバリデーション(単純に時間で分割する方法) 5.3.4 時系列データのバリデーションの注意点 5.3.5 Kaggleの「Recruit Restaurant Visitor Forecasting」 5.3.6 Kaggleの「Santander Product Recommendation」 5.4 バリデーションのポイントとテクニック 5.4.1 バリデーションを行う目的 5.4.2 学習データとテストデータの分割をまねる 5.4.3 学習データとテストデータの分布が違う場合 5.4.4 Leaderboardの情報を利用する 5.4.5 バリデーションデータやPublic Leaderboardへの過剰な適合 5.4.6 クロスバリデーションのfoldごとに特徴量を作り直す 5.4.7 使える学習データを増やす 第6章 モデルのチューニング 6.1 パラメータチューニング 6.1.1 ハイパーパラメータの探索手法 6.1.2 パラメータチューニングで設定すること 6.1.3 パラメータチューニングのポイント 6.1.4 ベイズ最適化でのパラメータ探索 6.1.5 GBDTのパラメータおよびそのチューニング Column xgboostの具体的なパラメータチューニングの方法 6.1.6 ニューラルネットのパラメータおよびそのチューニング Column 多層パーセプトロンの具体的なパラメータチューニングの方法 6.1.7 線形モデルのパラメータおよびそのチューニング 6.2 特徴選択および特徴量の重要度 6.2.1 単変量統計を用いる方法 6.2.2 特徴量の重要度を用いる方法 6.2.3 反復して探索する方法 6.3 クラスの分布が偏っている場合 Column ベイズ最適化およびTPEのアルゴリズム 第7章 アンサンブル 7.1 アンサンブルとは? 7.2 シンプルなアンサンブル手法 7.2.1 平均、加重平均 7.2.2 多数決、重みづけ多数決 7.2.3 注意点とその他のテクニック 7.3 スタッキング 7.3.1 スタッキングの概要 7.3.2 特徴量作成の方法としてのスタッキング 7.3.3 スタッキングの実装 7.3.4 スタッキングのポイント 7.3.5 hold-outデータへの予測値を用いたアンサンブル 7.4 どんなモデルをアンサンブルすると良いか? 7.4.1 多様なモデルを使う 7.4.2 ハイパーパラメータを変える 7.4.3 特徴量を変える 7.4.4 問題のとらえ方を変える 7.4.5 スタッキングに含めるモデルの選択 7.5 分析コンペにおけるアンサンブルの例 7.5.1 Kaggleの「Otto Group Product Classification Challenge」 7.5.2 Kaggleの「Home Depot Product Search Relevance」 7.5.3 Kaggleの「Home Credit Default Risk」 付 録 A.1 分析コンペの参考資料 A.2 参考文献 A.3 本書で参照した分析コンペ 索引 著者プロフィール

東京大学のデータサイエンティスト育成講座 ~Pythonで手を動かして学ぶデ―タ分析~

塚本邦尊
マイナビ出版
おすすめ度
58
紹介文
東大 松尾研究室が提供するあの人気講座が待望の書籍化! 本書は、2017年と2018年に東京大学で実施された「グローバル消費インテリジェンス寄付 講座」の学生向けオフライン講義と、社会人向けオンライン講座で使われた教材がベースになっています。 約400名ほどの受講枠(2年間)に、のべ1,800人以上の応募があった人気の講義です。この本のベースとなるコンテンツはJupyter Notebook形式で公開されていますが、この内容をさらに精査、ブラッシュアップし、読みやすく整えたものが本書になります。 ●本書の内容 本書には、データサイエンティストになるための基礎をつめこんでいます。データサイエンティストは、Pythonや確率・統計、機械学習など、幅広くさまざまな分野の知識を必要とします。 すべての分野を1冊で学ぶことは無理ですので、各分野で深入りはせず基礎的な事項を取り扱っています。データサイエンティストになるための地図と羅針盤のような位置づけとなることをイメージしています。 この本は主にPython 3を使って、基本的なプログラムの書き方、データの取得、読み込み、そのデータ操作からはじまり、さまざまなPythonのライブラリの使い方、確率統計の手法、機械学習(教師あり学習、教師なし学習とチューニング)の使い方についても学びます。取り扱っているデータは、マーケティングに関するデータやログデータ、金融時系列データなどさまざまで、モデリングの前にそれらを加工する手法も紹介しています。データサイエンティストになるには、どれも必要なスキルです。 本書には、さらに以下の3つの特徴があります。 ・実際のデータを使って手を動かしながら、データサイエンスのスキルを身に付けることができる ・データ分析の現場で使える実践的な内容(データ前処理など)が含まれている ・練習問題や総合問題演習など実際に頭を使って考える内容がたくさんある この本に書いてあることを実践し、読み終えた後には、実際の現場でデータ分析ができるようになるはずです。 ●この本の対象読者 この本は、プログラミングの経験があり、理系の大学1~2年生程度の教養課程の数学(線形代数、微分積分学、確率統計の基礎など)を終えている方を対象にしています。具体的には、勉強熱心な大学3~4年生の理系の学生さんや大学院生の方、また社会人になってデータサイエンスを学ぼうという意欲の高い方たちが対象です。データサイエンスの入門レベルから中級レベルの手前までを考えている人に最適で、本書のゴールもデータサイエンス入門レベルを卒業できることを想定しています。 "Contents Chapter 1 本書の概要とPythonの基礎 1-1 データサイエンティストの仕事  1-1-1 データサイエンティストの仕事  1-1-2 データ分析のプロセス  1-1-3 本書の構成  1-1-4 本書を読み進めるのに役立つ文献  1-1-5 手を動かして習得しよう 1-2 Pythonの基礎   1-2-1 Jupyter Notebookの使い方  1-2-2 Pythonの基礎  1-2-3 リストと辞書型  1-2-4 条件分岐とループ  Column format記法と%記法  1-2-5 関数  Practice 練習問題1-1  Practice 練習問題1-2  1-2-6 クラスとインスタンス  Practice 1章 総合問題 Chapter 2 科学計算、データ加工、グラフ描画ライブラリの使い方の基礎 2-1 データ分析で使うライブラリ  2-1-1 ライブラリの読み込み  2-1-2 マジックコマンド  2-1-3 この章で使うライブラリのインポート 2-2 Numpyの基礎  2-2-1 Numpyのインポート  2-2-2 配列操作  2-2-3 乱数  Column Numpyは高速 2-2-4 行列  Practice 練習問題2-1  練習問題2-2  練習問題2-3 2-3 Scipyの基礎  2-3-1 Scipyのライブラリのインポート  2-3-2 行列計算  2-3-3 ニュートン法  Practice 練習問題2-4  練習問題2-5  練習問題2-6 2-4 Pandasの基礎  2-4-1 Pandasのライブラリのインポート  2-4-2 Seriesの使い方  2-4-3 DataFrameの使い方  2-4-4 行列操作  2-4-5 データの抽出  2-4-6 データの削除と結合  2-4-7 集計  2-4-8 値のソート  2-4-9 nan(null)の判定  Practice 練習問題2-7  Practice 練習問題2-8  Practice 練習問題2-9 2-5 Matplotlibの基礎  2-5-1 Matplotlibを使うための準備  2-5-2 散布図  2-5-3 グラフの分割  2-5-4 関数グラフの描画  2-5-5 ヒストグラム  Column さまざまなデータのビジュアル化  Practice 練習問題2-10  Practice 練習問題2-11  Practice 練習問題2-12  Practice 2章 総合問題 Chapter 3 記述統計と単回帰分析 3-1 統計解析の種類  3-3-1 記述統計と推論統計  3-3-2 この章で使うライブラリのインポート 3-2 データの読み込みと対話  3-2-1 インターネットなどで配布されている対象データの読み込み  3-2-2 データの読み込みと確認  3-2-3 データの性質を確認する  Column  「変数」という用語について  3-2-4 量的データと質的データ 3-3 記述統計  3-3-1 ヒストグラム  3-3-2 平均、中央値、最頻値  3-3-3 分散と標準偏差  3-3-4 要約統計量とパーセンタイル値  3-3-5 箱ひげ図  3-3-6 変動係数  3-3-7 散布図と相関係数  3-3-8 すべての変数のヒストグラムや散布図を描く  Practice 練習問題3-1  Practice 練習問題3-2  Practice 練習問題3-3 3-4 単回帰分析  3-4-1 線形単回帰分析  3-4-2 決定係数  Practice 練習問題3-4  Practice 練習問題3-5  Practice 練習問題3-6  Practice 3章 総合問題 Chapter 4 確率と統計の基礎 4-1 確率と統計を学ぶ準備  4-1-1 この章の前提知識  4-1-2 この章で使うライブラリのインポート 4-2 確率  4-2-1 数学的確率  4-2-2 統計的確率  4-2-3 条件付き確率と乗法定理  4-2-4 独立と従属  4-2-5 ベイズの定理  Practice 練習問題4-1  Practice 練習問題4-2  Practice 練習問題4-3 4-3 確率変数と確率分布  4-3-1 確率変数、確率関数、分布関数、期待値  4-3-2 さまざまな分布関数  4-3-3 カーネル密度関数  Practice 練習問題4-4  Practice 練習問題4-5  Practice 練習問題4-6 4-4 応用:多次元確率分布  4-4-1 同時確率関数と周辺確率関数  4-4-2 条件付き確率関数と条件付き期待値  4-4-3 独立の定義と連続分布 4-5 推計統計学  4-5-1 大数の法則  4-5-2 中心極限定理  4-5-3 標本分布  Practice 練習問題4-7  Practice 練習問題4-8  Practice 練習問題4-9 4-6 統計的推定  4-6-1 推定量と点推定  4-6-2 不偏性と一致性  4-6-3 区間推定  4-6-4 推定量を求める  Practice 練習問題4-10  Practice 練習問題4-11  Practice 練習問題4-12 4-7 統計的検定  4-7-1 検定  4-7-2 第1種の過誤と第2種の過誤  4-7-3 ビッグデータに対する検定の注意  Practice 練習問題4-13  Practice 4章 総合問題 Chapter 5 Pythonによる科学計算(NumpyとScipy) 5-1 概要と事前準備  5-1-1 この章の概要  5-1-2 この章で使うライブラリのインポート 5-2 Numpyを使った計算の応用  5-2-1 インデックス参照  Practice 練習問題5-1  Practice 練習問題5-2  Practice 練習問題5-3 5-2-2 Numpyの演算処理  Practice 練習問題5-4  Practice 練習問題5-5  Practice 練習問題5-6 5-2-3 配列操作とブロードキャスト  Practice 練習問題5-7  Practice 練習問題5-8  Practice 練習問題5-9 5-3 Scipyを使った計算の応用・  5-3-1 補間  5-3-2 線形代数:行列の分解  Practice 練習問題5-10  Practice 練習問題5-11  Practice 練習問題5-12  Practice 練習問題5-13  Practice 練習問題5-14  5-3-3 積分と微分方程式  Practice 練習問題5-15  Practice 練習問題5-16  5-3-4 最適化  Practice 練習問題5-17  Practice 練習問題5-18  Practice 5章 総合問題 Chapter 6 Pandasを使ったデータ加工処理 6-1 概要と事前準備  6-1-1 この章で使うライブラリのインポート 6-2 Pandasの基本的なデータ操作  6-2-1 階層型インデックス  Practice 練習問題6-1  Practice 練習問題6-2  Practice 練習問題6-3 6-2-2 データの結合  Practice 練習問題6-4   練習問題6-5   練習問題6-6 6-2-3 データの操作と変換  Practice 練習問題6-7  Practice 練習問題6-8  Practice 練習問題6-9 6-2-4 データの集約とグループ演算  Practice 練習問題6-10  Practice 練習問題6-11  Practice 練習問題6-12 6-3 欠損データと異常値の取り扱いの基礎  6-3-1 欠損データの扱い方  Practice 練習問題6-13  Practice 練習問題6-14  Practice 練習問題6-15  6-3-2 異常データの扱い方 6-4 時系列データの取り扱いの基礎  6-4-1 時系列データの処理と変換  Practice 練習問題6-16  6-4-2 移動平均  Practice 練習問題6-17  Practice 6章 総合問題 Chapter 7 Matplotlibを使ったデータ可視化 7-1 データの可視化  7-1-1 データの可視化について  7-1-2 この章で使うライブラリのインポート 7-2 データ可視化の基礎  7-2-1 棒グラフ  7-2-2 円グラフ  Practice 練習問題7-1  Practice 練習問題7-2  Practice 練習問題7-3 7-3 応用:金融データの可視化  7-3-1 可視化する金融データ  7-3-2 ローソクチャートを表示するライブラリ 7-4 応用:分析結果の見せ方を考えよう  7-4-1 資料作成のポイントについて  Practice 7章 総合問題  Column 移動平均時系列データと対数時系列データ Chapter 8 機械学習の基礎(教師あり学習) 8-1 機械学習の全体像  8-1-1 機械学習とは  8-1-2 教師あり学習  8-1-3 教師なし学習  8-1-4 強化学習  8-1-5 この章で使うライブラリのインポート 8-2 重回帰  8-2-1 自動車価格データの取り込み  8-2-2 データの整理  8-2-3 モデル構築と評価  8-2-4 モデル構築とモデル評価の流れのまとめ  Practice 練習問題8-1 8-3 ロジスティック回帰  8-3-1 ロジスティック回帰の例  8-3-2 データの整理  8-3-3 モデル構築と評価  8-3-4 スケーリングによる予測精度の向上  Practice 練習問題8-2  Practice 練習問題8-3 8-4 正則化項のある回帰:ラッソ回帰、リッジ回帰  8-4-1 ラッソ回帰、リッジ回帰の特徴  8-4-2 重回帰とリッジ回帰の比較  Practice 練習問題8-4 8-5 決定木  8-5-1 キノコデータセット  8-5-2 データの整理  8-5-3 エントロピー:不純度の指標  8-5-4 情報利得:分岐条件の有益さを測る  8-5-5 決定木のモデル構築  Practice 練習問題8-5 8-6 k-NN(k近傍法)  8-6-1 k-NNのモデル構築  Practice 練習問題8-6  Practice 練習問題8-7 8-7 サポートベクターマシン  8-7-1 サポートベクターマシンのモデル構築  Practice 練習問題8-8  Practice 8章 総合問題 Chapter 9 機械学習の基礎(教師なし学習) 9-1 教師なし学習  9-1-1 教師なしモデルの種類  9-1-2 この章で使うライブラリのインポート 9-2 クラスタリング  9-2-1 k-means法  9-2-2 k-means法でクラスタリングする  9-2-3 金融マーケティングデータをクラスタリングする  9-2-4 エルボー法によるクラスター数の推定  9-2-5 クラスタリング結果の解釈  9-2-6 k-means法以外の手法  Practice 練習問題9-1 9-3 主成分分析  9-3-1 主成分分析を試す  9-3-2 主成分分析の実例  Practice 練習問題9-2 9-4 マーケットバスケット分析とアソシエーションルール  9-4-1 マーケットバスケット分析とは  9-4-2 マーケットバスケット分析のためのサンプルデータを読み込む  9-4-3 アソシエーションルール  Practice 9章 総合問題 Chapter 10 モデルの検証方法とチューニング方法 10-1 モデルの評価と精度を上げる方法とは  10-1-1 機械学習の課題とアプローチ  10-1-2 この章で使うライブラリのインポート 10-2 モデルの評価とパフォーマンスチューニング  10-2-1 ホールドアウト法と交差検証法  10-2-2 パフォーマンスチューニング:ハイパーパラメータチューニング  Practice 練習問題10-1  Practice 練習問題10-2  10-2-3 パフォーマンスチューニング:特徴量の扱い  10-2-4 モデルの種類  10-3 モデルの評価指標  10-3-1 分類モデルの評価:混同行列と関連指標  10-3-2 分類モデルの評価:ROC曲線とAUC  Practice 練習問題10-3  10-3-3 回帰モデルの評価指標  Practice 練習問題10-4 10-4 アンサンブル学習  10-4-1 バギング  Practice 練習問題10-5  10-4-2 ブースティング  10-4-3 ランダムフォレスト、勾配ブースティング  Practice 練習問題10-6  10-4-4 今後の学習に向けて  Practice 練習問題10-7  Practice 10 章 総合問題 Chapter 11 総合演習問題 11-1 総合演習問題  11-1-1 総合演習問題(1)  11-1-2 総合演習問題(2)  11-1-3 総合演習問題(3)  11-1-4 総合演習問題(4)  11-1-5 総合演習問題(5)  11-1-6 総合演習問題(6)  11-1-7 参考:今後のデータ分析に向けて Appendix A-1 本書の環境構築について  A-1-1 Anacondaについて  A-1-2 Anacondaのパッケージをダウンロードする  A-1-3 Anacondaをインストールする  A-1-4 pandas-datareaderおよびPlotlyのインストール A-2 練習問題解答  A-2-1 Chapter1 練習問題  A-2-2 Chapter2 練習問題  A-2-3 Chapter3 練習問題  A-2-4 Chapter4 練習問題  A-2-5 Chapter5 練習問題  A-2-6 Chapter6 練習問題  A-2-7 Chapter7 練習問題  A-2-8 Chapter8 練習問題  A-2-9 Chapter9 練習問題  A-2-10 Chapter10 練習問題  A-2-11 Chapter11 総合演習問題  Column ダミー変数と多重共線性 A-3 参考文献・参考URL  A-3-1 参考文献  A-3-2 参考URL

Deep Learning Javaプログラミング 深層学習の理論と実装 (impress top gear)

巣籠悠輔
インプレス
おすすめ度
58

Python実践データ分析100本ノック

下山 輝昌
秀和システム
おすすめ度
58
紹介文
データ分析の現場にあって入門書にない「汚いデータ」(ダーティデータ)に対応する、プロのノウハウを解説します。 これがリアルなデータ分析だ! 君は「汚いデータ」を処理できるか? データ分析の現場にあって入門書にないもの――それは、「汚いデータ」(ダーティデータ)です。本書は、データ分析の現場では①どんなデータに出会い、②どのような問題が生じ、③どう対応すればよいのかというノウハウを解説。 事前の加工(視覚化)から機械学習、最適化問題まで、100本ノックをこなして、ビジネス現場で即戦力になれる「応用力」を身につけよう! 練習するライブラリ ・Pandas ・Numpy ・Matplotlib ・scikit-learn ・Networkxs ・pulp ・ortoolpy ・opencv ・dlib ・MeCab 第1部 基礎編:データ加工 第1章 ウェブからの注文数を分析する10本ノック 第2章 小売店のデータでデータ加工を行う10本ノック 第2部 実践編①:機械学習 第3章 顧客の全体像を把握する10本ノック 第4章 顧客の行動を予測する10本ノック 第5章 顧客の退会を予測する10本ノック 第3部 実践編②:最適化問題 第6章 物流の最適ルートをコンサルティングする10本ノック 第7章 ロジスティクスネットワークの最適設計を行う10本ノック 第8章 数値シミュレーションで消費者行動を予測する10本ノック 第4部 発展編:画像処理/言語処理 第9章 潜在顧客を把握するための画像認識10本ノック 第10章 アンケート分析を行うための自然言語処理10本ノック

データ分析のための数理モデル入門 本質をとらえた分析のために

貴裕, 江崎
ソシム
おすすめ度
58
紹介文
「数理モデル」とは、現実のデータを理解・活用するために生み出された様々な数理的な手段の総称である。これには、近年注目を浴びている機械学習だけでなく、物理学、生物学、生態学などの自然科学、また心理学、経済学、といった人文社会科学分野で用いられる諸手法が含まれている。 こうした極めて多様な方法論の間には、データの背後に存在するメカニズムをある種の数式で表現し、それを利用するという共通の目的・手続きが存在する。 データと目的が与えられたとして、どのモデリング手法に頼ればいいのだろうか?特に、現象の理解を目的とした分析には、機械学習の諸手法では太刀打ちできないこともある。 こういった場合には、統計モデリングだけでなく所謂計算論的モデルと呼ばれるボトムアップ型のモデリング手法が必要とされることもあるだろう。こうした俯瞰的な視点でモデルの「種類」を選択することはデータ分析において必須のステップであるが、そうした分野を跨いだ解説書は殆ど存在していないといっても良い。 そこで本書は、数理モデル全体が有機的に繋がって見えるような「横糸的な」理解を可能にする、全く新しい入門的な教科書を目指した。 本書では、さまざまなモデリング手法の基礎的な部分を解説するだけでなく、それらをどのように選択して使用すればよいか、そしてモデリングによって得られる結論について初学者が勘違いしやすい事項について丁寧に解説した。 主な読者としては、「これからデータ分析を始める」、或いは「ある種の分析で結果を出すことはできるが、それが何をやっていることになるのかがモヤモヤする」といった初学者・初級者を想定している。大学の一年次でも読み通せる程度の解説レベルを採用しているが、内容が淡泊になりすぎないように注意した。 また、通常データ分析の文脈では言及されない(しかし重要な)種々の数理手法についても解説することで、ある程度モデリングに慣れた読者が読んでも楽しめる内容を目指した。 第一部 数理モデルとは 第1章 データ分析と数理モデル 〔データを分析するということ/数理モデルの役割〕 第2章 数理モデルの構成要素・種類 〔理解志向型・応用志向型モデリング/数理モデルの適用限界〕 第二部 基礎的な数理モデル 第3章 少数の方程式によるモデル 〔線形モデル/実験式・カーブフィッティング/最適化問題〕 第4章 少数の微分方程式によるモデル 〔線形微分方程式/非線形微分方程式/安定性解析/制御理論〕 第5章 確率モデル 〔確率過程/マルコフ過程/待ち行列理論〕 第6章 統計モデル 〔正規分布/統計的検定/回帰分析〕 第三部 高度な数理モデル 第7章 時系列モデル 〔時系列データの構造/自己回帰モデル/状態空間モデル/非線形時系列解析〕 第8章 機械学習モデル 〔複雑なモデルと過学習/分類・回帰問題/クラスタリング/次元削減/深層学習〕 第9章 強化学習モデル 〔行動モデルとしての強化学習/機械学習モデルとしての強化学習〕 第10章 多体系モデル・エージェントベースモデル 〔ミクロからマクロへ/さまざまな集団現象モデル/相互作用のネットワーク分析〕 第四部 数理モデルを作る 第11章 モデルを決めるための要素 〔数理モデルの性質/理解志向型・応用志向型モデリングのポイント〕 第12章 モデルを設計する 〔変数の選択/データの取得・実験計画/数理構造・パラメータの選択/間違ったモデリングをしないために〕 第13章 パラメータを推定する 〔目的に応じたパラメータ推定/パラメータ推定における目的関数の最小化/ベイズ推定・ベイズモデリング〕 第14章 モデルを評価する 〔「いいモデル」とは/分類精度の指標/情報量基準/ヌルモデルとの比較・尤度比検定/交差検証〕

Java人工知能プログラミング -オブジェクト指向と関数スタイルによるAIの実装-

深井 裕二
三恵社
おすすめ度
58

仕事ではじめる機械学習 第2版

有賀 康顕
オライリージャパン
おすすめ度
58
紹介文
仕事で機械学習に携わる際に知っておきたい事を伝えるというコンセプトで、機械学習を使った実務に初めて関わる読者のための1冊。 大好評の機械学習実務者向け書籍が最新情報にアップデート! 2018年に発行された初版から3年ぶりの改訂となる本書は、「仕事で機械学習に携わる際に知っておきたい事」を伝えるというコンセプトはそのままに、3年の間に登場した新たな考え方、手法など最新の情報を踏まえて内容を全面的に見直しました。これまで同様、機械学習を使った実務に初めて関わる読者にとって頼りになる1冊となるでしょう。「バンディットアルゴリズム」を紹介する新章など、追加原稿も多数。 仕事で機械学習に携わる際に知っておきたい事を伝えるというコンセプトで、機械学習を使った実務に初めて関わる読者のための1冊。
search