【2023最新】「自然言語処理」のおすすめ本100選!人気ランキング
- ゼロから作るDeep Learning ❷ ―自然言語処理編
- 自然言語処理〔改訂版〕 (放送大学教材)
- 深層学習による自然言語処理 (機械学習プロフェッショナルシリーズ)
- 機械学習・深層学習による自然言語処理入門 ~scikit-learnとTensorFlowを使った実践プログラミング~ (Compass Data Science)
- 言語処理のための機械学習入門 (自然言語処理シリーズ)
- ゼロから作るDeep Learning ―Pythonで学ぶディープラーニングの理論と実装
- 自然言語処理の基礎
- 人工知能は人間を超えるか ディープラーニングの先にあるもの (角川EPUB選書)
- 入門 自然言語処理
- Javaで学ぶ自然言語処理と機械学習
自然言語処理編
ディープラーニング実装入門書の決定版! ニューラルネットワークの理論とディープラーニングの実装について丁寧に解説。実装には、Python(3.x)とディープラーニング向けライブラリKeras(2.x)、TensorFlow(2.x)、PyTorch(1.x)を用います。 本書では、自然言語処理をはじめとした時系列データ処理のためのディープラーニング・アルゴリズムに焦点を当てているのも大きな特徴の1つです。本書の[第1版](2017年)以降に次々と登場している新しい手法やモデルを丁寧に説明、記事も大幅にボリュームアップしました。 [本書の構成] 1章 数学の準備:ニューラルネットワークのアルゴリズムを理解するための数学の知識、偏微分と線形代数の基本を学びます。アルゴリズムが複雑になってもこの2つを押さえておけばきちんと理解できます。 2章 Pythonの準備:ディープラーニングのアルゴリズムを実装するため、Python環境の構築およびPythonの基本から代表的なライブラリの使い方までを解説します。 3章 ニューラルネットワーク:ニューラルネットワークとは何か、どういった手法かを解説します。単純パーセプトロン、ロジスティック回帰、多クラスロジスティック回帰、多層パーセプトロンを扱います。 4章 ディープニューラルネットワーク:ディープラーニングはニューラルネットワークのモデルの発展形です。ニューラルネットワークから「ディープ」ニューラルネットワークになるうえで発生する課題とそれを解決するテクニックについて解説します。 5章 リカレントニューラルネットワーク:ニューラルネットワークに「時間」という概念を取り込むとどのようなモデルになるのか。通常のディープラーニングのモデルではうまく扱うことができない時系列データの扱いに特化したモデルであるリカレントニューラルネットワーク(RNN)とその手法LSTM、GRUについて取り上げます。 6章 リカレントニューラルネットワークの応用:時系列データの扱いに関しては、自然言語処理で新しいモデルが考えられてきました。本章では、Encoder-Decoder、Attention、Transformerについて学んでいきます。 付録 ライブラリ内部の処理を理解するためのグラフの知識と、Pythonのデコレータ @tf.function の実装例、Keras、TensorFlow、PyTorchによるモデルの保存・読み込みについて解説します。 はじめに 1章 数学の準備 1.1 偏微分 1.2 線形代数 1.3 まとめ 1章の参考文献 2章 Python の準備 2.1 Python 2とPython 3 2.2 Anaconda ディストリビューション 2.3 Python の基本 2.4 NumPy 2.5 ディープラーニング向けライブラリ 2.6 まとめ 3章 ニューラルネットワーク 3.1 ニューラルネットワークとは 3.2 回路としてのニューラルネットワーク 3.3 単純パーセプトロン 3.4 ロジスティック回帰 3.5 多クラスロジスティック回帰 3.6 多層パーセプトロン 3.7 モデルの評価 3.8 まとめ 4章 ディープニューラルネットワーク 4.1 ディープラーニング向けライブラリの導入(Keras/TensorFlow/PyTorch) 4.2 ディープラーニングへの準備 4.3 活性化関数の工夫 4.4 ドロップアウトの導入 4.5 学習の効率化に向けて 4.6 学習率の設定 4.7 重みの初期値の設定 4.8 バッチ正規化 4.9 まとめ 4章の参考文献 5章 リカレントニューラルネットワーク 5.1 基本のアプローチ 5.2 LSTM 5.3 GRU 5.4 双方向リカレントニューラルネットワーク 5.5 埋め込み層における計算 5.6 まとめ 5章の参考文献 6章 リカレントニューラルネットワークの応用 6.1 Encoder-Decoder 6.2 Attention 6.3 Transformer 6.4 まとめ 6章の参考文献 付録 A.1 計算グラフ A.2 @tf.function A.3 モデルの保存と読み込み(Keras、TensorFlow、PyTorch) 索引
認識と学習の基本的な考え方をわかりやすく解説。 第1章 パターン認識とは 第2章 学習と識別関数 第3章 誤差評価に基づく学習 第4章 識別部の設計 第5章 特徴の評価とベイズ誤り確率 第6章 特徴空間の変換 第7章 部分空間法 第8章 学習アルゴリズムの一般化 第9章 学習アルゴリズムとベイズ決定則
This long-awaited revision offers a comprehensive introduction to natural language understanding with developments and research in the field today. Building on the effective framework of the first edition, the new edition gives the same balanced coverage of syntax, semantics, and discourse, and offers a uniform framework based on feature-based context-free grammars and chart parsers used for syntactic and semantic processing. Thorough treatment of issues in discourse and context-dependent interpretation is also provided. In addition, this title offers coverage of two entirely new subject areas. First, the text features a new chapter on statistically-based methods using large corpora. Second, it includes an appendix on speech recognition and spoken language understanding. Also, the information on semantics that was covered in the first edition has been largely expanded in this edition to include an emphasis on compositional interpretation. 0805303340B04062001 1. Introduction to Natural Language Understanding. The Study of Language. Applications of Natural Language Understanding. Evaluating Language Understanding Systems. The Different Levels of Language Analysis. Representations and Understanding. The Organization of Natural Language Understanding Systems. 2. Linguistic Background: An Outline of English Syntax. Words. The Elements of Simple Noun Phrases. Verb Phrases and Simple Sentences. Noun Phrases Revisited. Adjective Phrases. Adverbial Phrases. 3. Grammars and Parsing. Grammars and Sentence Structure. What Makes a Good Grammar. A Top-Down Parser. A Bottom-Up Chart Parser. Top-Down Chart Parsing. Finite State Models and Morphological Processing. Grammars and Logic Programming. 4. Features and Augmented Grammars. Feature Systems and Augmented Grammars. Some Basic Feature Systems for English. Morphological Analysis and the Lexicon. A Simple Grammar Using Features. Parsing with Features. Augmented Transition Networks. Definite Clause Grammars. Generalized Feature Systems and Unification Grammars. 5. Grammars for Natural Language. Auxiliary Verbs and Verb Phrases. Movement Phenomena in Language. Handling Questions in Context-Free Grammars. Noun Phrases and Relative Clauses. The Hold Mechanism in ATN. Gap Threading. 6. Toward Efficient Parsing. Human Preferences in Parsing. Encoding Uncertainty: Shift-Reduce Parsers. A Deterministic Parser. Techniques for Efficient Encoding of Ambiguity. Partial Parsing. 7. Ambiguity Resolution: Statistical Methods. Basic Probability Theory. Estimating Probabilities. Part-of-Speech Tagging. Obtaining Lexical Probabilities. Probabilistic Context-Free Grammars. Best-First Parsing. A Simple Context-Dependent Best-First Parser. 8. Semantics and Logical Form. Semantics and Logical Form. Word Senses and Ambiguity. The Basic Logical Form Language. Encoding Ambiguity in Logical Form. Verbs and States in Logical Form. Case Relations. Speech Acts and Embedded Sentences. Defining Semantic Structure: Model Theory. 9. Linking Syntax and Semantics. Semantic Interpretation and Compositionality. A Simple Grammar and Lexicon with Semantic Interpretation. Prepositional Phrases and Verb Phrases. Lexicalized Semantic Interpretation and Semantic Roles. Handling Simple Questions. Semantic Interpretation Using Feature Unification Generating Sentences from Logical Form. 10. Ambiguity Resolution. Selectional Restrictions. Semantic Filtering Using Selectional Restrictions. Semantic Networks. Statistical Word Sense Disambiguation. Statistical Semantic Preferences. Combining Approaches to Disambiguation. 11. Other Strategies for Semantic Interpretation. Grammatical Relations. Semantic Grammars. Template Matching. Semantically-Directed Parsing Techniques. 12. Scoping and the Interpretation of Noun Phrases. Scoping Phenomena. Definite Descriptions and Scoping. A Method for Scoping While Parsing. Co-Reference and Binding Constraints. Adjective Phrases. Relational Nouns and Nominalizations. Other Problems in Semantics. 13. Knowledge Representation and Reasoning. Knowledge Representation. A Representation Based on FOPC. Frames: Representing Stereotypical Information. Handling Natural Language Quantification. Time and Aspectual Classes of Verbs. Automating Deduction in Logic-Based Representations. Procedural Semantics and Question Answering. Hybrid Knowledge Representations. 14. Local Discourse Context and Reference. Defining Local Discourse Context and Discourse Entities. A Simple Model of Anaphora Based on History Lists. Pronouns and Centering. Definite Descriptions. Definite Reference and Sets. Ellipsis. Surface Anaphora. 15. Using World Knowledge. Using World Knowledge: Establishing Coherence. Matching Against Expectations. Reference and Matching Expectations. Using Knowledge About Action and Casualty. Scripts: Understanding Stereotypical Situations. Using Hierarchical Plans. Action-Effect-Based Reasoning. Using Knowledge About Rational Behavior. 16. Discourse Structure. The Need for Discourse Structure. Segmentation and Cue Phrases. Discourse Structure and Reference. Relating Discourse Structure and Inference. Discourse Structure, Tense, and Aspect. Managing the Attentional Stack. An Example. 17. Defining a Conversational Agent. What's Necessary to Build a Conversational Agent? Language as Multi-Agent Activity. Representing Cognitive State: Beliefs. Representing Cognitive State: Desires, Intentions, and Plans. Speech Acts and Communicative Acts. Planning. Communicative Acts. Communicative Acts and the Recognition of Intention. The Source of Intention in Dialogue. Recognizing Illocutionary Acts. Discourse and Level Planning. Appendices. An Introduction to Logic and Model Theoretic Semantics. Symbolic Computation. Spoken Language. 0805303340T04062001
人気のAIフレームワーク「PyTorch」で、ディープラーニングプログラミングができるようになる本です。 人気のAIフレームワーク「PyTorch」で、ディープラーニングプログラミングができるようになる本です。ディープラーニングのアルゴリズムが原理からわかります。 初心者でも他書に頼らず、本書1冊でマスターできます! (本書掲載のコードは、2023年3月にリリースされたPyTorch 2.0でも、そのまま動作します) 本書は、次のような読者を想定しています。 1. 企業でディープラーニングプログラムを業務で利用している、あるいはこれから利用しようとしているITエンジニアや研究者 Keras/Tensorflowを使った経験がある方は、まずPyTorch独特の「ポリシー」につまずきがちです。 PyTorchは「多値分類モデルにおける損失関数」の考え方が独特で、それを分かりやすく解説します。 2. 理工系の大学・大学院の学生で研究の一環としてディープラーニングのプログラムを開発する必要がある方 今後、論文で公開されている実装コードを試すには、PyTorchの知識が必須になってきます。 本書では、ディープラーニングに必要な数学をイメージとして解説するので、公開コードを深く理解し、応用できるようになります。 3. まだPythonもKeras/TensorFlowも知らないが、ディープラーニングプログラミングをこれから勉強してみたいという方 初心者に向けて、PyTorchプログラミングを理解するのに必要な、Pythonの基本文法と、NumPy、Matplotlibの必要最小限の機能を、巻末の講座として用意しました。 目的がディープラーニングだけなら、本書の講座で書いた概念・機能だけを理解すれば十分で、ディープラーニングを学ぶためのスタートラインに立てます。 本書は、新しい概念は一気には詰め込まず、できるだけ細分化して一歩一歩確実に進めます。 機械学習の基本から、「CNN」などを使った画像認識ディープラーニングモデルの開発・チューニングまでをじっくり学べます。 人気のAIフレームワーク「PyTorch」で、ディープラーニングプログラミングができるようになる本です。 初心者でも他書に頼らず、本書1冊でマスターできます! 序章 初めての画像認識 ◆基礎編 1 章 ディープラーニングのためのPython のツボ 2 章 PyTorch の基本機能 3 章 初めての機械学習 4 章 予測関数の定義 ◆機械学習 実践編 5 章 線形回帰 6 章 2 値分類 7 章 多値分類 8 章 MNIST を使った数字認識 ◆画像認識 実践編 9 章 CNN による画像認識 10 章 チューニング技法 11 章 事前学習済みモデルの利用 12 章 カスタムデータの画像分類 講座 Python入門、NumPy入門、Matplotlib入門
本書では、Pytorchを使い、実際の製品やサービスの開発時に役に立つ手法を紹介するようにしています。 本書で紹介する「AI開発」では、必ずしもすべての章で、ニューラルネットワークの構造(ニューロン同士の接続の仕方)を一から新しく作成するようなことはしませんが、ModelZOOやGitHub上で公開されているモデルも、積極的に採用するようにしています。また、利用できる学習済みのモデルが公開されている際には、それをダウンロードして使用するようにします。 本書では、章によって、異なるAIを開発しますが、その際には、公開されているモデルをそのまま流用して「広義のAI」のみを作成したり、あるいは公開済みのモデルを転移学習・ファインチューニングしたりと、その都度、もっとも近道であると思われるスキームを利用して、「AI開発」を行います。 本書では次のような機能を解説しています。 ・CHAPTER 02・・・画像認識 ・CHAPTER 03・・・異常検出 ・CHAPTER 04・・・物体検出 ・CHAPTER 05・・・セグメンテーション ・CHAPTER 06・・・顔認証 ・CHAPTER 07・・・線画イラスト変換 ・CHAPTER 08・・・OCRの文字認識 ・CHAPTER 09・・・OCRの文章認識 本書では次のような機能を解説しています。 ・CHAPTER 02・・・画像認識 ・CHAPTER 03・・・異常検出 ・CHAPTER 04・・・物体検出 ・CHAPTER 05・・・セグメンテーション ・CHAPTER 06・・・顔認証 ・CHAPTER 07・・・線画イラスト変換 ・CHAPTER 08・・・OCRの文字認識 ・CHAPTER 09・・・OCRの文章認識
さまざまな業界で導入が進められているAIについて、どのような分野で活用されているのかが鳥瞰図で一目でわかる AIの導入事例が一目でわかる! 金融、流通、製造、インフラなど全8業界36業種のAIの導入について、どのような分野で活用されているのか、 どのような事項との親和性が高いかといったことについて鳥瞰図で解説。豊富な実例も掲載しており、ビジネスのアイデア創出にも応用できます。 また、「こんな応用可能性があります」にとどめず、実際に実装したりトライアルをするときのノウハウも掲載しています。 本書掲載の鳥瞰図はご購入者特典としてDLして活用できます。 【本書に掲載されている業種】 〈流通〉 コンビニ・スーパーマーケット 百貨店業 郵便・運送業 〈製造〉 自動車製造業 食品・飲料製造業 化粧品・日用品製造業 金属製造業・化学工業 重工業 建設業 繊維工業(アパレル) 電機製造業 〈金融〉 銀行業 保険業 証券業 〈サービス〉 ホテル業 旅行代理業 外食業 テーマパーク 放送局 〈インフラ〉 通信業 鉄道業 航空業 空港 道路・交通インフラ管理業 エネルギー業(ガス・電気) 石油および天然ガス生産・販売業 〈公共〉 学校・学習塾 警察・警備 消防・防災 〈ヘルスケア〉 病院 介護サービス業 製薬業 〈その他〉 農業 水産業 スタジアム・(プロ/アマ)スポーツ ゲーム業 Chapter 1 流通 コンビニ・スーパーマーケット 百貨店業 郵便・運送業 詳細解説:商品需要予測に基づく在庫管理 Chapter 2 製造 自動車製造業 食品・飲料製造業 化粧品・日用品製造業 金属製造業・化学工業 重工業 建設業 繊維工業(アパレル) 電機製造業 詳細解説:査定自動化・見積り自動化 Chapter 3 金融 銀行業 保険業 証券業 詳細解説:不正検知 Chapter 4 サービス ホテル業 旅行代理業 外食業 テーマパーク 放送局 詳細解説:キャンペーン企画・価格設定 Chapter 5 インフラ 通信業 鉄道業 航空業 空港 道路・交通インフラ管理業 エネルギー業(ガス・電気) 石油および天然ガス生産・販売業 詳細解説:劣化予測・メンテナンス計画作成 Chapter 6 公共 学校・学習塾 警察・警備 消防・防災 詳細解説:画像データによる異常検知・品質評価 Chapter 7 ヘルスケア 病院 介護サービス業 製薬業 詳細解説:センサーデータによる異常検知 Chapter 8 その他 農業 水産業 スタジアム・(プロ/アマ)スポーツ ゲーム業 詳細解説:見込み顧客分析・離反分析
ディープラーニング技術を使った自然言語処理においてword2vec、LSTM、seq2seq、BERTは、重要な技術です。本書では、機械学習フレームワークのPyTorchを利用することで、それらのディープラーニング技術を使ったプログラムをより容易に実装する方法を解説します。本書で作成するプログラムは、「文章内の単語の品詞を分類する」「日英の機械翻訳を行う」「質問に対する回答を返す」ことなどを目的にしています。本書は、そうした自然言語処理システムの実装を試してみたいという方にとって格好の一冊です。
これからAIを学ぶ人に向けた入門書。ビジネスへの活用法から最新技術までをカバーした、「最初に手にすべきAI本」 本書は、これから人工知能(AI)を学びたいと考える人に向けたAIの入門書です。エンジニアではない人、すなわち中高生や文系学部の大学生、文系出身のビジネスパーソンや経営者などでも理解できるように、分かりやすくAIの本質や基礎知識を解説しました。AIのビジネスへの活用法からAIの最新技術までをカバーした、「最初に手にすべきAI本」です。 著者は、日本経済新聞社や日経BPのセミナーでAIやIoTの講座を教える人気講師。フジテレビの「ホンマでっか!?TV」に評論家として出演もしています。語り口が初心者にも分かりやすいと定評のある著者が、必要最低限のポイントに絞り、できる限り専門用語を使わないように配慮しながら書き上げました。 初心者でも人工知能の本質を短時間で理解できるようにするために、それぞれの状況や理解度に応じて学習できるように3部に分けて構成しています。 第1部(第1章)は「基礎編」です。ここでは、今後、人工知能が中心となる社会で生きていくために必要最低限の知識についてまとめました。人工知能は何が得意で、何が不得意なのか、そして社会をどう変えていくのかについて解説しています。 第2部(第2~4章)は「ビジネス編」です。ここでは、ビジネスに人工知能を活用するに当たり、各業界の活用事例や今後どのような使われ方をするのかについて書いています。 また、人工知能を活用する際の注意事項を中心に、プロジェクト推進方法や国などの支援状況についても解説しています。 第3部は「技術編」です。ここでは、人工知能の仕組みについて解説しています。今後、データサイエンスや人工知能に関する知識は、エンジニアや人工知能のプロジェクトに関わる人にとっては必須の知識です。 本書を読めば、AIに関する一般向けの本にありがちな曖昧すぎてよく分からない、なぜそこにAIを使う必要があるのか理解できないといった疑問を解消できると思います。 第1章【基礎編】人工知能(AI)の世界 第2章【ビジネス編】産業別に見た人工知能事例と未来予想図 第3章【ビジネス編】人工知能活用に関する国の施策 第4章【ビジネス編】人工知能プロジェクトの進め方と注意点 第5章【技術編】機械学習 ~これまでの人工知能と歴史~ 第6章【技術編】ディープラーニング ~現在の人工知能~ 第7章【技術編】人工知能開発と運用管理 第8章【技術編】人工知能の最新技術 ~これからの人工知能~ 第9章 人工知能開発に関するいろいろなFAQ
手を動かしアプリを動かしながら学ぶをコンセプトにしたPyTorchの入門書。「解説」と「コード作成」を柱とした構成。 手を動かして学ぶ!! 「手を動かしアプリを動かしながら学ぶ」をコンセプトにしたPyTorchの入門書です。「解説」と「コード作成」を柱とした構成で、主な特徴は次の通りです。 ・最低限の知識でアプリ開発までを実現できる。 ・実用性のあるアプリを作りながら学ぶ。 ・実用性のあるアプリにより学習モチベーションが上がる。 第4章では実用性のある「株価の予測」アプリを開発します。アプリづくりの面白さを通し、読者に楽しみながらPyTorchを学んでいただくものです。
広がるAI化格差と5年先を見据えた企業戦略 ▼技術から利用動向、制度政策に至るまで、国内と海外の人工知能の最新動向がすべてわかるAI白書の2020年版 DX(デジタルトランスフォーメーション)のための重要な技術であるAIの社会実装が進む一方、そのAI化で格差が広がっています。また、5Gのサービス開始、EU一般データ保護規則、米中間の対立など、AIを取り巻く環境は目まぐるしく変化しています。 第1章では、石角友愛氏(パロアルトインサイトCEO)と中島秀之 AI白書編集委員長(札幌市立大学理事長・学長)の対談、北野宏明 AI白書編集委員(ソニーコンピュータサイエンス研究所代表取締役社長・所長)と片岡 晃 IPA社会基盤センター長の対談を通じて、AIをめぐる日本の課題とビジネス戦略について解説。第2章「技術動向」では、AIに関する技術の概要と最新動向を整理し、第3章「利用動向」では国内外でのAI活用事例を紹介。さらに、AIの社会実装を支える環境として、第4章で「制度政策」、第5章で社会実装に係る課題解決の方向性(AI人材育成及びスタートアップエコシステム)について記載しています。 『AI白書2019』に最新情報を加え、大幅にアップデートしています。AIの基礎的な技術解説から、国内外の多様な導入事例、制度・政策面での取り組み、中国のAI動向データ、企業経営者の意識調査結果まで、AIにまつわる幅広い話題を網羅して収録。AIを実装し、DXを推進するにあたってのひとつの指針として、本書をご活用いただけます。 DX(デジタルトランスフォーメーション)のための重要な技術であるAIの社会実装。そのAI化で格差が広がっている。AIの技術や利用動向、制度政策、スタートアップエコシステムに至るまで、AIのすべてを解説 □第1章「2020年のAIとビジネス」 生産性やDXといった日本の課題、AI時代のビジネス戦略をテーマにした対談、など □第2章「技術動向」 AIを支える技術と最新動向、ディープラーニング、開発基盤、標準化・オープンプラットフォーム・信頼性、各国の研究開発の現状、など □第3章「利用動向」 日本と世界の分野別の利用動向、AI利用動向アンケート調査、AI導入予算・AI市場規模、中国のAI最新動向、など □第4章「制度政策動向」 AIに関する原則・ガイドライン、制度改革(モビリティ、データ流通、知的財産)、各国の政策動向、など □第5章「AI実装を推進するAI人材育成と地域スタートアップエコシステム」 スタートアップエコシステム、AI人材の育成、社会実装の課題と現状、など
生成型ディープラーニングの解説。人間にしかできないと思われていた創造的な作業を機械に行わせる技術の基礎から応用までを学ぶ。 生成型ディープラーニングの基礎から応用までを網羅! 生成型ディープラーニングの解説書。「絵を描く」「曲を作る」といった、これまで人間にしかできないと思われていた創造的な作業を機械に行わせるという、いま最もホットな技術の基礎から応用までをJupyterノートブック環境で実際に試しながら学びます。第I部は基礎編です。機械学習プログラミング、変分オートエンコーダ、GANやVAEなど、生成モデルの作成において重要な基礎技術を学びます。第II部は応用編です。CycleGAN、エンコーダ―デコーダモデル、MuseGANなどのモデルを作成し、作画、作文、作曲といった創造的なタスクに取り組みます。さらには、実環境を用いずにゲームプレイAIの学習を可能にする、世界モデルを使った強化学習にも取り組みます。最後に生成モデリングの未来として、StyleGAN、BigGAN、BERT、GPT-2、MuseNetなどのアーキテクチャを紹介します。
人工知能とは何か? 機械学習・ディープラーニングとは何かを、高クオリティなマンガとともに、くわしく・やさしく解説していきます。 人工知能がどのように発展してきたのか、私たちの未来をどのように変えていくのか、そして人工知能とどのように向き合っていくのかをテーマにストーリーを構成。人工知能という難しそうなテーマを、より身近に感じられるようになる一冊です。 Chapter1 人工知能の正体 ・「人間の脳」と「人工知能」 ・人工知能の定義 Chapter2 人工知能の歴史 ・人工知能の誕生-第1次AIブーム- ・コンピュータとの対話-第2次AIブーム- Chapter3 人工知能の新時代① ・第3次AIブームの始まり ・機械学習の広がりと課題 Chapter4 人工知能の新時代② ・ディープラーニングとは何か ・ディープラーニングによるブレイクするー Chapter5 人工知能と心 ・心と身体性 ・人工知能と創造性 Chapter6 人工知能が変えていく未来 ・AIを牽引する企業たち ・「眼を持つ機械」の活用 Chapter7 人工知能が人類にもたらすもの ・人工知能と倫理的課題 ・「シンギュラリティ」とその先の未来
個人の地域密着型アウトドアショップがデジタルマーケティングで業績を飛躍的にアップさせていくストーリーに乗せて、DMの基礎を… 個人の地域密着型アウトドアショップがデジタルマーケティングで業績を飛躍的にアップさせていくストーリーに乗せて、DMの基礎を学ぶ
第1章 自然言語処理の基礎 第2章 形態論:辞書と形態素解析 第3章 統語論と統語解析 第4章 意味論と意味解析 第5章 コーパスと統計処理 第6章 自然言語処理システム
【東京大学特任准教授 松尾 豊氏 推薦】 大人気「10秒で始める人工知能プログラミング学習サービス」の代表者がおくる、 人工知能プログラミングに必要な数学を、やさしく学ぶ参考書が登場! キホンのキホンからおさらいするから、ニガテな人でも大丈夫! 後半では、Pythonのコードを動かしてさらに理解を深められます! ■本書の目的 ・人工知能関連の書籍に現れる数式への抵抗感をなくし、専門書を読むための数学基礎力をつけます。 ・いくつかの人工知能のアルゴリズムを理解し、数式の意味を理解できるようにします。 ■本書の特長 ・ゼロからおさらいするので、誰でも読めます。 ・人工知能プログラミングに必要な分野に特化しています。 ・演習問題や例題で、理解を深められます。 ■本書の対象読者 ・人工知能アルゴリズムを用いてモデリングをしているが、その根底のアルゴリズムはブラックボックスであり、数学を復習したい方。 ・人工知能アルゴリズムを体系的に学びたいが、数学を忘れており、専門書に現れる数式が理解できない方。 ・人工知能アルゴリズムに興味があるが、ハードルが高いと感じている方。 ■目次 CHAPTER 1 数学基礎 中学1 年から高校の数学を復習し、機械学習で使う数学の「入門レベル」を固めます。 CHAPTER 2 微分 微分の概念や表現方法を学びます。機械学習では「ディープラーニング(深層学習)」「ニューラルネットワーク」「最小2 乗法」「勾配降下法」「誤差逆伝播法」などで微分を活用します。 CHAPTER 3 線形代数 高校の範囲に大学1 年で学ぶ線形代数を加え、ベクトル・行列・線形変換を学びます。線形代数は膨大なデータや複雑なシステムを扱うのに役立ちます。 CHAPTER 4 確率・統計 確率・統計は「傾向を知り、限られたデータから全体像を予測する」ために、機械学習で活用されます。分散・尤度・正規分布などの難しい用語もやさしく学びます。 CHAPTER 5 実践編1 回帰モデルで住宅価格を推定してみよう 「データから住宅価格を推定する」ことを題材に、線形回帰モデルを理解します。 CHAPTER 6 実践編2 自然言語処理で文学作品の作者を当てよう 「文学作品を分析する」ことを題材に、自然言語を数学的に表現する方法などを学びます。 CHAPTER 7 実践編3 ディープラーニングで手書き数字認識をしてみよう 「手書きの数字を認識させる」ことを題材に、ディープラーニングの一種であるDNNを、画像認識から学びます。 東京大学特任准教授 松尾 豊氏 推薦! 人工知能プログラミングに必要な数学を、ゼロから抜け漏れなく、体系的に学ぶ! 数学を復習したいエンジニアに! CHAPTER1 数学基礎 CHAPTER2 微分 CHAPTER3 線形代数 CHAPTER4 確率・統計 CHAPTER5 実践編1 回帰モデルで住宅価格を推定してみよう CHAPTER6 実践編2 自然言語処理で文学作品の作者を当てよう CHAPTER7 実践編3 ディープラーニングで手書き数字認識をしてみよう
かな漢字入力・機械翻訳・情報検索など、なくてはならない身の回りの応用から期待高まる未来の技術まで、それらの背後にある理論と仕 人の言葉をコンピュータに理解させるには? 使い慣れた「言葉」も,コンピュータで扱おうとした途端にその奥深さがみえてくる.かな漢字入力・機械翻訳・情報検索など,なくてはならない身の回りの応用から期待高まる未来の技術まで,それらの背後にある理論と仕組みをコンパクトに解説.自然言語処理の難しさと面白さを存分に味わえる,初学者に格好の入門書! 第1章 コンピュータが言葉を理解するために 第2章 言葉を理解するために必要ないくつかの知識 第3章 文字の羅列から単語を見つける:形態素解析 第4章 文法として正しい単語の並びになっているかをチェックする:構文解析 第5章 どんな内容が書かれているのかを解釈する:意味解析 第6章 自然言語処理を使った便利なアプリケーション
本書はコンピュータが言葉を覚えて話せるようになったら面白いと考えている人に、これまでどのような研究が行われどこまでできていてどこからができないのかを、著者のこれまで行ってきた研究を例に取り簡単に説明したものである。 第1章 言葉をコンピュータで扱う方法 第2章 コンピュータが言葉を覚える方法 第3章 コンピュータで文章から単語を取り出す方法 第4章 コンピュータが読みを漢字に変換する方法 第5章 コンピュータで文の構造を解析する方法 第6章 コンピュータで文の意味を理解する方法 第7章 コンピュータで翻訳する方法 第8章 コンピュータが対話できるようになる仕組み 第9章 コンピュータはどこまで赤ちゃんに近づけたのか?
はじめに 系列の解析 構文の解析 意味の解析 文脈の解析 ニューラルネットワークの利用 情報抽出と知識獲得 情報検索 トピックモデル 機械翻訳 対話システム まとめ
自然言語処理の概要と歴史 文字列・テキスト処理の基礎 系列の解析 コーパスに基づく自然言語処理 意味の解析 構文の解析 文脈の解析 情報抽出と知識獲得 情報検索 対話システム 機械翻訳 まとめ
統計的自然言語処理を徹底的に論じた教科書 原著が刊行されたのは18年ほど前になるので,本書の内容の一部は歴史的な記録となっており,現在の状況に照らして異なる含意を読み取るべき言及もある。そのような若干の注意書きを要するとはいえ,本書の重要性,今日性は高い。 学問的基礎の記述の豊かさに加えて,マルコフモデルや確率文脈自由文法など,統計的自然言語処理の基盤となる概念について,丁寧な式の導出を含めたわかりやすい説明がなされている。そのような理論的基盤と合わせて,n-グラムモデルにおけるスムージングや分類学習における過学習など,実際に研究を進める上では重要でありながら,えてして短めの注意書きになりがちな部分についても,十分な量が割かれている。 「今」の自然言語処理研究をその基礎から正しく理解し,その上に新たな積み上げを行うための基盤を提供してくれる良書となっている。 [原著名:Foundations of Statistical Natural Language Processing] I編 前提知識 1章 導 入 1.1 言語に対する合理主義的方法論と経験主義的方法論 1.2 科学的意義 1.3 言語の曖昧性:なせ自然言語処理は困難なのか 1.4 汚れ仕事 1.5 さらに学ぶために 1.6 練習問題 2章 数学的基礎 2.1 確率論の基礎 2.2 情報理論の要点 2.3 さらに学ぶために 3章 言語学の要点 3.1 品詞と形態論 3.2 句構造 3.3 意味論と語用論 3.4 その他の分野 3.5 さらに学ぶために 3.6 練習問題 4章 コーパスに基づく研究 4.1 準備 4.2 テキストの観察 4.3 データのマークアップ 4.5 練習問題 II編 語 5章 連 語 5.1 頻度 5.2 平均と分散 5.3 仮説検定 5.4 相互情報量 5.5 連語とは何か 5.6 さらに学ぶために 6章 統計的推論:スパースなデータ上のn-グラムモデル 6.1 ビン:同値類の形成 6.2 統計的推定 6.3 推定値を組み合わせる 6.4 結論 6.5 さらに学ぶために 6.6 練習問題 7章 語義の曖昧性解消 7.1 方法論に関する準備 7.2 教師あり曖昧性解消 7.3 辞書に基づく曖昧性解消 7.4 教師なし曖昧性解消 7.5 単語の意味とは何か? 7.6 さらに学ぶために 7.7 練習問題 8章 語彙獲得 8.1 評価指標 8.2 動詞の下位範疇化 8.3 付加の曖昧性 8.4 選択選好 8.5 意味的類似性 8.6 統計的自然言語処理における語彙獲得の役割 8.7 さらに学ぶために III編 文 法 9章 マルコフモデル 9.1 マルコフモデル 9.2 隠れマルコフモデル 9.3 HMMについての三つの基本的な問題 9.4 HMM:実装,性質,変種 9.5 さらに学ぶために 10章 品詞のタグ付け 10.1 タグ付けのための情報源 10.2 マルコフモデルによるタグ付け器 10.3 隠れマルコフモデルによるタグ付け器 10.4 変換に基づくタグの学習 10.5 別の方法,英語以外の言語 10.6 タグ付けの正解率とタグ付け器の適用先 10.7 さらに学ぶために 10.8 練習問題 11章 確率文脈自由文法 11.1 PCFGのいくつかの特徴 11.2 PCFGの三つの基本的な問題 11.3 系列の確率 11.4 内側外側アルゴリズムの問題点 11.5 さらに学ぶために 11.6 練習問題 12章 確率的構文解析 12.1 いくつかの概念 12.2 いくつかのアプローチ 12.3 さらに学ぶために 12.4 練習問題 IV編 応用と技法 13章 統計的アライメントと機械翻訳 13.1 テキストアライメント 13.2 語のアライメント 13.3 統計的機械翻訳 13.4 さらに学ぶために 14章 クラスタリング 14.1 階層的クラスタリング 14.2 非階層的クラスタリング 14.2.1 K平均法 14.2.2 EMアルゴリズム 14.3 さらに学ぶために 14.4 練習問題 15章 情報検索におけるいくつかの話題 15.1 情報検索に関する背景知識 15.2 ベクトル空間モデル 15.3 タームの分布のモデル 15.4 潜在意味インデキシング 15.5 談話分割 15.6 さらに学ぶために 15.7 練習問題 16章 テキスト分類 16.1 決定木 16.2 最大エントロピーモデル 16.3 パーセプトロン 16.4 k最近傍分類 16.5 さらに学ぶために 簡易統計表 参考文献 訳者あとがき 索 引
1 統計的潜在意味解析とは(潜在的意味・トピックと潜在的共起性 潜在意味解析の歴史 ほか) 2 Latent Dirichlet Allocation(多項分布とDirichlet分布 LDAの生成過程 ほか) 3 学習アルゴリズム(統計的学習アルゴリズム サンプリング近似法 ほか) 4 潜在意味空間における回帰と識別(潜在意味空間における回帰問題 潜在意味空間における分類問題 ほか) 5 拡張モデル(相関構造のモデリング 系列データのモデリング-統語構造のモデリング ほか)
「なぜディープラーニングが形を区別できるのか」が見えてくる!Excelと対話しながらしくみを解き明かす画期的な超入門書!初めてのAI学習に最適!難しい数学計算はExcelに任せてディープラーニングのしくみを動かしながら理解できる! 1章 初めてのディープラーニング(畳み込みニューラルネットワークのしくみは簡単 AIとディープラーニング) 2章 Excelの確認とその応用(利用するExcel関数はたったの7個 Excelの参照形式 ほか) 3章 ニューロンモデル(神経細胞の働き 神経細胞の働きを数式表現 ほか) 4章 ニューラルネットワークのしくみ(読み物としてのニューラルネットワークのしくみ ニューラルネットワークが手書き文字を識別 ほか) 5章 畳み込みニューラルネットワークのしくみ(読み物としての畳み込み-ニューラルネットワークのしくみ 畳み込みニューラルネットワークが手書き数字を識別 ほか) 付録
1 はじめに 2 品詞解析と機械学習 3 句構造解析 4 依存構造解析 5 文法理論、深い構文解析 6 構文解析の応用 7 構文解析ツール 8 ツリーバンク
ディープラーニングの動作する数学の仕組みを解説。どの分野が必要かを知り、基本を理解し、どのように効いているかを学びます。 本書は、ディープラーニングを支え、ベースとなっている数学に焦点をあて、どのような仕組みで、どのように効いて、なぜ機能するのかの解説をしていきます。「ブラックボックス」と思われがちなディープラーニングの中身を理解していきます。 高校数学の知識を前提としながらも、必要な数学を復習しつつ、高校で習わない偏微分に関しては基本から必要な部分を解説して、ディープラーニングを支える数学の知識を学んでいきます。 「ディープラーニングという言葉は聞くが、どんなものなのか分からないので理解したい」「ブラックボックスと言われるディープラーニングの仕組みを知りたい」「ディープラーニングを学びたいけれど、数学の勉強のどこから手を付けていいか分からない」といった読者の興味に応える一冊です。 数学を学びながら、それがディープラーニングにどのように効いているのか分かることが重要です。その点を実感として理解することができれば、ディープラーニングの仕組みの本質が理解できたことにつながっていきます。そのためのディープラーニングの主要な概念の解説もしていきます。
「述語項構造解析」、「共参照・照応解析」、「談話構造解析」という自然言語テキストの文脈理解に関連した三つの解析についてまとめた専門書。この三つのトピックを対象に、解析手法そのものよりも、それぞれの解析がどのような問題を解こうとしているかや、関連する言語資源がどのような考えの下で作成されているかを中心に解説。 1 はじめに 2 述語項構造解析(述語項構造とは 述語項構造の定義 ほか) 3 共参照・照応解析(共参照と照応 共参照・照応解析 ほか) 4 談話構造解析(談話とは 談話の構成単位 ほか) 付録(統計的仮説検定の基礎と性質 自然言語処理における検定 ほか)
特集 統計的自然言語処理-ことばを扱う機械(ことばのモデル入門 言葉の個性をとらえるトピックモデル 創発する記号-ことばを知るロボット Pythonでword2vec 単語の意味をコンピュータに教える 自然言語の意味に対する2つのアプローチ-記号表現と分散表現 人間の翻訳、機械の翻訳 機械翻訳の現在と将来 自然言語処理のためのソフトウェア) 話題 ナンプレと魔方陣-作る・解く・数える(ナンプレの自動生成 ナンプレと統計物理-物理の研究者がナンプレを素人的に考えてみた 稀な事象のサンプリングと魔方陣 レプリカ交換モンテカルロ法とマルチカノニカル法 比熱の正体はフィッシャー情報量) 連載(正定値行列の情報幾何‐1 確率と論理を融合した確率モデリングへの道‐2) その他・小説(計算機で作る面白いナンプレ2 掌編小説・海に溺れて(2)対話)
Pythonを使ったテキストマイニングの入門書。テキストマイニングについては概要からに実例に至るまで一から解説を行っている。 Python 3を使ったテキストマイニングの入門書! 本書は、Pythonを使ったテキストマイニングの入門書です。Pythonのインストールから基本文法、ライブラリパッケージの使用方法などについてもていねいに解説していますので、Pythonに触れたことがない方でも問題なく使用できます。また、テキストマイニングも、概要から実例に至るまで一から解説していますので、Python・テキストマイニング両方の知識が全くない方にとって最適な入門書となっています。 第1章 テキストマイニングの概要 第2章 テキストデータの構造 第3章 Python の概要と実験の準備 第4章 出現頻度の統計の実際 第5章 テキストマイニングの様々な処理例 付録 Python, Jupyter notebook のインストール
本書は、Pythonでプログラミングをした経験のある読者が、 各種オープンソースソフトウェア(OSS)やライブラリを利用して、 自然言語処理を行うWebアプリケーションを作って動かし、自然言語処理を体験するための書籍です。 またその中で、自然言語処理に関連するさまざまな概念や手法、 簡単な理論についても学ぶことができ、本格的な学習の 前段階としても最適です。 本書の構成としては大きく2つの部に分かれており、 それぞれ以下のような内容を解説しています。 第1部:データの準備 ●テキストデータの収集 ●データベースへの格納 ●検索エンジンへの登録 第2部:データの解析 ●文法構造を調べる ●意味づけ ●知識データとの連係 全13章を順に追いながらWebアプリケーションを作っていくことで、 自然言語処理に関連するさまざまなテーマを学ぶことができます。 第0章 自然言語処理とは 第1部 データを準備しよう 第1章 実行環境を整えよう 1.1 実行環境の概要 1.2 実行環境の構成 1.3 Windows 10にUbuntuをインストールする 1.4 Linuxコマンドの使い方 1.5 Ubuntuへのソフトウェアのインストール方法 1.6 Pythonプログラムを実行してみる 第2章 テキストデータを収集しよう 2.1 データ収集とは 2.2 Webページのスクレイピング 2.3 テキストデータを抽出する 2.4 テキストデータのクレンジング 2.5 データ収集のプログラム 第3章 データベースに格納しよう 3.1 データベースを使った検索エンジン 3.2 データベースと検索エンジンの用途 3.3 データベースを使ってみる 3.4 Solrの設定とデータ登録 3.5 Solrを使った検索 第2部 テキストデータを解析しよう 第4章 構文解析をしよう 4.1 構文解析とは 4.2 構文解析の用途 4.3 係り受け構造とは 4.4 CaboChaのセットアップ 4.5 PythonからCaboChaを呼び出そう 4.6 係り受け構造の解析結果のSQLiteへの格納 第5章 テキストにアノテーションを付ける 5.1 アノテーションとは 5.2 アノテーションの用途 5.3 アノテーションのデータ構造 5.4 正規表現のパターンによるテキストデータの解析 5.5 精度指標:RecallとPrecision 5.6 アノテーションのSQLiteへの格納 5.7 正規表現の改良 5.8 チャンクを使わない抽出アルゴリズムを考える 第6章 アノテーションを可視化する 6.1 アノテーションを表示するWebアプリ 6.2 アノテーションを可視化する必要性 6.3 アノテーションツールbrat 6.4 Webアプリケーション 6.5 bratをWebアプリケーションに組み込もう 6.6 SQLiteからアノテーションを取得して表示する 第7章 単語の頻度を数えよう 7.1 テキストマイニングと単語の頻度 7.2 統計的手法の用途 7.3 単語の重要度とTF-IDF 7.4 文書間の類似度 7.5 言語モデルとN-gramモデル 7.6 クラスタリングとLDA 第8章 知識データを活用しよう 8.1 知識データと辞書 8.2 エンティティ 8.3 知識データを活用することでできること 8.4 SPARQLによるDBpediaからの情報の呼び出し 8.5 WordNetからの同義語・上位語の取得 8.6 Word2Vecを用いた類語の取得 第3部 テキストデータを活用するWebアプリケーションを作ろう 第9章 テキストを検索しよう 9.1 Solrを使った検索Webアプリケーション 9.2 検索の用途 9.3 転置インデックス 9.4 プログラムからのSolrの検索 9.5 Solrへのアノテーションデータの登録 9.6 検索結果のWebアプリケーションでの表示 9.7 検索時の同義語展開 9.8 アノテーションでの検索 第10章 テキストを分類しよう 10.1 テキスト分類とは 10.2 テキスト分類の用途 10.3 特徴量と特徴量抽出 10.4 ルールベースによるテキスト分類 10.5 教師あり学習によるテキスト分類 10.6 ディープラーニングによるテキスト分類 10.7 分類結果のWebアプリケーションでの表示 第11章 評判分析をしよう 11.1 評判分析とは 11.2 評判分析技術の用途 11.3 辞書を用いた特徴量抽出 11.4 TRIEを用いた辞書内語句マッチ 11.5 教師あり学習による評判分析 11.6 評判分析の結果を表示するWebアプリケーション 第12章 テキストからの情報抽出 12.1 情報抽出とは 12.2 情報抽出技術の用途 12.3 関係のアノテーション 12.4 正規表現を用いた関係抽出 12.5 係り受け構造を用いた関係抽出 12.6 抽出した関係をSolrに登録 12.7 抽出した関係を表示するWebアプリケーション 第13章 系列ラベリングに挑戦しよう 13.1 系列ラベリングとその特徴 13.2 系列ラベリングの用途 13.3 CRF(条件付き確率場) 13.4 系列ラベリング用の学習データ 13.5 CRF++を用いた学習 13.6 CRF++の出力のアノテーションへの変換 13.7 CRF++で付けたアノテーションをSolrで検索する 付録 A.1 Wikipediaのダンプデータを使う A.2 PDF、Wordファイル、Excelファイルを使う
本書は、言語研究者の関心に即したプログラミングの入門書です。近年、注目を集めているPythonを取り上げ、英語や日本語の言語分析のための具体的な処理例が多数収録されています。フィールドワークでも実験研究でもコーパス研究でも、電子テキストを使ったあらゆるタイプの研究者にすぐに実践できるテクニックを紹介しています。本書を通じてプログラミング処理が持つ威力を実感し、自分の研究に活用してください。
ディープラーニングの発展・応用手法を実装しながら学ぼう 本書ではディープラーニングの発展・応用手法を実装しながら学習していきます。ディープラーニングの実装パッケージとしてPyTorchを利用します。扱うタスク内容とディープラーニングモデルは次の通りで「ビジネスの現場でディープラーニングを活用するためにも実装経験を積んでおきたいタスク」という観点で選定しました。 [本書で学習できるタスク] 転移学習、ファインチューニング:少量の画像データからディープラーニングモデルを構築 物体検出(SSD):画像のどこに何が映っているのかを検出 セマンティックセグメンテーション(PSPNet):ピクセルレベルで画像内の物体を検出 姿勢推定(OpenPose):人物を検出し人体の各部位を同定しリンク GAN(DCGAN、Self-Attention GAN):現実に存在するような画像を生成 異常検知(AnoGAN、Efficient GAN):正常画像のみからGANで異常画像を検出 自然言語処理(Transformer、BERT):テキストデータの感情分析を実施 動画分類(3DCNN、ECO):人物動作の動画データをクラス分類 本書は第1章から順番に様々なタスクに対するディープラーニングモデルの実装に取り組むことで高度かつ応用的な手法が徐々に身につく構成となっています。各ディープラーニングモデルは執筆時点でState-of-the-Art(最高性能モデル)の土台となっており、実装できるようになればその後の研究・開発に役立つことでしょう。 ディープラーニングの発展・応用手法を楽しく学んでいただければ幸いです。 実装環境 ・読者のPC(GPU環境不要)、AnacondaとJupyter Notebook、AWSを使用したGPUサーバー ・AWSの環境:p2.xlargeインスタンス、Deep Learning AMI(Ubuntu)マシンイメージ(OS Ubuntu 16.04|64ビット、NVIDIA K80 GPU、Python 3.6.5、conda 4.5.2、PyTorch 1.0.1) 第1章 画像分類と転移学習(VGG) 1.1 学習済みのVGGモデルを使用する方法 1.2 PyTorchによるディープラーニング実装の流れ 1.3 転移学習の実装 1.4 Amazon AWSのクラウドGPUマシンを使用する方法 1.5 ファインチューニングの実装 第2章 物体検出(SSD) 2.1 物体検出とは 2.2 Datasetの実装 2.3 DataLoaderの実装 2.4 ネットワークモデルの実装 2.5 順伝搬関数の実装 2.6 損失関数の実装 2.7 学習と検証の実施 2.8 推論の実施 第3章 セマンティックセグメンテーション(PSPNet) 3.1 セマンティックセグメンテーションとは 3.2 DatasetとDataLoaderの実装 3.3 PSPNetのネットワーク構成と実装 3.4 Featureモジュールの解説と実装 3.5 Pyramid Poolingモジュールの解説と実装 3.6 Decoder、AuxLossモジュールの解説と実装 3.7 ファインチューニングによる学習と検証の実施 3.8 セマンティックセグメンテーションの推論 第4章 姿勢推定(OpenPose) 4.1 姿勢推定とOpenPoseの概要 4.2 DatasetとDataLoaderの実装 4.3 OpenPoseのネットワーク構成と実装 4.4 Feature、Stageモジュールの解説と実装 4.5 TensorBoardXを使用したネットワークの可視化手法 4.6 OpenPoseの学習 4.7 OpenPoseの推論 第5章 GANによる画像生成(DCGAN、Self-Attention GAN) 5.1 GANによる画像生成のメカニズムとDCGANの実装 5.2 DCGANの損失関数、学習、生成の実装 5.3 Self-Attention GANの概要 5.4 Self-Attention GANの学習、生成の実装 第6章 GANによる異常検知(AnoGAN、Efficient GAN) 6.1 GANによる異常画像検知のメカニズム 6.2 AnoGANの実装と異常検知の実施 6.3 Efficient GANの概要 6.4 Efficient GANの実装と異常検知の実施 第7章 自然言語処理による感情分析(Transformer) 7.1 形態素解析の実装(Janome、MeCab+NEologd) 7.2 torchtextを用いたDataset、DataLoaderの実装 7.3 単語のベクトル表現の仕組み(word2vec、fastText) 7.4 word2vec、fastTextで日本語学習済みモデルを使用する方法 7.5 IMDb(Internet Movie Database)のDataLoaderを実装 7.6 Transformerの実装(分類タスク用) 7.7 Transformerの学習・推論、判定根拠の可視化を実装 第8章 自然言語処理による感情分析(BERT) 8.1 BERTのメカニズム 8.2 BERTの実装 8.3 BERTを用いたベクトル表現の比較(bank:銀行とbank:土手) 8.4 BERTの学習・推論、判定根拠の可視化を実装 第9章 動画分類(3DCNN、ECO) 9.1 動画データに対するディープラーニングとECOの概要 9.2 2D Netモジュール(Inception-v2)の実装 9.3 3D Netモジュール(3DCNN)の実装 9.4 Kinetics動画データセットをDataLoaderに実装 9.5 ECOモデルの実装と動画分類の推論実施
AIブームでニーズが急上昇!形態素解析の理論と実装を,技術者向けて網羅的に解説!! C++11による実装方法も掲載 あの工藤 拓が具体的に解説 !! 本書は,汎用形態素解析システムMeCabを開発した著者が、言語において意味を成す最小の要素である「形態素」の解析方法について,技術者向けにその理論や実装方法を網羅的,体系的に解説する.実装や高速化なども扱う点がユニークであるが、辞書やコーパスなどの言語資源の構築・利用といった形態素解析では外せないテーマもきちんと解説している. 本書を読めば,解析ツールを「ブラックボックス」として使っている人も中身を理解したうえで拡張・改良できる道筋ができ,ひいては独自の辞書の作成を目指せるようになる.C++11を使った具体的な実装方法も掲載.AI・自然言語処理関係の技術者,研究者には必携の書である. 汎用形態素解析システムMeCabを開発した著者が、言語において意味を成す最小の要素である形態素の解析方法について,技術者向けにその理論や実装方法を網羅的,体系的に解説.AI・自然言語処理関係の技術者,研究者必携 1.形態素解析の概要 2.言語資源 3.テキスト処理の基礎 4.辞書引きアルゴリズム 5.最小コスト法 6.点予測 7.未知語処理 8.評価 9.高度な解析
大学で学ぶ数学の基礎知識とPythonコードを紐づけて機械学習の基本を学べる! 数学の基礎知識とPythonコードを紐づけて機械学習の基本を学べる! 【本書の目的】 現在、人工知能関連のプロダクト・サービスが数多く見受けられるようになりました。 人工知能関連の開発に機械学習の基礎知識は必須です。 本書はそうした機械学習の基礎知識を学びたいエンジニアに向けた書籍です。 【本書の特徴】 本書は機械学習の基本について、数学の知識をもとに、 実際にPythonでプログラムしながら学ぶことができる書籍です。 ・最新のPython 3.7に対応 ・学習内容を「要点整理」で復習 ・数式とコードをつなげたわかりやすい解説 【読者が得られること】 本書を読み終えた後には、機械学習のしくみとプログラミング手法を理解できます。 【対象読者】 機械学習の基礎を学びたい理工学生・エンジニア 【目次】 第1章 機械学習の準備 第2章 Pythonの基本 第3章 グラフの描画 第4章 機械学習に必要な数学の基本 第5章 教師あり学習:回帰 第6章 教師あり学習:分類 第7章 ニューラルネットワーク・ディープラーニング 第8章 ニューラルネットワーク・ディープラーニングの応用(手書き数字の認識) 第9章 教師なし学習 第10章 要点のまとめ 第1章 機械学習の準備 1.1 機械学習について 1.2 Pythonのインストール 1.3 Jupyter Notebook 1.4 KerasとTensorFlowのインストール 第2章 Pythonの基本 2.1 四則演算 2.2 変数 2.3 型 2.4 print文 2.5 list(リスト、配列変数) 2.6 tuple(タプル) 2.7 if文 2.8 for文 2.9 ベクトル 2.10 行列 2.11 行列(ndarray)の四則演算 2.12 スライシング 2.13 条件を満たすデータの書き換え 2.14 Help 2.15 関数 2.16 ファイル保存 第3章 グラフの描画 3.1 2次元のグラフを描く 3.2 3次元のグラフを描く 第4章 機械学習に必要な数学の基本 4.1 ベクトル 4.2 和の記号 4.3 積の記号 4.4 微分 4.5 偏微分 4.6 行列 4.7 指数関数と対数関数 第5章 教師あり学習:回帰 5.1 1次元入力の直線モデル 5.2 2次元入力の面モデル 5.3 D次元線形回帰モデル 5.4 線形基底関数モデル 5.5 オーバーフィッティングの問題 5.6 新しいモデルの生成 5.7 モデルの選択 5.8 まとめ 第6章 教師あり学習:分類 6.1 1次元入力2クラス分類 6.2 2次元入力2クラス分類 6.3 2次元入力3クラス分類 第7章 ニューラルネットワーク・ディープラーニング 7.1 ニューロンモデル 7.2 ニューラルネットワークモデル 7.3 Kerasでニューラルネットワークモデル 第8章 ニューラルネットワーク・ディープラーニングの応用(手書き数字の認識) 8.1 MNISTデータベース 8.2 2層フィードフォワードネットワークモデル 8.3 ReLU活性化関数 8.4 空間フィルター 8.5 畳み込みニューラルネットワーク 8.6 プーリング 8.7 ドロップアウト 8.8 集大成のMNIST認識ネットワークモデル 第9章 教師なし学習 9.1 2次元入力データ 9.2 K-means法 9.3 混合ガウスモデル 第10章 要点のまとめ 要点のまとめ
東大 松尾研究室が提供するあの人気講座が待望の書籍化! 本書は、2017年と2018年に東京大学で実施された「グローバル消費インテリジェンス寄付 講座」の学生向けオフライン講義と、社会人向けオンライン講座で使われた教材がベースになっています。 約400名ほどの受講枠(2年間)に、のべ1,800人以上の応募があった人気の講義です。この本のベースとなるコンテンツはJupyter Notebook形式で公開されていますが、この内容をさらに精査、ブラッシュアップし、読みやすく整えたものが本書になります。 ●本書の内容 本書には、データサイエンティストになるための基礎をつめこんでいます。データサイエンティストは、Pythonや確率・統計、機械学習など、幅広くさまざまな分野の知識を必要とします。 すべての分野を1冊で学ぶことは無理ですので、各分野で深入りはせず基礎的な事項を取り扱っています。データサイエンティストになるための地図と羅針盤のような位置づけとなることをイメージしています。 この本は主にPython 3を使って、基本的なプログラムの書き方、データの取得、読み込み、そのデータ操作からはじまり、さまざまなPythonのライブラリの使い方、確率統計の手法、機械学習(教師あり学習、教師なし学習とチューニング)の使い方についても学びます。取り扱っているデータは、マーケティングに関するデータやログデータ、金融時系列データなどさまざまで、モデリングの前にそれらを加工する手法も紹介しています。データサイエンティストになるには、どれも必要なスキルです。 本書には、さらに以下の3つの特徴があります。 ・実際のデータを使って手を動かしながら、データサイエンスのスキルを身に付けることができる ・データ分析の現場で使える実践的な内容(データ前処理など)が含まれている ・練習問題や総合問題演習など実際に頭を使って考える内容がたくさんある この本に書いてあることを実践し、読み終えた後には、実際の現場でデータ分析ができるようになるはずです。 ●この本の対象読者 この本は、プログラミングの経験があり、理系の大学1~2年生程度の教養課程の数学(線形代数、微分積分学、確率統計の基礎など)を終えている方を対象にしています。具体的には、勉強熱心な大学3~4年生の理系の学生さんや大学院生の方、また社会人になってデータサイエンスを学ぼうという意欲の高い方たちが対象です。データサイエンスの入門レベルから中級レベルの手前までを考えている人に最適で、本書のゴールもデータサイエンス入門レベルを卒業できることを想定しています。 "Contents Chapter 1 本書の概要とPythonの基礎 1-1 データサイエンティストの仕事 1-1-1 データサイエンティストの仕事 1-1-2 データ分析のプロセス 1-1-3 本書の構成 1-1-4 本書を読み進めるのに役立つ文献 1-1-5 手を動かして習得しよう 1-2 Pythonの基礎 1-2-1 Jupyter Notebookの使い方 1-2-2 Pythonの基礎 1-2-3 リストと辞書型 1-2-4 条件分岐とループ Column format記法と%記法 1-2-5 関数 Practice 練習問題1-1 Practice 練習問題1-2 1-2-6 クラスとインスタンス Practice 1章 総合問題 Chapter 2 科学計算、データ加工、グラフ描画ライブラリの使い方の基礎 2-1 データ分析で使うライブラリ 2-1-1 ライブラリの読み込み 2-1-2 マジックコマンド 2-1-3 この章で使うライブラリのインポート 2-2 Numpyの基礎 2-2-1 Numpyのインポート 2-2-2 配列操作 2-2-3 乱数 Column Numpyは高速 2-2-4 行列 Practice 練習問題2-1 練習問題2-2 練習問題2-3 2-3 Scipyの基礎 2-3-1 Scipyのライブラリのインポート 2-3-2 行列計算 2-3-3 ニュートン法 Practice 練習問題2-4 練習問題2-5 練習問題2-6 2-4 Pandasの基礎 2-4-1 Pandasのライブラリのインポート 2-4-2 Seriesの使い方 2-4-3 DataFrameの使い方 2-4-4 行列操作 2-4-5 データの抽出 2-4-6 データの削除と結合 2-4-7 集計 2-4-8 値のソート 2-4-9 nan(null)の判定 Practice 練習問題2-7 Practice 練習問題2-8 Practice 練習問題2-9 2-5 Matplotlibの基礎 2-5-1 Matplotlibを使うための準備 2-5-2 散布図 2-5-3 グラフの分割 2-5-4 関数グラフの描画 2-5-5 ヒストグラム Column さまざまなデータのビジュアル化 Practice 練習問題2-10 Practice 練習問題2-11 Practice 練習問題2-12 Practice 2章 総合問題 Chapter 3 記述統計と単回帰分析 3-1 統計解析の種類 3-3-1 記述統計と推論統計 3-3-2 この章で使うライブラリのインポート 3-2 データの読み込みと対話 3-2-1 インターネットなどで配布されている対象データの読み込み 3-2-2 データの読み込みと確認 3-2-3 データの性質を確認する Column 「変数」という用語について 3-2-4 量的データと質的データ 3-3 記述統計 3-3-1 ヒストグラム 3-3-2 平均、中央値、最頻値 3-3-3 分散と標準偏差 3-3-4 要約統計量とパーセンタイル値 3-3-5 箱ひげ図 3-3-6 変動係数 3-3-7 散布図と相関係数 3-3-8 すべての変数のヒストグラムや散布図を描く Practice 練習問題3-1 Practice 練習問題3-2 Practice 練習問題3-3 3-4 単回帰分析 3-4-1 線形単回帰分析 3-4-2 決定係数 Practice 練習問題3-4 Practice 練習問題3-5 Practice 練習問題3-6 Practice 3章 総合問題 Chapter 4 確率と統計の基礎 4-1 確率と統計を学ぶ準備 4-1-1 この章の前提知識 4-1-2 この章で使うライブラリのインポート 4-2 確率 4-2-1 数学的確率 4-2-2 統計的確率 4-2-3 条件付き確率と乗法定理 4-2-4 独立と従属 4-2-5 ベイズの定理 Practice 練習問題4-1 Practice 練習問題4-2 Practice 練習問題4-3 4-3 確率変数と確率分布 4-3-1 確率変数、確率関数、分布関数、期待値 4-3-2 さまざまな分布関数 4-3-3 カーネル密度関数 Practice 練習問題4-4 Practice 練習問題4-5 Practice 練習問題4-6 4-4 応用:多次元確率分布 4-4-1 同時確率関数と周辺確率関数 4-4-2 条件付き確率関数と条件付き期待値 4-4-3 独立の定義と連続分布 4-5 推計統計学 4-5-1 大数の法則 4-5-2 中心極限定理 4-5-3 標本分布 Practice 練習問題4-7 Practice 練習問題4-8 Practice 練習問題4-9 4-6 統計的推定 4-6-1 推定量と点推定 4-6-2 不偏性と一致性 4-6-3 区間推定 4-6-4 推定量を求める Practice 練習問題4-10 Practice 練習問題4-11 Practice 練習問題4-12 4-7 統計的検定 4-7-1 検定 4-7-2 第1種の過誤と第2種の過誤 4-7-3 ビッグデータに対する検定の注意 Practice 練習問題4-13 Practice 4章 総合問題 Chapter 5 Pythonによる科学計算(NumpyとScipy) 5-1 概要と事前準備 5-1-1 この章の概要 5-1-2 この章で使うライブラリのインポート 5-2 Numpyを使った計算の応用 5-2-1 インデックス参照 Practice 練習問題5-1 Practice 練習問題5-2 Practice 練習問題5-3 5-2-2 Numpyの演算処理 Practice 練習問題5-4 Practice 練習問題5-5 Practice 練習問題5-6 5-2-3 配列操作とブロードキャスト Practice 練習問題5-7 Practice 練習問題5-8 Practice 練習問題5-9 5-3 Scipyを使った計算の応用・ 5-3-1 補間 5-3-2 線形代数:行列の分解 Practice 練習問題5-10 Practice 練習問題5-11 Practice 練習問題5-12 Practice 練習問題5-13 Practice 練習問題5-14 5-3-3 積分と微分方程式 Practice 練習問題5-15 Practice 練習問題5-16 5-3-4 最適化 Practice 練習問題5-17 Practice 練習問題5-18 Practice 5章 総合問題 Chapter 6 Pandasを使ったデータ加工処理 6-1 概要と事前準備 6-1-1 この章で使うライブラリのインポート 6-2 Pandasの基本的なデータ操作 6-2-1 階層型インデックス Practice 練習問題6-1 Practice 練習問題6-2 Practice 練習問題6-3 6-2-2 データの結合 Practice 練習問題6-4 練習問題6-5 練習問題6-6 6-2-3 データの操作と変換 Practice 練習問題6-7 Practice 練習問題6-8 Practice 練習問題6-9 6-2-4 データの集約とグループ演算 Practice 練習問題6-10 Practice 練習問題6-11 Practice 練習問題6-12 6-3 欠損データと異常値の取り扱いの基礎 6-3-1 欠損データの扱い方 Practice 練習問題6-13 Practice 練習問題6-14 Practice 練習問題6-15 6-3-2 異常データの扱い方 6-4 時系列データの取り扱いの基礎 6-4-1 時系列データの処理と変換 Practice 練習問題6-16 6-4-2 移動平均 Practice 練習問題6-17 Practice 6章 総合問題 Chapter 7 Matplotlibを使ったデータ可視化 7-1 データの可視化 7-1-1 データの可視化について 7-1-2 この章で使うライブラリのインポート 7-2 データ可視化の基礎 7-2-1 棒グラフ 7-2-2 円グラフ Practice 練習問題7-1 Practice 練習問題7-2 Practice 練習問題7-3 7-3 応用:金融データの可視化 7-3-1 可視化する金融データ 7-3-2 ローソクチャートを表示するライブラリ 7-4 応用:分析結果の見せ方を考えよう 7-4-1 資料作成のポイントについて Practice 7章 総合問題 Column 移動平均時系列データと対数時系列データ Chapter 8 機械学習の基礎(教師あり学習) 8-1 機械学習の全体像 8-1-1 機械学習とは 8-1-2 教師あり学習 8-1-3 教師なし学習 8-1-4 強化学習 8-1-5 この章で使うライブラリのインポート 8-2 重回帰 8-2-1 自動車価格データの取り込み 8-2-2 データの整理 8-2-3 モデル構築と評価 8-2-4 モデル構築とモデル評価の流れのまとめ Practice 練習問題8-1 8-3 ロジスティック回帰 8-3-1 ロジスティック回帰の例 8-3-2 データの整理 8-3-3 モデル構築と評価 8-3-4 スケーリングによる予測精度の向上 Practice 練習問題8-2 Practice 練習問題8-3 8-4 正則化項のある回帰:ラッソ回帰、リッジ回帰 8-4-1 ラッソ回帰、リッジ回帰の特徴 8-4-2 重回帰とリッジ回帰の比較 Practice 練習問題8-4 8-5 決定木 8-5-1 キノコデータセット 8-5-2 データの整理 8-5-3 エントロピー:不純度の指標 8-5-4 情報利得:分岐条件の有益さを測る 8-5-5 決定木のモデル構築 Practice 練習問題8-5 8-6 k-NN(k近傍法) 8-6-1 k-NNのモデル構築 Practice 練習問題8-6 Practice 練習問題8-7 8-7 サポートベクターマシン 8-7-1 サポートベクターマシンのモデル構築 Practice 練習問題8-8 Practice 8章 総合問題 Chapter 9 機械学習の基礎(教師なし学習) 9-1 教師なし学習 9-1-1 教師なしモデルの種類 9-1-2 この章で使うライブラリのインポート 9-2 クラスタリング 9-2-1 k-means法 9-2-2 k-means法でクラスタリングする 9-2-3 金融マーケティングデータをクラスタリングする 9-2-4 エルボー法によるクラスター数の推定 9-2-5 クラスタリング結果の解釈 9-2-6 k-means法以外の手法 Practice 練習問題9-1 9-3 主成分分析 9-3-1 主成分分析を試す 9-3-2 主成分分析の実例 Practice 練習問題9-2 9-4 マーケットバスケット分析とアソシエーションルール 9-4-1 マーケットバスケット分析とは 9-4-2 マーケットバスケット分析のためのサンプルデータを読み込む 9-4-3 アソシエーションルール Practice 9章 総合問題 Chapter 10 モデルの検証方法とチューニング方法 10-1 モデルの評価と精度を上げる方法とは 10-1-1 機械学習の課題とアプローチ 10-1-2 この章で使うライブラリのインポート 10-2 モデルの評価とパフォーマンスチューニング 10-2-1 ホールドアウト法と交差検証法 10-2-2 パフォーマンスチューニング:ハイパーパラメータチューニング Practice 練習問題10-1 Practice 練習問題10-2 10-2-3 パフォーマンスチューニング:特徴量の扱い 10-2-4 モデルの種類 10-3 モデルの評価指標 10-3-1 分類モデルの評価:混同行列と関連指標 10-3-2 分類モデルの評価:ROC曲線とAUC Practice 練習問題10-3 10-3-3 回帰モデルの評価指標 Practice 練習問題10-4 10-4 アンサンブル学習 10-4-1 バギング Practice 練習問題10-5 10-4-2 ブースティング 10-4-3 ランダムフォレスト、勾配ブースティング Practice 練習問題10-6 10-4-4 今後の学習に向けて Practice 練習問題10-7 Practice 10 章 総合問題 Chapter 11 総合演習問題 11-1 総合演習問題 11-1-1 総合演習問題(1) 11-1-2 総合演習問題(2) 11-1-3 総合演習問題(3) 11-1-4 総合演習問題(4) 11-1-5 総合演習問題(5) 11-1-6 総合演習問題(6) 11-1-7 参考:今後のデータ分析に向けて Appendix A-1 本書の環境構築について A-1-1 Anacondaについて A-1-2 Anacondaのパッケージをダウンロードする A-1-3 Anacondaをインストールする A-1-4 pandas-datareaderおよびPlotlyのインストール A-2 練習問題解答 A-2-1 Chapter1 練習問題 A-2-2 Chapter2 練習問題 A-2-3 Chapter3 練習問題 A-2-4 Chapter4 練習問題 A-2-5 Chapter5 練習問題 A-2-6 Chapter6 練習問題 A-2-7 Chapter7 練習問題 A-2-8 Chapter8 練習問題 A-2-9 Chapter9 練習問題 A-2-10 Chapter10 練習問題 A-2-11 Chapter11 総合演習問題 Column ダミー変数と多重共線性 A-3 参考文献・参考URL A-3-1 参考文献 A-3-2 参考URL