【2023最新】「テキストマイニング」のおすすめ本!人気ランキング

この記事では、「テキストマイニング」のおすすめ本をランキング形式で紹介していきます。インターネット上の口コミや評判をベースに集計し独自のスコアでランク付けしています。
記事内に商品プロモーションを含む場合があります
目次
  1. Pythonによるテキストマイニング入門
  2. 機械学習・深層学習による自然言語処理入門 ~scikit-learnとTensorFlowを使った実践プログラミング~ (Compass Data Science)
  3. 入門 自然言語処理
  4. 言語処理のための機械学習入門 (自然言語処理シリーズ)
  5. ゼロから作るDeep Learning ❷ ―自然言語処理編
  6. 深層学習による自然言語処理 (機械学習プロフェッショナルシリーズ)
  7. テキストデータの統計科学入門
  8. 岩波データサイエンス Vol.2
  9. Excelで学ぶテキストマイニング入門
  10. Rによるテキストマイニング入門
他27件
No.1
100

Pythonを使ったテキストマイニングの入門書。テキストマイニングについては概要からに実例に至るまで一から解説を行っている。 Python 3を使ったテキストマイニングの入門書! 本書は、Pythonを使ったテキストマイニングの入門書です。Pythonのインストールから基本文法、ライブラリパッケージの使用方法などについてもていねいに解説していますので、Pythonに触れたことがない方でも問題なく使用できます。また、テキストマイニングも、概要から実例に至るまで一から解説していますので、Python・テキストマイニング両方の知識が全くない方にとって最適な入門書となっています。 第1章 テキストマイニングの概要 第2章 テキストデータの構造 第3章 Python の概要と実験の準備 第4章 出現頻度の統計の実際 第5章 テキストマイニングの様々な処理例 付録 Python, Jupyter notebook のインストール

みんなのレビュー
まだレビューはありません
No.3
92

入門 自然言語処理

Steven Bird
オライリージャパン

自然言語処理の概念から実践までを詳説

みんなのレビュー
まだレビューはありません
No.5
88

自然言語処理編

みんなのレビュー
ゼロから分かるディープラーニングシリーズはどれも非常に分かりやすい。こちらの自然言語処理編は前作を読みディープラーニングの基本を理解してより高度なアーキテクチャを学びたいと思った時にオススメ。レベルは少々上がっているがそれでも分かりやすく学べる。RNNやLSTMなどが学べる
No.7
68

ウェブや電子メールに代表されるように、テキストデータが大量に流通、蓄積されるようになった。文字列で記述されたデータの山から情報や知識を探し出すテキストマイニングの手法がさまざまな分野で必要になってきている。テキスト化された顧客の声から新たなニーズを抽出したり、迷惑メールを自動判別するなど、実用的な場面ですでに多くの活用がなされている。また、学術的な場面でも計量言語学やゲノム解析といった分野を中心に、強力な研究手段となっている。このように幅広い分野で共通に用いられる統計的テキストマイニングの知識とスキルを、フリーのソフトウェアと具体例を用いた実践で身につけるのが本書の目的である。統計的テキストデータ解析に焦点を絞り、初歩的な統計学の解説からはじめて、近年提案されたデータマイニング手法まで紹介している。そのおもな内容は文系・理系を問わず理解できるだろう。 統計的テキストマイニング テキストのクリーニングと関連ツール 形態素解析と構文解析 テキストにおける集計モデルと集計ツール テキストにおける統計法則と指標 テキストにおけるネットワーク分析 テキストの探索的分析 テキストにおける確率モデリング テキストと情報量 テキストにおける推測分析 テキストにおける差異の分析と特徴抽出 テキストの特徴と話題分析 テキストのクラスター分析 テキストの分類 テキストの時系列分析 アソシエイション分析と意味処理

みんなのレビュー
まだレビューはありません
No.8
68

岩波データサイエンス Vol.2

岩波データサイエンス刊行委員会
岩波書店

特集 統計的自然言語処理-ことばを扱う機械(ことばのモデル入門 言葉の個性をとらえるトピックモデル 創発する記号-ことばを知るロボット Pythonでword2vec 単語の意味をコンピュータに教える 自然言語の意味に対する2つのアプローチ-記号表現と分散表現 人間の翻訳、機械の翻訳 機械翻訳の現在と将来 自然言語処理のためのソフトウェア) 話題 ナンプレと魔方陣-作る・解く・数える(ナンプレの自動生成 ナンプレと統計物理-物理の研究者がナンプレを素人的に考えてみた 稀な事象のサンプリングと魔方陣 レプリカ交換モンテカルロ法とマルチカノニカル法 比熱の正体はフィッシャー情報量) 連載(正定値行列の情報幾何‐1 確率と論理を融合した確率モデリングへの道‐2) その他・小説(計算機で作る面白いナンプレ2 掌編小説・海に溺れて(2)対話)

みんなのレビュー
まだレビューはありません
No.9
68

形態素解析ツール「茶筌」とExcelではじめるテキストマイニング商品開発の事例を使いながら実践的なテキストデータ分析を体験。 第1章 テキストマイニングの基礎 第2章 自由文の手作業によるテキストマイニング 第3章 形態素解析によるテキストのキーワード化 第4章 定型自由文のテキストマイニング 第5章 テキストから因果関係を探る 第6章 形態素解析による定型自由文のカテゴリ化 第7章 より高度なテキストマイニング

みんなのレビュー
まだレビューはありません
No.10
67

電子化されたテキストの中から、有益な情報を探し出すテキストマイニング。ソフトのインストールから実際の解析まですべてフリーでできる。 第1章 テキストマイニングとは何か 第2章 テキストマイニングの準備 第3章 Rに慣れる 第4章 MeCabとRMeCab 第5章 RMeCabによるテキスト解析 第6章 インターネット上のクチコミ情報の分析 第7章 アンケートの自由記述文の分析 第8章 沖縄観光のアンケートの分析 第9章 テキストの自動分類 第10章 書き手の判別

みんなのレビュー
まだレビューはありません
No.12
67

「テキストマイニングに必要な知識とはなんだろう?」という素朴な疑問に直球でお答えする入門書。 「テキストマイニングに必要な知識とはなんだろう?」 素朴な疑問に答えたテキストマイニング入門書の決定版!  本書は、「テキストマイニングに必要な知識とはなんだろう?」という素朴な疑問に直球でお答えする入門書です。テキストマイニング自体に注力して、わかりやすく解説しています。  単なるツールの説明にならないように、言語学や社会調査法の理論についても前半でていねいにふれ、さまざまな用途に応じたデータの視覚化手法を盛り込みます。また、テキスト分析やデータ分析のためのファイルの作り方についても詳しく説明します。 Part Ⅰ 基礎編 第1章 テキストマイニング入門 第2章 テキストマイニングの理論的枠組み Part Ⅱ 準備編 第3章 分析データの準備 第4章 データ分析の基本 第5章 データの可視化. Part Ⅲ 実践編 第6章 基本的なテキスト分析 第7章 発展的なテキスト分析 第8章 基本的な統計処理 第9章 発展的な統計処理 第10章 英語テキストの分析

みんなのレビュー
まだレビューはありません
No.13
67

第1部 テキスト分析(テキスト分析の概要 言語の特徴を考慮したカテゴリ作成 カテゴリのカスタマイズに役立つ機能) 第2部 IBM SPSS Text Analytics for Surveysの操作(インターフェース 分析のステップとプロジェクト 抽出パネル リソースエディタ カテゴリパネル テキスト分析パッケージの保存と新規作成 定義済みカテゴリのインポート) 第3部 統計解析(基本的な解析 多変量解析の活用)

みんなのレビュー
まだレビューはありません
No.14
67
みんなのレビュー
まだレビューはありません
No.15
67

技術面での今後の発展可能性を示した 第1章 テキストマイニングとは何か  1.1 分析の技術としてのテキストマイニング  1.2 類似技術との比較—単なる検索や分類整理と何が違うか—  1.3 テキストマイニングの基本的な仕組み  1.4 テキストマイニングの自然言語処理  1.5 テキストマイニングにおけるマイニング処理  1.6 第1章のまとめ 第2章 テキストマイニングの適用例と効果  2.1 テキストマイニングの適用対象  2.2 コールセンターにおけるコンタクト履歴への適用例  2.3 インバウンドコールセンター(PCヘルプセンター)のコンタクト履歴のテキストマイニング  2.4 アウトバウンドセールスセンターのコンタクト履歴のテキストマイニング  2.5 第2章のまとめ 第3章 テキストマイニングの理想的な使い方  3.1 経営戦略としてのテキストマイニング  3.2 テキストマイニングの位置付け —誰が何のために行うのか—  3.3 情報の適切な共有  3.4 データを活かすことを意識したデータ収集  3.5 テキストマイニングの適用形態  3.6 第3章のまとめ 第4章 テキストマイニングに対する疑問への回答  4.1 どんなデータでも結果が必ず出るものか?  4.2 テキストマイニングの効果をどう判断すべきか?  4.3 テキストマイニングの結果はあてになるか?  4.4 辞書のメンテナンスが大変だからつかいこなせないというのは本当か?  4.5 テキストマイニングの分析に適正やコツがあるか?  4.6 テキストマイニングは文書の意味をどこまで把握できるのか? 第5章 テキストマイニングの今後  5.1 感情・評価・態度の分析技術  5.2 発話内容の分析技術(自動音声認識結果のテキストマイニング)  5.3 どうなるべきか—テキストマイニングの活用動向— 参考文献 索 引

みんなのレビュー
まだレビューはありません
No.16
67

コーパスとテキストマイニング 金融テキストマイニングの紹介 テキストマイニングを用いた医療専門職のクセの可視化およびその活用 自由記述によるアンケート調査からことばの地域差を探る 文章の書き手の特徴情報と書き手の識別 テキストの多様性をとらえる分類指標-体系化の試み テキストマイニングと付加的な情報の組合せによるニーズ分析支援 政治テキストの計量分析 ブランドマネジメントにおける自由回答データの活用-競争環境の変容を把握するカテゴリー・トレンドマップ分析 社会調査における計量テキスト分析の手順と実際-アンケートの自由回答を中心に〔ほか〕

みんなのレビュー
まだレビューはありません
No.17
67

近年、計読(テキストマイニング、テキストアナリティクス、計量テキスト分析、質的データ分析)は人文・社会科学の多岐にわたる領域で応用が進みつつある。本書は単なるハウツーではなく、具体的な課題に計読の諸技法を本格的に適用した研究成果を集めた。思想史・概念史、学説研究、ジャーナリズム言説の分析、研究者ネットワークの分析など、研究会での議論を通じた切磋琢磨を経て、現代日本の計読研究の規準を提示する。 執筆者:河野静香、左古輝人、鈴木努、橋本直人、樋熊亜衣、前田一歩 序 1. 計読の提案 2. オープンソースの形態素解析器と計読ソフトウェアの展開 3. 計読私譚―1990年代半ば 4. 計読私譚―1990年代終わり 5. 計読にかかわる素朴な疑問―2000年代以降 6. 計読コミュニティの形成―2010年代 7. 計読の近未来 新自由主義の探究―日英の比較から― 左古 輝人 1. はじめに―新自由主義の迷路 2. 近代世界の重要アンブレラ・ターム―国家、社会、資本制 3. 20世紀の4つの新自由主義 3.1 戦前日本新自由主義 3.2 戦後ドイツ新自由主義 3.3 反ケインズ新自由主義 3.4 ホブソン新自由主義 4. 図書と逐刊の題目による全体の概観 4.1 21世紀新自由主義の理念型 4.2 1910年代から2010年代までをおしなべた日英比較 4.3 1910年代から2010年代までの、経時的な日英比較 5. 各時期における諸特徴の掘り下げ 5.1 英語における統治対象の変化―ラテン・アメリカから地球へ 5.2 日本における新自由主義政策の焦点化―労働と教育 5.3 ハーヴェイとフーコー 6. まとめと展望 マックス・ウェーバーにおける「暴力Gewalt」概念 ―「権力Macht」「支配Herrschaft」との対比から― 橋本 直人 1. 本章の目的と背景 2. 分析の対象とすすめ方 3. 分析の実行 3.1 テキストの確定 3.2 《Gewalt》の比較対象としての《Macht》《Herrschaft》の妥当性 3.3 《Gewalt》《Macht》《Herrschaft》3 語群の比較―共起ネットワークに おける《Herrschaft》と《Gewalt》《Macht》との差異 3.4 《Gewalt》と《Macht》との比較―共起78語群との出現頻度の相関における差異 4. 計量分析を踏まえたウェーバー解釈とその射程 新聞記事にみる近代東京・都市公園の話題変遷 ― 長期・記事見出しデータへのトピックモデルの適用― 前田 一歩 1. はじめに 1.1 都市公園の利用・受容という研究対象 1.2 本章の分析対象 1.3 本章の構成 2. 研究方法 2.1 分析に使用するデータセット 2.2 トピックモデルの方法と意義 3. 分析結果―都市公園のトピック 3.1 上野公園のトピック 3.2 日比谷公園のトピック 4. トピックの変遷―変わったこと、変わらないこと 4.1 啓蒙から社会教育・行楽の場へ、「猥雑さ」の縮小 4.2 国威発揚から社会運動の場へ 4.3 都市公園利用者としての子どもの登場 5. おわりに 近代日本社会におけるSelf-Starvation の歴史 ―摂食障害の形成以前を中心に― 河野 静香 1. はじめに 2. SS事例の抽出 2.1 資料の選定 2.2 分析手法と手順 2.3 初歩的な分析と仮説の導出 3. 第1期におけるSS記事本文の内容分析 3.1 宗教の文脈でのSS 事例 3.2 政治の文脈でのSS 事例 3.3 医療の文脈でのSS 事例 3.4 精神病や狐憑病とされるSS事例の登場 3.5 自殺の文脈でのSS事例 3.6 美容・健康の文脈でのSS事例 3.7 その他のSS 事例 4. 第2期と第3期の概要 4.1 第2期[医療、教育、フェミニズム] 4.2 第3期[医療、依存、福祉] 5. おわりに 婦人運動とウーマン・リブとの架橋 ―「日本婦人問題懇話会」の会報にみるリブへの共感と距離感― 樋熊 亜衣 1. 問題設定 2. 分析方法/対象 2.1 ミニコミの分析 2.2 テキストマイニングという手法 2.3 対象のグループ 3. 1970 年代ウーマン・リブの台頭 3.1 既存の婦人運動への批判―求められる女性解放 3.2 リブの主張した「女性解放」 4. タイトルにみるリブと懇話会の問題関心 5. 1960年代から70年代の「女性解放」の変遷 5.1 抽象的な「女性解放」―1965–1969年(1–11 号) 5.2 問い直される「女性解放」―1970–1974年(12–21 号) 5.3 「女性解放」の進め方―1975–1980(24–30号) 6. リブへの共感と距離感 7. 結語 安全保障技術研究推進制度の助成を受けた研究者のネットワーク可視化 ―KAKENデータベースを用いて― 鈴木 努 1. 構造探索のツールとしての計量分析 2. 科学研究と軍事研究 3. KAKENデータベースの利用 4. 共同研究者ネットワークの作成 5. ネットワーク構造による分類 6. おわりに 執筆者紹介

みんなのレビュー
まだレビューはありません
No.21
67

経済学は人々の間にどのように浸透し、受容されていったのか。テキストマイニングによる「計量テキスト分析」から明らかにする。 『国富論』から限界革命、ケインズ革命、社会選択理論まで、経済学は人々の間にどのように浸透し、受容されていったのか。テキストマイニングによる「計量テキスト分析」から明らかにする。 ●著者紹介 小峯 敦(こみね あつし)  龍谷大学経済学部教授 『福祉国家の経済思想』(編著、ナカニシヤ出版、2006年) 『ベヴァリッジの経済思想』(昭和堂、2007年) Keynes and his Contemporaries(Routledge, 2014年) 『戦争と平和の経済思想』(編著、晃洋書房、2020年) * 古谷 豊  東北大学経済学研究科准教授  福田進治  弘前大学人文社会科学部教授 下平裕之  山形大学人文社会科学部教授 舩木惠子  武蔵大学研究員 松山直樹  兵庫県立大学国際商経学部准教授 仲北浦淳基 大正大学地域創生学部助教 金井辰郎  東北工業大学ライフデザイン学部教授 斉藤 尚  北海道大学大学院経済学研究科准教授 岸見太一 早稲田大学現代政治経済研究所特別研究員 大槻忠史 東京外国語大学特別研究員 第Ⅰ部 経済学史の新しい方法  第1章 テキスト解釈の多層化と研究プロジェクト  第2章 テキストマイニングと経済学史の方法  第3章 定量化の二大仮定(質から量へ)  第4章 テキストマイニングの具体的手順 第Ⅱ部 応用事例Ⅰ(古典派経済学の普及)  第5章 スミス『国富論』の普及過程       書評と書簡の解析  第6章 リカード『原理』の普及過程       ミル『要綱』からマーティノー『例解』へ  第7章 マーティノー『アイルランド便り』における経済分析 第Ⅲ部 応用事例Ⅱ(限界革命とケインズ主義)  第8章 マーシャル『経済学原理』(1890年)とその書評       需給均衡分析の普及過程  第9章 ロバートソンにおける「実物」と「貨幣」       コーディング・ルールの作成と特徴語の抽出  第10章 ケインズ『一般理論』の普及過程       書評媒体による受容の差 第Ⅳ部 応用事例Ⅲ(イギリスからアメリカへ)  第11章 カルドア=ヒックス補償原理をめぐって       語彙からみた論争史  第12章 ケネス・アローにおける思想的変遷       社会選択の規範的合意という観点から

みんなのレビュー
まだレビューはありません
No.22
67

具体的な事例を通してテキストマイニングを解説  テキストマイニングとは、膨大なテキストデータをマイニング(発掘)して宝物(情報・知識・知見・仮説・課題など)を見つける手法・プロセスです。  本書では、豊富で具体的な事例を通してテキストマイニングの手法を説明していきます。フリーの言語解析ツールとExcelを用いた事例、比較的安価なテキストマイニングシステムを用いた事例、より高価で機能も豊富な「テキストマイニングシステム」を用いた事例など、多様な方法・システムを利用した事例を紹介しています。読者はこれにより、テキストマイニングを身近に体感できます。  また付録では、各社のテキストマイニングシステムの紹介と比較、さらにテキストマイニングやデータマイニングに役立つ情報を掲載しました。また、フリーソフト(ChaSenやCaboCha)のインストール方法や使い方に加え、テキストマイニングの分析に役立つ双対尺度法やクラスター分析についても説明しています。 第1章 テキストマイニングとは 第2章 テキストマイニングのための自然言語処理入門 第3章 テキストマイニングの実践:基礎編 第4章 テキストマイニングの実践:応用編 付録1 市販のテキストマイニングシステムと,テキストマイニングに役立つデータ・ツール 付録2 ChaSenとCaboChaのインストールと使い方 付録3 双対尺度法 付録4 クラスター分析 付録5 意味ソート 付録6 diffコマンドを利用したテキスト処理

みんなのレビュー
まだレビューはありません
No.23
67

フリーソフトとExcelを使って自由回答文アンケートのテキストマイニングに挑戦する入門書。 アンケート調査の自由回答文を題材に,フリーソフトKH CoderとExcelを使ってテキストデータの定量分析に挑戦。テキストマイニングの勘所や流れがわかる入門書。〔内容〕分析の手順/データの事前編集/形態素解析/抽出語の分析/文書の分析/他 第1章 テキストマイニングをはじめる  1.1 テキストマイニングとは   1.2 テキストマイニングの手順   1.2.1 「文書」を「言葉」にばらす――形態素解析   1.2.2 「言葉」と「言葉」の関係を分析する  1.3 データ構造の特徴   1.4 テキストマイニングのポイント   1.4.1 データ整理の段階   1.4.2 検索や分析の段階   1.4.3 解釈する段階――仮説を立てて要約する  1.5 事例について  第2章 データの事前編集  2.1 外部変数とテキストデータ   2.2 有効データの抽出   2.3 データの置換   2.4 改行コードの編集  第3章 データの読み込み  3.1 データファイルの分割   3.2 テキスト部のデータの読み込みとファイル形式    3.3 前処理   3.3.1 分析対象ファイルのチェック   3.3.2 前処理の実行  3.4 抽出語の暫定的なリスト表示   3.5 My辞書の作成   3.5.1 複合語の検出とMy辞書の作成   3.5.2 語の取捨選択  3.6 前処理の再実行   3.7 外部変数の読み込み  第4章 第1段階の分析1:抽出語の分析  4.1 抽出語全体のリスト表示と集計   4.1.1 [抽出語リスト]――抽出語を頻度順に並べる   4.1.2 [記述統計]――抽出語の基本的な集計を行う  4.2 抽出語のさまざまな検索   4.2.1 [抽出語検索]――抽出語の詳細な情報を表示する   4.2.2 [KWICコンコーダンス]――文脈内で抽出語を一覧する   4.2.3 [関連語検索]――共起性に基づく関連語を検索する  4.3 抽出語の分析   4.3.1 共通の手続き:抽出語の選択と調整ボタン   4.3.2 [対応分析]――クロス集計を視覚化する   4.3.3 [多次元(構成)法]――抽出語どうしの共起関係を視覚化する  4.3.4 [階層的クラスター分析]――似たものどうしをグループ化する   4.3.5 [共起ネットワーク]――共起関係のネットワークを描写する   4.3.6 [自己組織化マップ]――抽出語を自動分類する 第5章 第1段階の分析2:文書の分析  5.1 [文書検索]――抽出語の組み合わせで文書を検索する   5.1.1 検索条件の設定   5.1.2 結果の表示方法   5.1.3 文書(サンプル)の詳細表示  5.2 [クラスター分析]――類似の回答をグループ化する   5.2.1 クラスター分析のオプション設定   5.2.2 クラスター別文書数と併合過程   5.2.3 クラスター別文書検索と特徴後語の表示 第6章 第2段階の分析:仮説検証的な分析  6.1 仮説をコーディングする   6.1.1 仮説たてる   6.1.2 仮説をコード化する  6.2 仮説コードの集計と分析   6.2.1 仮説コードの集計   6.2.2 仮説コードの分析  6.3 再び文書検索/コード化できなかった文書を追跡する   6.4 コーディング結果の出力と利用法  第7章 テキストマイニングの事例  7.1 高齢者向けサービスのまとめ   7.2 来街者による街の評価   7.3 週報データの分析   7.4 公的統計におけるコメントの分析  付録A データ編集の補足  A.1 Excelマクロによる一括変換   A.2 改行コードの編集  付録B Excelマクロによる外部変数と抽出語のクロス集計  B.1 クロス集計用Excelデータ   B.2 クロス集計の実行    B.2.1 データの貼りつけ   B.2.2 集計指示表の作成と実行   B.2.3 集計結果の表示  B.3 「外部変数と見出し」の利用    B.3.1 外部変数の特定の値(カテゴリー)の特徴語   B.3.2 外部変数の特徴語一覧 付録C ベイズ学習による分類  C.1 ベイズの定理とテキストマイニングへの応用   C.2 外部変数からの学習   C.3 学習結果を用いた自動分類 索引 ●コラム目次  1 KH Coderについて   2 HTMLマーキング   3 抽出語に関する注意事項とKH Coderの品詞体系   4 共起性の尺度  5 サブグラフ 

みんなのレビュー
まだレビューはありません
No.24
67

データサイエンスの中のテキストマイニング テキストマイニングを「言語処理技術により変換された構造化データおよび変数を用い、知識・仮説発見、仮説検証を行う手法」と定義。データサイエンスの領域(分析用データ作製、データヴィジュアライゼーション、アナリシス、モデリング)について、事故の研究例を挙げ、俯瞰的に説明。 ビッグ・データで注目を集めているテキストという「非構造化データ」の経営研究での扱い方を提示する。 序 章 レビューと本書の特徴と流れ 第1章 テキストマイニングとは 第2章 内容分析の研究例:喜田(1999)より 第3章 テキストマイニングツールの基礎知識 第4章 モデル構築の方法:アカデミックで用いるその他の方法の提案 第5章 テキストマイニングでのデータクリーニング:言語資料の資料論と分析データの作成 第6章 テキストマイニングの研究例I:品詞情報、形態素を基礎にした分析 第7章 テキストマイニングの研究例II:内容分析ソフトの代替品として 第8章 テキストマイニングの研究例III:モデリング手法を用いたテキスト分類と変数の構築 第9章 言語分析視点からデータマイニング(データサイエンス)視点でのテキストマイニングの整理 第10章 実務界でのテキストマイニングの動向と利用法 終 章 本書のまとめと方法論としてのテキストマイニング、テキストマイニングでの問題点

みんなのレビュー
まだレビューはありません
No.25
67

有価証券報告書の中のテキストと数字とをともに分析する。著者判別を行う。話題をクラスタリングする。知識・認知変化の可視化。新たなソーシャルキャピタルの分析へ。自社の製品の好評面と不評面を明らかにする(感性分析)。テキストマイニングを業務に埋め込む。内容分析の省力化。経営学の新たなメソドロジーの確立。 テキストマイニングとは 内容分析の研究例:喜田(1999)より Clementine入門:テキストマイニングを行う最低限の知識 モデル構築の方法:アカデミックで用いるその他の方法の提案 テキストマイニングでのデータクリーニング:言語資料の資料論 テキストマイニングの研究例(品詞情報を基礎にした分析 内容分析ソフトの代替品として) 実務界でのテキストマイニングの動向と利用法 本書のまとめとテキストマイニングでの問題点

みんなのレビュー
まだレビューはありません
No.26
67

第1部 理論編-文章を科学する視点(文章の科学が目指すもの 文章とは何か-日本語の表現面から見たよい文章 作文と評価-日本語教育的観点から見たよい文章) 第2部 技術編-文章の科学を支える技術(文章の計量的分析 文章の計量的分析ツール「KH Coder」-言語学的な分析のための設定と操作 自然言語処理における文章解析 文章解析を目的とするウェブ基盤システム) 第3部 研究編-文章の科学を実践する研究(学習者作文を科学する 英語の自動作文評価 文章の難易度を科学する)

みんなのレビュー
まだレビューはありません
No.29
67

本書は、Pythonでプログラミングをした経験のある読者が、 各種オープンソースソフトウェア(OSS)やライブラリを利用して、 自然言語処理を行うWebアプリケーションを作って動かし、自然言語処理を体験するための書籍です。 またその中で、自然言語処理に関連するさまざまな概念や手法、 簡単な理論についても学ぶことができ、本格的な学習の 前段階としても最適です。 本書の構成としては大きく2つの部に分かれており、 それぞれ以下のような内容を解説しています。 第1部:データの準備 ●テキストデータの収集 ●データベースへの格納 ●検索エンジンへの登録 第2部:データの解析 ●文法構造を調べる ●意味づけ ●知識データとの連係 全13章を順に追いながらWebアプリケーションを作っていくことで、 自然言語処理に関連するさまざまなテーマを学ぶことができます。 第0章 自然言語処理とは 第1部 データを準備しよう 第1章 実行環境を整えよう  1.1 実行環境の概要  1.2 実行環境の構成  1.3 Windows 10にUbuntuをインストールする  1.4 Linuxコマンドの使い方  1.5 Ubuntuへのソフトウェアのインストール方法  1.6 Pythonプログラムを実行してみる 第2章 テキストデータを収集しよう  2.1 データ収集とは  2.2 Webページのスクレイピング  2.3 テキストデータを抽出する  2.4 テキストデータのクレンジング  2.5 データ収集のプログラム 第3章 データベースに格納しよう  3.1 データベースを使った検索エンジン  3.2 データベースと検索エンジンの用途  3.3 データベースを使ってみる  3.4 Solrの設定とデータ登録  3.5 Solrを使った検索 第2部 テキストデータを解析しよう 第4章 構文解析をしよう  4.1 構文解析とは  4.2 構文解析の用途  4.3 係り受け構造とは  4.4 CaboChaのセットアップ  4.5 PythonからCaboChaを呼び出そう  4.6 係り受け構造の解析結果のSQLiteへの格納 第5章 テキストにアノテーションを付ける  5.1 アノテーションとは  5.2 アノテーションの用途  5.3 アノテーションのデータ構造  5.4 正規表現のパターンによるテキストデータの解析  5.5 精度指標:RecallとPrecision  5.6 アノテーションのSQLiteへの格納  5.7 正規表現の改良  5.8 チャンクを使わない抽出アルゴリズムを考える 第6章 アノテーションを可視化する  6.1 アノテーションを表示するWebアプリ  6.2 アノテーションを可視化する必要性  6.3 アノテーションツールbrat  6.4 Webアプリケーション  6.5 bratをWebアプリケーションに組み込もう  6.6 SQLiteからアノテーションを取得して表示する 第7章 単語の頻度を数えよう  7.1 テキストマイニングと単語の頻度  7.2 統計的手法の用途  7.3 単語の重要度とTF-IDF  7.4 文書間の類似度  7.5 言語モデルとN-gramモデル  7.6 クラスタリングとLDA 第8章 知識データを活用しよう  8.1 知識データと辞書  8.2 エンティティ  8.3 知識データを活用することでできること  8.4 SPARQLによるDBpediaからの情報の呼び出し  8.5 WordNetからの同義語・上位語の取得  8.6 Word2Vecを用いた類語の取得 第3部 テキストデータを活用するWebアプリケーションを作ろう 第9章 テキストを検索しよう  9.1 Solrを使った検索Webアプリケーション  9.2 検索の用途  9.3 転置インデックス  9.4 プログラムからのSolrの検索  9.5 Solrへのアノテーションデータの登録  9.6 検索結果のWebアプリケーションでの表示  9.7 検索時の同義語展開  9.8 アノテーションでの検索 第10章 テキストを分類しよう  10.1 テキスト分類とは  10.2 テキスト分類の用途  10.3 特徴量と特徴量抽出  10.4 ルールベースによるテキスト分類  10.5 教師あり学習によるテキスト分類  10.6 ディープラーニングによるテキスト分類  10.7 分類結果のWebアプリケーションでの表示 第11章 評判分析をしよう  11.1 評判分析とは  11.2 評判分析技術の用途  11.3 辞書を用いた特徴量抽出  11.4 TRIEを用いた辞書内語句マッチ  11.5 教師あり学習による評判分析  11.6 評判分析の結果を表示するWebアプリケーション 第12章 テキストからの情報抽出  12.1 情報抽出とは  12.2 情報抽出技術の用途  12.3 関係のアノテーション  12.4 正規表現を用いた関係抽出  12.5 係り受け構造を用いた関係抽出  12.6 抽出した関係をSolrに登録  12.7 抽出した関係を表示するWebアプリケーション 第13章 系列ラベリングに挑戦しよう  13.1 系列ラベリングとその特徴  13.2 系列ラベリングの用途  13.3 CRF(条件付き確率場)  13.4 系列ラベリング用の学習データ  13.5 CRF++を用いた学習  13.6 CRF++の出力のアノテーションへの変換  13.7 CRF++で付けたアノテーションをSolrで検索する 付録  A.1 Wikipediaのダンプデータを使う  A.2 PDF、Wordファイル、Excelファイルを使う

みんなのレビュー
まだレビューはありません
No.30
67

 統計的自然言語処理を徹底的に論じた教科書  原著が刊行されたのは18年ほど前になるので,本書の内容の一部は歴史的な記録となっており,現在の状況に照らして異なる含意を読み取るべき言及もある。そのような若干の注意書きを要するとはいえ,本書の重要性,今日性は高い。  学問的基礎の記述の豊かさに加えて,マルコフモデルや確率文脈自由文法など,統計的自然言語処理の基盤となる概念について,丁寧な式の導出を含めたわかりやすい説明がなされている。そのような理論的基盤と合わせて,n-グラムモデルにおけるスムージングや分類学習における過学習など,実際に研究を進める上では重要でありながら,えてして短めの注意書きになりがちな部分についても,十分な量が割かれている。  「今」の自然言語処理研究をその基礎から正しく理解し,その上に新たな積み上げを行うための基盤を提供してくれる良書となっている。 [原著名:Foundations of Statistical Natural Language Processing] I編 前提知識 1章 導  入 1.1 言語に対する合理主義的方法論と経験主義的方法論 1.2 科学的意義 1.3 言語の曖昧性:なせ自然言語処理は困難なのか 1.4 汚れ仕事 1.5 さらに学ぶために 1.6 練習問題 2章 数学的基礎 2.1 確率論の基礎 2.2 情報理論の要点 2.3 さらに学ぶために 3章 言語学の要点 3.1 品詞と形態論 3.2 句構造 3.3 意味論と語用論 3.4 その他の分野 3.5 さらに学ぶために 3.6 練習問題 4章 コーパスに基づく研究 4.1 準備 4.2 テキストの観察 4.3 データのマークアップ 4.5 練習問題 II編 語 5章 連  語 5.1 頻度 5.2 平均と分散 5.3 仮説検定 5.4 相互情報量 5.5 連語とは何か 5.6 さらに学ぶために 6章 統計的推論:スパースなデータ上のn-グラムモデル 6.1 ビン:同値類の形成 6.2 統計的推定 6.3 推定値を組み合わせる 6.4 結論 6.5 さらに学ぶために 6.6 練習問題 7章 語義の曖昧性解消 7.1 方法論に関する準備 7.2 教師あり曖昧性解消 7.3 辞書に基づく曖昧性解消 7.4 教師なし曖昧性解消 7.5 単語の意味とは何か? 7.6 さらに学ぶために 7.7 練習問題 8章 語彙獲得 8.1 評価指標 8.2 動詞の下位範疇化 8.3 付加の曖昧性 8.4 選択選好 8.5 意味的類似性 8.6 統計的自然言語処理における語彙獲得の役割 8.7 さらに学ぶために III編 文  法 9章 マルコフモデル 9.1 マルコフモデル 9.2 隠れマルコフモデル 9.3 HMMについての三つの基本的な問題 9.4 HMM:実装,性質,変種 9.5 さらに学ぶために 10章 品詞のタグ付け 10.1 タグ付けのための情報源 10.2 マルコフモデルによるタグ付け器 10.3 隠れマルコフモデルによるタグ付け器 10.4 変換に基づくタグの学習 10.5 別の方法,英語以外の言語 10.6 タグ付けの正解率とタグ付け器の適用先 10.7 さらに学ぶために 10.8 練習問題 11章 確率文脈自由文法 11.1 PCFGのいくつかの特徴 11.2 PCFGの三つの基本的な問題 11.3 系列の確率 11.4 内側外側アルゴリズムの問題点 11.5 さらに学ぶために 11.6 練習問題 12章 確率的構文解析 12.1 いくつかの概念 12.2 いくつかのアプローチ 12.3 さらに学ぶために 12.4 練習問題 IV編 応用と技法 13章 統計的アライメントと機械翻訳 13.1 テキストアライメント 13.2 語のアライメント 13.3 統計的機械翻訳 13.4 さらに学ぶために 14章 クラスタリング 14.1 階層的クラスタリング 14.2 非階層的クラスタリング 14.2.1 K平均法 14.2.2 EMアルゴリズム 14.3 さらに学ぶために 14.4 練習問題 15章 情報検索におけるいくつかの話題 15.1 情報検索に関する背景知識 15.2 ベクトル空間モデル 15.3 タームの分布のモデル 15.4 潜在意味インデキシング 15.5 談話分割 15.6 さらに学ぶために 15.7 練習問題 16章 テキスト分類 16.1 決定木 16.2 最大エントロピーモデル 16.3 パーセプトロン 16.4 k最近傍分類 16.5 さらに学ぶために 簡易統計表 参考文献 訳者あとがき 索  引

みんなのレビュー
まだレビューはありません
No.32
67

テキストマイニングの基礎と事例について、いかに業務に活かしていくかをマンガやイラスト、図解を用いてわかりやすく解説。 テキストマイニングの手法がよくわかる!! 本書はテキストマイニングの基礎と事例について、フリーの計量テキスト分析ソフトKH Coderを利用したテキストの解析と、Excelによるその分析手法を通して解説する入門書です。  テキストマイニングをいかに業務に活かしていくか、つまづきがちなポイントをマンガやイラスト、図解を用いてわかりやすく解説します。 第0章 ビジネスに使えるテキストデータの解析フロー 第1章 テキストマイニングとは 第2章 理想的なテキストマイニングの使い方 第3章 アンケートデータから市場ニーズを分析する ~潜在ニーズを掘りおこすには~ 第4章 Excelを用いたテキストマイニング 第5章 テキストマイニングの応用事例 第6章 こんなときどう分析する? テキストマイニングQ&A

みんなのレビュー
まだレビューはありません
No.33
67

内容分析ってどうやるの? サンプルを取る時の注意点は? 定番の教科書をついに完訳! 機械学習の教師データ作成にも役立ちます。 内容分析ってどうやるの? サンプルを取る時の注意点は? 定番の教科書をついに完訳! 機械学習の教師データ作成にも役立ちます。 欧米諸国で広く読まれている内容分析のテキストを、わかりやすい翻訳でついに刊行! 測定、サンプリング、信頼性、妥当性などを丁寧に教えるだけでなく、相関関係や因果関係の違いといった実証分析の基本もきちんと概説する役立つ一冊。AIの機械学習での教師データ作成にも、内容分析のプロセスと手続きは欠かせない! 日本語版はしがき はしがき 第1章 イントロダクション  1.マスコミュニケーション研究  2.内容分析とマスコミュニケーション効果研究  3.内容分析とコンテンツ生産の文脈  4.コンテンツの「中心性」  5.コンテンツの記述という目的  6.他の研究方法との接合  7.他分野における内容分析の活用  8.まとめ 第2章 社会科学のツールとしての内容分析  1.さまざまな定義  2.内容分析の定義  3.研究手法としての内容分析の問題点  4.量的内容分析の利点  5.まとめ 第3章 内容分析のデザイン  1.内容分析の研究デザインにおける概念化  2.良いデザインと悪いデザイン  3.内容分析の一般的なモデル  4.研究プログラムのデザイン  5.まとめ 第4章 測  定  1.内容分析におけるコンテンツ単位と変数  2.コンテンツの形態  3.観察単位  4.分析単位  5.尺度のレベル  6.測定のステップ  7.まとめ 第5章 サンプリング  1.サンプリングの期間  2.サンプリングの手法  3.伝統的メディアを分析する際の層化サンプリング  4.インターネットのサンプリング  5.個人コミュニケーションのサンプリング  6.ビッグデータとサンプリング  7.まとめ 第6章 信頼性  1.信頼性─基本的な考え方  2.概念の定義とカテゴリの構築  3.内容分析のマニュアル  4.コーダーのトレーニング  5.コーダー間信頼性の評価  6.信頼性係数  7.まとめ 第7章 妥当性  1.信頼性と妥当性を測定する際の問題  2.測定方法の妥当性に関する確認方法  3.観察プロセスにおける妥当性  4.内容分析における外的妥当性と意味  5.まとめ 第8章 データ分析  1.内容分析への導入  2.データ分析の基本  3.知見の記述と要約  4.関係性を発見する  5.統計的前提  6.まとめ 第9章 コンピュータ  1.コンピュータを用いたコンテンツの発見,アクセス,集積  2.コンピュータによる内容分析  3.まとめ 付録 内容分析を用いた論文において報告すべき情報の基準  1.サンプリング  2.コーダーと変数  3.信頼性 監訳者あとがき 参考文献 索引

みんなのレビュー
まだレビューはありません
No.34
67

質的研究を志す人のための手引き インタビューや観察、質問表を主とする質的研究では、テキスト=文字のデータや記録が膨大になります。それらを適切に解釈・分析し、良い論文を書くためにはどうすればよいのか、多くの初心者が途方に暮れ、アドバイスを求めています。本書は、そんな不安と渇望に応える、質的データを体系的に分析するための実践的なガイドブックです。代表的な方法を取り上げ、実際の手順をステップ・バイ・ステップで示しながら懇切に解説しました。さらに日本語で使えるようになったコンピュータ・ソフトウェアの意義と可能性についても解説されています。著者・訳者とも質的研究の第一人者による本書は、質的研究の初心者だけでなく、研究者にとっても、方法について改めて見直す恰好の手引きです。 質的テキスト分析法 目次 日本語版への序 序 謝辞 1章 質的データの分析─さて、いかにおこなうべきか?   1.1 質的・量的の区別に関する論点整理   1.2 質的研究法、量的研究法、混合研究法   1.3 実際の研究において質的データを分析していく際の課題   1.4 リサーチ・クェスチョンの重要性   1.5 方法面での厳密性の必要性 2章 体系的な質的テキスト分析の源流   2.1 古典的な解釈学   2.2 グラウンデッド・セオリー   2.3 古典的内容分析と質的内容分析   2.4 質的テキスト分析に関する他の種類の実践的アプローチ 3章 質的テキスト分析の基本概念と作業プロセス   3.1 質的テキスト分析に関する主要概念   3.2 質的テキスト分析と古典的な内容分析における分析プロセス   3.3 質的テキスト分析を開始する     ─テキスト、メモ、事例要旨による初期段階の作業   3.4 カテゴリーを構築する   3.5 研究例 4章 質的テキスト分析における3つの主要な方法   4.1 プロフィール・マトリクス─質的テキスト分析の基本概念   4.2 3つの方法の類似点と相違点   4.3 テーマ中心の質的テキスト分析   4.4 評価を含む質的テキスト分析   4.5 類型構築式テキスト分析 5章 質的テキスト分析におけるコンピュータ・プログラムの利用   5.1 データの管理     ─文字起こし、匿名化処理、チームワークの計画立案   5.2 QDAソフトによる質的テキスト分析   5.3 QDAソフトによる分析─上級編 6章 質の基準、研究報告書、研究プロセスの記録   6.1 質的テキスト分析に関する質の基準   6.2 研究報告・研究プロセスに関する記録の作成 7章 結 語 補論 質的データ分析の基本原理とQDAソフトウェアの可能性     ─佐藤郁哉   Ⅰ 序 論   Ⅱ 質的調査の魅力と落とし穴─7つのタイプの薄い記述   Ⅲ 翻訳プロセスとしての質的調査   Ⅳ 質的データ分析における脱文脈化・再文脈化と定性的コーディング   Ⅴ 紙媒体でおこなわれる質的データ分析   Ⅵ QDAソフトの概要と特長   Ⅶ 質的調査の「質的転換」の可能性   Ⅷ QDAソフトだけではできないこと     ─質的調査のアート&サイエンス 訳者あとがき 注 引用文献 人名索引 事項索引 装幀=新曜社デザイン室

みんなのレビュー
まだレビューはありません
No.35
67

人間の言葉をコンピュータに理解させ、利用する「自然言語処理」の、技術的、ビジネス的基礎知識をコンパクトに図解した一冊です Webやクラウド上の膨大な文字情報の中から、「意味のある」情報だけを取り出して活用したい、文脈を読んで最適な文章を自動的に作成して欲しい… そんな夢のような技術がすでに一歩ずつ現実のものとなろうとしています。 ハードウェア&ソフトウェアの高度化、高速化に伴い「自然言語処理」と呼ばれる「人間の言葉をコンピュータに理解させ、活用させる、結果を返させる」テクノロジーが実用化のレベルまで到達しつつあるのです。 本書は、この未来に不可欠となるに違いない自然言語処理の、技術的、ビジネス的基礎知識をくまなくコンパクトに図解した一冊です。 著者陣もそれぞれの分野の第一線で活躍するエキスパート揃い! 世界を大きく変えるであろうテクノロジーに一歩近付いてみませんか? 自然言語処理の概要 自然言語処理の基礎知識 日本語入力と自然言語処理 機械翻訳 情報検索 Webと自然言語処理 自然言語処理のこれから

みんなのレビュー
まだレビューはありません
No.36
67

◆◆ PythonとKerasで基礎から一巡 ◆◆ 本書のゴールは自然言語、とりわけ日本語を扱うサービスや アプリケーションを開発できるようになることです。 そのために欠かせない「機械学習」と「深層学習」について、しっかり解説します。 ただし、難解な理論や数式は大胆にスキップ。 エンジニアの実務に役立つ知識に絞り、独自に15の学習ステップを体系化しました。 数値計算にNumPy、形態素解析にMeCab、機械学習にscikit-learn、ディープラーニングに Keras等を使い、Pythonのコードを記述し動かしていきます。 何らかのプログラミング経験のある方なら、無理なく読めると思います。 ◆◆ 本書の構成 ◆◆ ■1章 演習に入るまえの予備知識 1 序論・自然言語処理と機械学習 2 本書の執筆・開発環境 3 機械学習のためのPythonの基礎 4 数値計算ライブラリNumPy 5 本書で利用するその他の主要ライブラリ ■2章 基礎を押さえる7ステップ Step 01 対話エージェントを作ってみる Step 02 前処理 Step 03 形態素解析とわかち書き Step 04 特徴抽出 Step 05 特徴量変換 Step 06 識別器 Step 07 評価 ■3章 ニューラルネットワークの6ステップ Step 08 ニューラルネットワーク入門 Step 09 ニューラルネットワークによる識別器 Step 10 ニューラルネットワークの詳細と改善 Step 11 Word Embeddings Step 12 Convolutional Neural Networks Step 13 Recurrent Neural Networks ■4章 2ステップの実践知識 Step 14 ハイパーパラメータ探索 Step 15 データ収 ■1章 演習に入るまえの予備知識 1 序論・自然言語処理と機械学習 2 本書の執筆・開発環境 3 機械学習のためのPythonの基礎 4 数値計算ライブラリNumPy 5 本書で利用するその他の主要ライブラリ ■2章 基礎を押さえる7ステップ Step 01 対話エージェントを作ってみる Step 02 前処理 Step 03 形態素解析とわかち書き Step 04 特徴抽出 Step 05 特徴量変換 Step 06 識別器 Step 07 評価 ■3章 ニューラルネットワークの6ステップ Step 08 ニューラルネットワーク入門 Step 09 ニューラルネットワークによる識別器 Step 10 ニューラルネットワークの詳細と改善 Step 11 Word Embeddings Step 12 Convolutional Neural Networks Step 13 Recurrent Neural Networks ■4章 2ステップの実践知識 Step 14 ハイパーパラメータ探索 Step 15 データ収集

みんなのレビュー
まだレビューはありません
No.37
67

自然言語処理におけるニューラルネットワーク技術を「ニューラルネットワークまずありき」ではなく,これまでの様々な方法論と比較し,それらとの位置関係を丁寧に説明している。  従来の機械学習技術から説き起こして,ニューラルネットワーク技術の利点や特徴を明らかにしながら,その導入を行い,言語処理の基盤技術となったニューラルネットワークによる言語モデルと単語埋め込み(ニューラルネットワークを用いた単語の意味表現)について,その背景や応用を含めてわかりやすく説明している。  特に単語埋め込みについては,その様々な利用方法を詳しく紹介しており,言語処理の様々な問題に深層学習を活用する方法について取り上げた後,ニューラルネットワークの中でも特に言語処理に頻繁に用いられる再帰的ニューラルネットワーク(RNN)とそれを用いたエンコーダ・デコーダアーキテクチャ(近年の機械翻訳システムの基本的な枠組み)を系統立てて説明している。また,木構造ネットワーク,構造予測,マルチタスク学習という進んだ話題についても適当な分量が割かれている。  本書には,自然言語処理の中核的なシステムを題材とした具体的な事例紹介が多数含まれており,さらに実装実現における注意事項や研究事例へのポインタも豊富に取り上げられている。様々な事項が相互に関連づけられて一枚の地図として示されているので,初学者が通読すれば技術の全容を把握できるし,すでに研究開発を進めている研究者・技術者であれば,多くの技術の位置付けが再確認でき,より広い文脈に位置付けるのに有益だろう。 [原著:Neural Network Methods for Natural Language Processing] 第1章 導入 1.1 自然言語処理の困難さ 1.2 ニューラルネットワークと深層学習 1.3 自然言語処理における深層学習 1.4 本書で扱う内容とその構成 1.5 本書で扱っていない内容 1.6 用語に関する注意 1.7 数学的記法について 第1編 教師あり分類とフィードフォワードニューラルネットワーク 第2章 機械学習の基礎と線形モデル 2.1 教師あり学習とパラメータを持つ関数 2.2 訓練セット,テストセット,検証セット 2.3 線形モデル 2.4 表現 2.5 ワンホットベクトル表現と密ベクトル表現 2.6 対数線形多クラス分類 2.7 最適化としての訓練 2.8 勾配に基づく最適化 第3章 線形モデルから多層パーセプトロンへ 3.1 線形モデルの限界:排他的論理和問題 3.2 非線形入力変換 3.3 カーネル法 3.4 訓練可能な写像関数 第4章 フィードフォワードニューラルネットワーク 4.1 脳にヒントを得た比喩 4.2 数学的記法による記述 4.3 表現力 4.4 一般的な非線形要素 4.5 損失関数 4.6 正則化とドロップアウト 4.7 類似度と距離の層 4.8 埋め込み層 第5章 ニューラルネットワークの訓練 5.1 計算グラフによる抽象化 5.2 実践豆知識 第2編 自然言語データの扱い 第6章 テキストデータのための素性 6.1 自然言語処理における分類問題のタイプ分け 6.2 自然言語処理問題のための素性 第7章 事例研究:自然言語処理における素性 7.1 文書分類:言語同定 7.2 文書分類:トピック分類 7.3 文書分類:著者特定 7.4 文脈に埋め込まれた単語:品詞タグ付け 7.5 文脈に埋め込まれた単語:固有表現認識 7.6 文脈に埋め込まれた単語と言語学的素性:前置詞意味曖昧性解消 7.7 文脈に埋め込まれた単語の間の関係:アークを単位としたパージング 第8章 テキストの素性から入力への変換 8.1 カテゴリ素性の符号化 8.2 密ベクトルの組み合わせ 8.3 ワンホットベクトルと密ベクトルの関係 8.4 諸事項 8.5 事例紹介:品詞タグ付け 8.6 事例紹介:アークを単位としたパージング 第9章 言語モデリング 9.1 言語モデリングタスク 9.2 言語モデルの評価:パープレキシティ 9.3 言語モデリングの古典的手法 9.4 ニューラル言語モデル 9.5 生成における言語モデルの利用 9.6 副産物:単語表現 第10章 事前学習された単語表現 10.1 無作為初期化 10.2 タスクに固有の教師あり事前学習 10.3 教師なし事前学習 10.4 単語埋め込みアルゴリズム 10.5 文脈の選択 10.6 連語と屈折の扱い 10.7 分布に基づく手法の限界 第11章 単語埋め込みの利用 11.1 単語ベクトルの獲得 11.2 単語の類似度 11.3 単語のクラスタリング 11.4 類義語の発見 11.5 仲間外れ探し 11.6 短い文書の類似度 11.7 単語の類推 11.8 レトロフィッティングと射影 11.9 実践における落し穴 第12章 事例研究:文の意味推論のためのフィードフォワードアーキテクチャ 12.1 自然言語推論とSNLIデータセット 12.2 テキストの類似性を判定するネットワーク 第3編 特別なアーキテクチャ 第13章 n-グラム検出器:畳み込みニューラルネットワーク 13.1 基本的な畳み込みとプーリング 13.2 代替法:素性ハッシュ 13.3 階層的畳み込み 第14章 再帰的ニューラルネットワーク:系列とスタックのモデリング 14.1 RNN抽象化 14.2 RNNの訓練 14.3 一般的なRNNの利用方法 14.4 双方向RNN(biRNN) 14.5 多層RNN(積み上げRNN) 14.6 RNNによるスタックの表現 14.7 文献を読む際の注意 第15章 RNNの具体的な構成 15.1 RNNとしてのCBOW 15.2 単純RNN 15.3 ゲート付きアーキテクチャ 15.4 その他の変種 15.5 RNNにおけるドロップアウト 第16章 RNNを用いたモデリング 16.1 受理器(アクセプタ) 16.2 素性抽出器としてのRNN 第17章 条件付き生成 17.1 RNN生成器 17.2 条件付き生成(符号化器復号化器) 17.3 文の類似度の教師なし学習 17.4 アテンションあり条件付き生成 17.5 自然言語処理におけるアテンションに基づくモデル 第4編 追加的な話題 第18章 RecNNによる木構造のモデリング 18.1 形式的定義 18.2 拡張と変種 18.3 木構造ニューラルネットワークの訓練 18.4 シンプルな代替案:木を線条化する 18.5 今後の見通し 第19章 構造を持つ出力の予測 19.1 探索に基づく構造予測 19.2 貪欲法による構造予測 19.3 構造を持つ出力の予測としての条件付き生成 19.4 例 第20章 モデルのカスケード接続,マルチタスク学習,半教師あり学習 20.1 モデルのカスケード接続 20.2 マルチタスク学習 20.3 半教師あり学習 20.4 様々な例 20.5 今後の見通し 第21章 結論 21.1 これまでの進展 21.2 これからの課題 文献一覧 訳者あとがき 略語一覧 索  引

みんなのレビュー
まだレビューはありません
search