Movatterモバイル変換
[0]
ホーム
URL:
画像なし
夜間モード
Submit Search
KH Coder 2 チュートリアル(スライド版)
56 likes
266,976 views
khcoder
KH Coderを用いて計量テキスト分析を行う方法を、簡易なスライド形式で解説。
Self Improvement
Read more
1 of 30
Download now
Downloaded 501 times
1
2
3
4
5
6
7
8
9
10
11
12
Most read
13
14
15
16
17
18
19
20
Most read
21
22
23
24
25
26
27
28
29
30
Most read
Ad
Recommended
PDF
フリーソフトウェア「KH Coder」を使った計量テキスト分析 ―手軽なマウス操作による分析からプラグイン作成まで― #TokyoWebmining 41st
khcoder
PDF
Jaccard係数の計算式と特徴(1)
khcoder
PDF
単語の分散表現と構成性の計算モデルの発展
Naoaki Okazaki
PDF
深層学習による自然言語処理入門: word2vecからBERT, GPT-3まで
Yahoo!デベロッパーネットワーク
PDF
トピックモデルの評価指標 Perplexity とは何なのか?
hoxo_m
PDF
「内積が見えると統計学も見える」第5回 プログラマのための数学勉強会 発表資料
Ken'ichi Matsui
PPTX
PyTorchLightning ベース Hydra+MLFlow+Optuna による機械学習開発環境の構築
Kosuke Shinoda
PDF
ブルックスのいう銀の弾丸とは何か?
Yoshitaka Kawashima
PDF
Jaccard係数の計算式と特徴(2)
khcoder
PDF
GoによるWebアプリ開発のキホン
Akihiko Horiuchi
PPTX
[DL輪読会]Bayesian Uncertainty Estimation for Batch Normalized Deep Networks
Deep Learning JP
PPTX
DXとかDevOpsとかのなんかいい感じのやつ 富士通TechLive
Tokoroten Nakayama
PDF
エンジニアも知っておきたいAI倫理のはなし
Yasunori Nihei
PDF
Semantic segmentation
Takuya Minagawa
PPTX
本当は恐ろしい分散システムの話
Kumazaki Hiroki
PPTX
カルマンフィルタ入門
Yasunori Nihei
PPTX
世界一わかりやすいClean Architecture
Atsushi Nakamura
PPTX
物体検出の歴史(R-CNNからSSD・YOLOまで)
HironoriKanazawa
PDF
[DL輪読会]Deep Learning 第5章 機械学習の基礎
Deep Learning JP
PDF
Word2vecの理論背景
Masato Nakai
PDF
例外設計における大罪
Takuto Wada
PDF
イミュータブルデータモデルの極意
Yoshitaka Kawashima
PDF
レコメンドアルゴリズムの基本と周辺知識と実装方法
Takeshi Mikami
PPTX
トランクベース開発を活用して爆速に開発した話
Tier_IV
PDF
LSTM (Long short-term memory) 概要
Kenji Urai
PDF
DevOpsに求められる様々な技術とその連携の学習方法
CASAREAL, Inc.
PDF
Transformerを多層にする際の勾配消失問題と解決法について
Sho Takase
PDF
事業成長にコミットするエンジニア組織への道のり
Recruit Lifestyle Co., Ltd.
PDF
Rファイルの保存と活用1―KH Coderによる対応分析の結果のエクスポートと活用―
khcoder
PDF
サリエンシーマップの視線計測への応用
Masatoshi Yoshida
More Related Content
What's hot
(20)
PDF
Jaccard係数の計算式と特徴(2)
khcoder
PDF
GoによるWebアプリ開発のキホン
Akihiko Horiuchi
PPTX
[DL輪読会]Bayesian Uncertainty Estimation for Batch Normalized Deep Networks
Deep Learning JP
PPTX
DXとかDevOpsとかのなんかいい感じのやつ 富士通TechLive
Tokoroten Nakayama
PDF
エンジニアも知っておきたいAI倫理のはなし
Yasunori Nihei
PDF
Semantic segmentation
Takuya Minagawa
PPTX
本当は恐ろしい分散システムの話
Kumazaki Hiroki
PPTX
カルマンフィルタ入門
Yasunori Nihei
PPTX
世界一わかりやすいClean Architecture
Atsushi Nakamura
PPTX
物体検出の歴史(R-CNNからSSD・YOLOまで)
HironoriKanazawa
PDF
[DL輪読会]Deep Learning 第5章 機械学習の基礎
Deep Learning JP
PDF
Word2vecの理論背景
Masato Nakai
PDF
例外設計における大罪
Takuto Wada
PDF
イミュータブルデータモデルの極意
Yoshitaka Kawashima
PDF
レコメンドアルゴリズムの基本と周辺知識と実装方法
Takeshi Mikami
PPTX
トランクベース開発を活用して爆速に開発した話
Tier_IV
PDF
LSTM (Long short-term memory) 概要
Kenji Urai
PDF
DevOpsに求められる様々な技術とその連携の学習方法
CASAREAL, Inc.
PDF
Transformerを多層にする際の勾配消失問題と解決法について
Sho Takase
PDF
事業成長にコミットするエンジニア組織への道のり
Recruit Lifestyle Co., Ltd.
Jaccard係数の計算式と特徴(2)
khcoder
GoによるWebアプリ開発のキホン
Akihiko Horiuchi
[DL輪読会]Bayesian Uncertainty Estimation for Batch Normalized Deep Networks
Deep Learning JP
DXとかDevOpsとかのなんかいい感じのやつ 富士通TechLive
Tokoroten Nakayama
エンジニアも知っておきたいAI倫理のはなし
Yasunori Nihei
Semantic segmentation
Takuya Minagawa
本当は恐ろしい分散システムの話
Kumazaki Hiroki
カルマンフィルタ入門
Yasunori Nihei
世界一わかりやすいClean Architecture
Atsushi Nakamura
物体検出の歴史(R-CNNからSSD・YOLOまで)
HironoriKanazawa
[DL輪読会]Deep Learning 第5章 機械学習の基礎
Deep Learning JP
Word2vecの理論背景
Masato Nakai
例外設計における大罪
Takuto Wada
イミュータブルデータモデルの極意
Yoshitaka Kawashima
レコメンドアルゴリズムの基本と周辺知識と実装方法
Takeshi Mikami
トランクベース開発を活用して爆速に開発した話
Tier_IV
LSTM (Long short-term memory) 概要
Kenji Urai
DevOpsに求められる様々な技術とその連携の学習方法
CASAREAL, Inc.
Transformerを多層にする際の勾配消失問題と解決法について
Sho Takase
事業成長にコミットするエンジニア組織への道のり
Recruit Lifestyle Co., Ltd.
Viewers also liked
(6)
PDF
Rファイルの保存と活用1―KH Coderによる対応分析の結果のエクスポートと活用―
khcoder
PDF
サリエンシーマップの視線計測への応用
Masatoshi Yoshida
PDF
GraphX Advent Calendar Day17
鉄平 土佐
PDF
エクセルでテキストマイニング TTM2HADの使い方
Hiroshi Shimizu
PPTX
ようやく分かった!最尤推定とベイズ推定
Akira Masuda
PDF
エクセルで統計分析 統計プログラムHADについて
Hiroshi Shimizu
Rファイルの保存と活用1―KH Coderによる対応分析の結果のエクスポートと活用―
khcoder
サリエンシーマップの視線計測への応用
Masatoshi Yoshida
GraphX Advent Calendar Day17
鉄平 土佐
エクセルでテキストマイニング TTM2HADの使い方
Hiroshi Shimizu
ようやく分かった!最尤推定とベイズ推定
Akira Masuda
エクセルで統計分析 統計プログラムHADについて
Hiroshi Shimizu
Ad
More from khcoder
(7)
PDF
KH Coder 3 チュートリアル(スライド版)
khcoder
PDF
【旧版】KH Coder 3 チュートリアル(スライド版)
khcoder
PDF
Quick Start Tutorial of KH Coder 3
khcoder
PDF
[OUTDATED] Quick Start Tutorial of KH Coder 3
khcoder
PDF
Executing SQL Queries and Making Plugins
khcoder
PDF
Example of Using R #1: Exporting the Result of Correspondence Analysis
khcoder
PDF
Quick Start Tutorial of KH Coder 2: Quantitative Content Analysis or Text Min...
khcoder
KH Coder 3 チュートリアル(スライド版)
khcoder
【旧版】KH Coder 3 チュートリアル(スライド版)
khcoder
Quick Start Tutorial of KH Coder 3
khcoder
[OUTDATED] Quick Start Tutorial of KH Coder 3
khcoder
Executing SQL Queries and Making Plugins
khcoder
Example of Using R #1: Exporting the Result of Correspondence Analysis
khcoder
Quick Start Tutorial of KH Coder 2: Quantitative Content Analysis or Text Min...
khcoder
Ad
KH Coder 2 チュートリアル(スライド版)
1.
KH Coder チュートリアル漱石「こころ」を題材に【スライド版】1
2.
本チュートリアルの内容1.2.3.4.5.2KH Coderの準備プロジェクト作成と前処理頻出語と共起それぞれの部(上・中・下)に特徴的な語コーディングによるコンセプトの抽出
3.
1. KH Coderの準備3
4.
1.1 Windows版パッケージをダウンロード①http://khc.sourceforge.net/か ら
「 Windows 版 パ ッケージ」をダウンロード② 「khcoder‐2b30‐f.exe」のようなファイル名をクリックすると、このページに飛ぶ④ 5秒ほど待つと、自動的にダウンロードが開始(セキュリティの警告が出る場合は「許可」や「保存」をクリック)4③ この部分は広告なので無視
5.
1.2 インストール(解凍)② Unzipをクリック①
ダウンロードしたファイルをダブルクリック③ 「unzipped successfully」の表示が出れば完了なので、すべての画面を閉じるKH Coderは解凍(Unzip)するだけで利用可5
6.
1.3 KH Coderの起動方法(Windows
7)② 「C:¥khcoder」と入力してEnter キー① スタートボタンをクリック③ 「kh_coder.exe」Windows 8の場合はスタート画面で直接「C:¥khcoder」と入力6をダブルクリック
7.
2. プロジェクト作成と前処理7
8.
2.1 プロジェクト作成(分析するファイルを指定)① メニューから「プロジェクト」「新規」を選択②
「参照」をクリックして「tutorial_jp」フォルダ内の「kokoro2.txt」を開く③ 自由にメモを入力④ 「OK」をクリック次回KH Coderを起動した時は「新規」ではなく、「プロジェクト」「開く」を選択して、既存のプロジェクトを開く8
9.
【解説】漱石「こころ」ファイルの内容このチュートリアルでは漱石「こころ」(kokoro2.txt)を分析物語最後の「先生」の自殺は突然で不自然という批判はもっともか?「こころ」は上・中・下の3部構成「上_先生と私」のような部の見出しをH1タグで括っている部の内部がさらに一・二・三などの章に分かれている9「一」のような章の見出しをH2タグで括っている
10.
2.2 前処理(テキストから自動的に語を取り出す)① KH
Coderのメニューから「前処理」「語の取捨選択」重要な言葉なのに、1語として抽出されない時は「強制抽出」② 全角で「K」と入力③ クリック④ メニューから「前処理」「前処理の実行」10→「OK」KH Coderはアルファベット1文字を無視するが、「K」は「こころ」の重要な人物そこで「K」を強制抽出するよう指定してから、前処理を実行
11.
3. 頻出語と共起11
12.
3.1 多く出現していた語① メニューから「ツール」「抽出語」「抽出語リスト」②
「頻出150語」を選択③ クリック小説なので主要人物が上位に「死ぬ」が89回と多く出現?12活用のある語は基本形に直して抽出&カウントex.「死ねば」→「死ぬ」
13.
3.2 共起ネットワークの作成① メニューから「ツール」「抽出語」「共起ネットワーク」②
「集計単位」として「段落」を選んで「OK」同じ段落によく一緒に出現する(共起する)語同士を、線(edge)で結んだネットワーク③ 「調整」をクリックして、「描画数」を120にして「OK」④ 「調整」をクリックして、「出現数の多い語ほど大きい円…」をチェックして「OK」⑤ 「カラー:」の箇所を「サブグラフ検出(modularity)」に変更13色々お試しください
14.
【解説】語の共起を探索する手法階層的クラスター分析、MDS、自己組織化マップ等も利用可MDS共起ネットワーク自己組織化マップ共起する語のグループから、データ中のテーマないしトピックを探索できるこれらの多変量解析の実行には内部でRを使用14クラスター分析
15.
3.3 KWICコンコーダンス 1/2①
メニューから「ツール」「抽出語」「KWICコンコーダンス」② 検索したい語を入力してEnterキーダブルクリックで、さらに広い範囲の文脈を表示集計や解析の結果だけを見るのでは不十分(多くの場合)もとのテキスト中で語がどのように使われていたかを確認!③ 「集計」をクリックすると15コロケーション統計が開く
16.
3.3 KWICコンコーダンス 2/2①
前のページ手順でコロケーション統計が開く「左1」は、左側の1つ目、すなわち直前に出現していた回数のこと。「意味」は「解る」の3つ前に5回出現② 表示する語を、16品詞をもとに選択可
17.
4. それぞれの部(上・中・下)に特徴的な語17
18.
4.1 それぞれの部の特徴語一覧① メニューから「ツール」「外部変数と見出し」「リスト」②
クリック③ 「文」を選択④ 「特徴語」「一覧(Excel形式)」を選択18上・中・下の特徴語が上 位 10 語 ず つ リ ス トアップされる。数値はどの程度「特徴的」かを示すJaccard係数。
19.
【解説】特徴語からみる物語の流れ下 は「先生」が主人公に送った長い遺書。親友「K」と「お嬢さん」との三角関係などを通じて、上では主人公にも読者にも「解ら」なかった事柄が明らかに。上 では主人公と「先生」中では主人公が実家に戻が交流を深めていく。しかし「先生」の話はよく「解ら」ないことも多い。り「父」「母」との会話が多くなる。「先生」とも「手紙」をやりとり。19Ex.
「先生の話のうちでただ一つ底まで聞きたかったのは,人間がいざという間際に、誰でも悪人になるという言葉の意味であった。単なる言葉としては、これだけでも私に解らない事はなかった。しかし…」(上二九)
20.
4.2 対応分析による視覚的な探索① メニューから「ツール」「抽出語」「対応分析」②
「H1」になっていることを確認③ クリック20上・中・下の特徴をグラフィカルに探索
21.
【解説】対応分析の見方② 原点(0, 0)から見て、「上_先生と私」の方向にある語、そして原点から離れている語ほど、上に特徴的!原点(0,
0)※特徴語の一覧から読み取れた上・中・下の特徴と、おおむね同じ特徴を対応分析からも読み取れる。21① 原点(0, 0)付近にはこれといって特徴のない語が集まる
22.
5. コーディングによるコンセプトの抽出22
23.
【解説】 コーディングとは語ではなくコンセプトを数えたい場合もある例えば「人の死」というコンセプトは、「死ぬ」だけでなく「殺す」という語でも表現されるコンセプトを数えるためのコーディングルールコード(コンセプト)の名前*人の死死ぬ or
殺す or 亡くなるコードを付与する条件。「死ぬ」「殺す」「亡くなる」のどれかが出現している文書は、「*人の死」に言及していたと見なされる。23チュートリアルで使用する「theme.txt」
24.
5.1 コーディングルールによる検索① メニューから「ツール」「文書」「文書検索」②
「参照」をクリックして「theme.txt」を開く④ ダブルクリック③「段落」を選択⑤ ダブルクリックで段落全体を表示24コーディングルール作成時には、どのような文書にコードが付与されているかを検索・確認することが大切
25.
5.2 コードのクロス集計(部ごと)① メニューから「ツール」「コーディング」「クロス集計」②
「参照」をクリックして「theme.txt」を開く人の死恋愛③「段落」を選択④「集計」をクリック友情信用・不信⑤「バブル」をクリックしてプロットを作成25下_先生と遺書中_両親と私上_先生と私病気コードが多く出現していたかどうかを、部ごとに集計したプロット
26.
【解説】部ごとの集計から見る物語の流れ③ 中・下のような人物の死は描かれていないのに、上でも「人の死」が一定数出現。① 下では3角関係のいき人の死さつから親友が自殺。そのため「恋愛」「友情」「信用・不信」が多い。恋愛Per
cent :友情510信用・不信15② 中では病気で死に する26「父」の様子が描かれる。下_先生と遺書中_両親と私なぜ?次の分析で確認!上_先生と私病気
27.
5.3 コードのクロス集計(章ごと)① 5.2に続けて以下の操作を行う②「文」を選択③「見出し2」を選択④「集計」をクリック⑤「選択」「人の死」をクリックしてグラフを作成27「人の死」が多く出現していたかどうかを、章ごとに細かく見る折れ線グラフ
28.
【解説】「人の死」の推移から 1/2① 自殺の直前だけを見②
しかし物語全体に視野を広げると、「先生」が死ぬことに執着している様子が、上でも詳細に描かれている。Ex. 「…先生の話は,容易に自分の死という遠い問題を離れなかった。そうしてその死は必ず奥さんの前に起るものと仮定… 」(上三五)ると、「先生」はかなり急激に決意を固めているようにも見える。上二四上三五③ 自殺の理由の一部には、お金や恋に切羽詰まれば誰でも悪人になる、人間一般への失望28Ex. 「…自分もあの叔父と同じ人間だと意識した時…。他に愛想を尽かした私は、自分にも愛想を尽かして動けなくなったのです」 (下五二)
29.
【解説】「人の死」の推移から 2/2④ 自殺が突然で不自然という批判は必ずしもあたらないのでは?計量テキスト分析の利点として:データ全体を見渡す視点が得られる目で読むべき特徴的な部分はどこか探索できる29上二四上三五
30.
おわりにさらに詳しくは『社会調査のための計量テキスト分析』(樋口耕一著,ナカニシヤ出版,2014)第3章の文章版チュートリアルや、KH Coder同梱のリファレンスマニュアル、掲示板(ユーザーフォーラム)などをご利用ください。謝辞30本チュートリアルの作成と改善にあたっては、立命館大学産業社会学部ならびに大学院社会学研究科の学生諸氏にご協力いただきました。
Download
[8]
ページ先頭
©2009-2025
Movatter.jp