Movatterモバイル変換


[0]ホーム

URL:


Skip to content

Navigation Menu

Sign in
Appearance settings

Search code, repositories, users, issues, pull requests...

Provide feedback

We read every piece of feedback, and take your input very seriously.

Saved searches

Use saved searches to filter your results more quickly

Sign up
Appearance settings

古典日本語の分類語彙表データ

License

NotificationsYou must be signed in to change notification settings

yocjyet/wlsp-classical

Repository files navigation

versionLicense: CC BY-NC 4.0

© 2013–2024 宮島 達夫・鈴木 泰・石井 久雄・安部 清哉・于 拙

概要

『古典分類語彙表』のデータを整理し、構造化した上で公開したものです。また、近日中検索用インタフェースも併せて公開する予定です。

構成

├── CHANGELOG.md├── README.md├── 分類ツリー.json├── 分類語彙表.csv├── 統計情報│   ├── A.項目総数.tsv│   ├── B.分類項目数内訳(類・部門).tsv│   ├── C.語彙項目数内訳(類・部門).tsv│   └── D.分類項目数(語彙項目数)内訳(類・部門).tsv└── 項目一覧    ├── 0_全項目.csv    ├── 1_類.csv    ├── 2_部門.csv    ├── 3_中項目.csv    └── 4_分類項目.csv

変更履歴を記したファイルです。

本ファイルです。利用方法・ファイル構成などを記載しています。

分類語彙表をツリー状に構造化されたデータをJSON形式で表したものです。データスキームは以下のTypeScriptの型定義によって表されます。

typeRoot=Category[];typeLevel='類'|'部門'|'中項目'|'分類項目';typeDigit='1'|'2'|'3'|'4'|'5'|'6'|'7'|'8'|'9';typeCategoryNumber=| `${Digit}.${Digit}${Digit}${Digit}${Digit}`// 1.1000| `${Digit}.${Digit}${Digit}`// 1.10| `${Digit}.${Digit}`// 1.1| `${Digit}`;// 1typeCategory={level:Level;number:CategoryNumber;description:string;count:number;children:(Category|Word)[];};typeTextTitle=|'徒然草'|'平家物語'|'宇治拾遺物語'|'方丈記'|'新古今和歌集'|'大鏡'|'更級日記'|'紫式部日記'|'枕草子'|'蜻蛉日記'|'後拾遺和歌集'|'土佐日記'|'古今和歌集'|'伊勢物語'|'竹取物語'|'万葉集';typeWord={lemma:string;kanji:string;attested:{[textinTextTitle]?:number};};

分類ツリーをJSON形式で表したものです。

分類語彙表をCSV表データとして整理したものです。

類,部門,中項目,分類項目,分類番号,語番号,語彙素,表記,徒然草,平家物語,宇治拾遺物語,方丈記,新古今和歌集,大鏡,更級日記,紫式部日記,枕草子,蜻蛉日記,後拾遺和歌集,土佐日記,古今和歌集,伊勢物語,竹取物語,万葉集

列の一覧

  • 類: 類の名称(項目一覧/1_類.csv参照)
  • 部門: 部門の名称(項目一覧/2_部門.csv参照)
  • 中項目: 中項目の名称(項目一覧/3_中項目.csv参照)
  • 分類項目: 分類項目の名称(項目一覧/4_分類項目.csv参照)
  • 分類番号: 分類番号(1,1.2,1.23,1.2345のような形式)
  • 語番号: 分類番号の語の番号(1,2,3, ...)
  • 語彙素: 語彙素(あまりこと,いちじ,いちだいじ, ...)
  • 表記: 漢字表記(余事,一事,一大事, ...)
  • 徒然草:『徒然草』における出現回数(以下同じ)
  • […]

TSV形式で表された本データに関する統計情報です。

各階層の項目数、語彙の総数などが含まれます。

〈類〉〈部門〉の分類項目数の内訳のクロス集計表が含まれます。

〈類〉〈部門〉の語彙項目数の内訳のクロス集計表が含まれます。

〈類〉〈部門〉の分類項目数と語彙項目数の内訳のクロス集計表が含まれます。

分類語彙表の各階層の項目一覧表です。

階層に関わらず、すべての項目を含む表です。それぞれの分類番号、語彙素、総語数が含まれるCSVファイルです。

類の階層のみの項目一覧表です。以下同じ。

利用

ライセンス

当データはクリエイティブ・コモンズ 表示 - 非営利 - 継承 4.0 国際にてリリースされております。

CC BY-NC-SA 4.0

表示

表示方法として、以下を参考文献として引用してください。形式は自由です。

商業利用について

「『古典分類語彙表』データ版」の営利目的の利用に関しては、以上のライセンスによって許可されておりません。商業利用に関するお問い合わせは、件名に「古典分類語彙表の商業利用について」と明言した上、contact@yocjyet.devまでご連絡をお願い致します。

About

古典日本語の分類語彙表データ

Resources

License

Stars

Watchers

Forks

Packages

No packages published

[8]ページ先頭

©2009-2025 Movatter.jp