- Notifications
You must be signed in to change notification settings - Fork0
yocjyet/wlsp-classical
Folders and files
Name | Name | Last commit message | Last commit date | |
---|---|---|---|---|
Repository files navigation
© 2013–2024 宮島 達夫・鈴木 泰・石井 久雄・安部 清哉・于 拙
『古典分類語彙表』のデータを整理し、構造化した上で公開したものです。また、近日中検索用インタフェースも併せて公開する予定です。
├── CHANGELOG.md├── README.md├── 分類ツリー.json├── 分類語彙表.csv├── 統計情報│ ├── A.項目総数.tsv│ ├── B.分類項目数内訳(類・部門).tsv│ ├── C.語彙項目数内訳(類・部門).tsv│ └── D.分類項目数(語彙項目数)内訳(類・部門).tsv└── 項目一覧 ├── 0_全項目.csv ├── 1_類.csv ├── 2_部門.csv ├── 3_中項目.csv └── 4_分類項目.csv
変更履歴を記したファイルです。
本ファイルです。利用方法・ファイル構成などを記載しています。
分類語彙表をツリー状に構造化されたデータをJSON形式で表したものです。データスキームは以下のTypeScriptの型定義によって表されます。
typeRoot=Category[];typeLevel='類'|'部門'|'中項目'|'分類項目';typeDigit='1'|'2'|'3'|'4'|'5'|'6'|'7'|'8'|'9';typeCategoryNumber=| `${Digit}.${Digit}${Digit}${Digit}${Digit}`// 1.1000| `${Digit}.${Digit}${Digit}`// 1.10| `${Digit}.${Digit}`// 1.1| `${Digit}`;// 1typeCategory={level:Level;number:CategoryNumber;description:string;count:number;children:(Category|Word)[];};typeTextTitle=|'徒然草'|'平家物語'|'宇治拾遺物語'|'方丈記'|'新古今和歌集'|'大鏡'|'更級日記'|'紫式部日記'|'枕草子'|'蜻蛉日記'|'後拾遺和歌集'|'土佐日記'|'古今和歌集'|'伊勢物語'|'竹取物語'|'万葉集';typeWord={lemma:string;kanji:string;attested:{[textinTextTitle]?:number};};
分類ツリーをJSON形式で表したものです。
分類語彙表をCSV表データとして整理したものです。
類,部門,中項目,分類項目,分類番号,語番号,語彙素,表記,徒然草,平家物語,宇治拾遺物語,方丈記,新古今和歌集,大鏡,更級日記,紫式部日記,枕草子,蜻蛉日記,後拾遺和歌集,土佐日記,古今和歌集,伊勢物語,竹取物語,万葉集
- 類: 類の名称(項目一覧/1_類.csv参照)
- 部門: 部門の名称(項目一覧/2_部門.csv参照)
- 中項目: 中項目の名称(項目一覧/3_中項目.csv参照)
- 分類項目: 分類項目の名称(項目一覧/4_分類項目.csv参照)
- 分類番号: 分類番号(
1
,1.2
,1.23
,1.2345
のような形式) - 語番号: 分類番号の語の番号(
1
,2
,3
, ...) - 語彙素: 語彙素(
あまりこと
,いちじ
,いちだいじ
, ...) - 表記: 漢字表記(
余事
,一事
,一大事
, ...) - 徒然草:『徒然草』における出現回数(以下同じ)
- […]
TSV形式で表された本データに関する統計情報です。
各階層の項目数、語彙の総数などが含まれます。
〈類〉〈部門〉の分類項目数の内訳のクロス集計表が含まれます。
〈類〉〈部門〉の語彙項目数の内訳のクロス集計表が含まれます。
〈類〉〈部門〉の分類項目数と語彙項目数の内訳のクロス集計表が含まれます。
分類語彙表の各階層の項目一覧表です。
階層に関わらず、すべての項目を含む表です。それぞれの分類番号、語彙素、総語数が含まれるCSVファイルです。
類の階層のみの項目一覧表です。以下同じ。
当データはクリエイティブ・コモンズ 表示 - 非営利 - 継承 4.0 国際にてリリースされております。
表示方法として、以下を参考文献として引用してください。形式は自由です。
- 宮島 達夫・鈴木 泰・石井 久雄・安部 清哉・于 拙(2024)「『古典分類語彙表』データ版」 v0.2.1、https://github.com/yocjyet/wlsp-classical
- 于 拙(2024)「宮島達夫他編『古典分類語彙表』データの構造化及びその応用」『情報処理学会研究報告』Vol. 2024-CH-134
- 宮島 達夫・鈴木 泰・石井 久雄・安部 清哉(2014)「古典分類語彙表」『日本古典対照分類語彙表』笠間書院
「『古典分類語彙表』データ版」の営利目的の利用に関しては、以上のライセンスによって許可されておりません。商業利用に関するお問い合わせは、件名に「古典分類語彙表の商業利用について」と明言した上、contact@yocjyet.devまでご連絡をお願い致します。
About
古典日本語の分類語彙表データ
Resources
License
Uh oh!
There was an error while loading.Please reload this page.