- Notifications
You must be signed in to change notification settings - Fork0
Japanese Livedoor news corpus for huggingface datasets
shunk031/huggingface-datasets_livedoor-news-corpus
Folders and files
Name | Name | Last commit message | Last commit date | |
---|---|---|---|---|
Repository files navigation
annotations_creators | language | language_creators | license | multilinguality | pretty_name | size_categories | source_datasets | tags | task_categories | task_ids | ||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
|
|
|
| livedoor-news-corpus |
|
|
- Table of Contents
- Dataset Description
- Dataset Structure
- Dataset Creation
- Considerations for Using the Data
- Additional Information
- Homepage:http://www.rondhuit.com/download.html#ldcc
- Repository:https://github.com/shunk031/huggingface-datasets_livedoor-news-corpus
本コーパスは、NHN Japan 株式会社が運営する「livedoor ニュース」のうち、下記のクリエイティブ・コモンズライセンスが適用されるニュース記事を収集し、可能な限り HTML タグを取り除いて作成したものです。
[More Information Needed]
[More Information Needed]
fromdatasetsimportload_datasetdataset=load_dataset("shunk031/livedoor-news-corpus",train_ratio=0.8,val_ratio=0.1,test_ratio=0.1,random_state=42,shuffle=True,)print(dataset)# DatasetDict({# train: Dataset({# features: ['url', 'date', 'title', 'content', 'category'],# num_rows: 5894# })# validation: Dataset({# features: ['url', 'date', 'title', 'content', 'category'],# num_rows: 737# })# test: Dataset({# features: ['url', 'date', 'title', 'content', 'category'],# num_rows: 736# })# })
[More Information Needed]
[More Information Needed]
[More Information Needed]
[More Information Needed]
[More Information Needed]
[More Information Needed]
[More Information Needed]
[More Information Needed]
[More Information Needed]
[More Information Needed]
[More Information Needed]
[More Information Needed]
各記事ファイルにはクリエイティブ・コモンズライセンス「表示 – 改変禁止」が適用されます。 クレジット表示についてはニュースカテゴリにより異なるため、ダウンロードしたファイルを展開したサブディレクトリにあるそれぞれの LICENSE.txt をご覧ください。 livedoor は NHN Japan 株式会社の登録商標です。
[More Information Needed]
Thanks toRONDHUIT Co., Ltd. for creating this dataset.
About
Japanese Livedoor news corpus for huggingface datasets
Topics
Resources
Uh oh!
There was an error while loading.Please reload this page.
Stars
Watchers
Forks
Releases
Packages0
Uh oh!
There was an error while loading.Please reload this page.