- Notifications
You must be signed in to change notification settings - Fork5
License
NotificationsYou must be signed in to change notification settings
KodairaTomonori/ThreeLineSummaryDataset
Folders and files
Name | Name | Last commit message | Last commit date | |
---|---|---|---|---|
Repository files navigation
WebDB Forum 2017 の「TL;DR 3行要約に着目したニューラル文書要約」という発表論文内で構築されたデータセットです.
論文の内容に関しては,学位論文「文書構造に着目したニューラル文書要約」を参照してください.
または,こちらの動画3行要約に着目したニューラル文書要約@youtube参照.
LivedoorNews(http://news.livedoor.com/)からクロールしてデータセットの構築を行います.data/
以下にあるcsvファイルにサイトの情報が記述されています.
各列の詳細は以下,
1列目は記事の公開年
2列目は記事の公開月
3列目は記事のカテゴリ
4列目は記事のID
4列目はタイプラベル(0が並列,1が直列)
記事IDからサイトのURLが作成できます.3行要約が載っているURLはhttp://news.livedoor.com/topics/detail/xxxxxxxx/
記事が載っているURLはhttp://news.livedoor.com/article/detail/xxxxxxxx/
xxxxxxxx
にIDを入れてください.
About
No description, website, or topics provided.
Resources
License
Uh oh!
There was an error while loading.Please reload this page.
Stars
Watchers
Forks
Releases
No releases published
Packages0
No packages published