AIの著作権問題に終止符か? 8TBの巨大オープンデータセット「Common Pile」登場、Llama 2に匹敵するLLMもリリースAIは創作物を無断で学習しても許されるのか──。この問いは、生成AIの進化と共に業界全体に重くのしかかる根源的な課題となっている。著作権侵害を主張する訴訟が相次ぎ、AI開発企業は防衛的にそのデータ利用の詳細を固く閉ざすようになった。この「透明性の冬」とも言える状況が、健全な研究の進展を妨げていると懸念する声は少なくない。 そんな中、AI業界の分水嶺となる可能性を秘めた画期的なプロジェクトが姿を現した。 非営利の研究団体EleutherAIと、トロント大学、Hugging Face、Allen Institute forAI (AI2)など多数の組織からなる共同研究チームは、「Common Pile v0.1」と名付けられた、8テラバイト(TB)にも及ぶ巨

あけましておめでとうございます。 気が付けば2024年が終わり、また集計をする時期がやってきてました。 今年は12月中旬まで半年分放置してましたが、集計方法を変更し作業がかなり楽になりました。 どうでもいい話はこれくらいにして、2024年のななしいんくと配信を振り返っていきます。 2024年配信回数/配信時間まとめX(旧Twitter)に大みそかギリギリに上げましたが、配信中のものがあったりなんだかんだあったのでこちらが完全版です。多分。 元データには以下を使用 ・Googleスプレッドシート 私がWiki用に作成しているシートとその集計用シート ・Twitch Tracker Twitchの配信確認用。時間はいい感じに集計 ・Youtubeの各チャンネルのライブ画面 再生時間取得は手動でタイトルを確認しながら集計 一部配信枠が抜けていたことを確認したのでこっそり追記している Twitch

(2024/12/15) 12月16日~1月15日0時までの間、本記事を過去の販売価格の半額で販売いたします。2024年総集編もなるべく早く公開いたしますので、ご期待ください。 VSTATSで集計したデータの公開記事として「Vtuber業界地図」を作っておりましたが、2022年8月を最後に更新をしていませんでした。大変申し訳ございません。 ですが、今回2023年のまとめとして復活し、今後四半期に1度のペースでやっていきたいと思います(できませんでした!)ので、またご愛顧いただけたらと思います。 なお、個人ブログ「VSTATSBlog」において毎月集計結果は公表しておりました。よろしかったらそちらもご覧ください。 なおこの記事はVtuber全体及び企業別の概要としての分析は無料で読めますが、もう少し踏み込んだブランド別の分析は有料とさせていただきます。VSTATSを2年以上運用して取得した


ResourceSyncフレームワーク仕様等の日本語訳を作成しました。本資料は、国立情報学研究所 機関リポジトリにて公開しております。 ResourceSyncフレームワーク仕様(ANSI / NISO Z39.99-2017) 日本語訳 https://doi.org/10.20736/0002000713 [原文] http://www.openarchives.org/rs/1.1/resourcesync ResourceSyncフレームワーク仕様:変更通知 日本語訳 https://doi.org/10.20736/0002000721 [原文] http://www.openarchives.org/rs/notification/1.0.1/notification ResourceSyncフレームワーク仕様: フレームワーク通知 日本語訳 https://doi.org/
2023年8月23日、丸善雄松堂株式会社が、国立情報学研究所(NII)に、同社が保有する電子書籍に係る書誌データ約12万件を提供することについて、2023年7月に合意したことを発表しました。 発表によると、同社の電子図書館サービスである「Maruzen eBook Library」で提供されている電子書籍の書誌データについて、NIIが構築を進める国内電子ブックメタデータのディスカバリーサービスのプロトタイプのために提供することとしたとしています。 丸善雄松堂がNIIへ書誌データの提供で協力~NIIの電子ブックメタデータ「ディスカバリーサービス」の実証実験に電子図書館Maruzen eBook Libraryの書誌データを提供~(丸善雄松堂,2023/8/23) https://yushodo.maruzen.co.jp/release/20230823/ 参考: これからの学術情報システ

2023年7月25日更新 openBDプロジェクト(カーリル・版元ドットコム)は書誌情報・書影を、だれでも自由に使える、高速なAPIで提供することを目的にスタートしました。出版社団体である版元ドットコムの会員社が提供するデータだけではなく、版元ドットコムが受信している、出版情報登録センター(JPRO)のデータを含めることで、網羅率の高い書誌・書影情報の配信が実現しました。 2017年から始まったサービスは今年で7年目を迎えました。 現在、高いデータ網羅率と、高速で使いやすいAPIが評価され、毎日500万リクエスト以上のAPI要求を処理しており、書誌・書影情報へのニーズの高まりとともに利用が増加しておりました。2023年6月5日から、JPROから版元ドットコムへのデータ配信が停止され、版元ドットコム会員社以外のopenBDのデータ更新が停止しました。openBDが提唱する「書誌情報・書影を
Vの数字:VTuberの配信のいまを「生配信」「編集動画」「ショート」の分類と配信時間から読み解く試み2023/05/24 デジ埋です。最近はまた若干外出を控え気味にしているため、 記事更新がだいぶ滞りがちです。 そんな中でここしばらく何をしているのかと言いますと、 半年前くらいからちょこちょこ実験をしていたVTuberの情報を 分析するサイト 「ブィレーダー」 の手入れをしていました。 「ブィレーダー」Vtuberの話題を多角的にチェック このブログでも何度かお話をしていますが、私自身は2022年の1月頃から 急激にVTuber、特に 「にじさんじ」 にハマりまして、それが興じて更に 色々なことを知りたくなって実験しはじめたのがこの「ブィレーダー」です。 余談でいうと、先月からTwitterAPI が使い物にならなくなってしまった ことで「アニメレーダー」が止まってしまい、探求心

今朝方GPT-4が発表されて、みなさん死ぬほど盛り上がってますねー。 GPT-4を使えば一発でできそうなネタではありますが、GPT-4APIのお値段は3.5よりもお高めの設定なので、これからはどのように上手くGPTのバージョンを使い分けていくかが問われていくと思います。 というわけで今日は非構造化データを構造化データに変換する話です。 問題の背景行政が定期的に公開している統計資料をご覧になったことはありますでしょうか。ディスる訳ではないですが、以下に示すのは私が住んでいる富士吉田市の統計資料です。 統計ふじよしだ令和元年度版 - 商業 このように分かりやすい表で情報を提供してくれるのはありがたいのですが、数値データにはなっていないので分析に活用することができません。 GPTのパワーを使って、このような非構造化データを構造化データに変換できないか?というのが本日のお題になります。 コードP

MATSUTANI Soichiro @TRiCKPuSH 松谷創一郎/著書『ギャルと不思議ちゃん論』『SMAPはなぜ解散したのか』、共著『ポスト〈カワイイ〉の文化社会学』『文化社会学の視座』『どこか〈問題化〉される若者たち』等。4月から10月にかけてはカープのことばかり呟くので注意。連絡先: trickflesh@gmail.com sites.google.com/view/trickview/ MATSUTANI Soichiro @TRiCKPuSH Spotifyチャート73か国・地域のデータ6年分を分析して、日本の音楽ヒットが異様な「固着」状況であることを炙り出しました。先進国とは思えない流行の停滞が起きています。 ↓ ヒットの固着──Spotifyチャートから見えてきた停滞する日本の音楽(松谷創一郎) #Yahooニュース approach.yahoo.co.jp/r/QUy

No.漫画名 作者 発行部数 巻数 1巻当たり発行部数 1ワンピース ONE PIECE 尾田 栄一郎 4億9000万 103 4,757,282 2 ゴルゴ13 さいとう たかを 2億6000万 206 1,262,136 3 ドラゴンボール鳥山明 2億5000万 42 5,952,381 4 ナルトNARUTO岸本 斉史 2億5000万 72 3,472,222 5 名探偵コナン青山剛昌 1億5650万 102 1,534,314 6 こちら葛飾区亀有公園前派出所秋元 治 1億5000万 201 746,269 7鬼滅の刃吾峠呼世晴 1億3500万 23 5,869,565 8 美味しんぼ雁屋哲 1億2029万 111 1,083,694 9スラムダンクSLAMDUNK 井上雄彦 1億2000万 31 3,870,968 10BLEACH ブリーチ久保帯人 1億 74 1,35


Tech Journalist. Editor at large @TechnoEdgeJP テクノエッジ主筆 / ファウンダー / 火元 怖い実話としてよく耳にする「ある日突然Goolgeアカウントから締め出され、抗議しても泣き寝入り」にこれまた強烈な例がありました。 遠隔診療のため医療機関の指示で幼児の生殖器の写真を送信した父親が、Googleから「有害なコンテンツ」のアップロードを理由にアカウント停止処分と当局への通報を受け、捜査の結果警察の疑いは晴れたもののGoogleは許さず、GmailやGoogle Fi電話番号を含むアカウントを永久に消去した事例を NY Timesが伝えています。 リンク先は複数の事例や関係者からの聞き取りを含む長大な記事ですが、ひとつの件の概要を引くと、 米サンフランシスコ在住の40代男性が、乳幼児の息子の性器に腫れがあり痛がっていることに気づき、診察のた

Vtuber配信データ収集・分析サイトVSTATS(https://www.vstats.jp)を運営しているジェネリック集計人(またの名をHoloデータ分析)と申します。今回、データの集計環境がそろいましたので、現在のVtuber業界の概況が垣間見えるようなデータを公開したいと思います。 速報性を重視するため、とりあえず画像のみの公表で、解説等は気が向いたら随時追加予定ですので、ご了承ください。 なお、各種公表画像にはYoutubeが表示している各チャンネル・各動画のサムネイルを使用していますが、これは分析データを視認しやすくするため、著作権法に基づいた必要最小限の引用であると考えておりますので、ご理解をお願いいたします。 5月の概況・各種統計データ業界全体シェア(総視聴時間基準)VSTATSでは一定の基準を満たしたチャンネル(約550チャンネル)を観測対象としております。観測していない

2021年10月31日に行われた第49回衆院選では、2012年に自民党が政権を奪回して以降、はじめて衆院選での大規模な野党共闘が実現されました。しかし選挙結果は多くの野党支持者の期待とはうらはらに、野党第一党である立憲民主党が選挙前から13議席減らし、共産党も2議席失うという後退を示しました。この結果をうけて野党共闘の評価は割れています。 もちろんこうした結果をうけて試みを再考するというのは必要なことでしょう。しかしながら結論をはじめから決めてかかるような主張もまた、見かけないわけではありません。ここではそうした議論ならざる議論に終止符を打ち、真に内実のある議論へと進むべく、選挙結果をもとに野党共闘の検証を行っていきます。 野党共闘とは これまでの衆院選では、小泉政権下での一部の例外を除き、自民と公明の得た票の合計は全国の有効投票総数の半分に届いていませんでした。それにもかかわらず自公が圧

アニメウマ娘にハマったので,35年分の重賞[1]のレース結果をnetkeibaから取得した Plotlyでインタラクティブな散布図を描き,馬・タイトル・適性毎に分布を見てニヤニヤした 散布図に謎のクラスターが生じたが,1993年頃までの上りタイムの定義がわからず,原因解明に至らなかった 1993年頃まで一部のレースで上りタイムの計測方法が異なっていたことが原因と考えられる (長い記事なので,YouTubeの字幕をONにしてデモだけでもご覧頂けますと幸甚です) はじめにウマ娘プリティーダービー(以下,ウマ娘)とはCygamesによるスマホ向けゲームを中心とするとメディアミックスコンテンツ[2]です.テレビアニメは2018年4月から6月まで第1期,2021年1月から3月まで第2期が放送されました.私は当時それどころではなかったこともありリアルタイムで視聴できませんでしたが,のちほど全話視聴し

近年、テレビ受像機をインターネットに接続し、YouTube(ユーチューブ)、Netflix(ネットフリックス)といった動画配信サービスを視聴する行為が普及していることが注目されている。IXT(現インテージ)が2021年4月に日本全国約6000名に対して行ったアンケート調査によれば、全国でおおよそ3人に1人がスマートテレビ(ネットに接続可能なテレビ受像機)をネットに接続して利用している。 スマートテレビでは、放送(本稿では地上波、BS、CSを総称して「放送」と呼ぶ)だけではなく、ネット経由でさまざまな動画配信サービスを視聴することが可能だ。スマートテレビを利用する視聴者にとって、テレビ受像機はすでに放送のみを視聴するデバイスではなく、「さまざまな動画を大画面で視聴するためのデバイス」になっているといえるだろう。 スマートテレビ100万台の視聴ログを解析 では、スマートテレビに搭載されているア

「馬鹿げたプロジェクトだと思いましたね」 2018年、二人のドイツ軍将校がテュービンゲン大学を訪れてから数週間後のこと、ベルリンのドイツ国防省で、ヴェルトハイマーは最初の研究成果発表を行った。 彼は、第二次大戦期クロアチアのファシスト政党ウスタシャによるセルビア人大虐殺を扱った、作家ヨヴァン・ラデュロヴィックによる1983年の戯曲『鳩の穴』(未邦訳)、および1986年のセルビア作家協会による非セルビア人作家追放運動に注目した。 これらの出来事からまもなく、アルバニア人とセルビア人の間の民族を越えた友情や恋愛を扱った作品は姿を消し、修正主義的な歴史小説が流行するのだ。 「1998年にコソボ紛争が勃発し、大量の血が流されるずっと以前から、文学、また文学関係組織は10年にわたって、戦争への布石を敷いていたのです」とヴェルトハイマーは軍関係者らに語った。 発表会には、「プレビュー」計画の監督者、カ

「“開発者体験”で世界をエンパワメントする1日。」と題し、チームや組織の課題に日々取り組む方々に向けて開催された「Developer eXperience Day CTO/VPoE Conference 2021」。ここで、アイシア=ソリッド氏が「あなたが始めるデータ分析~データ分析プロジェクトの立ち上げ方から分析文化の作り方まで~」をテーマに登壇。まずはデータサイエンティストの杉山氏のストーリーを紹介します。 今日伝えたい3つの結論アイシア=ソリッド氏:じゃーん! 私でーす! 見えてるかな? 始まりまーす。イエーイ! というわけで、やってまいりました。Hello, world! アイシアです! イエイ、イエイ、イエイ、イエイ、イエイ! この部屋は、Developer eXperience Day 2021のルームA、アイシア=ソリッドによる発表です。「あなたが始めるデータ分析~データ分析

リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く