
はてなキーワード:パブリシティ権とは
■まず大前提
著作権侵害の刑事処罰は原則“親告罪”(権利者の告訴が必要)。
ただし悪質な海賊版行為の一部は非親告罪化されとる(TPP関連改正)。
つまり、営利・原作そのまま・権利者利益を不当に害するなどの条件を満たすと、告訴なしでも動けるケースがあるで。
肖像権侵害は民事上の問題(人格権)。刑事罰の条文はなく、差止・削除・損害賠償などで争われるタイプや。判例上の権利として整理されてる。
■A.著作権侵害っぽいのを見たら(あなたが当事者ではない場合)
2.プラットフォームに通報:各SNS/サイトの著作権侵害報告フォームから淡々と報告。(プロバイダ責任制限法関係の最新ガイドラインに沿って運営側が対処する)
3.公的窓口も選択肢:違法・有害情報相談センター(ihaho)で相談可。
・投稿者へ直接DMで抗議/晒し行為(誤認・名誉毀損のリスク)。
・「作者本人」に勝手に通知(誤情報や二次被害を招きやすい)。
◯迷いどころメモ
引用ならOK? →出所明示/主従関係/必要最小限など厳しめの要件を全部満たして初めてセーフ。見かけが“引用っぽい”だけやと通らんことも多いで。
2.サイト運営へ削除申請(専用フォーム or送信防止措置の申出)。
4.刑事も視野:原則は親告罪やけど、悪質な海賊版の一部は非親告罪化されとる(営利目的・原作そのまま・利益を不当に害する等)。状況がハマるなら警察/相談窓口へ。
■C.肖像権侵害っぽいのを見たら(あなたが当事者ではない場合)
◯ベターな動き
2.プラットフォームの通報機能で報告(ガイドラインに沿って処理される)。
◯NG
・当人へ直DMして不安を煽る/晒す(誤認・二次被害・三者間トラブルの火種)。
■D.肖像権侵害っぽいのを見たら(あなたが写ってる本人の場合)
1.証拠保全。
3. 応じない場合は弁護士へ(差止・削除・損害賠償の民事対応)。
※肖像権は条文でなく判例上の人格権として扱われるのが基本や。
二次創作:公式ガイドラインで許容範囲が定められてることがある。なければ基本グレー。
AI生成:見た目が似てても直トレースや原作そのままでなければ即アウトとは限らん。が、原作そのまま流用や配布は危険。
素材サイトの人物写真:モデルリリース(肖像使用許諾)の有無・用途制限を要確認。ロイヤリティフリーでも万能ではない。
正規配信か迷ったらABJマーク/エルマークの有無も目安になるで。
公式配布物の無断転載(原作そのまま)と思われ、権利者の利益を不当に害する可能性があります。貴サービスの規約と法令に照らしたご確認をお願いします。
本人同意がない公開で、人格的利益を害するおそれがあります。ガイドラインに基づくご対応をご検討ください。
> 私は当該著作物の権利者です。以下のURLの内容は無断利用であり、削除(送信防止措置)を求めます。
作品名:____/権利立証資料:____/URL:____/日時:____
■まとめ(フローチャート風)
2.当事者でなければ:運営へ通報(DM抗議や晒しはしない)。
3.当事者なら:削除申請 → 応じなければ弁護士 →(著作権で悪質類型なら)警察相談も視野。
4.引用・二次創作・AIは要件確認。迷ったら触らんのが安全。
絵からトレパクしても写真からトレパクしても日本の著作権法的には基本的に問題ない。
絵からトレパクした場合、線だけで無く塗りも完全にマネしてたらそれは著作権侵害になり得る。
今は、肖像に関する別個の権利として整理する方が主流じゃない?
「財産権」の中に所有権と知的財産権があるとして、知的財産権は所有権の一種だとは言わないじゃん。
判例が「肖像権」という表現を使ってきたのはもっぱら肖像に関するプライバシー権なので、パブリシティ権も含む一段上の抽象的権利ではなく、上の例で言えば「財産権」ではなく「所有権」に相当する位置に整理されることが多いと思う。
本人の投稿でも書かれているようにほぼパブリシティ権の問題であり、そこを解決したという話になるのだと思う。
肖像権はみだりに撮影・公表されない権利と言えるが、違法判断は侮辱的、名誉感情侵害等が強く作用し、広告利用で直ちに肖像権を侵害とは言い難い。本件態様は駅貼り広告等であって、そこが「専ら顧客吸引力の利用を目的とする場合」に不法行為となり得るパブリシティ権に刺さっていたわけである。ただ、肖像権が完全に並走しないわけでもなく、また特に"写真の撮影者"の著作権の許諾がはっきりとしていないように読めるので、そこに若干の懸念は残っているかもね。大きな問題とは思わないけども。
本人の投稿でも書かれているというのは「文筆/モデルなどで発信されている」という部分。職業的に自己の肖像・氏名に経済的価値がある者の顧客吸引力を無断で用いたと評価され得る状態が問題だったので解決したという主張であり、弁護士が助言しているのだろう。
写真の著作権と混同されている方もいるが、判例的には構図・配置・色調・光線・背景の扱い等の写真特有の個性的表現の持込みが重要であり、輪郭の一致は依拠の推認に効くものの、「本質的特徴の直接感得」とは言えず、メッシュやほくろ位置一致も被写体の事実であり写真家の創作的選択と言い難いかな
あの写真の著作物性の源泉を考えてる。被写体は人物で、容貌そのままなので、そこに著作物性はないだろう。印象的な画角構図だが、そこに著作物性を認めると、人物が別でもあの画角構図では写真が撮れなくなる。
光の加減や細部の明暗ぼけ具合などには著作物性があるだろうが、イラストに残っているか?
確かに人目を引く広告なので、専ら顧客吸引力の利用を目的としていると言える。
肖像に由来するのか、それともあの写真の出来栄えに由来するのか。前者ならパブリシティ権侵害だが、後者だと侵害にはならない。
うーん、難しいぞ。
パブリシティ権の問題にした方が良いかも。でないと、肖像権の議論になって、広告利用の受忍限度論になるけど、パブリシティ権のご先祖様みたいな話しで、そこが今更発展するのは抵抗感がある。
その「アカウントを見てみたらSNSを中心に文筆/モデルなどで発信されている金井 球さんという方でした」(江口)のくだりは、パブリシティ権があり得る方だった(一般人ではないのでパブリシティ権ないとはいえないのであった)という意味じゃないかな。みんな肖像権とか言ってるけど、そこじゃなく。
江口寿史のツイートだとパブリシティ権で解決したことが分かるけど、それが金井球氏の経済的利益に最も便利だったからか、肖像権の問題にするのは江口の作家性として譲れなかったからか、どちらかは不明。いずれにせよ民事的に解決済みなので、外野には今後の表現の問題で参考にする以外のことはない。
江口寿史問題の発端、金井球氏の「わたしはわたしだけのものであり、人間としてさまざまな権利を有しております」の言葉を尊重すると、金井氏をむやみに被害者扱いしない、共感しないというのが、俺の倫理なんだよな。なお、「わたしはわたしだけのものであり」の言明には同意しない。権利は当然ある。
むやみに同情するくらいなら経済的利益を理論づけた方がよく、そしたら受忍限度と、表現の自由一般および江口寿史の作家性の参酌含めて諸般の事情との比較衡量になる肖像権よりも、顧客吸引力について「専ら」を緩く捉えてパブリシティ権で攻めた方がいいということなのかなと法律の素人は想像した。
先に言っておく。本件を
あるいは
【ホ】 声が似ているだけの他人(声優の別名義ではなく、文字通り声が似ているだけの他人)の問題
だと思い込んでる人がいるが、声に関して上記2つは問題にならない。
同様に
【バ】 声泥棒よくない
これらも、本件とは直接関係ないので、この手のアホバカなトラバ・ブクマは無視しろ。
本件の争点は3つある。
「ピンク・レディー事件」への最高裁判決を判例として整備されつつある権利。
立法はまだだが、判例があればそこに生まれた権利は保護される。
ダンダダンのXパロディも、もしYOSHIKIが紅の権利をソニーに売ってなければ、パブリシティー権侵害を主張できた。
もしDMMが、にじボイスの学習元の権利を持っていて、声優との契約書にも学習や利用を制限する条項が無いなら、にじボイスのサービスには法的問題がない。
しかし今回、kaunistaは学習元を公開しながら、同時にモデルを自ら決めたライセンスのもとで提供し続けた期間があり、民事で訴えられたらパブリシティー権侵害したと認定される可能性がある。
2項についても言えることだが、著作権法30条の4は「学習の自由」を広く認めるものの、不正競争防止法は「営業上の信用や限定データの保護」を守る方向で働く。
公開されている音声を学習する行為自体はグレー〜合法寄りでも、生成AIを「特定声優の代替商品」として流通させた場合は、不正競争防止法で差し止め対象になり得る。
生成された音声が「○○声優の公式音声」と誤認させる態様で流通する場合、ブランドや表示の冒用に当たり得る。
特に「声=キャラクターの同一性の重要要素」と見られる場合、商品等表示(トレードドレス的要素)に該当する可能性がある。
特定声優の声質をまねたAIを「○○声優風」として提供すれば、声優の営業上の信用にタダ乗りしたと評価される可能性がある。
これはパブリシティ権侵害と重なる部分があるが、民事上は不正競争防止法で差止請求・損害賠償が認められる可能性もある。
なお、民事で訴えられるのはAIの開発者・提供者ではなく、AIの使用者(例えば無料だからと安心して動画つくった配信者)である!
最後に言っておく。
声は聞いたことないが、本件周りには、やたらと共通点の多い声豚が、3匹いる。
もし元増田=litagen=kaunistaだったら、この後の展開どうなるんだろな?
https://news.livedoor.com/article/detail/28724117/
最後に、AIに関して、制度という観点で申しますと、先ほど杉村委員からも御指摘あ
りましたとおり、声と肖像とAIという点に関して、知的財産推進計画2024の中でも
現行の不正競争防止法との関係を整理すべきというような御議論もございました。我々と
しても現時点の考え方について今回整理をさせていただきました。
9ページ目に、生成AIと肖像・声に関して、現行不競法における考え方について、海
外事例等も参考にしつつ、有識者の皆様方に御意見をお伺いしながら事務局としてまとめ
ました。
- 12 -
まず、不正競争防止法に関しては様々な不正競争を2条1項に規定しているところです
が、俳優、声優さんの声や肖像と生成AIの関係に関しては、個別事案によりますけれど
も、1号の周知表示混同惹起行為、2号の著名表示冒用行為、20号の誤認惹起行為、21号
の信用毀損行為の4つの不正競争行為が、該当し得るのではないかと考えているところで
ございます。
ただ、繰り返しになりますけれども、肖像や声という観点から申しますと、実態として
肖像や声の周知の程度であったり、肖像や声がどのように使われているのか等により、個
...
次に、声に先ほどと同様に、本人の許諾を得ていない場合を想定してございますが、事
例③のように、ある人物と同一の声を出力することができる生成AIを使って、当該人物
の持ち歌ではない曲を歌わせ、それを動画投稿プラットフォームなどに投稿する場合です
ね。この場合ですと、当該人物の声が周知ということであれば、1号によって対処し得る
と考えられます。ただ、1号はあくまでも混同の要件ありますので、仮に「これは生成A
Iを使って歌わせています」というような、打ち消し表示が付されているような場合には、
- 13 -
1号で対処することが難しく、その場合、理論上は、その声に著名性が認められるという
...
争防止法自体は肖像・声そのものを規制するものではありません。不正競争防止法以外で
も、パブリシティ権も判例上認められているところでございますし、昨年の5月に取りま
https://www.meti.go.jp/shingikai/sankoshin/chiteki_zaisan/fusei_kyoso/pdf/028_gijiroku.pdf
元ネタはこれなんだろうけど、不正競争防止法って説明そのまま読むなら事業者間での話であって、別に収益化してない投稿なら適用されない気もするのだがどうなのか。
お互い話が通じないと表現しているやり取りが多いのが気になったので。
◾︎コスした状態で電車やバスといった公共交通機関を使うべきではない
→わかる。ジョーカーの事件もあったし、一般の方からの視線を考えると控えた方が良いとは思う。衣装とかに対して周りも気を使うからね。
けど強制は難しそう
→公共交通機関と捉えるかは解釈は分かれそう。公共交通機関としてタクシーを含んで表記されてる時もある
→公共交通機関ではあるけど他者の迷惑になる、っていう部分はクリアしてる。個人的にはタクシーにイレギュラー対応求めない+迷惑をかけなければ良いんじゃないかなとも思うけど、タクシー側の判断が全て。
今回は乗れてるからNGではないんだな、くらいだし、服装やメイクで乗車拒否されても多様性云々とも言えない。
(だからコスして乗るならベストは自家用車だとも思う。中汚したりしても自己責任の範疇なので)
◾︎万博に自家用車なりタクシーなりで行ってるならいいだろ(該当の方はタクシーを使用)
→自家用車は万博の公式サイトにて乗入NG記載があるので辞めた方がよい。駐車場→万博直通のシャトルバスの利用を指定されてるし、そのルートはバスにコスしたまま乗ることになるのでどうなのかな…とは思う。
タクシーは乗り入れ場所があるので使って乗り付けはいいと思う。
ただ万博サイトのアクセスガイドに「電車やバスなどの公共交通機関を利用しての来場」をお願いしているけど、バスや電車・フェリーでのアクセスを説明する一覧の中にタクシーは並んでいないので障がいを持ってたり、高齢の方などの前述された交通機関を使うのに不安がある人達向けの対応の1つとして取り扱ってる印象を受けた(これは個人の主観なので普通にシャトルバス使いたくない、とかでタクシー使うのもいいんじゃないとは思う)
→これはもっと言い方あるだろうし、だから因習村だと揶揄される。
ただ公共交通機関をコスした状態で利用しない+更衣室もないってなったらしっかりしたコスは無理って考えになるのも腑に落ちる。
→結構更衣室がないとして名前が出てくる国内のイベント(Dハロ・ユニバ・地方のイベント)は調べたら普通に近くの施設に更衣室用意されてたり、会場までの徒歩圏内にホテルがあったり、自家用車で会場まで乗り付けられる。って感じぽいので今回のタクシー必須はまた前提変わってくる気がする。過去のDハロとかは更衣室なかったみたいだけど用意されたってことはその範囲で着替えてほしいって意図を感じるし。
→それは一部そうだと思う。オリキャラのコスや一次創作コスなら今より批判される部分は少なかったと思う。ただ版権元によってはコスOKのところもあるから版権というよりはダンジョン飯って作品なのが問題あるかもねくらい。
明確にOK出してない版権コスに関してはSNSで載せてる時点で綱渡りっぽいけど、法の素人すぎて分からないし、なにより弁護士の間でも所感が分かれてる感じだった。
(共通してたのは自作衣装・自宅で家族に見せるくらいなら基本的には法的に問題ない、くらい)
→指摘の仕方があまりにも因習村仕草だったのはそう。なんか火を立てたのは所謂学級会と揶揄されてる側ではあるけど、本人が収益化関係もあるのかもしれないけど油注いでいる部分もなくはないなと思った。
→人によりけりではありそうだけど、二次創作ガイドラインがあるところだとコスプレに触れてるところも多いので、二次創作だと捉えてる人は多いと思う
→コスプレと明記した上で、制限なりルールなりある上で二次創作ガイドラインにてOK出してるところは普通にあった
◾︎二次創作してる人間やコスプレイヤーだって権利侵害してるのにこの人に対して言ってるのはおかしい
→それはその人の考え方だね
◾︎これで問合せする人が増えて禁止になったらどうする
→正直ここまで大事になったら禁止になる覚悟決めてる人もいると思うし、見かけた。
権利者側が問合せしないでくれ、一律禁止にするしかなくなる。ってポストしてるのも見かけたけど多分自分が例外だと思ってるオメでたい人以外に、一律禁止になる覚悟ガンギマリ人間か、他ジャンルで活動してるから自分には影響ないと思ってる人間もいるからあんまり響かない気がしてる。
→FAすらSNS掲載NGにしてる作品はある。あと成人向けや同人グッズを禁止にしてるところもいくつか見つけたので大枠として公序良俗に反する、的な理由以外でもNGがある作品はある
→いくつか調べたら普通にファン個人を相手取って同人関連で裁判起こしたり、商品取り下げ対応要請・警告文送付してる事例は見つかったので一切ないとは思えないかな。だから今回の人相手に公式が何も動かないだろ、とは言いきれないかな。警告文ならともかくそれ以外の対応に関しては会社やら弁護士やら挟むので直ぐに対応が表に出てこないだろうし。
→多分難しいと思う。スタッフがコスプレなのか、版権作品のコスプレなのかどうかって判断する作業が増えるのはもちろんだけど、そこをくぐり抜けられたって載せる人間はいるだろうから。
それこそ本人の問題でしかないけど因習村的にはコスプレイヤーは〜だの、該当の作品のファンは〜って言う人間は出そうだしね。そう言う人間が視野が狭いだけだけど。
◾︎ユニフォームやスーツを着てる人達だって公共の場でコスプレしてる
→コスプレで権利関係が問題になる部分を照らし合わせると、そのユニフォームが自己制作の場合は問題になるかもしれないけどユニフォームがチームなりで販売されたものなら問題はなさそう。
それこそ小さい子のプリキュアやディズニー衣装とかはまさにそれっぽい。
→これはご本人のnote見ると分かるけど万博で働く友人に確認をとってるだけで、公式へ問い合わせをしてるわけではない。
再追記
https://faq.expo2025.or.jp/hc/ja/search?utf8=%E2%9C%93&query=%E3%82%B3%E3%82%B9%E3%83%97%E3%83%AC
ただしチケットインフォメーションに掲載されている万博での肖像の使用および撮影について
・著作権、商標権、パブリシティ権、その他知的財産を侵害する撮影、または侵害する恐れがある撮影
との記載あり。
他方で人格権については製造者本人が一人で楽しんでてもアウトだったりする。他人に見せなくても盗撮はダメって話。
で、肖像権や人格権だから他人に見せなくてもダメな場合がある。剥ぎコラとか。なので実在人のヌードフェイクを作ると他人に見せなくてもアウトになる可能性がある。普通はバレないけどうっかりバレたり別件で警察に記録媒体押収されたり。
パブリシティ権になると顧客誘引力を利用する行為が対象なので、公表しなければまぁセーフだけど、特化させたモデルを頒布するとアウトになるっぽい。ちなみに最高裁判所判調査官によるとパブリシティ権は顔(肖像)だけじゃなくて声とかにも認められるらしい。
注意:AI批判目的ではありません。単なる考察結果の共有です。どちらかというと私は思想的にはAI推進過激派です。また、ここでの推測はすべて外れている可能性はあります、あくまで推測です。
DMMボイスという名前から「にじボイス」という名称に変更された。主な変更点は以下。
それ以外は本記事の内容はすべて当てはまるので、以下「DMMボイス」となっている箇所は適宜「にじボイス」へ読み替えて呼んでほしい。
最近AI界隈(?)で話題になっている、20人分のアニメ調キャラクターの声で感情的な音声を簡単に生成することができるAIサービス。
それの学習元に、エロゲーのテキスト音声データが使われているのではないかという話。
まずは性能がかなり高くて楽しいのでみんな遊んでみてください。(そして知ってる声優がいないか探してみてください。)
現時点では何のフィルターもなく、どのような卑語や卑猥なセリフも発話させられる。
ただ、ある特定の雰囲気のパターンのみなぜか音声合成させると吐息のようなものになり、入力文章からかけ離れてしまう。
それは「ちゅぱちゅぱれろれろ」だ。
他にも、例えば「んじゅぷんくっちゅぱ……じゅ……れちゅはぁ……」や「ちゅぷぷっ、んちゅぅ……ちゅくくっ、むちゅぅ……ぢゅるっ、ちゅちゅぅっ」等を試してみてほしい。
ひらがなですべて書かれているので、発音は明確にはっきりしているはずだが、それでもなぜか発音できず吐息のようなものとなる。
一方で、並びはそのままのまま「ふゅととっ、んびゅぅ……こゅねねっ、むびゅぅ……ぞゅけっ、たゅたゅぅっ」や「にゅべべっ、おにゅぅ……にゅけけっ、めにゅぅ……づゅれっ、にゅにゅぅっ。」等は、きちんと文字通り発音される。
さらに、単純に全てカタカナにして、「チュパチュパレロレロ」にしてもきちんと発音される。またちょっと並び替えて「ぱちゅぱちゅろれろれ」は発音される。その他、適当な意味をなさない「ちゅかちゅほぱれもふい」等のランダムな文字列にしても発音される。
他にも、私が試してみた限りでは、上述の謎の雰囲気のテキスト群以外の文章はほぼ正確に文字通りに発音される。
以上のことから、学習データには「ちゅぱちゅぱれろれろ」やその他の上記例のような特定雰囲気のセリフに対して、「その文字の通常の発音通りでないような音声」が対応しているようなデータが使われていることが推測される。
(念の為に書いておくと、音声合成の学習にあたっては、音声とその音声が何を喋っているかというテキストのペアを、大量に学習させる。)
余談であるが、カタカナの「チュパチュパレロレロ」は発音できるがひらがなの「ちゅぱちゅぱれろれろ」は発音できないという事実からは、古くからの音声合成での「日本語文章→音素列(簡単に言えば読みのカナ列)→音声」という流れの単純な音声合成だけでなく、元の日本語からの情報も音声合成に入力していること推測できる。
元の日本語テキストに対して、その音素列に加えて、大規模言語モデルのエンコーダーモデル、いわゆるテキスト埋め込みも音声合成のテキストエンコーダ部分へ注入するというのは、近年の感情豊かな音声合成界隈での一つのトレンドである。
音声合成にあたりAIが「発音の仕方」だけじゃなくて「セリフの意味」も理解する、というわけである。
例えば「ちゅぱちゅぱれろれろ」も、単独では正常な発話ができないが、「はてなは、匿名性を活かした自由な表現が可能となる場として、ちゅぱちゅぱれろれろ、はてな匿名ダイアリーをご利用いただきたいと考えております。」等に文中に紛れ込ませると正常に発話ができること、また文章全体の示す感情によって途中の声音のテンション等が変わること等も、これらの帰結である。
さて、我々は「れろれろれろ……ちゅぱっ、ちゅぶっ……んちゅ、れろっ……ぺろ、ぺろっ……んちゅぅ」のようなテキストが文字通りの発音と対応しない、そのような状況を知っているはずである。そう、エロゲーだ。
エロゲーにはチュパ音という文化がある。これはヒロインが主人公にフェラチオをするシーンで、ヒロインの声優がそのおしゃぶりシーンを汁音たっぷりに演技をするものである。
そこでは、「あぁむ、じゅぶ……じゅぽじゅぽ……ちゅるっ、ちゅ、ちゅっ、ちゅぅぅぅぅ……んっ、んっ、んんっーー!」のようなテキストに対して、そのテキストの通常の文字通りの発音からはかけ離れた、しゃぶりまくり水音出しまくり啜りまくりの演技が音声として与えられる。
よって上記挙動から、DMMボイスの学習元の少なくとも一部には、エロゲーから抽出したデータが使われているのではないかと推測することができる。
界隈では有名な事実だが、エロゲー(R18に限らずノベルゲー一般)からは、1本だいたい(ものによるが)20時間程度の音声とテキストの両方を(多少の知識があれば)大量に抽出することができ、音声合成や音声認識等の音声に関するAIの研究においては非常に貴重なデータとなっている。
よって、大量の「テキストと音声のペア」が必要な音声合成では、特に表に出ないアングラなところで、ひっそりと学習に使われることが多々ある。また特定の声優の声を出そうという意図はなくても、いわゆる音声AIの事前学習モデルとして、すなわち日本語の発音の仕方をAIが学ぶときに必要な大量の音声データとして、そのようなデータを使うことは、一般的とまでは言わないにしても、あることである。
ましてやDMMである。エロゲープレイヤーならば、近年の衰退しつつあるノベルゲー文化はかなりの部分をFANZAに依存していることをすでに知っているだろう(いつもお世話になっております)。
以上のような理由から私はエロゲーが少なくとも学習データに含まれているのではないかと推測したが、そもそものきっかけは、それより前に、単純にいろんなキャラで音声合成させて遊んでいたら、
少なくとも私の耳には「あれこの人あの声優じゃん?」というキャラが何人かいたからである。
久世凛さん(くん?)の人はたぶん声優として有名なあの人だし、ノエラちゃんとか多分一般でも最近いろいろ有名なんじゃなかろうか?(元エロゲー声優出身でそれから表に出てきて大成功していることで有名)
月城 美蘭ちゃんのキャラは某シリーズの某キャラがめっちゃ好きです。
他にも声優に詳しい方だったら、誰の声か分かるキャラが数人はいるのではなかろうか。
さらに実験を重ねていると、エロゲーが学習に使用されていると推測されるもう一つの事象を発見した。
それは「おちんちん」という単語を含んだセリフを音声合成させると、不自然に「おちんちん」の1番目の「ん」がきれて「おちっちん」のように音声合成されるという現象である。
(実際は「おちっちん」ほど極端ではないが、明確に2番目の「ん」の音が通常の発音よりもかなり弱く、不自然に途切れた印象の発音になっている。「おちんつん」等にして比較するとより違いが明確になる。)
このことから、「おちんちん」という単語がそのまま発話されないデータが学習元に多いのではないかと推測できる。
エロゲープレイヤーならば知っているだろうが、大半の商業エロゲーでは規制から「おちんちん」という文字は「おち○ちん」と伏せ字になり音声ではピー音が入る。
このような音声の内部の音声データは、伏せ字部分が抜けて発音されていることが多い(ピー音がそのまま入っているものもある)。
このことも、エロゲーの音声データがDMMボイスの学習元として使われているという推測を支持している。
追記。ブコメ等で、「膣」がなぜか「ナカ」と発音されるという現象の報告が多くあった。また試すと「ナツ」と発話されることも多い。これについて、私よりも音声学に詳しいであろう増田の観察があったのでリンクを貼っておく:anond:20241105060042
端的に言うと、データセットに「膣内に出して……!」等のセリフで「ナカに出して!」と発音されていることが多いことから、本来の読みである「チツ」と「ナカ」との混乱がテキストエンコーダ部分で起きた結果の現象だと推測される。
引用になるが「膣はあけぼの。膣は夜。膣は夕暮れ。膣はつとめて。」を音声合成させてみるのを試してみるとよいだろう。
DMMボイスに対して学習元等の問い合わせをしている人たちが数人はいるようで、開発者サイドのそれに対するリプライの文章から抜粋する。
https://x.com/1230yuji/status/1852914053326483685
「音声学習データは音声データの大量購入、機械合成、収録で取得しています。具体的な情報は企業秘密にあたるため開示できません。」
ここで「音声データの大量購入」という箇所がひっかかる。そう、界隈にいれば知っている人が多いだろうが、音声とテキストのペアのデータセットで、大量購入できるようなものはほぼない(あったら喉から手が出るほど欲しい)。
さらにまた、DMMボイスはアニメ調のキャラクターの音声合成が売りである。そのようなデータセットで、大量購入できるようなものはほぼない(あったら喉から手が出るほど欲しい)。
つまり、ここでの大量購入はエロゲーの大量購入を指しているのではないかと推測することができる。(もしくは、少し前に触れた、すでに公開されているそのような音声データセットから流用したか)。
追記となるが、DMMボイスの利用規約自体が少しおかしいのではという議論を提起している動画があったので紹介しておく:https://www.youtube.com/watch?v=tkBGBVjOIZk
(以前ここで第8条1(1)について書いたいたが、この文言自体は利用規約で一般的なもののようだ、申し訳ない)
音声AIについて昨年5月あたりから品質が大いに向上したことで、AIカバーや声優音声の無断学習等の文脈で、様々な議論が発生している。最近では有名な声優たちがNOMORE無断生成AIというスローガンで大々的に活動している。
これは、声優たちが、自分たちの声が無断でAI学習に使用され、その上で収益化をされていることに対して反対して展開している運動だ。
(この運動に対する是非等の意見は私は持たない、最初に述べた通り私はどちらかというとAI推進過激派である。)
また、このような運動がおこる背景として、(イラストでかなりバトルが発生しているが、)AI学習における「声の権利」との法的な取り扱いが現状の法律だと不明瞭な点から、法律とくに著作権に訴えることでは現状の使われ方に対して法的措置を取りにくいところにある。
このようなAIと音声の権利については最近の柿沼弁護士の記事が参考になるので詳しくはそちらを読んでほしい。
https://storialaw.jp/blog/11344
私自身は法律の専門家でもなんでもないので法的なあれこれについて述べることはできないが、理解している範囲で述べる(間違ってたらすみません)。
音声AIの法的議論では「パブリシティ権」という概念が重要になる。これはざっくり言うと、有名女優の肖像を勝手に商品の宣伝に使ったりすると、その女優が得られたであろう広告収入が奪われたことになるのでダメ、という感じのものである。
このパブリシティ権は現在の日本の法律の文面では明文化されておらず、どこまでがパブリシティ権にあたるのかということについて、特に音声については、未だ判例がなくはっきり分からない。
しかし有名人の氏名についてはパブリシティ権は認められているので、もしDMMボイスが、「あの人気声優○○さんの声で音声合成できる!」としてこのサービスを提供していたら、正式に契約を結んでいた場合に得られたであろう声優の利益のことを考慮すると、声優の許諾がない場合ほぼ確実にダメだと思われる(判例待ちなので断言はたぶんできない)。
だがDMMボイスは、学習元の20人分の声優が誰かや、またその声優からの許諾を得て20人分の声優を使っているかを、うまい具合に言及を避けている。
声優好きな人は声のみからその声優が誰であるかを判定することができる人も多いので、そのような場合に、声優名を伏せていたとしてもパブリシティ権の侵害にあたるかは、おそらくかなりグレーで判例待ち事案である。
そのような意味で、このDMMボイスは(もし裁判等や運動が起これば)音声AIと声の権利に対する法的な解像度を上げ議論を起こすのに貢献する事例になるであろうことは間違いない。
何度か述べている通り、私はAI推進過激派寄りの人間であり、NOMORE無断生成AI等の、最近の声優たちやアンチ生成AIの人達による運動に対しては、事態を注視しているだけの中立的(むしろ逆にガンガン生成AI使っていこうぜという)立場である。
また今回のDMMボイスの公開や今後のサービス展開に対しても、ことさらそれが悪いことだとか、そのようなものは避けるべきだとか、については思っておらず、むしろ「いつか来るだろうなあと思っていたものを大きい企業がようやく出してきたかあ、これで法律や声の権利についての議論や判例が進むかもな」といった程度の感想である。
(そしてDMMボイスのような技術が可能なこと、また実際にそれを学習させてみて個人で楽しむことは、私自身一年前くらいからずっとしており、そこから音声AI界隈をウォッチしていた。)
しかし、最近の声優サイドの運動や時流を見ると、せめて生成できる20人分の声優の許諾を取っているかについて言及しないままでは、アンチ生成AIサイドの批判の格好の的になるだけなのではないかと感じている。
技術的なことになるが、最近の音声AIでは、実在する声優の声から学習させて、しかし音声合成する際には非実在の人物による声音の音声合成が可能である(例えば声優二人の中間の声等)。
それが権利的や法的や倫理的にどうか等は置いておいて、DMMボイスは少なくともそのような措置を取るのがよかったのではないかと個人的には感じている。
(ただ、私の耳が悪いだけで、ホントは「この人の声だ!」と思ったキャラクターは実は全然そうじゃなかった可能性もある。しかしこの「「誰が喋っているかが明確に100%には断言できない」ところが音声AIと声の権利の議論の難しいところである。)
公平のため、最後に「ちゅぱちゅぱれろれろ」が発音できない現象について、エロゲーがDMMボイスの学習に直接使われたという以外に他のありうる可能性をいくつか書いておく。
また端的にありえるのは、他の「ちゅぱちゅぱれろれろ」が発音できないような音声AIをそのまま流用している可能性である。一つ「ちゅぱちゅぱれろれろ」が正常に発話できない音声合成AIライブラリを知っているが、それはデモ動画に私の好きなエロゲーのセリフが堂々と出ていたことから、それの学習元にエロゲーが入っていることはほぼ確実である。
また他に、DMMボイス自体を開発する際にはエロゲーデータは使っておらず許諾を得た声優のみから学習させるが、その学習元となった事前学習モデルにはエロゲーデータが入っていた、という可能性である。前に少し触れた通り、現在の生成AIには学習に大量のデータが必要であり、まず音声AIが発音の仕方を学ぶために、無から正常に発話できるようになるまでには大量のデータが必要である。そのような学習は非常にお金と時間がかかるため、生成AIでは「まず大規模なデータで学習させて事前学習モデルを作る」「次に、その事前学習モデルに対して、話させたい話者のデータで少量追加学習する」というアプローチが取られる場合がほとんどである。このPermalink |記事への反応(17) | 07:53
1.一般的に言われるAIは、狭義のAIすなわち完全自律自己成長型人工知能の事ではないよ
2.これをAIと認めないならAIAct 筆頭に人工知能を対象とした規制は「生成AIはAIじゃないんで関係ないね」になるよ
3.「生成AI」はホニャララ生成モデルを包括した用語だから、当たり前に使ってる機能が実は生成AIに該当するという事もよくあるよ
1.テキストを入力したら入力通りの画像が生成表示されるText-to-Imageの様子を検索エンジンになぞらえただけのものだよ
2.本気で生成AIはAIじゃなくて検索エンジンだと思ってるのは君だけだよ
1.そういうのもあるし、そうじゃないものもあるよ
2.極端な話、個人のゲーミングパソコンで動く程度のAIはネットワーク不要だと思って差し支えないよ
3.ただ、ChatGPTのようなクローズドモデルはそもそもユーザーがモデル本体を自由に扱えないから、ネット環境がないと使えないよ
4.そうではないモデル、例えばLlamaはモデルが公開されているから、動かせる性能のコンピュータがあって生成環境が整っていれば使えるよ
1.今どきの生成AIはテキスト入力するやつだけじゃなくて色んなのがあるよ テキストは出力をガイドするために使う手段の一つだよ
例えばテキストの場合、テキストからテキストを生成するのはText-to-text、テキストから音声はText-to-speech、音楽はText-to-musicのように色々あるよ
画像を入力に使うものは大体Image-to-****って言うよ
4.最近は複数の形式を同時に処理できるマルチモーダルモデルも盛況だよ
1.特定の絵柄に寄せて生成された画像じゃない限り、元の絵師は存在しないよ
2.例えば特定の画家の絵柄で、その画家が描いたことのない表現Bを描かせたAIイラストは巷に溢れてるよね
同じように、誰とも言い難い絵柄でBを描けるよ
1.コラージュのようなものだと単純化するのはいいけど、実際はコラージュじゃない*から注意が必要だよ
*補足:『実際はコラージュじゃない』けど、「どう見てもコラージュにしか見えない」ものが生成される事はあるよ これは全ての生成物がコラージュだ、という話ではないよ
2.人間の学習とAIの学習は同じみたいな話だよ 概念に共通部分を見いだせる以上でも以下でもないよ
1.推奨はしてるけど限定ではないよ 研究目的を推奨してる理由はLaion 5B自体が最低限のフィルタリングしかしていない闇鍋だからだよ
2.Laion 5Bを使うとしても、普通はそこから目的に合わせてフィルタリングした別のデータセットを作成するよ
1.Laion 5Bは画像へのリンクとキャプション集で、画像は含まれてないよ
2.何十億もの画像へのリンクが含まれ、その中には著作物のリンクが大量にあり、CSAMにアクセスできるものも含まれていた という所までは客観的な事実だよ
1.CSAMの判定は日本で言う児童ポルノとはかなり差異があるよ
2.日本でエロ同人やエロ創作を頒布してるような作家の大半が逮捕されるくらいCSAM判定が厳しい国もあるよ
3.ここは日本だよ
1.多様なイラストを生成できるのは多様なイラストを学習しているからという理由が大きくて、それを「データセットのおかげ」と言うのは厳密には間違いではないよ
ただ「データセット」には画像以外のデータも含まれるから、これを言いたい場合は「イラストのおかげ」と言うのがいいよ
詳細が公開されている画像生成AIの場合、学習に使われた画像は初期に公開されたモデルが最も多いけど、学習している画像が減った最近のAIのほうが明らかに高性能*だよね
それは生成係と人間とを橋渡しする通訳係の性能向上や、学習の仕方の研究が進んでいるからだよ
*補足:何をもって高性能とするかは諸説あるけど、ここではプロンプト忠実度や表現力、質の高さなどを評価対象とするよ
1.その判断が出たアメリカでも、生成AI使ってるから著作権なしなんていう暴論は文章が読めない人しか言ってないよ
2.外国を持ち出すと、例えば中国ではテキストから生成したAI画像に著作物性が認められてAI画像の転載を著作権侵害とした裁判例が出てるよ
転載者が作者のクレジットを除去してたことで、氏名表示権の侵害も認められたよ
つまり調整と選択を人間が繰り返したAI画像は、AIを道具として使った人間による創作意図あり創作的寄与ありの著作物と認定されたということだよ
アメリカより中国の方が日本と近い判断基準で考え方にも合致してるから、日本でもAI画像に著作権があると見なすべきだよ
っていうことにもなるね
3.人間の手で自ら苦労して作った創作でも、最小限度の創造性や独自性がないと判断されて著作物性が認められない事もあるくらいケースバイケースなのが著作権だよ
4.どのAI画像は著作権で保護され、どのAI画像が著作権で保護されないのか外野から分からないのだから、とりあえず大抵のものは著作権があるものとして扱うのが安全だよ
君がAI画像に著作権は無いと言ってたのを信じて転載した人が著作権侵害で訴えられても、責任取れないよね
5.ここは日本だよ
1.要は国次第だよ
1.トラブル回避を目的として転載や二次利用を制限している人は全く珍しくないよ 君達の行いを考えよう
2.自分が丹精込めて作ったものが勝手に使われて嫌…という気持ちだけじゃないことは君なら分かるはずだよ
3.AI絵師が皆「バンバン転載してください!」って言ってる方が、今以上にAIだらけの環境になるから大変だよ
4.著作権の有無に拘らず、AI絵の転載や無断使用禁止を宣言するのはむしろ奨励すべきことだよ
5.それでいて著作権法の権利制限規定の影響を受けるのはみんな同じだよ
1.僭称ではなく「偽称」や「詐称」の方が正確だけど、意図は分かるからここでは横に置くよ
2.僭称とは、相応しくない身分を偽ることだよ そこから手描きと機械生成の区分を偽ることとして使われだしたよ
3.偽る、つまりAI絵を手描きだと自称するようなこと以外は僭称と言い難いよ
4.「パッと見で手描きかと思ったらAIだった」とか「AIだけどAIタグつけてない」などは僭称を意味しないよ
5.『「AIだけどAIタグつけてない」などは僭称を意味しないよ』 とは言ったけど、それはAIタグをつけなくてもいいプラットフォームに限るよ
6.騙すつもりで表記してないんだーとかまで言っちゃうと、君が処される可能性が出てくるからやめたほうがいいよ
1.君の規制論を適用すると二次創作にも被弾するよっていう程度の話だよ
2.AI使いへ言葉を選ばずに心無いツッコミをすると人間絵師にも流れ弾が当たるのと同じようなことだよ
3.反AIに本物の表現規制派が紛れてるのと一緒で、ちょこちょこ本物の二次創作アンチも参戦してるから注意が必要だよ
1.文字通りの反AIという意味で君を反AI扱いしてる人はほとんどいないよ
2.この呼称はAntiAIという単純なシンボルを、集団で連日投稿サイトに上げてた反生成AIの先輩たちによる努力の証だよ
1.君が無断学習に反対してるだけじゃないことは皆分かってるよ*
2.普段どんな事を言ってるか、何に賛同しているか、どんな呟きに共感しているかは意外と見られてるよ
*補足:本当に無断学習をどうにかしてほしいだけの人を反AIとは言っていないし言うべきでもないよ
1.『当該著作物に表現された思想又は感情を自ら享受し又は他人に享受させること』は、生成するから享受だーなんていう単純な話じゃないよ
2.享受という言葉が生成物に関わる時は、まさにその学習に使われた当該著作物を見た時と同様の知的又は精神的欲求を満たせるか、が重要なポイントになる時だよ
3.一番考えやすいのは、既に著作物だと認められている特定キャラクターが表現されている画像データで学習したLoRAを作成する場合、いわゆるキャラクターLoRAについてだよ
まず1. もちろん学習しただけでは学習元の著作物を享受できないから関係ないね
そして2. LoRAを生成に使用したとしても、無関係な画像を生成する場合には学習元の著作物は享受はできないね
*補足:LoRAとは言っても出力を特定の方向に誘導するために使うものだから、例えばマイナス方向に適用すると学習データの特徴とは離れるし、LoRA無しの場合と比べて微妙に変化が加わる程度に適用することもできるし、LoRA同士を混ぜたり引いたりできるし、色々な使い方があるよ
最後に3.学習させたキャラクターを再現したり、部分的に改変したキャラクターを生成するための利用
*補足:学習した人と利用した人が別だと、考えることが増えるよ
そうしてやっと、作られた画像のデキ次第で類似性バトルが始まるよ ここがいわゆる「手描きと一緒」とされる部分だよ
この場合の「類似性」は法律基準であって、トレパク警察のように認定されるものではないよ
4.事前学習モデルの副産物として特定著作物の本質的特徴を再現できる場合は、AIで生成させるサービスの提供者が該当キーワードのブロックや置換などの技術的な措置を取り、普通の利用者*が生成できないように対策すべき、というのは国際的なコンセンサスが取れつつあるよ
*補足:文字列を一部書き換えたり入れ替えたり、なんとか規制を潜って生成しようとするのは「Obfuscation」という攻撃手法の一種で、こういう事をする人は「普通の利用者」とは認められないよ
2.言葉遣いが丁寧だから問題ない、悪いからアウトじゃなくて、振る舞いを総合的に判断されるよ
3.どうしてもやりたいなら自覚と責任を持ってやるんだよ そんなつもりじゃなかった、は通用しないからね
1.ディープフェイクとは、深層学習=ディープラーニングと偽物=フェイクをあわせた造語で、深層学習を利用した現実に存在しない画像や映像のことだよ
生成系AIによる生成物も「深層学習モデルで生成された、これまでに存在しなかったメディア」だよ
2.このうち、実在対象をヌードにするなどのポルノグラフィを特に、ディープフェイクポルノやフェイクポルノと言うよ フェイクポルノは、深層学習でないものも含むよ
3.言うまでもないけどフェイクポルノを公開すると法に触れる可能性が高くて、既に判例もあるんだ
生成AIを使わなければいいなどという事もないよ
4.どの法律で罰せられるか、どんな法律違反になるかは内容によるよ 主に名誉毀損、肖像権、プライバシー、わいせつ物陳列、著作権、パブリシティ権だよ
5.よく「取り締まる法律がない」というけど、それはフェイクポルノの作成自体を罰する法律がない という意味で、基本的に世論を煽る目的で言われるよ
6.作れるからというだけでツールを取り締まるのは難しいけど、フェイクポルノ作成を売りにしているくらいまで行くとチャンスはありそうだよ
「作れる」の規制が簡単にできない理由は、厳密に範囲を指定しないとコンテンツ製作に使われる顔変更やボイスチェンジャーの他、様々なツールも対象になってしまうからだよ
またなんか思いついて気が向いたら続きを書くよ
女性が「見たくないものを見ないで済む権利」を持つことは、非常に基本的で当然の権利です。誰もが、自分の生活の中で安心して暮らしたいという思いを持っています。特に女性にとって、この権利はその日常の安全と精神的な安定を守るために極めて重要です。
それにもかかわらず、見たくないものを見せられることがしばしばあります。これは女性の人権を著しく侵害する行為です。現実には、女性がこのような経験をすることが多いにもかかわらず、これを罰するための明確な法律が存在しません。この状況は、法律が現実に追いついていないことを示しています。
長年、女性たちは「見たくないものを見ないで済む権利」を訴えてきましたが、未だに立法化の兆しが見えません。この権利を保護するためには、法律の改正が必要です。女性たちの声が聞かれるために、一刻も早くこの権利を法制化するべきです。
一方で、最近では「声のパブリシティ権」に関する議論が進んでいます。もちろん、この権利も重要ですが、十分な議論がされずに立法化の動きが進むことは稚拙です。声の権利よりも、女性の見たくないものを見ないで済む権利の方が、より広範囲かつ人権に関わる重要なテーマではないでしょうか。
ここでは株式会社ポケモンやゲームフリークも「任天堂」に入れるとして…
(そうでなきゃ今話題になってるゲームが「任天堂」関係で話題になったりはしないから)
今steamで出てる特定のゲームが有る種の基準を満たしてないと「任天堂」が好きな方々に批判を受けている
とりあえず主な批判はこの2つ
・キャラクターデザインが似てる
この先に「任天堂」が出す全ての、勿論すべてのゲームにも同じ批判が検討されるようになると思うんだが
まさか特定のゲームは批判を受けてもいいけど「任天堂」はその手の批判は考えなくていいなんて
(任天堂ファンのブクマカさんが過去に特定サイトのエイプリルフールネタを批判しながら自分も同レベルの嘘を別の年にかますような所だし)
それはともかく「任天堂」のゲームでこれから新しく出る全ての作品の全てのキャラクターは
同じレベルのパクリ基準がネットの人達にチェックされていくだろう
自分も「任天堂」が○○パクってるーみたいな騒ぎが起きたら参加するかもしれないな
まさかユンゲラーとフーディンとサワムラーとエビワラーが新しい作品に出る事は無いだろうし
肖像権やパブリシティ権など著作権以外の法律は著作権と違って全く気にしなくてもOK!とか
そもそも裁判で負けるような事が起きてないからOK!なんて糞ダブスタかます奴もいないだろうし
(特定のゲームは裁判なんて全く起きてないし真面目に法律の専門家に検討されてもいない素人判断だけされてる状況なのにね)
任天堂のハードから出る全てのゲームが「○○歳推奨」という言葉に相応しい内容で発売されていくと思うから