
はてなキーワード:作成者とは
dorawiiより
-----BEGINPGP SIGNEDMESSAGE-----Hash: SHA512https://anond.hatelabo.jp/20251201041624# -----BEGINPGP SIGNATURE-----iHUEARYKAB0WIQTEe8eLwpVRSViDKR5wMdsubs4+SAUCaS1GUAAKCRBwMdsubs4+SAuDAP94Tc53hnFB3JzKiMQDjwwO2N7dbe2SWJZt1nuGaLFTUAD/X/4OkmrmTb5s5O4jY546Im5gU+6VbNhkQn+E7pyvOQY==pIKV-----ENDPGP SIGNATURE-----
増田です。DMM傘下のAlgomaticが提供していた「にじボイス」がサシュウを発表した。
プレスリリースには「法的な権利侵害はなかった」「パラメータ調整の結果、偶然似てしまった」などと書かれているが、これを真に受けている人は少し冷静になったほうがいい。
「日本の法律では学習は合法だ!」「日俳連の圧力に屈した!」と騒ぐ擁護派もいるが、今回の件はそんな単純な話じゃない。
これは「AI技術の敗北」ではなく、「ある企業が吐いた嘘と、杜撰なデータ管理が露呈して自爆した」というだけの話だ。
盲目的に企業を擁護する前に、技術的な事実関係の「答え合わせ」をしておこう。
なお、あくまで技術的な根拠を示しているだけであって、問題があると断言できないことは断っておく。
まず、擁護派が盾にする「著作権法30条の4」について。 確かに今の日本の法律では「情報解析」が目的ならば、元データが何であれ(おそらくエロゲーから音声を抽出したデータセット『moe-speech』であっても)、それをAIに食わせてAIモデルを作るだけなら、一応は適法とされている。 そこだけ切り取れば、違法ではないと言い張れる余地はある。
Algomaticが行っていたのは、一般的な基盤学習にとどまらず、「特定のキャラクター(=特定の声優)を狙い撃ちしたFine-tuning(追加学習)」である疑いが極めて濃厚だという点だ。
『moe-speech』は、親切なことにキャラごと(声優ごと)にフォルダ分けされている。 ここから特定のフォルダを選んで、「その声優の声質や演技の癖」を再現するために個別学習(Fine-tuning)を行う。 これはもはや「データの統計解析」ではない。特定個人の実演の「デッドコピー(模倣品)の作成」だ。 これをやると、生成された音声には明白な「依拠性」が生まれる。つまり「パラメータ調整で偶然似た」のではなく、「その声優のデータを意図的に使って似せた」ことになる。これはパブリシティ権や人格権の侵害に問われる可能性が極めて高いラインだ。
Algomaticは「適切な権利処理を行った」「声優から許諾を得た」「パラメータ調整で作った」と主張していた。
しかし、有志による技術検証によって、その主張と矛盾する証拠がいくつも出てきている。
「にじボイス」の音声を分析すると、キャラによって音量が不均一だったり、明らかに古い年代のマイクで録ったような「こもった音」が混在していることが判明している。 もし公式が言うように「統一されたスタジオでプロを呼んで新規収録」したなら、こんな品質のバラつきが出るはずがない。 これは、録音環境も年代も異なるバラバラのゲームデータ(moe-speech等)を寄せ集めたと考えるのが自然だ。
検証の結果、有名声優の声と音声の特徴量が「ほぼ本人」レベルで一致するキャラが多数発見されている。 「パラメータ調整で偶然似た」と言うが、声の高さや速度はいじれても、その人特有の「骨格からくる響き」や「微細な演技の癖」まで偶然一致することは、AIでもまずまずあり得ない。 元データとして「その人の声」を食わせない限り、ここまでの再現は不可能だ。
これも動かぬ証拠だ。元ネタの『moe-speech』には、作成者の抽出ミスで「幼い女の子の祖父の声(老人男性)」に、誤って「幼女(女性声優)」のタグが付いているという有名な汚れ(エラー)がある。
これを踏まえて、にじボイスに実装されていた「ある老人キャラ」の声を解析モデルにかけると、どうなるか。 なんと、「この老人の声は、〇〇(特定の女性声優)である」という判定が出たのだ。
意味がわかるだろうか? にじボイスのモデルは、「このおじいちゃんのダミ声=あの女性声優の声だ」という、moe-speech特有の「間違った知識」を学習していたということだ。
もしAlgomaticが主張するように、スタジオで老人役の声優を収録したなら、そのデータに「女性声優」のタグが付くわけがない。 これは、「タグ付けミスすら直されていないネット上のデータを、中身の検品もせずにそのまま学習させた」という、言い逃れのできない証拠(トレーサビリティ)になってしまっている。
今回のサービス終了は、日俳連の理不尽な圧力によるものではない。
「自社開発」と謳っておきながら、実際はネットのデータを検品もせずに流用していた事実が、技術的な証拠によって明るみに出そうになったため、これ以上の追及を避けるために店を畳んだ。
そう見るのが妥当だ。
「AI推進派」を自認する人たちにこそ言いたい。 もし本当にAIの発展を願うなら、こうした「産地偽装」のような振る舞いをする企業を擁護してはいけない。
それは真面目にコストを払い、権利処理を行い、クリーンなデータセットを構築しようとしている技術者への冒涜であり、ひいてはAI技術そのものの社会的信用を地に落とす行為だ。
「AIだから何でも許される」わけではない。技術は魔法ではないし、嘘はいつか必ずバレる。
今回の件を「可哀想なAIベンチャーがいじめられた」と総括するのは、あまりにも事態の本質を見誤っている。
以上。
センター試験の本番の現代文で満点をとったこともあるのに、「お前の日本語は不自然だ」といつも言われてしまう。
センター試験の現代文は「文章に書いてあることを、書いてあるとおりに理解しているか」を問う試験だ。
例えば次のような問題があったとする。
この問題の正解はAだ。
「本をよく食べる」なんて表現は一般的なものではないが、本文にそう書いてあるならそれが正解になる。
想像力が豊かな人は「『本をよく食べる』というのはきっと『本をよく読む』の比喩なんだろう」と考えてBを選択してしまうかもしれない。
もしかすると素材文の筆者も、そのつもりで書いたのかもしれない。
しかし入試現代文においては、Bは不正解である。なぜなら「本をよく読む」という記述はないからだ。
入試現代文の世界では「書いてあることがすべて」であり、「書かれていないことを勝手に想像してはいけない」というのが正義だ(と予備校の講師が言っていた)。
予備校の講師によれば、この考え方はテクスト論というものに基づいているらしい。
この講師は次のようにも言っていた:入試問題の題材になった文章の筆者が模範解答に文句を言うことがあるが、これはお門違いである――問題の作成者は文章から読み取れることだけをもとに設問と模範解答を作っており、それが筆者の意図と異なるのであれば、それは筆者の書き方に落ち度がある。
受験生だった私は、この考え方に感銘を受けた。
自分は、誰が読んでも正しく意図が伝わるような文章を書けるようになりたいと思った。
センター試験の現代文で満点を取れる程度にはこのテクニックを習得できた。(難関大学にも合格した。東大は無理だったが……)
受験が終わってからも、このテクニックから逆算して、正しく読解できる文章を書くように心がけてきた。
文章を正しく読解する能力と、正しく意図が伝わる文章を書ける能力。 この2つを身につけられたと思っていた。
就活の面接官や職場の上司などに言われたことを以下に列挙してみる。
さらに言うと、私は前述の言葉を投げかけてきた人たちの書く文章をうまく読解することもできなかった。
それに、彼らの書く文章にこそ問題がある――曖昧であったり、そもそも必要な情報が記述されていなかったり――と、自分は認識している。
でも自認なんて関係ない。 なぜなら正しさを決めるのは立場が上の人間なのだから。
一般的に自然とされるような文章を正しく読解することもできない。
リーディングとライティングすらできないやつが、当然リスニングやスピーキングができるわけもなく。(そもそも口下手だったからこそライティングで挽回しようと思っていた)
誰か早く俺を殺してくれ。
パーキングメーターが「休止」などと表示されて作動がされなかったが駐停車いずれかに該当する行為をしてしまった。
これに関し、踏み倒しとの非難を受けることのないよう、公安委員会に対し現金書留を送付することとし、かつ(いきなり送付するのは業務影響が大きすぎるであろうことから)予告をした。
以下の予告の文章はhttps://creativecommons.org/licenses/by-sa/4.0/ のライセンス形態によりライセンスする。
(※はてな匿名ダイアリーサイドが広告などを途中に入れることがありうるが、それはライセンスの対象外である。気を付けていただきたい。また、ライセンスにおいて、著作物の利用者が示すべきクレジットは「https://anond.hatelabo.jp/20251105195229 の投稿者」とする。)
現金書留送付の予告
東京都渋谷区あああ3-2-2の建物の周辺20メートル以内であって同建物からみて北西方向に、少なくとも2025年11月1日のある1分間以上の間存在していた、時間制限駐車区間(それに係りパーキング・メーターの設けられているもの)に、私(一自然人)または他の一自然人のいずれかが、同日、自動車(自動車登録番号(同日時点)について地名をあらわす部分が品川であり(かつ国土交通省令に言うところの「四けた以下のアラビア数字」が四けたであり、先頭と末尾の数字1つずつを足し合わせた和が5である)、車種が現在の株式会社SUBARUの「WRX」であり、かつ車体の主たる色が赤ないし黒であるもの)を停車し、または駐車しました。なお本文書の取り扱う対象の停車または駐車は、同日18時1分から同日18時25分の間のいずれかの時刻に開始したただ1つの駐車または駐車です。
(本文書で「パーキング・メーター」とは道路交通法上のパーキング・メーターを指します。「時間制限駐車区間」について同様です。また本文書で「自動車登録番号」とは道路運送車両法上の自動車登録番号を指します。)
駐車に該当する可能性が否定できないことから、私はパーキング・メーターについて作動をさせるべく合理的な方法により試行をしたものの、作動しませんでした。
事実上、有料で駐車のできるスペースであることを踏まえると、平たく言えば踏み倒し状態に該当する可能性があることから、法的地位を安定させたく、本件にかかり東京都公安委員会として受け取れるはずであった可能性のある金銭300円と、法定利率(年3%)による利息(相当額)について、支払いを行わせていただければと思います。
支払い方法として、ご希望があれば、カラ駐車(東京都公安委員会に属するパーキング・メーターについて、それへ現金を差入れるが、実際の駐車は行わないこととすること)で前記の金銭(利息(相当額)を含む)の額を上回る額を差し入れる、という形で行うことも可能です。
また現金書留について、東京都(機関としては知事に限りません。)に属する機関、組織、部門、職、または職員を、送付先建物を特定するための表現(住居表示による表現)等とともに指定いただければ、宛先について変更いたします。
また、本件について金銭の支払いが一切かつ終局的に不要である旨の文書での表明をしていただけるようでしたら、金銭の支払いは一切行わないこととします。
現金書留の差出は今月18日から30日の間のいずれかにおいて、行います。支払い方法について前記のカラ駐車の方法を希望されたり、現金書留の宛先の指定(前記の態様での指定に該当する指定)をされたり、または前記の不要表明をされる場合、今月17日に届くよう、郵送で希望、指定、または表明をしてください。
なお、上記の変更許容範囲にとどまらない支払い方法変更をご希望されたり、または上記の不要表明に条件を(貴委員会側で)付されたうえで表明をされたりした場合におきましては、こちらの法的地位の安全の確保につながらないことから、恐縮ですがお受けできないことがあり、お受けできないとこちらで決めた場合には、上記の原則のとおり支払いを行います。
また、こちらが収める金銭が駐車に係る実質的な料金を超える場合については、越えた部分は東京都への寄付、またはそれに類するものとして(こちらの更なる承諾等を経ずに)取り扱っていただいて構いません。
※上記住居表示(東京都渋谷区あああ3-2-2-622)に宛てられ、かつ「小鳥遊(パーキング事案2025.11担当者 甲)」の宛先名義で、文書等の送付される相手方は、転居等の事情の生じない限り、一自然人である、本文書作成者ただ一名のみに特定されます。個人情報の保護の観点から、氏名を完全に記すことはしておりません。