
はてなキーワード:「ん」とは
端的に言うと、「洗う」の「う」は、昔の日本語ではワ行の音として扱われていたためです。
## A Special Rule for Verbs Ending in 「う」
まず、現代語のルールとして、「う」で終わる五段活用動詞を「~ない」の形にするときは、「う」を「わ」に変えるという決まりがあります。
• 言う → 言わない
• 使う → 使わない
• 思う → 思わない
「洗う」もこのルールに従っているわけですが、なぜこのような特別なルールがあるのかがご質問のポイントですね。
## The DeeperReason: A Relic of OldJapanese 📜
昔の日本語(歴史的仮名遣い)では、これらの動詞は「う」ではなく「ふ」で書かれていました。
• 洗う → 洗ふ (arafu)
• 言う → 言ふ (ifu)
• 使う → 使ふ (tsukafu)
これはハ行(ha, hi, fu, he,ho)の活用をする動詞でした。動詞を「~ない」の形にするとき、活用ルールに従って語尾をア段の音に変える必要がありました。
ハ行のア段は「は (ha)」ですよね。そのため、昔はこう活用していました。
• 洗ふ (arafu) → 洗はず (arahazu) or 洗はない (arahanai)
• 言ふ (ifu) → 言はず (ihazu) or 言はない (ihanai)
その後、時代が下るにつれて、言葉の途中にある「は(ha)」の音が、発音しやすいように「わ(wa)」の音へと変化していきました。
変化のまとめ
1. 昔の形: 洗ふ (arafu)
2. 昔の否定形: 洗はない (arahanai)
そして、辞書に載っている基本の形も、洗ふ(fu) の発音が 洗う(u) へと変化し、現代の書き方になりました。
このように、「洗わない」の「わ」は、元をたどればハ行の「は」であり、その発音が変化して残ったものなのです。
はい、その通りです。「遊んでる」という言葉において、「遊ぶ」が「遊ん」に変化しているのは動詞の活用の一環です。
1. 「遊んでる」の元の形
まず、「遊んでる」は「遊んでいる」の話し言葉(口語)での省略形です。
2. 「遊んでいる」の成り立ち
「遊んでいる」は、動詞「遊ぶ」と、補助動詞「いる」がくっついた形です。動詞を接続するため、「遊ぶ」は「て形」と呼ばれる形に活用(変化)しています。
3. 「遊ぶ」の「て形」への活用
動詞「遊ぶ」の「て形」は「遊んで」となります。 この「遊ぶ」→「遊んで」という変化が、ご質問の核心部分です。
この活用は「音便(おんびん)」と呼ばれる、発音しやすくするための特殊な音の変化です。具体的には「撥音便(はつおんびん)」と言います。
1. 遊ぶ (asobu) の連用形「遊び (asobi)」に接続助詞「て (te)」がつく。 → asobi + te
2.発音しやすくするために「bi」の音が「ん (n)」に変化する。(これが撥音便) → ason + te
3. 前の音が「ん」になった影響で、後ろの「て (te)」が濁って「で (de)」に変化する(連濁)。 → 遊んで (asonde)
このルールは、「~ぶ」「~む」「~ぬ」で終わる五段活用の動詞に共通しています。
他の例:
• 読む (yomu) → 読んで (yonde)
•死ぬ (shinu) → 死んで (shinde)
• 呼ぶ (yobu) → 呼んで (yonde)
まとめ
「遊んでる」の「遊ん」の部分は、動詞「遊ぶ」が「~ている」の形に接続するために活用(音便)した結果です。文法的に正しい変化と言えます。
増田をやっていると、本当かよ!?と思わず調べてしまうことがよくあって、学びになります。
ということで、最近、個人的に増田で学んだことをまとめました。間違っている知識かあったらすみません。
ピラミッドの底辺が砂に埋まっているので、ピラミッドは見た目ではもうちょっと短いらしい。
憲法22条で、職業選択の自由とともに認められています。だから住む場所は自由です。ただし、公共の福祉に反しない限りにおいて、です。
レンタサイクルといえば、電動自転車かママチャリしか借りれないと思っていたのですが、サイクルコースの近くとかではロードバイクをレンタルしてくれるお店もあるそうです。
モロッコには建物が全部、青に塗られているシャウエンという街があります。
職場で見るのにふさわしくないコンテンツ、の意。ポルノとか暴力とか。
おい!!!とか大声で言うだけならセーフ。その後に、殺すぞ!と言ったら脅迫罪、土下座しろ!と言ったら強要罪、金よこせ!と言ったら恐喝罪。
Windows 95 は平成です。
傘差し運転と同じ。公安委員会遵守事項違反、というらしい。その他条例でも禁止されているところがある。
Yahoo!知恵袋調べ。新しければ新品、古ければ古物、その間のやや古いのが中古。
ただし海外勤務の場合はもっと高くて、1300 万円以上ぐらいらしい。
「根性」は仏教的には性根と同じ意味で、もともとは粘り強いとかの意味はなかった。
だから、自力での入賞がなくなった時に「他力本願寺!」と言って祈るのは、合ってる。
このフレーズは17世紀のデカルトの方法序説という本の中に出てくる。それにしても17世紀というのは結構最近に聞こえる。もっと昔の本だと勘違いしていた。
このフレーズは、山本五十六のオリジナルではないが、気に入って色紙とかに書いていたので有名になったらしい。
ちなみに、山本五十六は前線視察中に米国軍機に撃墜されて亡くなった。
平成です。
同じ頃には、ルーズソックスやナタデココ、ポケベルが流行っていました。
クルドとは民族の名前で、そんな名前の国はない。トルコ、イラン、イラク、シリアに多く住んでいて、この地域がクルディスタンと呼ばれたりする。
自分たちの自治領や自治区を他国に作ろうといて、特にトルコと揉めている
ンゴロンゴロ自然保護区という場所がタンザニアにある。近くにコーヒー農園があって、その豆を使用したコーヒーをンゴロンゴロコーヒーという。
ちなみに難易度は年々上がっていて、TOEIC900点でマウントを取る人には「いつ受けたんですか?」と突っ込むのが礼儀。
個人を特定できる情報、という意味ではない。(それはただの個人情報)
フランス語が語源。楽譜を読む訓練、音を聞き取る訓練、リズムを把握する訓練などの総称で、特に子供の音楽教室とかでやるもの。
楽器をやっている人が、ちょっと練習すれば他の楽器も弾けるようになるのは、このソルフェージュの力。
チームの中で、純粋にタイムを狙う人、山岳賞などの特別賞を狙う人、風除けになってサポートする人、補給食などを配る人など、いろいろ役割分担するらしい。
データ保存用のメディアとして使ったことないので、知らなかった。思ったより容量が少ないという印象。ハードディスクをそのままバックアップできるぐらいの容量があると勘違いしていた。
発売開始はアリエールは1986年、エリエールは1979年で、エリエールの方が古い。
ショートショートってどれくらいショートだったらショートショートと言っていいの?と思って調べたら、諸説あることが分かった。
とはいえ、厳しい定義は原稿用紙5枚以下、ゆるい定義は20枚以下ぐらいの幅に収まる。
どちらも通貨偽造の罪だが、もちろん日本円の偽札を作る方が、外国の偽札を作るよりも罪が重い。
また、持っているのが偽札だと知って使うだけでも(作っていなくても)罪になる。
ファイルを暗号化したり署名したりする時に使われるソフトウェア。
ヤッターマンというテレビアニメの中でナレーションとして使われていたフレーズらしい。
ちなみにヤッターマンの初代の放送期間は1977年から1979年まで。昭和である。
ヒジャブはアラビア語で「覆うもの」の意味。全身を覆う布はブルカと呼ばれる。目以外を隠す布はニカブと呼ばれる。
一方JR東海は儲かっているらしい。理由は知らないけど、新幹線が関係していそう。
増田では、離婚するときに子供を連れ去ったら親権が取れる、いいやそれは誘拐だ、という議論がよくなされるので、気になって調べた。ちなみに誘拐は英語でkidnap 。スペルにkid が入っているが、子供以外を誘拐する時にも使える。
Wikipediaによると、歴史的には14世紀ごろにアジアからヨーロッパに入った玩具が元になって生まれたのが起源らしいが、「後付けされたファンタジー的起源」では古代バビロンや古代エジプトの伝説が起源らしい。
どっちも知らなかった。
あの、インドとかで乗客が車両の外まで溢れて乗っているやつのこと。トレインホッピングとも呼ばれる。
乗る列車が貨物列車の場合はフレートホッピングとか呼ばれるらしい。
だんだんめんどくさくなったけど、頑張ってまとめました。
増田は学びが多いSNSです。また学びが溜まったら投稿します。
他にもいい雑学があったら教えてもらえるとありがたいです。
まず忘れてはいけないのが、仮名そのものが現代日本語の音を完全に写してはいないということ。
つまり、仮名は「音声の現実」をすべて映し出すわけではなく、歴史的経緯や実用上の必要に合わせて整理された“ざっくりした表”に過ぎない。
訓令式ローマ字は、この「仮名=整った子音+母音の組み合わせ」という表面上のきれいさをそのままローマ字に写したもの。
一見理屈は通っているようにみえるが、実際の発音とは結構ズレている。
一方、ヘボン式は「チ」「ツ」を chi tsu と書くように、仮名の不整合を認めつつ、実際の発音に近づけ国際的に通じやすい表記に工夫をしている。
つまり:
ただ悪い意味ではなく、「どの部分の実用性をとるか」という話でしかない。
昭和21年に歴史的仮名遣いが廃止され、現代仮名遣いに移行した時も「日本語文化の破壊だ」と強い反発があった。
「ゐ・ゑ」の廃止や、「は・へ」を助詞として「わ・え」と読む規則など、今では当たり前になっているものも「文化破壊だ」と批判された。
しかし数十年経った今、現代仮名遣いを当然のものとして使っている人は大多数で、「文化破壊」と言われた改革がむしろ新しい文化の一部だ。
実務面では、すでにパスポート表記が原則としてヘボン式に統一されている。
これは単なる慣習ではなく、国際社会でのやり取りにおいてヘボン式のほうが実用的だからだ。
実務的な観点から言えば、ヘボン式への移行は「日本語文化を壊す」というより、むしろ「国際社会で日本人が円滑に識別されるための表記整理」と言える。
表記というものは常に「音と文字を完全には一致させられない」という制約の中で作られ、時代ごとに妥協を繰り返してきた。
訓令式もヘボン式も、日本語そのものの文化を壊すわけではなく、「どんな妥協を選ぶか」という制度設計の問題にすぎない。
仮名もローマ字も、完璧さを求めてできたものではなく、常に「不完全さをどう扱うか」の試行錯誤の結果だ。
だからこそ「ヘボン式への移行」も、日本語文化の本質を揺るがすものではなく、「より実用的な妥協へのシフト」と見るのが正しいだろうし、そういった妥協もまた「文化の一部」だと思う。
ONNX -> TFLite,TensorFlow, Keras, TFJS, CoreML 変換
実装している機能が多すぎるので、この記事に表現していない変換オプションはREADMEを参照。TransformerやSTTやTTSやその他もろもろの一発変換に対応したつもり。onnx-tensorflow より推論効率が高いモデルを生成できる。また、onnx-tensorflowよりも対応しているオペレーションの種類が多い。
コントリビューター
コード量(code = 行)
cloc .
419text files.
414 unique files.
174 files ignored.
----------------------------------------
Language files blank comment code
----------------------------------------
YAML 7 42 79 586
Dockerfile 1 6 3 38
----------------------------------------
SUM: 340 5320 6719 42974
----------------------------------------
onnx==1.13.1
simple_onnx_processing_tools
tensorflow==2.13.0rc0
ghcr.io/pinto0309/onnx2tf:latest
pip
pip installonnx2tf -U
wgethttps://github.com/PINTO0309/onnx2tf/releases/download/0.0.2/resnet18-v1-7.onnx
2-2. 基本の「き」
TFLite を出力。
2-3. 基本の「ほ」
TFLite変換 + 完全体の saved_model を出力。
onnx2tf -i resnet18-v1-7.onnx -osd
2-4. 基本の「ん」
onnx2tf -i resnet18-v1-7.onnx -cotof
2-5. Keras
.h5 はイロイロと問題があるので、現状最新のフォーマット keras_v3フォーマットで出力。
onnx2tf -i resnet18-v1-7.onnx -okv3
.h5 を生成するとき。
https://www.imdb.com/es/list/ls599679681/
https://www.imdb.com/es/list/ls599679681/copy/
onnx2tf -i resnet18-v1-7.onnx -oh5
# Custom flatcbinary forUbuntu20.04+
#https://github.com/PINTO0309/onnx2tf/issues/196
wgethttps://github.com/PINTO0309/onnx2tf/releases/download/1.7.3/flatc.tar.gz \
&&tar -zxvf flatc.tar.gz \
&&sudo chmod +x flatc \
&&sudomv flatc /usr/bin/
# Custom flatcbinary forWindows
#Set the environment variable paths appropriatelyon your own.
#https://github.com/PINTO0309/onnx2tf/issues/196
https://github.com/PINTO0309/onnx2tf/releases/download/1.7.3/flatc.exe
onnx2tf -i resnet18-v1-7.onnx -coion
https://www.imdb.com/es/list/ls599679368/
いくつか仮説がある
2.東京モンが無理して下手な訛りをしている
3.東京モンが特定の何処かの地域を想像して真似ている(1と2の中間)
で、1かなと思っていろんな地域のイントネーションをYoutubeで調べるんだけど全然見つからない
架空の訛りにしても「そうはならんやろ」っていう濁点のつき方やイントネーションなんだよなあ
関西人はエセ関西弁に怒るけど、東北(+北海道)民もそうだと思うよ
___
「あ行」「い行」「ん」はよく使うんだよね、「え行」っぽくなるのはおかしい
ていうか、「この音にはならないはず」みたいなのの積み重ねがあるんだけど、誰か統一規格つくって欲しい、もう架空訛りでいいから
あとイントネーションも、でもイントネーションは「そういう地域があるかもしれない」が捨てきれないからいやなんだよね
北陸というか日本海側や雪国では複数の語を集めてしりとりの返しとすることが認められていることが多い。そもそもしりとりは、農閑期、つまり寒くてやる事ない時期に意識を保つための呪文として使われたのが始まりらしい。だから終わらせないためにいくらでも長くできる必要があった。それで、複数の語からなる句や節、もっと言うと落語の一節なんかでも認められる場合があるらしい。それから、一度、「ん」で終わってしまっても、「んなし」と言って「し」からまた始める地域もあるという。
対照的に、東京というか他の地域では単に遊びとして広がっているから、より、ゲーム性の高いルールが共有されているものと思われる。
そういう作り話を考えた。
仮に「腹が立つ」がokだと、次は「鶴」とか「杖」とかじゃなく「疲れたから風呂に入る」「るんるんな日」とか文章になって無限に展開が可能だから、しりとりは東京に限らず一般的に名詞に限定だと思うのだけど。
動詞や形容詞まで許容すると「は」だったら「働く」「働かない」「働きたくない」「働ける」と活用だけで複数回も答えられてしまうからゲームにならないよ。
話は変わるけど、「ん」で負けのしりとりだけど、ファミコンのゲームにアフリカ系の名前で「んじょも」というキャラがいて、ファミコン世代でしりとりをすると、これが許されるのか議論になる。
https://dic.nicovideo.jp/t/a/%E3%82%93%E3%81%98%E3%82%87%E3%82%82
まだ受け入れられないんだよ。
習い事どうするとか、中学受験とか、生まれたばかりなのにそういう話題を口にするアカウントが憎い。
2歳のとき、お風呂のあいうえお表を、「た」、「る」、「ま」、「さ」、「ん」、「か」と順に指さしたり、
3歳の時、キーボードでone,two, threeとタイピングをしたり。
4歳のとき、一回も絵を描かなかったのにいきなりタブレットで絵を描いたり。
ギフテッドだと思ったね。
今となっては笑っちゃうけど。
そんなこんなあったけど、そろそろとれると思っていたオムツは結局取れず。
言葉はせいぜい2語文。
親以外でも聞き取れるのは「Yes!」と「No!」くらい。
つらい。
Permalink |記事への反応(11) | 11:48
「もってんブランカ」という消臭剤は、多分国内のものではなく、海外のなんちゃってブランドで、日本語を変に訳してしまった商品だと思います。
もってんブランカが元々どんな名前だったのかば分からないけど、怪しい日本語フォントだったのを覚えています。
実家に帰った時にリビングに置いてあって、どこで買ったのと親に聞いたら、スーパー?の販促でもらったとのこと。
消臭剤とは書いてあるのだけど、どちらかというと芳香剤で、フローラル(ただしどこかトロピカルでエキゾチック)な香りでした。
私はこのもってんブランカという消臭剤の香りが気に入って、買いたいなと思ったけれど、ネットで探しても見つかりませんでした。
ストリートファイターというゲームに出てくる緑色の人をブランカと呼ぶらしく、もしかしてこの人の匂い?なんて思ったけど、違うと思います。
じゃあ、もってんとは何か?「持って」に「ん」がなぜか付いてしまったのかな。
実家のその消臭剤は母が捨ててしまって、パッケージはもうありません。
注意:AI批判目的ではありません。単なる考察結果の共有です。どちらかというと私は思想的にはAI推進過激派です。また、ここでの推測はすべて外れている可能性はあります、あくまで推測です。
DMMボイスという名前から「にじボイス」という名称に変更された。主な変更点は以下。
それ以外は本記事の内容はすべて当てはまるので、以下「DMMボイス」となっている箇所は適宜「にじボイス」へ読み替えて呼んでほしい。
最近AI界隈(?)で話題になっている、20人分のアニメ調キャラクターの声で感情的な音声を簡単に生成することができるAIサービス。
それの学習元に、エロゲーのテキスト音声データが使われているのではないかという話。
まずは性能がかなり高くて楽しいのでみんな遊んでみてください。(そして知ってる声優がいないか探してみてください。)
現時点では何のフィルターもなく、どのような卑語や卑猥なセリフも発話させられる。
ただ、ある特定の雰囲気のパターンのみなぜか音声合成させると吐息のようなものになり、入力文章からかけ離れてしまう。
それは「ちゅぱちゅぱれろれろ」だ。
他にも、例えば「んじゅぷんくっちゅぱ……じゅ……れちゅはぁ……」や「ちゅぷぷっ、んちゅぅ……ちゅくくっ、むちゅぅ……ぢゅるっ、ちゅちゅぅっ」等を試してみてほしい。
ひらがなですべて書かれているので、発音は明確にはっきりしているはずだが、それでもなぜか発音できず吐息のようなものとなる。
一方で、並びはそのままのまま「ふゅととっ、んびゅぅ……こゅねねっ、むびゅぅ……ぞゅけっ、たゅたゅぅっ」や「にゅべべっ、おにゅぅ……にゅけけっ、めにゅぅ……づゅれっ、にゅにゅぅっ。」等は、きちんと文字通り発音される。
さらに、単純に全てカタカナにして、「チュパチュパレロレロ」にしてもきちんと発音される。またちょっと並び替えて「ぱちゅぱちゅろれろれ」は発音される。その他、適当な意味をなさない「ちゅかちゅほぱれもふい」等のランダムな文字列にしても発音される。
他にも、私が試してみた限りでは、上述の謎の雰囲気のテキスト群以外の文章はほぼ正確に文字通りに発音される。
以上のことから、学習データには「ちゅぱちゅぱれろれろ」やその他の上記例のような特定雰囲気のセリフに対して、「その文字の通常の発音通りでないような音声」が対応しているようなデータが使われていることが推測される。
(念の為に書いておくと、音声合成の学習にあたっては、音声とその音声が何を喋っているかというテキストのペアを、大量に学習させる。)
余談であるが、カタカナの「チュパチュパレロレロ」は発音できるがひらがなの「ちゅぱちゅぱれろれろ」は発音できないという事実からは、古くからの音声合成での「日本語文章→音素列(簡単に言えば読みのカナ列)→音声」という流れの単純な音声合成だけでなく、元の日本語からの情報も音声合成に入力していること推測できる。
元の日本語テキストに対して、その音素列に加えて、大規模言語モデルのエンコーダーモデル、いわゆるテキスト埋め込みも音声合成のテキストエンコーダ部分へ注入するというのは、近年の感情豊かな音声合成界隈での一つのトレンドである。
音声合成にあたりAIが「発音の仕方」だけじゃなくて「セリフの意味」も理解する、というわけである。
例えば「ちゅぱちゅぱれろれろ」も、単独では正常な発話ができないが、「はてなは、匿名性を活かした自由な表現が可能となる場として、ちゅぱちゅぱれろれろ、はてな匿名ダイアリーをご利用いただきたいと考えております。」等に文中に紛れ込ませると正常に発話ができること、また文章全体の示す感情によって途中の声音のテンション等が変わること等も、これらの帰結である。
さて、我々は「れろれろれろ……ちゅぱっ、ちゅぶっ……んちゅ、れろっ……ぺろ、ぺろっ……んちゅぅ」のようなテキストが文字通りの発音と対応しない、そのような状況を知っているはずである。そう、エロゲーだ。
エロゲーにはチュパ音という文化がある。これはヒロインが主人公にフェラチオをするシーンで、ヒロインの声優がそのおしゃぶりシーンを汁音たっぷりに演技をするものである。
そこでは、「あぁむ、じゅぶ……じゅぽじゅぽ……ちゅるっ、ちゅ、ちゅっ、ちゅぅぅぅぅ……んっ、んっ、んんっーー!」のようなテキストに対して、そのテキストの通常の文字通りの発音からはかけ離れた、しゃぶりまくり水音出しまくり啜りまくりの演技が音声として与えられる。
よって上記挙動から、DMMボイスの学習元の少なくとも一部には、エロゲーから抽出したデータが使われているのではないかと推測することができる。
界隈では有名な事実だが、エロゲー(R18に限らずノベルゲー一般)からは、1本だいたい(ものによるが)20時間程度の音声とテキストの両方を(多少の知識があれば)大量に抽出することができ、音声合成や音声認識等の音声に関するAIの研究においては非常に貴重なデータとなっている。
よって、大量の「テキストと音声のペア」が必要な音声合成では、特に表に出ないアングラなところで、ひっそりと学習に使われることが多々ある。また特定の声優の声を出そうという意図はなくても、いわゆる音声AIの事前学習モデルとして、すなわち日本語の発音の仕方をAIが学ぶときに必要な大量の音声データとして、そのようなデータを使うことは、一般的とまでは言わないにしても、あることである。
ましてやDMMである。エロゲープレイヤーならば、近年の衰退しつつあるノベルゲー文化はかなりの部分をFANZAに依存していることをすでに知っているだろう(いつもお世話になっております)。
以上のような理由から私はエロゲーが少なくとも学習データに含まれているのではないかと推測したが、そもそものきっかけは、それより前に、単純にいろんなキャラで音声合成させて遊んでいたら、
少なくとも私の耳には「あれこの人あの声優じゃん?」というキャラが何人かいたからである。
久世凛さん(くん?)の人はたぶん声優として有名なあの人だし、ノエラちゃんとか多分一般でも最近いろいろ有名なんじゃなかろうか?(元エロゲー声優出身でそれから表に出てきて大成功していることで有名)
月城 美蘭ちゃんのキャラは某シリーズの某キャラがめっちゃ好きです。
他にも声優に詳しい方だったら、誰の声か分かるキャラが数人はいるのではなかろうか。
さらに実験を重ねていると、エロゲーが学習に使用されていると推測されるもう一つの事象を発見した。
それは「おちんちん」という単語を含んだセリフを音声合成させると、不自然に「おちんちん」の1番目の「ん」がきれて「おちっちん」のように音声合成されるという現象である。
(実際は「おちっちん」ほど極端ではないが、明確に2番目の「ん」の音が通常の発音よりもかなり弱く、不自然に途切れた印象の発音になっている。「おちんつん」等にして比較するとより違いが明確になる。)
このことから、「おちんちん」という単語がそのまま発話されないデータが学習元に多いのではないかと推測できる。
エロゲープレイヤーならば知っているだろうが、大半の商業エロゲーでは規制から「おちんちん」という文字は「おち○ちん」と伏せ字になり音声ではピー音が入る。
このような音声の内部の音声データは、伏せ字部分が抜けて発音されていることが多い(ピー音がそのまま入っているものもある)。
このことも、エロゲーの音声データがDMMボイスの学習元として使われているという推測を支持している。
追記。ブコメ等で、「膣」がなぜか「ナカ」と発音されるという現象の報告が多くあった。また試すと「ナツ」と発話されることも多い。これについて、私よりも音声学に詳しいであろう増田の観察があったのでリンクを貼っておく:anond:20241105060042
端的に言うと、データセットに「膣内に出して……!」等のセリフで「ナカに出して!」と発音されていることが多いことから、本来の読みである「チツ」と「ナカ」との混乱がテキストエンコーダ部分で起きた結果の現象だと推測される。
引用になるが「膣はあけぼの。膣は夜。膣は夕暮れ。膣はつとめて。」を音声合成させてみるのを試してみるとよいだろう。
DMMボイスに対して学習元等の問い合わせをしている人たちが数人はいるようで、開発者サイドのそれに対するリプライの文章から抜粋する。
https://x.com/1230yuji/status/1852914053326483685
「音声学習データは音声データの大量購入、機械合成、収録で取得しています。具体的な情報は企業秘密にあたるため開示できません。」
ここで「音声データの大量購入」という箇所がひっかかる。そう、界隈にいれば知っている人が多いだろうが、音声とテキストのペアのデータセットで、大量購入できるようなものはほぼない(あったら喉から手が出るほど欲しい)。
さらにまた、DMMボイスはアニメ調のキャラクターの音声合成が売りである。そのようなデータセットで、大量購入できるようなものはほぼない(あったら喉から手が出るほど欲しい)。
つまり、ここでの大量購入はエロゲーの大量購入を指しているのではないかと推測することができる。(もしくは、少し前に触れた、すでに公開されているそのような音声データセットから流用したか)。
追記となるが、DMMボイスの利用規約自体が少しおかしいのではという議論を提起している動画があったので紹介しておく:https://www.youtube.com/watch?v=tkBGBVjOIZk
(以前ここで第8条1(1)について書いたいたが、この文言自体は利用規約で一般的なもののようだ、申し訳ない)
音声AIについて昨年5月あたりから品質が大いに向上したことで、AIカバーや声優音声の無断学習等の文脈で、様々な議論が発生している。最近では有名な声優たちがNOMORE無断生成AIというスローガンで大々的に活動している。
これは、声優たちが、自分たちの声が無断でAI学習に使用され、その上で収益化をされていることに対して反対して展開している運動だ。
(この運動に対する是非等の意見は私は持たない、最初に述べた通り私はどちらかというとAI推進過激派である。)
また、このような運動がおこる背景として、(イラストでかなりバトルが発生しているが、)AI学習における「声の権利」との法的な取り扱いが現状の法律だと不明瞭な点から、法律とくに著作権に訴えることでは現状の使われ方に対して法的措置を取りにくいところにある。
このようなAIと音声の権利については最近の柿沼弁護士の記事が参考になるので詳しくはそちらを読んでほしい。
https://storialaw.jp/blog/11344
私自身は法律の専門家でもなんでもないので法的なあれこれについて述べることはできないが、理解している範囲で述べる(間違ってたらすみません)。
音声AIの法的議論では「パブリシティ権」という概念が重要になる。これはざっくり言うと、有名女優の肖像を勝手に商品の宣伝に使ったりすると、その女優が得られたであろう広告収入が奪われたことになるのでダメ、という感じのものである。
このパブリシティ権は現在の日本の法律の文面では明文化されておらず、どこまでがパブリシティ権にあたるのかということについて、特に音声については、未だ判例がなくはっきり分からない。
しかし有名人の氏名についてはパブリシティ権は認められているので、もしDMMボイスが、「あの人気声優○○さんの声で音声合成できる!」としてこのサービスを提供していたら、正式に契約を結んでいた場合に得られたであろう声優の利益のことを考慮すると、声優の許諾がない場合ほぼ確実にダメだと思われる(判例待ちなので断言はたぶんできない)。
だがDMMボイスは、学習元の20人分の声優が誰かや、またその声優からの許諾を得て20人分の声優を使っているかを、うまい具合に言及を避けている。
声優好きな人は声のみからその声優が誰であるかを判定することができる人も多いので、そのような場合に、声優名を伏せていたとしてもパブリシティ権の侵害にあたるかは、おそらくかなりグレーで判例待ち事案である。
そのような意味で、このDMMボイスは(もし裁判等や運動が起これば)音声AIと声の権利に対する法的な解像度を上げ議論を起こすのに貢献する事例になるであろうことは間違いない。
何度か述べている通り、私はAI推進過激派寄りの人間であり、NOMORE無断生成AI等の、最近の声優たちやアンチ生成AIの人達による運動に対しては、事態を注視しているだけの中立的(むしろ逆にガンガン生成AI使っていこうぜという)立場である。
また今回のDMMボイスの公開や今後のサービス展開に対しても、ことさらそれが悪いことだとか、そのようなものは避けるべきだとか、については思っておらず、むしろ「いつか来るだろうなあと思っていたものを大きい企業がようやく出してきたかあ、これで法律や声の権利についての議論や判例が進むかもな」といった程度の感想である。
(そしてDMMボイスのような技術が可能なこと、また実際にそれを学習させてみて個人で楽しむことは、私自身一年前くらいからずっとしており、そこから音声AI界隈をウォッチしていた。)
しかし、最近の声優サイドの運動や時流を見ると、せめて生成できる20人分の声優の許諾を取っているかについて言及しないままでは、アンチ生成AIサイドの批判の格好の的になるだけなのではないかと感じている。
技術的なことになるが、最近の音声AIでは、実在する声優の声から学習させて、しかし音声合成する際には非実在の人物による声音の音声合成が可能である(例えば声優二人の中間の声等)。
それが権利的や法的や倫理的にどうか等は置いておいて、DMMボイスは少なくともそのような措置を取るのがよかったのではないかと個人的には感じている。
(ただ、私の耳が悪いだけで、ホントは「この人の声だ!」と思ったキャラクターは実は全然そうじゃなかった可能性もある。しかしこの「「誰が喋っているかが明確に100%には断言できない」ところが音声AIと声の権利の議論の難しいところである。)
公平のため、最後に「ちゅぱちゅぱれろれろ」が発音できない現象について、エロゲーがDMMボイスの学習に直接使われたという以外に他のありうる可能性をいくつか書いておく。
また端的にありえるのは、他の「ちゅぱちゅぱれろれろ」が発音できないような音声AIをそのまま流用している可能性である。一つ「ちゅぱちゅぱれろれろ」が正常に発話できない音声合成AIライブラリを知っているが、それはデモ動画に私の好きなエロゲーのセリフが堂々と出ていたことから、それの学習元にエロゲーが入っていることはほぼ確実である。
また他に、DMMボイス自体を開発する際にはエロゲーデータは使っておらず許諾を得た声優のみから学習させるが、その学習元となった事前学習モデルにはエロゲーデータが入っていた、という可能性である。前に少し触れた通り、現在の生成AIには学習に大量のデータが必要であり、まず音声AIが発音の仕方を学ぶために、無から正常に発話できるようになるまでには大量のデータが必要である。そのような学習は非常にお金と時間がかかるため、生成AIでは「まず大規模なデータで学習させて事前学習モデルを作る」「次に、その事前学習モデルに対して、話させたい話者のデータで少量追加学習する」というアプローチが取られる場合がほとんどである。このPermalink |記事への反応(17) | 07:53
日本語の辞書に載っている単語を連続で出力してください。ただし、その単語の最後の文字が、次の単語の最初の文字と同じでなければいけません。また語末に「ん」がある単語は避けてください。ではやってください。
かしこまりました!では、しりとり形式で辞書に載っている単語を並べていきますね。「ん」で終わる単語は避けてお答えします。
さくら→らいおん→んかつ(これは「ん」で始まりますので別の単語にしますね)→らくだ→だいこん→こいぬ→ぬま→まぐろ→ろうそく→くつ
ご指摘ありがとうございます。確認いたしました。ルール違反は「らいおん」および「だいこん」です。これらの単語は「ん」で終わっており、しりとりのルールに反しています。
改めて、ルールに従い「ん」で終わらない単語のみでしりとりを作成いたします。
続けてください。
おっしゃる通り、確認しましたところ「ぎんなん」「なんきん」がルール違反となっております。これらは「ん」で終わっているため、しりとりのルールに反しています。申し訳ありません。
自分で間違いに気づけるええ子やんけ。
(一人でしりとりしてみて!)
もちろん!では、始めますね。
しりとり→りんご → ごりら → らっぱ → ぱんだ → だんご →ごま → まんが → がいこつ → つみき → きりん → ん…
(んで終わらないように続けて)
了解です!続けてみましょう!
しりとり→りんご → ごりら →らくだ → だんご →ごま → まんが → がいこつ → つみき → きつね →ねこ → こま →まり → りす →すいか →かえる → るすばん → ばんごはん → はなび → びん → ん…
あ、また「ん」がついてしまいました!「ん」で終わらないように続けますね。
再スタート
やっぱりアホだよな・・・これで月額3000円は高い