
エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
ここにツイート内容が記載されますhttps://b.hatena.ne.jp/URLはspanで囲んでください
Twitterで共有ONにすると、次回以降このダイアログを飛ばしてTwitterに遷移します
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

チャット系の生成AIの中で、最近はGeminiをよく使っています。今の自分の使い方ではほとんど問題ないの...チャット系の生成AIの中で、最近はGeminiをよく使っています。今の自分の使い方ではほとんど問題ないのですが、あるタスクの処理だけ、昔できていたことができなくなってしまいました。 ある音声の文字起こしを定期的にしているのですが、Gemini 1.5 Proを使っていたときは、ほぼ問題なくできていました。フォーマットを指定できるし、話者分離もできるし、タイムスタンプもつきます(ズレるのであまり信用できないけど)。誤変換もところどころありますが、ある程度の専門用語にも対応できているし、ほぼ満足できる品質でした。人間がやるよりも何倍も速いし。 ところが、Gemini 2.5 Proや2.0 Proを使うと、この文字起こしに問題が出始めました。頭がよくなってアウトプットを推敲するようになったからなのかはわかりませんが、発言内容の順番がまるっと移動してしまうことがあります。もとの音声では、話があっ