この記事は eeic (東京大学工学部電気電子・電子情報工学科)その2 Advent Calendar 2018 - Qiita の13日目の記事です。 1. なにをしたいの?本記事は、小説を書くことができない人間がなんとかして自力(?)で小説を生み出すために試行錯誤した記録です。 リカレントニューラルネットワークの一種である多層LSTMを用いて、「小説家になろう」に投稿された小説の「言語モデル」を学習し、学習したモデルをもとに実際に小説を自動生成します。 「御託はいいから生成された文章を見せろ」という人はこの記事の10章に飛ぶか、https://ncode.syosetu.com/n7444fc/ を見てください。 2. 「小説家になろう」とは https://syosetu.com/ 誰でも無料で小説を投稿、閲覧することができるWEBサイトです。 独自の文化を形成しており、主に異世界


リンク ログミーTech(テック) 「女性エンジニア少ない問題」を解決するために、機械学習で男性エンジニアを女性に変換する 2018年4月21日、株式会社サイバーエージェントが主催するイベント「Battle Conference U30」が開催されました。30歳以下のエンジニアによる30歳以下のエンジニアのための技術カンファレンスである本イベントには、さまざまな領域で活躍する若手が登壇。企業の枠を超えて、自身の技術・事業・キャリアに関する知見を発表しました。「機械学習ブームの裏側に」に登壇したのは、ヤフー株式会社データプラットフォーム本部の池上哲矢氏。「女性エンジニアが少ない」という問題に対して、機械学習を用いて解決を試みた、 384 users 527


2月14日といえば**バレンタインデー(Valentine's Day)**ですね。 日本では、女性から男性へチョコレートを贈る日というイメージが強いと思います。この日を心待ちにしている方も多いのではないのでしょうか。 このように楽しいイベントと認識されているバレンタインデーですが、一方、重要な課題として、**本命チョコ(Honmei Chocholate)と義理チョコ(Obligation Chocholate)**が判別できないという問題が挙げられます。 実際、この問題を解くため多くの先行研究がなされています。(参考[1], [2], [3]) 義理チョコと本命チョコの見分け方!義理チョコをあげる意味や理由って何だろう? バレンタインの本命と義理の違い&見分け方!手作りは!?男性必見! 【バレンタイン】やっぱり気になる、“本命か義理チョコ”かを判断するポイントまとめ しかし、既存手法に


2016年、Google DeepMind社から恐ろしい論文が出された、AlphaGoその名を冠した囲碁プログラムが既存の囲碁ソフトに勝率99%を叩き出したのだ。AlphaGoは強化学習とDeep Learningを組み合わせた囲碁プログラムで、その年に最強の囲碁棋士の一人である李世ドルさんに4勝1負で勝利した。その後も進歩を続けて今のAlphaGoの強さは人類が体感できるレベルを超えるほど強くなったと予想される。 2017年も終わりのころ、Google DeepMind社からまた途方もない論文が発表された。囲碁とほぼ同じ手法で最強レベルのチェスや将棋プログラムを超えたということだった。実際のところ正確に超えたのかどうかちょっとだけ疑問もあるのだが、まず前提として彼らの新手法が途方もない成果をあげたこと素直に祝福したい。彼らは自分たちのプログラムをAlpha Zeroと名付けた。 コンピュ

Googleの画像認識APIを基に、好きな画像を学習させて認識機能を簡単にカスタマイズできる「Cloud AutoML Vision」発表Googleは、Googleが提供する学習済み機械学習APIを基に、ユーザーが自分のデータを学習させることで認識機能をカスタマイズできる「Cloud AutoML」を発表しました。 「Cloud AutoML」に対応したAPIの第一弾として、ユーザーが独自の画像を学習させられる「Cloud AutoML Vision」を発表しました。 学習済みの機械学習APIに対して追加で学習可能Googleは、機械学習を用いた画像認識APIとして「Cloud VisionAPI」を以前から提供しています。 Cloud VisionAPIはあらかじめGoogleによって学習済みであるため、画像を読み込ませるだけで、人間の顔の検出や猫や犬といった動物、船や飛行機、

これを行ったのは、東京共済病院腎臓高血圧内科部長、東京医科歯科大学臨床教授などを務める神田英一郎氏。日本腎臓学会の組織した委員会による、慢性腎臓病(CKD)をテーマとした「エビデンスに基づくCKD診療ガイドライン2018」(未出版)の作成に関わった。その作成プロセスにおいて、論文スクリーニング作業の負担が重いことから、機械学習の活用を思い付き、「第3のスクリーニング担当者」を生み出した。 以下では、同氏の説明に基づき、これを紹介する。 「心の折れる作業」をどう軽減できるか 医療の世界では、「EBM(Evidence Based Medicine)」への取り組みが進められてきた。EBMとは、「医療行為は最新、最良の科学的根拠に基づいて行うべき」という考え方だ。診療ガイドラインは、EBM推進の観点から、臨床現場での意思決定における判断材料の1つとして利用することを目的とした文書で、各専門分野の

Google、任意の画像が技術的に審美的に美しいかを評価し1-10(10が最高得点)で採点するCNNベースの画像評価モデル「NIMA」を提案した論文を発表 2017-12-19Googleは、画像に対して技術面と審美面の両方で訓練できるCNN(Convolutional NeuralNetwork)ベースの画像評価モデル「NIMA(Neural Image Assessment)」を論文にて発表しました。NIMA:Neural Image Assessment本稿では、任意の画像に対して1から10(10が最高得点)の程度で評価の分布を生成し、スコアのそれぞれに尤度を割り当てるアプローチを提案します。 ユーザが技術的(ピクセルレベルの技術品質)に美しく、または審美的(美の本質)に美しく見えるような画像を予測するために訓練されたdeepCNNが紹介されます。 実験では、AVAなどの大

研究開発部の原島です。部のマネージメントのかたわら、自然言語処理関連の開発に従事しています。本エントリでは、最近社内で開発した自然言語処理システムを紹介します。 ■ 「しょうゆ」のバリエーションは 100 種類以上クックパッドで以前から解決したかった課題の一つに材料の名前(以下、材料名)の正規化があります。クックパッドのレシピは複数の材料から構成され、各材料は名前と分量から構成されています。例えば、上のレシピの一つ目の材料は「豚薄切り肉」が名前で、「200g」が分量です。 さて、この材料名はこのレシピでは「豚薄切り肉」という表現でした。しかし、他のレシピでは「豚うす切り肉」という表現かもしれません。「豚うすぎり肉」や「ぶた薄切り肉」、「豚薄ぎり肉」等の表現もありえますね。 これは異表記同義(いわゆる表記揺れ)の問題ですが、同様の問題は他にも沢山あります。例えば、以下のようなものです。

「スゲー。これが今の日本の技術か……」 「世間はここまで進歩していたのか」 開発したのは、兵庫県西脇市に本社を置くシステム開発会社・ブレイン。創業35年、いまも社員20人のうち約16人がエンジニアという、生粋の技術者集団だ。 約10年前にゼロから開発スタート マシンの名前は「BakeryScan」(ベーカリースキャン)。「お店に提供を始めたのは今から4年ほど前。最近になって突然『ネットですごい反響がある』と人に言われて驚いた」――ブレインの原進之介執行役員はこう話す。 BakeryScanの開発が始まったのは2008年にさかのぼる。きっかけは、地元・兵庫県のパン店社長から相談を受けたことだった。 「人が足りなくて困っている。経験の浅い外国人スタッフでもレジ打ちや接客ができるようなシステムを作ってほしい」――。 だが、同社のパンに関する専門知識はゼロ。そこから待ち受けていたのは、約6年にわた

こんにちは。ぼへみあです。機械学習がすっかりブームになって、仕事や趣味でディープラーニングを使ったことがある人が増えていると思います。 特に画像分野でディープラーニングは成果を上げているので、特定のものを判別・識別するといった事例が多いかと思います。 そうした画像系のディープラーニング経験者なら経験する現象があります。 それは、 「その分野について、作ったAIよりも自分が詳しくなる」 という現象です。 おそ松さん見分けの第一人者になってしまった 以前取り組んだおそ松さんの6つ子をディープラーニングで見分けるネタでは、学習用データセットの作成のために、自力で5000枚以上のおそ松さんたちを見分ける作業を行いました。その結果、アニメを見ても、これは何松だ、と判断できるようになってしまいました。当時はおそ松さんを見分ける能力は誰にも負けない自信がありました。 なぜか学会でおそ松さんの話をする機

こんにちは。久々の投稿です。 僕のTwitterをフォローしてくれている方はご存知かと思いますが、4月から機械学習エンジニア/データサイエンティスト(見習い)として働く事が決まりました。 今日六本木の某社から正式に内定を頂きましたが、間違いなくTwitterのおかげでありTwitterこそ就活の全てであると確信した次第でございます— マスタケ (@MATHETAKE) 2017年2月23日 良い区切りですので今回はタイトルの通り、ただの純粋数学の学生だった僕がデータサイエンスの勉強を何故/どのようにしてきたのか、についての思い出せる範囲で書こうと思います。 Disclaimer: この記事は基本的に、"What I did" に関する記事であって決して "What you should do" についての記事ではありません。そんな勉強方法おかしいとか、こうすべきだ、みたいなマサカリは一切受

By Johann Dreo ネット上の世界で相手を罵倒したり嫌がらせをする迷惑行為は世界中で行われているという実態があり、インターネット百科事典のWikipediaの中でも個人に対するハラスメント行為があとを絶ちません。状況を問題視しているウィキメディア財団は調査チームを組織し、Alphabet傘下のインキュベーター(起業支援事業者)である「Jigsaw」と協力して実態の調査に乗り出しました。 Algorithms and insults: Scaling up our understanding of harassment onWikipedia ? WikimediaBlog https://blog.wikimedia.org/2017/02/07/scaling-understanding-of-harassment/ オンライン辞典のWikipediaでは、誰もが中身を編集


機械学習の分類の話を、主に決定境界と損失関数の観点から整理してみました。 とはいっても、k-NNとか損失関数関係ないのもいます。 最初ははてなブログに書こうとしたのですが、数式を埋め込むのが辛かったのでjupyternotebookにしました。github.com [追記]githubだと日本語を含む数式のレンダーが壊れるので、nbviewerの方がいいかもしれません。 https://nbviewer.jupyter.org/github/chezou/notebooks/blob/master/classification.ipynb [/追記] パーセプトロンが見直されたのはなんでだっけ、SVMってどういう位置づけだっけ、というのを確認できればなぁと思っています。 多層パーセプトロンまでに至るところの流れがうまく伝わればなぁと思っています。 間違いなどがあれば、是非ご指摘いただ
先日書いたOpenCVでアニメ顔検出をやってみた - kivantium活動日記の続編です。アニメ顔を検出するところまではうまくいったので、今度はキャラの分類をやってみようと思います。環境はUbuntu 14.10です。 ひと目で、尋常でない検出器だと見抜いたよ まずは分類に使う学習用データを用意します。投稿から半年以上経つのにまだランキング上位に残っている驚異の動画ご注文はうさぎですか? 第1羽「ひと目で、尋常でないもふもふだと見抜いたよ」 アニメ/動画 - ニコニコ動画を使います。 動画のダウンロード Ubuntuならaptで入れられるnicovideo-dlというツールを使います。sudo apt-get install nicovideo-dl nicovideo-dl www.nicovideo.jp/watch/1397552685その後avidemuxでOP部分だけの動画を

1リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く