ディープラーニング(AI)を用いた多文字のくずし字OCRサービスを提供します。 なお、スマホアプリについては、みを(miwo) -AIくずし字認識アプリをご利用下さい。 KuroNetくずし字認識サービス KuroNetくずし字認識サービス KuroNetくずし字認識サービスは、IIIF (International Image Interoperability Framework)に準拠した画像を対象に、RURIを利用した多文字くずし字OCR機能を提供します。無料サービスですが、ログインが必要です。具体的な利用方法につきましては、リンク先をご覧下さい。 KuroNetくずし字認識ビューア KuroNetくずし字認識ビューア KuroNetくずし字認識ビューアは、KuroNetくずし字認識サービスを利用するための入口となります。ビューアにIIIF (International Image

はじめに Deep Learningを使った距離学習(Metric Learning)では、Contrastive LossやTriplet Lossなどを用いて、画像間の類似性(や非類似性)を直接学習していく方法が広く利用されていますが、学習データの組み合わせや選び方が難しく、学習自体が難航するケースが多い事も知られています。それだけに、これまで様々な改良と工夫が提案されています。 しかし、最近はこのような学習データ選びに難航することなく、一般的なクラス分類タスクの感覚で、Softmax関数をベースに学習できるMetric Learningが注目を浴びています。ArcFaceなどはその代表的手法でこちらで詳しく説明されています。 Softmax関数をベースにしたMetric Learningがうまくいく理由、またさらなる改良の余地はあるのか?これらに関して少し紹介しようと思います。 Ce

はじめに オプティムの R&D チームで Deep な画像解析をやっている奥村です。 Edge TPU は NVIDIAGPU と同じような感覚で使うことはできません。NVIDIAGPU よりもメモリの制約が強く、Edge TPU の性能を引き出したり、複数のモデルを1つの Edge TPU で同時に実行するにはいくつかのコツが必要になります。Edge TPU Compiler | Coral をベースに、意訳・追記したものをメモしました。 Edge TPU はモデルのパラメータデータをキャッシュするための 8MB 程度の SRAM を持っており、ここにモデルが乗り切らない場合、都度外部メモリから Edge TPU にデータを転送する必要があるため、性能低下を引き起します。また、複数モデルを 1 つの Edge TPU で実行する場合、同時コンパイル (Co-Compile) しないと

1. 概要 追記 公開当初Jetson Nanoの性能表記に誤記があったため修正しています。 最近組み込みデバイス(以下エッジと表現)で画像認識や音声認識、センサ情報の処理といったディープラーニングを利用した処理を実行することが容易になっている。低消費電力で、高速にディープラーニングを処理するためのエッジAI用アクセラレータが各社から発売されていることがその理由の一つだろう。 こういった、エッジAI用のアクセラレータは各社によってその使用や対応フレームワーク、利用できるディープラーニングのネットワーク構成に違いがある。どれも同じように利用できるわけではない。自分でエッジAI用アクセラレータを利用しようとしたときにいくつか調べてみた内容をメモがわりに残してみる。ちなみに個人で遊べるものを中心にしてるので、産業的にどうなのかは知らない、悪しからず。。。 あとこのブログではAndroid Thi

N-Shot Learning: Learning More with Less Data Isit possible to usemachine learning with small data? Yes,it is! Here's N-Shot Learning. Artificial Intelligence is the new electricity - Andrew NGIfAI is the new electricity, then data is the new coal. Unfortunately,just as we’ve seen a hazardous depletion in the amount of available coal, manyAI applications have little or no data accessible to

Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? 音声分析合成ってなぁに? 音声分析合成というのは、何らかの音声を合成して、それを分析し何らかのデータにして、それを複合して元の音声を生成する、という研究分野です。 ある意味では音声合成(Text-to-speech)はこの一分野としてみなすことができるかもしれません。 但し本研究はテキストから音声を合成することは出来ないと思われます。 音声分析合成の関連研究はどんなものがあるの? 日本語でかなり有名なものとして、WORLDというものがあります。 このあたり 1 2 が参考資料としてよいでしょう。 ここにはないものとして、LPCNet と

興味を持った点群深層学習の関連の論文についてまとめました.図などは各論文から引用しています.(最近は論文が多く,あまり網羅はできていません) 間違いなどあればご指摘頂けるとありがたいです. 論文リスト: https://docs.google.com/spreadsheets/d/1l4NTSE…

A Gentle Introduction toText Summarization inMachine LearningText summarization is a common problem in the fields ofmachine learning and natural language processing (NLP). In this article, we'll explore how tocreate asimple extractivetext summarization algorithm. Have you ever summarized a lengthy document into a short paragraph? How long did you take? Manually generating a summary can be t

Semi-supervised node classification in graphs is a fundamental problem in graph mining, and the recently proposed graph neuralnetworks (GNNs) have achieved unparalleled results on this task. Due to their massive success, GNNs have attracted a lot of attention, and many novel architectures have been put forward. In this paper we show that existing evaluation strategies for GNN models have serious
Home »Blog » Using a Keras Long Short-Term Memory (LSTM) Model to Predict Stock Prices Editor’snote: This tutorial illustrates how to get started forecasting time series with LSTM models. Stock market data is a great choice for this becauseit’s quite regular and widely available to everyone. Please don’t take this as financial advice or useit to make any trades of your own. In this tutorial, w

1. はじめに ~画像レジストレーション~ 画像レジストレーションとは、異なる画像間における点と点の対応関係から、画像間に存在する幾何学的な変換モデル(例えばアフィン変換など)を推定し、画像間の位置合わせを行うことをいいます。 画像レジストレーションの応用先としては、以下のような例があります。 複数の画像を組み合わせたモザイク画像(パノラマ画像)の生成 超解像画像の生成,etc. 今回は、このような画像間の位置合わせを、畳み込みニューラルネットワークで行った論文を紹介し、実際にコードを動かしてみます。 2. 今回紹介する論文 題名 : Convolutional NeuralNetwork Architecture for Geometric Matching 発表 : Spotlight & poster @ CVPR'17 実装 : https://github.com/ignac

はじめにAPIの全体像 Layer 0 : TensorFlow Layer 1 : StatisticalBuildingBlocks Layer 2 : ModelBuilding Layer 3 : Inferencetechniques Layer 4 : Pre-built models + inference 高レベルAPItfp.glmの紹介 提供されている一般化線形モデル(GLM) ●class Bernoulli ●class BernoulliNormalCDF ●class Poisson ●class PoissonSoftplus ●class Normal ●class NormalReciprocal ●classLogNormal ●classLogNormalSoftplus ●class GammaExp ●class GammaSoftp

抄訳 ONNXはNCHW形式のデータを受け付ける 他方通常ビルド形式のTensorflowはNHWC形式のデータしか受け付けない 実際のサーバではGPUを使いたくない MKLを使用するとCPUでもHCHW形式の予測が可能になる tensorflow-serving公式のDockerfileはMKL形式でビルドしていない 公式Dockerfileを改造したら予測が動くようになった 詳細Pytorchで訓練したモデルをONNX形式にexportしてtensorflow-servingで配信というフローがやりたかった。 公式のDocker Imageを普通にpullすると、config=nativeoptでビルドされたtensorflowを使用することになる為、MKLを導入するにはビルドの仕方を改造する必要がある。 公式のDockerfileからローカルでビルドを行う方法についてはこちらを参照

Watch Now This tutorial has a related video coursecreated by the RealPython team. Watchit together with the written tutorial to deepen your understanding: LearnText Classification WithPython and Keras Imagine you could know the mood of the people on the Internet. Maybe you are not interested inits entirety, but only if people are today happy on your favorite social media platform. After this

DeepMind, a leading artificial intelligence (AI) research company, has filed a series of international patent applications, which have now been published for the first time. The applications relate to a number of the fundamental aspects of modern daymachine learning, and are therefore of potential significance to anyone operating in the commercialAI sector. Background to DeepMind DeepMind is a L

Google recently added the Tensor Processing Unit v2 (TPUv2), a custom-developed microchip to accelerate deep learning, toits cloud offering. The TPUv2 is the second generation of this chip and the first publicly available deep learning accelerator that has the potential of becoming an alternative to NvidiaGPUs. We recentlyreported our first experience and received a lot ofrequests for a more d
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く