書籍の電子化について、現状把握をしよーとしてんだけど、今回の切り口は、「OCRのあたり」。 書籍電子化の歴史と、OCR*1の発展の紆余曲折は、姉妹のよーなもの。 OCRの発展の紆余曲折を知ることはとっても大事。 ただ、紆余も曲折もぜーんぶ見ようとすると大変だから、とりあえず「アキラメない」面々に注目しましょ。 出発点:OCRってダメじゃん。使えねぇー。 使えないOCRを前にして、たいていはアキラメる。もーだめだ、書籍電子化なんて、やってられん、ってな感じで。(上図、右の矢印で出て行ってしまう。) ところが、世の中には、なかなかアキラメん連中がいるもので、時に彼らはとんでもないイノベーションをもたらす。*2 使えないOCRを前にして、それでもアキラメなかったのは、次の3派。 1.それでもかけっぱ派 (左派) 2.タグでいいじゃん派 (中道) 3.なんとしても修正じゃい派 (右派) 第1の「そ
![2007-11-22 - simpleA@hatena[書籍電子化]「アキラメない」連中の系譜](/image.pl?url=https%3a%2f%2fcdn-ak-scissors.b.st-hatena.com%2fimage%2fsquare%2f733855ccb064c1b197626079ffcd13e18e9e766d%2fheight%3d288%3bversion%3d1%3bwidth%3d512%2fhttps%253A%252F%252Fcdn.image.st-hatena.com%252Fimage%252Fscale%252Fb42e7ee6f9430d2547002eeb8c4404ce129b2cee%252Fbackend%253Dimagemagick%253Bversion%253D1%253Bwidth%253D1300%252Fhttp%25253A%25252F%25252Fcdn-ak.f.st-hatena.com%25252Fimages%25252Ffotolife%25252Fs%25252FsimpleA%25252F20071122%25252F20071122164335.jpg&f=jpg&w=240)
Digitizing Books One Word at a Time reCAPTCHA is a free CAPTCHA service that helps to digitize books. A CAPTCHA is a program that can tell whetherits user is a human or a computer. You've probably seen them — colorful images with distortedtext at the bottom of Web registration forms. CAPTCHAs are used by many websites to prevent abuse from "bots," or automated programs usually written to genera
1リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く