使用Ruby和Ubuntu随着光学字符识别

我是一名大学生,现在是时候再次购买教科书。 本季度有超过20本书,我需要的类。 通常这不会是这样一个大问题,因为我只是复制和粘贴的ISBN进入亚马逊。 该ISBN号,然而,对我校的图书网站转换为图像。 所有我想要做的就是让ISBN编号转换成字符串,所以我不必键入每一个手工制作。 我已经使用GOCR将图像转换成文字,但我想用它与Ruby脚本这样我就可以自动完成该过程,做同样为我的同学。

我可以导航到该网站。 我该如何拯救我的电脑(运行Ubuntu),将图像与GOCR上的图像文件,并最终将其保存到一个文件中,这样我就可以再次用我的Ruby脚本访问它们?

--------------解决方案-------------

GOCR似乎是一个不错的选择,在第一,但我可以告诉从我自己的“研究”,质量并不完全足够日常使用。 也许这会导致一个问题,根据图像输入。 如果它不工作了你,试试谷歌文档,它允许你上传图片的OCR的“新”功能。 然后,您可以检索使用一些谷歌的API(有吨在那里,我使用GDATA,红宝石UTIL这需要一些黑客攻击的结果,虽然。

你也可以使用的tesseract-OCR为OCR的一部分,它也是开源的,并在积极发展。

对于检索的一部分,我想也坚持使用角度来说,Hpricot,超级强大和灵活。

听起来像一个凉爽的项目,应该不会太难,如果ISBN图像存储在单个文件。

这一切都可以在后台运行:

  • 下载网页(网/ HTTP)
  • 保存元数据+图像文件,每本手册(回形针)
  • 在所有影像上运行GOCR

所有你需要的是网址或一个履带式(机械化)的列表,那么你可能需要花几分钟的时间写一个解析器(见乔的职位)的大学HTML页面。

分类:Ruby on Rails的 时间:2012-01-01 人气:0
分享到:

相关文章

  • 如何使与MySQL环境的Ruby on Rails在Ubuntu 11.04 2014-01-22

    如何使与MySQL环境的Ruby on Rails在Ubuntu 11.04. 我用的是 sudo apt-get install ruby sudo apt-get install mysql-server 然后我试着 gem install rails 但我不知道要安装MySQL适配器? 有没有我可以按照文件? 更新: 现在,我在安装使用的宝石 gem install rails. 有没有错误. 然而,当我运行 rails -v 我得到了'轨'没有安装,可以输入sudo apt-get的安装

  • Ruby on Rails的Ubuntu上安装失败。 我已经帮助? 2012-04-17

    我试图安装Ruby,RubyGems的,​​和Ruby on Rails框架,使其与我的系统发挥很好. 我有我的安装问题. 有人能帮助我吗? 下面是我的系统的细节,我如何着手安装. 目前我使用的Linux内核2.6.35-28泛型运行Ubuntu 10.10. 我的服务器是Apache的2.2.16,我使用MySQL 49年5月1日. 于是,我去了我的新立得软件包管理器和选择以下软件包下载:* ruby​​1.8的 - 安装的Ruby 1.8.4 *的libmysql-红宝石 - 用来访问MyS

  • Ruby on Rails的Ubuntu Linux上:创建一个新类抛出数据库错误 2012-01-23

    我是新手Linux用户试图来使用Ruby on Rails条款与* nix的发展. 我正在读一本好书名为"简单的Rails 2"[SitePoint:伦兹],还没有任何问题,直到我尝试创建轨控制台内的一个新故事的对象,我得到一个"没有司机的sqlite3找到"错误: $ sudo的Ruby脚本/控制台载入开发环境(Rails的2.3.2) 类故事<ActiveRecord的::基地结束=>无故事= Story.new RuntimeError:没有驱动程

  • 问题安装Ruby on Rails在Ubuntu的Apache2 2012-04-04

    使用上http://www.modrails.com/install.html我在轨道上的Phusion乘客与Apache2的部署安装了Ruby中发现的指南. (Ubuntu的服务器上)(这不是开发服务器). 铁轨脚本工作正常,当我运行"轨道-s",但是当我尝试使用Apache访问服务器,我收到了"500 - 内部服务器错误". Apache的错误文件: [Fri Apr 27 22:52:01 2012] [notice] caught SIGTERM, shut

  • 红宝石/ Ruby on Rails的,连续的循环轮询数据库 2013-10-03

    所以,我有几个外部数据库和我想要得到相当接近实时的数据传输. 我会只是做一个简单的查询如: select count(total) from invoices where date = 'today'; // pseudo code 所以我想找到一种方法,不断打电话,可为天/月结束上没有问题运行数据库查询,如果有问题,自愈/重启 建议?

  • Web服务:PHP或Ruby on Rails的或Python? 2013-10-16

    我是通过我白天工作一个.net / SQL Server开发,并在身边,我做了一些客观的C开发的iPhone. 我想开发一个Web服务,自Dreamhost的支持MySQL,Python和Ruby on Rails和PHP5,我想用这些语言之一,它来创建. 如果你有在任Python和Ruby on Rails的或PHP没有经验,你会去,为什么? 这项服务基本上只需要一个请求,会谈到MySQL数据库. 注:正计划使用SOAP协议..虽然我很愿意听取建议,因为我有一个干净的石板用这些语言. ----

  • Ruby on Rails的3教程在Ubuntu 64 VMPlayer 2012-01-15

    我通过红宝石1章on Rails的3教程中,我第一次遇到了麻烦,当我试图使用git但那是因为我没有做的SSH密钥的工作. 我有工作,但接下来就死在试图密钥添加到Heroku的. 我想它应该只是能够使用相同的密钥进行保存. 这就是我得到,我想不出有什么错误是告诉我. 我完全新Ruby和Rails. bill44077@ubuntu:~/Sites/rails_projects/first_app$ heroku keys:add <internal:lib/rubygems/custom_requ

  • Ubuntu的安装+ 1.9的Ruby,Rails 3中使用RVM 2012-11-14

    安装最好的办法RUBY 1.9, Rails 3, Postgres, Heroku, GitHub,使用RVM 任何人都可以建议我在这,我跟着来正确地安装它的最好方式,因为我以前在各种依赖问题的感觉. 建议的东西! --------------解决方案------------- 这可以帮助你获得Ruby和Rails设立一步步从我的莅临指导http://www.aaginskiy.com/technology/2011/12/install-rails-3-1-from-scratch/ Pos

  • 在新鲜的Ubuntu 10.10系统上安装Ruby on Rails的 2013-05-02

    有关于如何在Ubuntu 10.10安装Ruby on Rails的很多教程. 但是,即使按照这些步骤,仍有将为了成功安装的RoR遇到的错误和依赖性. 系统上的显影剂的设置而变化. 使其均匀,安装必须新鲜的Ubuntu 10.10系统上. 是否有一个一步一步的关于如何将新鲜的Ubuntu 10.10机器上安装的回报率引导? 像第一件事情,我需要在启动终端后做. --------------解决方案------------- 我安装由本教程在Ubuntu 10.4 Rails3中,希望它有助于 易

  • 这将是最适合Ruby on Rails的开发项目 - 32位或64位的Ubuntu 11.10 2012-03-10

    我有一个关于英特尔Core 2 Duo 2.2 GHz处理器,运行的是64位操作系统一个4GB内存,500 GB硬盘. 我只是有一个澄清将所有工具(不同的编辑器等)和软件(如IDE的RubyMine等)与Ruby on Rails的项目提供支持/使用64位操作系统版本上运行,或者我应该去与推荐的32位操作系统安装Ubuntu的11.10为http://www.ubuntu.com/download/ubuntu/download给出. 也就是64位只适用于AMD处理器?(只是一个疑问,这个版本的

Copyright (C) 55228885.com, All Rights Reserved.

55228885 版权所有 京ICP备15002868号

processed in 0.255 (s). 10 q(s)