Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
有谁知道任何可以让我分解图像中的文本并为每个单词创建更小的图像的库(最好是 Java,但我会看任何东西)?我已经测试过GOCR和tesseract,但我不打算转录文本,并且在许多情况下,例如手写笔记或功能不佳的打字机,文本必须由人类转录。大多数文本是西班牙语的事实也使 OCR 更加困难。我搜索了 stackoverflow 档案,没有找到任何东西。我的问题的目的是在大学里,我们有数十万份非常古老的手写笔记,如果我可以将它们逐字分解成更小的图像,那么我们可以尝试转录和翻译它们。
http://sourceforge.net/projects/javaocr/
特别是,下面的屏幕截图似乎与您所追求的有关。