The OpenNET Project / Index page

[ новости /+++ | форум | теги | ]

Релиз открытой системы распознавания печатных текстов Cuneiform 0.5

23.11.2008 12:37

Выпущен новый релиз свободной системы распознавания печатных текстов Cuneiform, построенной на базе открытых компанией Cognitive Technologies исходных текстов. В новой версии появилась поддержка вывода в формате hOCR, который например можно без труда сконвертировать в PDF. В прошлом релизе была добавлена поддержка вывода в формате RTF, добавлена поддержка платформы FreeBSD.

OCR CuneiForm может распознавать любые полиграфические, машинописные гарнитуры всех начертаний и шрифты, получаемые с принтеров за исключением декоративных и рукописных. В систему встроены специальные алгоритмы для распознавания текста с матричного принтера, плохих ксерокопий факсов и машинописи. Поддерживается более чем 20 языков. Отдельно стоит отметить отличную поддержку распознавания текста на русском и украинском языках. Результат распознавания может быть сохранен в HTML формате с сохранением особенностей начертания оригинала (выделение жирным, курсивом и т.д.).

  1. Главная ссылка к новости (https://lists.launchpad.net/cu...)
  2. OpenNews: Завершена работа над FreeBSD портом системы распознавания Cuneiform
  3. OpenNews: В системе распознавания текста Cuneiform 0.3.1 появилась поддержка FreeBSD
  4. OpenNews: Вышла новая версия Linux редакции системы распознавания печатных текстов Cuneiform
  5. OpenNews: Открыты исходные тексты системы оптического распознавания CuneiForm
  6. OpenNews: Опубликован исходный код системы распознавания печатных текстов Cuneiform
Лицензия: CC BY 3.0
Короткая ссылка: https://opennet.ru/19050-ocr
Ключевые слова: ocr, text, Cuneiform
При перепечатке указание ссылки на opennet.ru обязательно


Обсуждение (7) Ajax | 1 уровень | Линейный | +/- | Раскрыть всё | RSS
  • 1.1, Aleksey (??), 13:07, 23/11/2008 [ответить]  
  • +/
    Cognitive Technologies спасибо за открытие исходников, новым мейнтерам спасибо за развитие столь нужного пакета.
     
  • 1.2, Аноним (2), 14:39, 23/11/2008 [ответить]  
  • +/
    А оно всё также стабильно падает с segfault при непонятных причинах?
     
     
  • 2.4, Аноним (-), 15:42, 23/11/2008 [^] [^^] [^^^] [ответить]  
  • +/
    > А оно всё также стабильно падает с segfault при непонятных причинах?
    >

    Нет, надежность повысилась, однако и стабильным назвать продукт пока никак нельзя. Так что можно сказать, что теперь падает не так уж стабильно ^_^

     
  • 2.6, User294 (ok), 13:10, 24/11/2008 [^] [^^] [^^^] [ответить]  
  • +/
    > А оно всё также стабильно падает с segfault при непонятных причинах?

    Как ни странно данная фича почему-то присуща "распознавалкам текста вообще".Другие распознавалки опробованные в свое время (в виндах) радостно сыпались к такой-то фене как только подсунешь что-то мало-мальски нестандартное.Например, распознавалки *очень* не любят жевать банальные скриншоты почему-то.Ну и так далее - немного креативности и ... распознавалка текста с грохотом выпадат.Странно.

     

  • 1.3, Аноним (3), 14:40, 23/11/2008 [ответить]  
  • +/
    Класс...  пошел качать...
     
  • 1.5, Vyacheslav (??), 19:58, 23/11/2008 [ответить]  
  • +/
    >А оно всё также стабильно падает с segfault при непонятных причинах?

    Нет, работает стабильно.
    Потестил, могу отметить, что  распознавание с параметрами  --dotmatrix --fax идет
    хуже - больше ошибок, нежели просто с --dotmatrix или с --fax.
    Вобщем в каждом частном случае стоит поиграться с этими параметрами.

     
  • 1.7, Аноним (2), 14:09, 24/11/2008 [ответить]  
  • +/
    распознавание текста в таблицах и графиках, все таблици ломает и переводит не совсем всё правильно. :(
     
     Добавить комментарий
    Имя:
    E-Mail:
    Текст:



    Партнёры:
    PostgresPro
    Inferno Solutions
    Hosting by Hoster.ru
    Хостинг:

    Закладки на сайте
    Проследить за страницей
    Created 1996-2024 by Maxim Chirkov
    Добавить, Поддержать, Вебмастеру