The OpenNET Project / Index page

[ новости /+++ | форум | wiki | теги | ]

форумы  помощь  поиск  регистрация  майллист  вход/выход  слежка  RSS
"Вышла оболочка для распознавания текста YAGF 0.9.4"
Вариант для распечатки  
Пред. тема | След. тема 
Форум Разговоры, обсуждение новостей
Изначальное сообщение [ Отслеживать ]

"Вышла оболочка для распознавания текста YAGF 0.9.4"  +/
Сообщение от opennews (ok) on 04-Авг-14, 10:27 
Вышла (http://symmetrica.net/cuneiform-linux/yagf-ru.html) новая версия YAGF, написанной с использованием Qt 4 графической оболочки для программ оптического распознавания текста  Cuneiform (https://launchpad.net/cuneiform-linux) и Tesseract (http://code.google.com/p/tesseract-ocr/). Программа позволяет через единый GUI-интерфейс управлять сканированием изображений, их предварительной обработкой и распознаванием большого числа отсканированных страниц.


Основные изменения:

-  Улучшены пред-обработка изображений и автоматическое исправление наклона страниц;-  Новый инструмент для ручной корректировки исправления наклона (если она нужна); -  Поддержка распознавания текста, напечатанного очень мелким шрифтом; -  Упрощен импорт документов PDF; -  Более тесная интеграция с Tesseract OCR: (распознавание двуязычных текстов, режим распознования "только числа", добавлены новые языки распознавания).

<center><a href="http://symmetrica.net/cuneiform-linux/yagf.jpg"><img src="http://www.opennet.ru/opennews/pics_base/0_1407129565.jpg" style="border-style: solid; border-color: #e9ead6; border-width: 15px;max-width:100%;" title="" border=0></a></center>

URL: http://symmetrica.net/cuneiform-linux/yagf-ru.html
Новость: http://www.opennet.ru/opennews/art.shtml?num=40323

Ответить | Правка | Cообщить модератору

Оглавление

Сообщения по теме [Сортировка по времени | RSS]


1. "Вышла оболочка для распознавания текста YAGF 0.9.4"  +1 +/
Сообщение от trdm (ok) on 04-Авг-14, 10:27 
Классно. Полезная штучка )
Ответить | Правка | ^ к родителю #0 | Наверх | Cообщить модератору

2. "Вышла оболочка для распознавания текста YAGF 0.9.4"  +/
Сообщение от ssh (ok) on 04-Авг-14, 10:32 
Может кто-нибудь поделиться реальным опытом использования Cuneiform и Tesseract в продакшен для распознавания русскоязычных текстов?
Ответить | Правка | ^ к родителю #0 | Наверх | Cообщить модератору

4. "Вышла оболочка для распознавания текста YAGF 0.9.4"  +1 +/
Сообщение от Аноним (??) on 04-Авг-14, 11:08 
> Может кто-нибудь поделиться реальным опытом использования Cuneiform и Tesseract в продакшен для распознавания русскоязычных текстов?

в продакшн файнридером пользуются, если контора адекватная.

Ответить | Правка | ^ к родителю #2 | Наверх | Cообщить модератору

8. "Вышла оболочка для распознавания текста YAGF 0.9.4"  +3 +/
Сообщение от ssh (ok) on 04-Авг-14, 11:37 
> в продакшн файнридером пользуются, если контора адекватная.

Я ведь не критерии определения адекватности конторы просил. :)

Ответить | Правка | ^ к родителю #4 | Наверх | Cообщить модератору

32. "Вышла оболочка для распознавания текста YAGF 0.9.4"  +/
Сообщение от Андрей Боровский email on 09-Авг-14, 05:51 
>> Может кто-нибудь поделиться реальным опытом использования Cuneiform и Tesseract в продакшен для распознавания русскоязычных текстов?

куниформом не пользуются, так как он не-адаптируем.

А Tesseract  используется, вот например, люди живут с того, что предлагают кастомизированный софт на основе  тессеракт:

http://www.customocr.com

Я с этой конторой никак не связан, есличо. Я связан с другой ;-)

Ответить | Правка | ^ к родителю #4 | Наверх | Cообщить модератору

5. "Вышла оболочка для распознавания текста YAGF 0.9.4"  –6 +/
Сообщение от Grammar_Nazi on 04-Авг-14, 11:13 
продакшон...
Ответить | Правка | ^ к родителю #2 | Наверх | Cообщить модератору

7. "Вышла оболочка для распознавания текста YAGF 0.9.4"  +/
Сообщение от Аноним (??) on 04-Авг-14, 11:33 
Для винды его нет вроде. Тамашний кунаиформ не обновляется сто лет и глючен.
Ответить | Правка | ^ к родителю #2 | Наверх | Cообщить модератору

9. "Вышла оболочка для распознавания текста YAGF 0.9.4"  +/
Сообщение от ssh (ok) on 04-Авг-14, 11:38 
> Для винды его нет вроде. Тамашний кунаиформ не обновляется сто лет и
> глючен.

Да мне и не для венды. А tesseract?

Ответить | Правка | ^ к родителю #7 | Наверх | Cообщить модератору

12. "Вышла оболочка для распознавания текста YAGF 0.9.4"  +/
Сообщение от Djam (ok) on 04-Авг-14, 13:01 
часто отвратительное распознавание... В связке Yagf+Cuneiforms. Таблицы, формулы распознавать не умеет. Если текст отсканирован не совсем хорошо, распознает от силы 10-15%...
Tesseract не пробовал
Ответить | Правка | ^ к родителю #9 | Наверх | Cообщить модератору

16. "Вышла оболочка для распознавания текста YAGF 0.9.4"  –1 +/
Сообщение от Аноном on 04-Авг-14, 15:00 
Tesseract для русскоязычного бесполезен.
Ответить | Правка | ^ к родителю #9 | Наверх | Cообщить модератору

25. "Вышла оболочка для распознавания текста YAGF 0.9.4"  +/
Сообщение от AlZr on 04-Авг-14, 18:57 
Ничего подобного - если распознавать напечатанный текст, а не рукописный, то распознает очень даже хорошо. Сам пользуюсь, когда надо старые статьи перевести в электронную форму, которые где-то до этого потерялись.
Ответить | Правка | ^ к родителю #16 | Наверх | Cообщить модератору

18. "Вышла оболочка для распознавания текста YAGF 0.9.4"  –3 +/
Сообщение от Аноним (??) on 04-Авг-14, 16:26 
Для Windows встроенный в Office Professional распознавальщик имеется неплохой. Так что упомянутый выше FineReader - пятое колесо в телеге типа коммерческого антивируса при наличии загружаемого (для 7-ки) или встроенного (в 8-ку) бесплатного.
Ответить | Правка | ^ к родителю #7 | Наверх | Cообщить модератору

21. "Вышла оболочка для распознавания текста YAGF 0.9.4"  +1 +/
Сообщение от Аноним (??) on 04-Авг-14, 18:04 
> Для Windows встроенный в Office Professional распознавальщик имеется неплохой. Так что
> упомянутый выше FineReader - пятое колесо в телеге типа коммерческого антивируса
> при наличии загружаемого (для 7-ки) или встроенного (в 8-ку) бесплатного.

Только вот он стоит 19 тыс. Сам офис нужен с большой натяжкой, файнридер стоит 6 тыс (и явно лучше для распознавания). Считайте.

Ответить | Правка | ^ к родителю #18 | Наверх | Cообщить модератору

22. "Вышла оболочка для распознавания текста YAGF 0.9.4"  –2 +/
Сообщение от Аноним (??) on 04-Авг-14, 18:41 
Я говорю как есть в обычном офисе.

По-моему, не нужен ни MS Office, ни Windows, ни FineRedaer. Причем первые легко заменяются существенно более качественными продуктами, а последний, несмотря на то, что делает свою работу вполне хорошо, не нужен как класс ПО. Из головы писать надо, а не старые чужие тексты тянуть.

Ответить | Правка | ^ к родителю #21 | Наверх | Cообщить модератору

28. "Вышла оболочка для распознавания текста YAGF 0.9.4"  +/
Сообщение от Клыкастый (ok) on 05-Авг-14, 12:46 
да. проблема только в том, что если нужно распознавание (не раз в год, а в нормальных масштабах), требуется FR и он за собой тащит и венду и офис.
Ответить | Правка | ^ к родителю #22 | Наверх | Cообщить модератору

29. "Вышла оболочка для распознавания текста YAGF 0.9.4"  +2 +/
Сообщение от Аноним (??) on 05-Авг-14, 13:45 
Яркий пример замкнутого мышления. Не сталкивался с задачей - не нужно никому.
Ответить | Правка | ^ к родителю #22 | Наверх | Cообщить модератору

26. "Вышла оболочка для распознавания текста YAGF 0.9.4"  +1 +/
Сообщение от kai3341 (ok) on 04-Авг-14, 21:58 
> пятое колесо в телеге типа коммерческого антивируса при наличии загружаемого (для 7-ки) или встроенного (в 8-ку) бесплатного

Вы принципиально не правы. Своим наплевательским отношением к уязвимостям Microsoft искусственно создали целую нишу для высасывания бабла у хомяка, а также подарила ему иллюзию выбора.

Ответить | Правка | ^ к родителю #18 | Наверх | Cообщить модератору

27. "Вышла оболочка для распознавания текста YAGF 0.9.4"  +/
Сообщение от soarin on 05-Авг-14, 09:56 
Под линуксом он тоже как-то не шибко развивается. Олсо вендовая версия cuneiform лучше распознает русский текст, чем линуксовая. Можешь запустить под вайном и сравнить.
Но само собой и tesseract, и cuneiform очень сильно уступают тому же fine reader. И годны только для распознавания простого текста без всяких таблиц и сложностей на сканах отличного качества.
Ответить | Правка | ^ к родителю #7 | Наверх | Cообщить модератору

6. "Новая версия оболочки для распознавания текста YAGF 0.9.4"  +1 +/
Сообщение от Аноним (??) on 04-Авг-14, 11:15 
До Abbyy им все равно далеко.
Ответить | Правка | ^ к родителю #0 | Наверх | Cообщить модератору

10. "Новая версия оболочки для распознавания текста YAGF 0.9.4"  –2 +/
Сообщение от Аноним (??) on 04-Авг-14, 12:01 
плевать на файнридер. Им всем даже до свободного cunieform для винды далеко.
Ответить | Правка | ^ к родителю #6 | Наверх | Cообщить модератору

15. "Новая версия оболочки для распознавания текста YAGF 0.9.4"  +/
Сообщение от none_first (ok) on 04-Авг-14, 13:29 
зависит от кач-ва текста и задач
Ответить | Правка | ^ к родителю #6 | Наверх | Cообщить модератору

11. "Новая версия оболочки для распознавания текста YAGF 0.9.4"  –4 +/
Сообщение от Zenitur (ok) on 04-Авг-14, 12:37 
Вот бы поддержку FineReader для Linux и FreeBSD! А то ncurses для мазохистов.
Ответить | Правка | ^ к родителю #0 | Наверх | Cообщить модератору

13. "Новая версия оболочки для распознавания текста YAGF 0.9.4"  +2 +/
Сообщение от Онвоним on 04-Авг-14, 13:08 
С их мнением и отношением к GNU/Linux - не нужно.
Ответить | Правка | ^ к родителю #11 | Наверх | Cообщить модератору

17. "Новая версия оболочки для распознавания текста YAGF 0.9.4"  +/
Сообщение от Аноном on 04-Авг-14, 15:01 
> Вот бы поддержку FineReader для Linux и FreeBSD! А то ncurses для
> мазохистов.

А она есть.

Ответить | Правка | ^ к родителю #11 | Наверх | Cообщить модератору

19. "Новая версия оболочки для распознавания текста YAGF 0.9.4"  –2 +/
Сообщение от Аноним (??) on 04-Авг-14, 17:07 
В виде продукта для конечного пользователя нет. Но и не нужно (как впрочем и для Windows) ввиду наличия онлайн-версии: http://finereaderonline.com/ru-ru
Ответить | Правка | ^ к родителю #17 | Наверх | Cообщить модератору

20. "Новая версия оболочки для распознавания текста YAGF 0.9.4"  +2 +/
Сообщение от Аноним (??) on 04-Авг-14, 18:01 
Кончай троллить уже. Или тебе распознать несколько страничек в интернете (про приватность молчу) достаточно? будешь создавать новую учетку каждые 20 (или сколько там?) страниц?
Ответить | Правка | ^ к родителю #19 | Наверх | Cообщить модератору

24. "Новая версия оболочки для распознавания текста YAGF 0.9.4"  –1 +/
Сообщение от Аноним (??) on 04-Авг-14, 18:48 
Так ты много и бесплатно хочешь? Выбирай http://vorabota.ru/rabota-s-tekstami/onlayn-servisi-dlya-bes...
Ответить | Правка | ^ к родителю #20 | Наверх | Cообщить модератору

30. "Вышла оболочка для распознавания текста YAGF 0.9.4"  +/
Сообщение от Skull_2 email on 07-Авг-14, 15:23 
У меня в git.altlinux.org/people/cas/packages/yagf.git последние два коммита фиксят сборку: нет файла align.png (взял вместо него Align.png) и явно включил unistd.h для sleep()
Ответить | Правка | ^ к родителю #0 | Наверх | Cообщить модератору

31. "Вышла оболочка для распознавания текста YAGF 0.9.4"  –1 +/
Сообщение от Lazy_Kent email(ok) on 07-Авг-14, 21:18 
> У меня в git.altlinux.org/people/cas/packages/yagf.git последние два коммита фиксят
> сборку: нет файла align.png (взял вместо него Align.png)

До этого момента не добрался пока. Буду иметь ввиду.

> и явно включил unistd.h для sleep()

На этом споткнулся тоже. Описано здесь: https://gcc.gnu.org/gcc-4.7/porting_to.html

Андрей, надо починить.


Ответить | Правка | ^ к родителю #30 | Наверх | Cообщить модератору

Архив | Удалить

Рекомендовать для помещения в FAQ | Индекс форумов | Темы | Пред. тема | След. тема




Партнёры:
PostgresPro
Inferno Solutions
Hosting by Hoster.ru
Хостинг:

Закладки на сайте
Проследить за страницей
Created 1996-2024 by Maxim Chirkov
Добавить, Поддержать, Вебмастеру