Добро пожаловать в форум, Guest  >>   Войти | Регистрация | Поиск | Правила | В избранное | Подписаться
Все форумы / Разработка информационных систем Новый топик    Ответить
Топик располагается на нескольких страницах: [1] 2 3   вперед  Ctrl      все
 потоковое сканирование документов  [new]
Lunx
Member

Откуда:
Сообщений: 489
Добрый день.
Есть задача - сканируем документы, распознаем, например, торг-12, выдергиваем номер документа и создаем pdf с таким именем. Весь контент пишем в этот pdf до следующего Торг-12 или окончания потока.

Кто посоветует решение, может, кто -то спрограммировать хочет.
Обсуждаемо.

МК,
14 ноя 18, 18:48    [21734531]     Ответить | Цитировать Сообщить модератору
 Re: потоковое сканирование документов  [new]
vill_ager
Member

Откуда: Belarus
Сообщений: 372
Lunx,

сканируй пачку документов в многостраничный PDF, потом разбивай его на отдельные страницы (они внутри лежат как JPG), распознавай и сохраняй назад.
15 ноя 18, 10:45    [21734887]     Ответить | Цитировать Сообщить модератору
 Re: потоковое сканирование документов  [new]
vill_ager
Member

Откуда: Belarus
Сообщений: 372
у меня распознаванием отсканированных страниц занимается неискусственный :) интеллект, который пишет аннотацию (ключевые слова) на каждую страницу.
Потом все сохраняется в БД (MySQL), и по ключевым словам можно выдергивать сканы.
Например, при отгрузке товара к накладной можно сформировать PDF с приходными документами (ттн, сертификаты и т.п.)
15 ноя 18, 15:10    [21735298]     Ответить | Цитировать Сообщить модератору
 Re: потоковое сканирование документов  [new]
Lunx
Member

Откуда:
Сообщений: 489
Спасибо за советы.
тоже мысль - иметь общий pdf а затем запустит обработчик который из одного файла наделает много.
Кто подскажет такого программиста ?
15 ноя 18, 15:24    [21735320]     Ответить | Цитировать Сообщить модератору
 Re: потоковое сканирование документов  [new]
Petro123
Member

Откуда: Загрузочный сектор Москвы (AutoPOI.ru)
Сообщений: 36104
Lunx
Спасибо за советы.
тоже мысль - иметь общий pdf а затем запустит обработчик который из одного файла наделает много.
Кто подскажет такого программиста ?
есть ветка - Работа
15 ноя 18, 15:49    [21735361]     Ответить | Цитировать Сообщить модератору
 Re: потоковое сканирование документов  [new]
vill_ager
Member

Откуда: Belarus
Сообщений: 372
Lunx,

тут одна проблема - распознавание

все остальное - просто
15 ноя 18, 16:10    [21735379]     Ответить | Цитировать Сообщить модератору
 Re: потоковое сканирование документов  [new]
Lunx
Member

Откуда:
Сообщений: 489
Может у кого есть опыт работы с FineReader ?
16 ноя 18, 10:16    [21735998]     Ответить | Цитировать Сообщить модератору
 Re: потоковое сканирование документов  [new]
Petro123
Member

Откуда: Загрузочный сектор Москвы (AutoPOI.ru)
Сообщений: 36104
Lunx
Может у кого есть опыт работы с FineReader ?
к студентам.
16 ноя 18, 10:53    [21736045]     Ответить | Цитировать Сообщить модератору
 Re: потоковое сканирование документов  [new]
Lunx
Member

Откуда:
Сообщений: 489
профессионалы не потянут?
16 ноя 18, 15:27    [21736498]     Ответить | Цитировать Сообщить модератору
 Re: потоковое сканирование документов  [new]
vill_ager
Member

Откуда: Belarus
Сообщений: 372
Petro123,

не так все просто
я (правда давно) искал возможность пакетного распознавания - не было ничего.
Может плохо искал.
Есть tesseract-ocr - посмотрите, ее можно натравить на файл из командной строки и получить текст.
16 ноя 18, 15:35    [21736505]     Ответить | Цитировать Сообщить модератору
 Re: потоковое сканирование документов  [new]
Petro123
Member

Откуда: Загрузочный сектор Москвы (AutoPOI.ru)
Сообщений: 36104
Lunx
профессионалы не потянут?
часовая ставка дорого.
vill_ager
не так все просто
я (правда давно)
вот именно, давно!
16 ноя 18, 16:12    [21736559]     Ответить | Цитировать Сообщить модератору
 Re: потоковое сканирование документов  [new]
Lunx
Member

Откуда:
Сообщений: 489
Нашел контору Элар, но они скорее для очень крупных предприятий. elar.ru
16 ноя 18, 16:22    [21736577]     Ответить | Цитировать Сообщить модератору
 Re: потоковое сканирование документов  [new]
vill_ager
Member

Откуда: Belarus
Сообщений: 372
Petro123,

а как оно сейчас?
16 ноя 18, 20:31    [21736757]     Ответить | Цитировать Сообщить модератору
 Re: потоковое сканирование документов  [new]
вадя
Member

Откуда: Екатеринбург
Сообщений: 15048
Lunx,
какое рабочее место предпологается?
16 ноя 18, 23:02    [21736821]     Ответить | Цитировать Сообщить модератору
 Re: потоковое сканирование документов  [new]
Petro123
Member

Откуда: Загрузочный сектор Москвы (AutoPOI.ru)
Сообщений: 36104
vill_ager
Petro123,

а как оно сейчас?
fineReader должна быть кнопка - распознать пакетно все из папки такой то.
17 ноя 18, 10:37    [21736914]     Ответить | Цитировать Сообщить модератору
 Re: потоковое сканирование документов  [new]
вадя
Member

Откуда: Екатеринбург
Сообщений: 15048
Petro123
fineReader должна быть кнопка - распознать пакетно все из папки такой то.
проблема в том что накладные могут быть многостраничными и важно не спутать связь.
можно конечно объединять по имени файлов, но тоже не очень.
вопрос какой сканер используется ? пакетный? - как обрабатываются двухстороннии доки, как нумеруются сканы.
самое оптимальное - посадить оператора и вручную вставлять листы
есть вариант как это всё сделать
но нужны более точные условия
17 ноя 18, 11:20    [21736921]     Ответить | Цитировать Сообщить модератору
 Re: потоковое сканирование документов  [new]
vill_ager
Member

Откуда: Belarus
Сообщений: 372
Petro123,

Должна. А есть?

И даже если есть - решение не идеальное,
еще надо проанализировать сканы и тексты,
склеить длинные документы в один файл.

Я бы еще и текст распознанный сохранил,
для организации поиска.
17 ноя 18, 12:02    [21736934]     Ответить | Цитировать Сообщить модератору
 Re: потоковое сканирование документов  [new]
Petro123
Member

Откуда: Загрузочный сектор Москвы (AutoPOI.ru)
Сообщений: 36104
vill_ager
склеить длинные документы в один файл.
в pdf счас работает любая табуретка.
А уже с ним работает любой студент.
17 ноя 18, 13:45    [21736983]     Ответить | Цитировать Сообщить модератору
 Re: потоковое сканирование документов  [new]
Petro123
Member

Откуда: Загрузочный сектор Москвы (AutoPOI.ru)
Сообщений: 36104
вадя
проблема в том что накладные могут быть многостраничными и важно не спутать связь.
каую связь? На выходе столько же страниц.
Что означает вместо принтера МФУ знаете?
17 ноя 18, 13:48    [21736986]     Ответить | Цитировать Сообщить модератору
 Re: потоковое сканирование документов  [new]
вадя
Member

Откуда: Екатеринбург
Сообщений: 15048
Petro123
каую связь? На выходе столько же страниц.
для экономии бумаги используют печать на 2 сторонах. эти мфу могут сканировать с двух сторон?
17 ноя 18, 15:11    [21737020]     Ответить | Цитировать Сообщить модератору
 Re: потоковое сканирование документов  [new]
Petro123
Member

Откуда: Загрузочный сектор Москвы (AutoPOI.ru)
Сообщений: 36104
вадя
Petro123
каую связь? На выходе столько же страниц.
для экономии бумаги используют печать на 2 сторонах. эти мфу могут сканировать с двух сторон?
ну и вопрос, LOL.
Для экономии бумаги вообще не надо печатать.
А двухсторонний скан на выходе это анекдот.
17 ноя 18, 16:30    [21737051]     Ответить | Цитировать Сообщить модератору
 Re: потоковое сканирование документов  [new]
вадя
Member

Откуда: Екатеринбург
Сообщений: 15048
Petro123
Для экономии бумаги вообще не надо печатать.
принтеры вполне справляются с печатью на обеих сторонах.
если ты их засунешь в пакетный сканер - что у тебя получится? будешь наугад группировать?
или мфу как принтеры умеют переворачивать бумагу?
17 ноя 18, 16:39    [21737056]     Ответить | Цитировать Сообщить модератору
 Re: потоковое сканирование документов  [new]
Petro123
Member

Откуда: Загрузочный сектор Москвы (AutoPOI.ru)
Сообщений: 36104
вадя,
Не врубился?
Прочти первый ответ в топике. Где там принтер?
Первый ответ в топике это решение задачи.
17 ноя 18, 18:55    [21737114]     Ответить | Цитировать Сообщить модератору
 Re: потоковое сканирование документов  [new]
вадя
Member

Откуда: Екатеринбург
Сообщений: 15048
Petro123
Прочти первый ответ в топике. Где там принтер?
Первый ответ в топике это решение задачи.
я о том что есть накладные напечатанные на обеих сторонах листа( а может и не на одном листе, тоже двухсторонних)
как автоматизировать сканирование таких доков?
17 ноя 18, 19:13    [21737126]     Ответить | Цитировать Сообщить модератору
 Re: потоковое сканирование документов  [new]
Petro123
Member

Откуда: Загрузочный сектор Москвы (AutoPOI.ru)
Сообщений: 36104
вадя
как автоматизировать
никак. Это не наш вопрос и не вопрос автора топика.
17 ноя 18, 20:06    [21737150]     Ответить | Цитировать Сообщить модератору
Топик располагается на нескольких страницах: [1] 2 3   вперед  Ctrl      все
Все форумы / Разработка информационных систем Ответить