Добро пожаловать в форум, Guest  >>   Войти | Регистрация | Поиск | Правила | В избранное | Подписаться
Все форумы / Разработка информационных систем Новый топик    Ответить
Топик располагается на нескольких страницах: Ctrl  назад   1 [2] 3   вперед  Ctrl      все
 Re: потоковое сканирование документов  [new]
Petro123
Member

Откуда: Загрузочный сектор Москвы (AutoPOI.ru)
Сообщений: 37116
вадя,
Я перелистывал книгу и ложил разворот в МФУ.
В любой книге буквы на двух сторонах.
Неожиданно?
Что за идиотский вопрос?
17 ноя 18, 20:08    [21737151]     Ответить | Цитировать Сообщить модератору
 Re: потоковое сканирование документов  [new]
вадя
Member

Откуда: Екатеринбург
Сообщений: 15278
Petro123
никак. Это не наш вопрос и не вопрос автора топика.
вот я и хочу услышать как это относится к потоковому сканированию

Petro123
Я перелистывал книгу и ложил разворот в МФУ.
если так же , в ручную, то я могу это сделать....
17 ноя 18, 21:51    [21737169]     Ответить | Цитировать Сообщить модератору
 Re: потоковое сканирование документов  [new]
Petro123
Member

Откуда: Загрузочный сектор Москвы (AutoPOI.ru)
Сообщений: 37116
вадя,
Т.е.ко мне вопросов нет.
Удачи.
17 ноя 18, 22:08    [21737172]     Ответить | Цитировать Сообщить модератору
 Re: потоковое сканирование документов  [new]
vill_ager
Member

Откуда: Belarus
Сообщений: 373
вадя,

Есть двухсторонние сканеры, сканируют сразу пачку листов
17 ноя 18, 23:50    [21737202]     Ответить | Цитировать Сообщить модератору
 Re: потоковое сканирование документов  [new]
вадя
Member

Откуда: Екатеринбург
Сообщений: 15278
vill_ager
вадя,

Есть двухсторонние сканеры, сканируют сразу пачку листов

ворос - есть ли такой у тс.....
18 ноя 18, 03:52    [21737266]     Ответить | Цитировать Сообщить модератору
 Re: потоковое сканирование документов  [new]
vill_ager
Member

Откуда: Belarus
Сообщений: 373
вадя,

это не важно

если документов много - без него не обойтись
если мало - можно все руками делать

посмотрел на tesseract снова:
- качество распознавания намного улучшилось
- скорость - 15 сек на страницу
18 ноя 18, 10:45    [21737320]     Ответить | Цитировать Сообщить модератору
 Re: потоковое сканирование документов  [new]
вадя
Member

Откуда: Екатеринбург
Сообщений: 15278
vill_ager
посмотрел на tesseract снова:
- качество распознавания намного улучшилось
- скорость - 15 сек на страницу
тут не просто распознавание...
не факт, что все используют 1с для печати Торг12.
к тому же есть портретный и ландшафтный вид листа.
если всё автоматизировать - то всё сложно и дорого
18 ноя 18, 12:26    [21737356]     Ответить | Цитировать Сообщить модератору
 Re: потоковое сканирование документов  [new]
Petro123
Member

Откуда: Загрузочный сектор Москвы (AutoPOI.ru)
Сообщений: 37116
вадя
vill_ager
посмотрел на tesseract снова:
- качество распознавания намного улучшилось
- скорость - 15 сек на страницу
тут не просто распознавание...
не факт, что все используют 1с для печати Торг12.
к тому же есть портретный и ландшафтный вид листа.
если всё автоматизировать - то всё сложно и дорого
если ты так испугался, то конкретнее по программной части.
На входе УЖЕ pdf в программной части.
Мне твои страхи в портрет ландшафт непонятны.
18 ноя 18, 12:52    [21737369]     Ответить | Цитировать Сообщить модератору
 Re: потоковое сканирование документов  [new]
вадя
Member

Откуда: Екатеринбург
Сообщений: 15278
Petro123
если ты так испугался, то конкретнее по программной части.
На входе УЖЕ pdf в программной части.
Мне твои страхи в портрет ландшафт непонятны.
как правило все распознаватели в качестве источника берут картинку, а не пдф (или потом сами извлекают картинку из пдф)
поэтому правильнее получить картинку , повернуть её для удобства просмотра выделить место номера(если это первая страница) , распознать, сохранить в пдф, и сохранить номер.
но если по уму - то надо сохранять с уникальным именем и обеспечить связь между номером и файлом.
и ещё надо не только сканировать номер, но и поставщика....(и возможно получателя)

а пока куча вопросов по ТЗ...
18 ноя 18, 14:27    [21737411]     Ответить | Цитировать Сообщить модератору
 Re: потоковое сканирование документов  [new]
Petro123
Member

Откуда: Загрузочный сектор Москвы (AutoPOI.ru)
Сообщений: 37116
вадя,
Я извлекал из pdf, сжимал и вставлял обратно. Нет проблем. Работа студента.
Ок. Считай что это работа профи.
18 ноя 18, 15:00    [21737428]     Ответить | Цитировать Сообщить модератору
 Re: потоковое сканирование документов  [new]
vill_ager
Member

Откуда: Belarus
Сообщений: 373
вадя
Petro123
если ты так испугался, то конкретнее по программной части.
На входе УЖЕ pdf в программной части.
Мне твои страхи в портрет ландшафт непонятны.
как правило все распознаватели в качестве источника берут картинку, а не пдф (или потом сами извлекают картинку из пдф)
поэтому правильнее получить картинку , повернуть её для удобства просмотра выделить место номера(если это первая страница) , распознать, сохранить в пдф, и сохранить номер.
но если по уму - то надо сохранять с уникальным именем и обеспечить связь между номером и файлом.
и ещё надо не только сканировать номер, но и поставщика....(и возможно получателя)

а пока куча вопросов по ТЗ...


PDF - самый простой вариант получения потока сканов
Где брать картинку в PDF я уже писал.
Как брать - не rocket science, я делаю в 4 строки

С поворотом (а также с вариантом "вверх ногами") - да, проблема, но решаема -
можно прогонять распознавание, проверять наличие обязательных слов в тексте,
если нет - вращать картинку и т.д.
18 ноя 18, 15:03    [21737433]     Ответить | Цитировать Сообщить модератору
 Re: потоковое сканирование документов  [new]
vill_ager
Member

Откуда: Belarus
Сообщений: 373
тест (Tesseract) распознавания ТОРГ-12 с этой страницы:
+

Унифицированная форма № ТОРГ-12
Утверждена постановлением Госкомстата России от 25.12.98 № 132
Коды
ИП Иванов Иван Иванович, ИНН 770289658888, свидетельство ЦМК 0005460 от 02.04.1998, р/с 40702810538009856241, в банке "БАНК РФТ", БИК 044540124, Форма по ОКУД 0330212
к/с 30101810300000000124 по ОКПО
организация-грузостправитель, адрес, телефон, факс, банковские реквизиты
структурное подразделение Вид деятельности по ОКДП
Грузополучатель ООО "Плотник+" по ОКПО
организация, адрес, телефон, факс, банковские реквизиты
ИП Иванов Иван Иванович, ИНН 770289658888, свидетельство ЦМК 0005460 от 02.04.1998, р/с 40702810538009856241, в банке "БАНК РФТ", БИК
Поставщик 044540124, к/с 30101810300000000124 по ОКПО
организация, адрес, телефон, факс, банковские реквизиты
Плательщик ООО "Плотник+" по ОКПО
организация, адрес, телефон, факс, банковские реквизиты
Основание 1234 от 10.02.2015 номер 1234
договор, заказ-наряд дата} 10.02.2015
Номер документа |Дата составления Транспортная накладная номер
ТОВАРНАЯ НАКЛАДНАЯ 1 10.02.2015 дата
Вид операции
Страница 1
Но- Товар иница измерения Количество Коли- НДС Сумма с
мер Вид Сумма без
в Масса чество Цена, учетом
по наименование, характеристика, сорт, ко наиме- |код по |упаков одном мест, брутто (масса ЕВ учета НДС, ставка, % сумма, НДС
по- артикул товара А нование | ОКЕЙ ки Ёесте штук нетто) ЕВ ‚* ЕВ ЕА
рядку
1 2 3 4 5 в 7 8 9 10 11 12 13 14 15
1 [Доска 4000х300х40 00-00000057 мЗ 113 2,000 1 238,90 2 477,80 18% 446,00 2 923,80
2 {Доска 3000х200х20 00-00000055 мЗ 113 5,000 715,81 3 579,05 18% 644,23 4 223,28
Итого 7,000 у4 6 056,85 Х 1 090,23 7 147,08
Всего по накладной 7,000 Х 6 056,85 Х 1 090,23 7 147,08
Товарная накладная имеет приложение на
и содержит Два порядковых номеров записей
прописью
Масса груза (нетто)
прописью
Всего мест Масса груза (брутто)
прописью прописью
Приложение (паспорта, сертификаты и т.п.) на листах По доверенности № от
прописью
Всего отпущено на сумму выданной
Семь тысяч сто сорок семь евро 08 центов кем, кому (организация, должность, фамилия, и. о.)
прописью
Отпуск груза разрешил Иванов И.И.
должность подпись расшифровка подписи
Главный (старший) бухгалтер Груз принял
подпись расшифровка подписи должность „подпись расшифровка подписи
Отпуск груза произвел Груз получил
должность подпись расшифровка подписи грузополучатель должность подпись расшифровка подписи
М.П. "10" февраля 2015 года М.П. "_" 20 _ тода
18 ноя 18, 15:39    [21737445]     Ответить | Цитировать Сообщить модератору
 Re: потоковое сканирование документов  [new]
вадя
Member

Откуда: Екатеринбург
Сообщений: 15278
vill_ager
PDF - самый простой вариант получения потока сканов
Где брать картинку в PDF я уже писал.
Как брать - не rocket science, я делаю в 4 строки

С поворотом (а также с вариантом "вверх ногами") - да, проблема, но решаема -
можно прогонять распознавание, проверять наличие обязательных слов в тексте,
если нет - вращать картинку и т.д.
если применить руки - то нет проблем, вопрос что у ТС?
и что он понимает под автоматизацией.
и я ведь не говорил что проблемы не решаемы.
Petro123
Я извлекал из pdf, сжимал и вставлял обратно. Нет проблем. Работа студента.
по отдельным частям у меня всё работает в разных проекта.
чтоб это собрать воедино в одном проекте надо конкретные условия.
то что Tesseract не плохо распознаёт - я использую в вебе, вот только одна проблема - если два языка.....
я и в браузере могу получать картинку со сканера и распознать её. и отправить на сервер отнормированной по размеру... и сохранить в пдф.....
18 ноя 18, 16:37    [21737465]     Ответить | Цитировать Сообщить модератору
 Re: потоковое сканирование документов  [new]
vill_ager
Member

Откуда: Belarus
Сообщений: 373
вадя,
если применить руки - то нет проблем

а где я писал про руки?
руки нужны чтобы вставить пачку 100 страниц в сканер, нажать на кнопку,
потом нажать на кнопку и выбрать файл PDF (с этой сотней страниц).
Все остальное сделает софт.
18 ноя 18, 17:43    [21737480]     Ответить | Цитировать Сообщить модератору
 Re: потоковое сканирование документов  [new]
вадя
Member

Откуда: Екатеринбург
Сообщений: 15278
vill_ager
потом нажать на кнопку и выбрать файл PDF (с этой сотней страниц).
Все остальное сделает софт.
повидав варианты накладных, я бы не стал доверять работе этого софта.
18 ноя 18, 17:57    [21737489]     Ответить | Цитировать Сообщить модератору
 Re: потоковое сканирование документов  [new]
Lunx
Member

Откуда:
Сообщений: 489
Большое всем спасибо за комментарии.
Итогом (но пока решение не куплено) смотрим протяжный сканер от Brother 3600 и Panasonic.
Фишка каждого решения - на сканер может быть установлен софт, который может сканировать ШК, в который надо записать идентификатор типа документа и номер документа. Этот софт можно настроить таким образом, что по требуемому идентификатору вида документа сканер может создавать pdf контейнер и заполнять его контентом до следующего идентификатора.

Решение недорогое, сам сканер порядка 100К рублей. На входе пачка А4, разложенная по пакетам, каждый пакет начинается счет-фактурой либо УПД. Выход - файлы pdf в котором сканы всего контента от фактуры до фактуры.
Документы могут быть двусторонними, но это не сильно волнует, если торг-12 внутри будет начинаться с четных страниц - страшного мало, информация то все равно есть, поэтому задачи разбора, анализа контента отпали.
Вся соль напечатать на документе эти ШК, что в общем и целом - задача плевая.
21 ноя 18, 15:57    [21740279]     Ответить | Цитировать Сообщить модератору
 Re: потоковое сканирование документов  [new]
Lunx
Member

Откуда:
Сообщений: 489
Да, любопытно как на этапе выбора решения отваливались разные поставщики.

HP - в принципе найти контакт для консультации по продукту невозможно, на сайте hp.ru телефонов нет вообще. Дилеры вообще не понимали что я их спрашиваю, только могут мямлить по тех.характеристикам с сайта.
Они могут делать сколь угодно классное оборудование (что вообще не так, принтеры HP ломучие и вообще дрянь), но если нельзя спросить про специализированное оборудование - как же его покупать.

Xerox - телефоны на сайте есть, но всегда заняты. Я делал три попытки им дозвониться, дальше просто жалко своего времени.

А вот ребята из Brother откровенно порадовали. Включились, стали разъяснять. Respect.
21 ноя 18, 16:01    [21740291]     Ответить | Цитировать Сообщить модератору
 Re: потоковое сканирование документов  [new]
вадя
Member

Откуда: Екатеринбург
Сообщений: 15278
Lunx
принтеры HP ломучие и вообще дрянь
в моей практике самые живучие.
зачем печатать ШК?
это чьи доки? ваши или поставщиков?
для оптимальности лучше использовать qr-код, если это ваши доки , и на каждой странице можно тогда ставить
и он может содержать и номер страницы
тогда софт сам всё раскидает...
21 ноя 18, 16:48    [21740339]     Ответить | Цитировать Сообщить модератору
 Re: потоковое сканирование документов  [new]
Lunx
Member

Откуда:
Сообщений: 489
Да, спасибо, думаем про QR.
Спасибо за мысль печатать QR на каждой странице в том числе с номером страницы.
21 ноя 18, 17:05    [21740356]     Ответить | Цитировать Сообщить модератору
 Re: потоковое сканирование документов  [new]
Lunx
Member

Откуда:
Сообщений: 489
А по поводу принтеров.
Принтеры HP хороши тем что картриджи позволяют заправлять.
Моя практика - самые удобные и живучие это LEXMARK. 5 лет на пробегах по 300.000 можно к ним вообще не подходить.
Раз в год ролики поменять. А HP постоянно что-то жует, зависает, пишет ошибки, просит перезагрузить.
21 ноя 18, 17:07    [21740360]     Ответить | Цитировать Сообщить модератору
 Re: потоковое сканирование документов  [new]
вадя
Member

Откуда: Екатеринбург
Сообщений: 15278
Lunx
Да, спасибо, думаем про QR.
Спасибо за мысль печатать QR на каждой странице в том числе с номером страницы.
это ваши доки?
а зачем свои документы сканировать?
21 ноя 18, 19:50    [21740550]     Ответить | Цитировать Сообщить модератору
 Re: потоковое сканирование документов  [new]
Lunx
Member

Откуда:
Сообщений: 489
Если документов очень много + надо удостовериться, что документы в том числе возвращены + стоит задача быстро найти посмотреть документы за прошлый период - для этого и разрабатывается такое решение.
22 ноя 18, 15:15    [21741470]     Ответить | Цитировать Сообщить модератору
 Re: потоковое сканирование документов  [new]
Bsplesk
Member

Откуда:
Сообщений: 106
Для этого вам не нужно ничего сканировать потоковым сканером и сканер вам нужен другой раз есть возможность печати QR-кодов.
Вам вообще достаточно смартфона, сканируете им QR-код, по данным из него моментально получаете данные из базы.

Всё.
22 ноя 18, 23:41    [21742206]     Ответить | Цитировать Сообщить модератору
 Re: потоковое сканирование документов  [new]
Bsplesk
Member

Откуда:
Сообщений: 106
Если нужны подписи, то кладете в обычный сканер лист A4 с "вырезом" под подпись, сканируете и отправляете на хранение в бд, обычно не более 10-25kb занимает.
22 ноя 18, 23:46    [21742207]     Ответить | Цитировать Сообщить модератору
 Re: потоковое сканирование документов  [new]
Bsplesk
Member

Откуда:
Сообщений: 106
Хорошие потоковые сканеры с которыми приходилось работать Fujitsu серии fi.

p.s. Epson говно, мрут быстро.
22 ноя 18, 23:59    [21742216]     Ответить | Цитировать Сообщить модератору
Топик располагается на нескольких страницах: Ctrl  назад   1 [2] 3   вперед  Ctrl      все
Все форумы / Разработка информационных систем Ответить