Добро пожаловать в форум, Guest  >>   Войти | Регистрация | Поиск | Правила | В избранное | Подписаться
Все форумы / Просто треп Новый топик    Ответить
 ФНС хочет читать почту?  [new]
Критик
Member

Откуда: Москва / Калуга
Сообщений: 30247
Блог
см требования выделения сущностей после троеточия,
где они могут быть? только в почте?

http://www.cnews.ru/news/top/2017-05-19_fns_otkazalas_ot_rossijskogo_po_dlya_bolshih

На создание программно-аппаратного комплекса (ПАК) аналитической подсистемы своей АИС для работы с большими данными Федеральная налоговая служба (ФНС) выделила p897,3 млн. Именно эта сумма заявлена стартовой ценой контракта ведомства в электронном аукционе на поставку оборудования, передачу прав на ПО и выполнение работ по созданию ПАКа.
...
Также указывается, что ПАКом должно обеспечиваться выделение не менее трех классов сущностей. Первый из них касается персон, организаций, географических объектов и пр., обозначаемых в тексте с использованием имен собственных. «Программа должна отождествить такие обозначения одной персоны как Владимир Петрович Штырь, Владимир, Штырь, он, отличив по контексту город Владимир от человека Владимира и человека с фамилией Штырь от цилиндрического стержня», — говорится в ТЗ.

Второй класс касается неименованных сущностей, обозначенных в тексте словами основных частей речи: нарицательными именами существительными, прилагательными, нестроевыми глаголами и пр. «Имена таких сущностей должны определяться на основании синтаксического анализа текста и правил русского языка. Так, от каждого упоминания имени существительного в тексте должны строиться нормальные формы всех именных групп, главным словом которых выступает данное существительное. Например, если в тексте упоминается китайские космические грузовик и лаборатория, то должно быть обеспечено получение имен всех неодушевленных предметов, о которых шла речь: китайские космические грузовик и лаборатория, китайский космический грузовик, китайская космическая лаборатория, космический грузовик, космическая лаборатория, китайский грузовик, китайская лаборатория, грузовик, лаборатория», — отмечается в документе.

Третий класс — специальные сущности, обозначаемые в тексте конструкциями особого вида, обычно смешанными из цифр и символов: даты и обстоятельства времени, денежные суммы, идентификационные данные персон и организаций и т. п. «Такие конструкции должны распознаваться посредством формальных правил. Должна быть обеспечена возможность добавления (исправления, удаления) для выявления новых типов специальных сущностей», — гласит ТЗ.

20 май 17, 02:06    [20497991]     Ответить | Цитировать Сообщить модератору
 Re: ФНС хочет читать почту?  [new]
Программизд 02
Member

Откуда: дедофорум
Сообщений: 229011
Критик,

и так патриотичненько:)

ФНС отказалась от российского ПО для больших данных. 900 млн будут потрачены на зарубежный софт

Почту читать им не дадут, я думаю прост освои данные анализировать будут. Типа если фирма отчиталась что перевела Васе Пупкину 100к а вася пупкин подал декларацию на 10к то его можно взять за иички.
20 май 17, 02:11    [20497992]     Ответить | Цитировать Сообщить модератору
 Re: ФНС хочет читать почту?  [new]
Мудроглюков
Member

Откуда:
Сообщений: 5034
млрд на создание и млрд на развитие
СРАЗУ на развитие, еще не успев создать??????
http://zakupki.gov.ru/epz/order/quicksearch/search_eis.html?searchString= ФНС АИС &morphology=on&pageNumber=1&sortDirection=false&recordsPerPage=_10&showLotsInfoHidden=false&fz44=on&fz223=on&af=on&ca=on&priceFrom=&priceTo=¤cyId=1&agencyTitle=&agencyCode=&agencyFz94id=&agencyFz223id=&agencyInn=®ions=&publishDateFrom=&publishDateTo=&sortBy=UPDATE_DATE&updateDateFrom=&updateDateTo=

А вообще пейсдец же = АНАЛИТИКА нужна

ИС ФНС есть и отчеты есть: ЕЁ ВСЮ ЗАМЕНИТЬ СОБРАЛИСЬ?
PS НА ТУ ЖЕ, поделив 2 млрд

Что анализировать-то с помощью искусственного интеллекта собрались? Задачи для
аналитической подсистемы как формулируют? ...

в аукционном ТЗ "прикольное" наукообразие?
семантические сети, фреймы, сущности, ... - что-то из древности, к чему отношение как
к "красивым словам"
вот не пощупать никак семантическую сеть, а вот искусственный интеллект возможно = вот в играх, например, искусственный интеллект
Средства выявления фактов должны позволять находить в тексте описания ситуаций в соответствии с заданными схемами, например, выборы или продажа облигаций, и извлечь требуемую информацию, связанную с ситуациями – имена задействованных участников-фигурантов. Поиск ситуаций должен производиться по семантической сети фрейма. Фрейм должен характеризоваться именем, которое идентифицирует класс описываемых им ситуаций, а также содержать слоты, которые имеют свои имена, идентифицирующие роли участников ситуации. Для конкретной ситуации, описанной в тексте, часть слотов должна быть заполнена именами ее конкретных участников, упомянутых в тексте (министр = Улюкаев, продавец=?, эмитент акций=Роснефть, количество акций=10%, сумма сделки=2 000 000, дата=2016). Модель фрейма должна задаваться множеством семантических шаблонов, каждый из которых должен описывать множество семантических сетей, соответствующих некоторому типовому способу описания ситуации в тексте.
Для выявления факта должен быть обеспечен поиск в семантической сети текста такой подсети, которая изоморфна одному из шаблонов. Если подсеть найдена, ситуация должна считается распознанной, после чего должно производится извлечение сущностей и их маркировка ролями, заданными в соответствующих узлах шаблона. Результат выявления факта должен содержать установленный класс ситуации и набор указателей на сущности семантической сети с указанием соответствующих им ролей из шаблона – фрейма известного класса с полностью или частично заполненными слотами.
Должна быть обеспечено фильтрация описания ситуаций, соответствующих реальным событиям или фактам: из числа найденных фреймов и сущностей в их слотах должны исключаться те фреймы, которые соответствуют нереальным ситуациям, и те сущности, которые реального участия в ситуации не принимали. Это должно производиться на основании лингвистического контекста описания ситуации – наличия показателей отрицания и нереальности.


_______________________
из запретов - туркам запрещено

ЗЫ вчера был в строительной турецкой фирме
работали и работают (только помидоры запретили что ли тогда и еще не разрешили?)
ИТ-отдел немаленький (вот нужно было спросить - а чо они там все делают = разрабатывают своё ПО что ли)
20 май 17, 09:34    [20498102]     Ответить | Цитировать Сообщить модератору
 Re: ФНС хочет читать почту?  [new]
Мудроглюков
Member

Откуда:
Сообщений: 5034
Критик
см требования выделения сущностей после троеточия,
где они могут быть? только в почте?



мелко мыслишь, ценных задач много
ЗЫ и наверно у тебя в памяти, широко освещенный с СМИ проект для ФСБ = где ВСЮ почту
хотели читать на предмет выявлений террористов,
НО потом одумались, трезво оценив "эффект"/"ресурсы"
а e-mail наверно смотрят как и раньше - выборочно
20 май 17, 09:49    [20498107]     Ответить | Цитировать Сообщить модератору
Все форумы / Просто треп Ответить