Добро пожаловать в форум, Guest  >>   Войти | Регистрация | Поиск | Правила | В избранное | Подписаться
Все форумы / Разработка информационных систем Новый топик    Ответить
Топик располагается на нескольких страницах: Ctrl  назад   1 2 3 4 5 [6] 7 8   вперед  Ctrl      все
 Re: Будущее компьютерной лингвистики  [new]
474
Member

Откуда:
Сообщений: 329
Martin114,

Проблема с Compreno в том, что работающего переводчика нет. Можно сколько угодно выкладывать "примеры" переводов, выполненных Compreno, но где доказательства, что это перевод программы, а не обманывание публики?
Есть ли ПО, которое доступно широким массам и которое можно протестировать, что-то типа Google translate или Яндекс переводчика?
Надеюсь у вас нет сомнений в том, что если бы Compreno действительно существовал и работал(!), то уже ABBYY не упустили бы шанса всем его продемонстрировать через веб-морду и пожинать заслуженные лавры?
19 дек 14, 11:38    [17021784]     Ответить | Цитировать Сообщить модератору
 Re: Будущее компьютерной лингвистики  [new]
Martin114
Member

Откуда:
Сообщений: 100
474
Martin114,

Проблема с Compreno в том, что работающего переводчика нет. Можно сколько угодно выкладывать "примеры" переводов, выполненных Compreno, но где доказательства, что это перевод программы, а не обманывание публики?
Есть ли ПО, которое доступно широким массам и которое можно протестировать, что-то типа Google translate или Яндекс переводчика?
Надеюсь у вас нет сомнений в том, что если бы Compreno действительно существовал и работал(!), то уже ABBYY не упустили бы шанса всем его продемонстрировать через веб-морду и пожинать заслуженные лавры?

Согласен, что Compreno - это еще сырая разработка, поэтому демонстрировать нечего. А если и был бы, потребовал бы таких ресурсов, что в вебе его вряд ли можно было бы продемонстрировать (хотя вообще можно было бы предусмотреть регистрацию желающих и назначение каждому места в очереди и промежутка времени для перевода, скажем, абзаца).
19 дек 14, 14:42    [17023383]     Ответить | Цитировать Сообщить модератору
 Re: Будущее компьютерной лингвистики  [new]
Martin114
Member

Откуда:
Сообщений: 100
В Википедии есть статья Теория "Смысл-Текст" про историю работ по машинному переводу в СССР (под руководством Мельчука).
Так что компьютерная лингвистика может оказаться рискованной областью, в ней и признанные корифеи терпели неудачу.
Поэтому скепсис присутствующих вполне понятен.
19 дек 14, 17:09    [17024737]     Ответить | Цитировать Сообщить модератору
 Re: Будущее компьютерной лингвистики  [new]
Martin114
Member

Откуда:
Сообщений: 100
474
Martin114,
Надеюсь у вас нет сомнений в том, что если бы Compreno действительно существовал и работал(!), то уже ABBYY не упустили бы шанса всем его продемонстрировать через веб-морду и пожинать заслуженные лавры?

Насчет веб-морды. Есть презентация Извлечение справочных данных из технических текстов на естественных языках.
19 дек 14, 22:36    [17026131]     Ответить | Цитировать Сообщить модератору
 Re: Будущее компьютерной лингвистики  [new]
Martin114
Member

Откуда:
Сообщений: 100
474
Martin114,
Проблема с Compreno в том, что работающего переводчика нет. Можно сколько угодно выкладывать "примеры" переводов, выполненных Compreno, но где доказательства, что это перевод программы, а не обманывание публики?
Есть ли ПО, которое доступно широким массам и которое можно протестировать, что-то типа Google translate или Яндекс переводчика?
Надеюсь у вас нет сомнений в том, что если бы Compreno действительно существовал и работал(!), то уже ABBYY не упустили бы шанса всем его продемонстрировать через веб-морду и пожинать заслуженные лавры?

Цитата отсюда:
автор
Нам посчастливилось поработать как онтоинженерам с Compreno, и поучить его разбирать инженерные тексты (тексты железной инженерии). До «успешного внедрения» нам ещё далеко, но зато и причин скрывать наши результаты за NDA у нас тоже нет.
19 дек 14, 23:25    [17026288]     Ответить | Цитировать Сообщить модератору
 Re: Будущее компьютерной лингвистики  [new]
AlexProOra
Member

Откуда:
Сообщений: 454
Че Вы на ABBYY то зациклились?
Сравнивали Abbyy и RCO, результат - в следующем году закупаем RCO FactExtractor.
Почему:
1. цена
2. у Abbyy API к IIS привязано, а оно нам нафиг не нужно, так как сервер приложений свой.
20 дек 14, 08:35    [17027208]     Ответить | Цитировать Сообщить модератору
 Re: Будущее компьютерной лингвистики  [new]
Martin114
Member

Откуда:
Сообщений: 100
AlexProOra
Че Вы на ABBYY то зациклились?
Сравнивали Abbyy и RCO, результат - в следующем году закупаем RCO FactExtractor.
Почему:
1. цена
2. у Abbyy API к IIS привязано, а оно нам нафиг не нужно, так как сервер приложений свой.

О, спасибо за наводку.
20 дек 14, 19:03    [17028169]     Ответить | Цитировать Сообщить модератору
 Re: Будущее компьютерной лингвистики  [new]
Martin114
Member

Откуда:
Сообщений: 100
AlexProOra
Че Вы на ABBYY то зациклились?
Сравнивали Abbyy и RCO, результат - в следующем году закупаем RCO FactExtractor.
Почему:
1. цена
2. у Abbyy API к IIS привязано, а оно нам нафиг не нужно, так как сервер приложений свой.

Вы случайно не знаете, RCO на каком ЯП работают? (В ABBYY, как известно - на C#.)
20 дек 14, 23:06    [17028837]     Ответить | Цитировать Сообщить модератору
 Re: Будущее компьютерной лингвистики  [new]
AlexProOra
Member

Откуда:
Сообщений: 454
Martin114
Вы случайно не знаете, RCO на каком ЯП работают? (В ABBYY, как известно - на C#.)

На каком написано? не знаю...
Там dll-ка, примеры идут на С или С++ (не помню точно), мы будем использовать в связке с Delphi7.
21 дек 14, 11:24    [17029752]     Ответить | Цитировать Сообщить модератору
 Re: Будущее компьютерной лингвистики  [new]
Martin114
Member

Откуда:
Сообщений: 100
474
Martin114,

Проблема с Compreno в том, что работающего переводчика нет. Можно сколько угодно выкладывать "примеры" переводов, выполненных Compreno, но где доказательства, что это перевод программы, а не обманывание публики?
Есть ли ПО, которое доступно широким массам и которое можно протестировать, что-то типа Google translate или Яндекс переводчика?
Надеюсь у вас нет сомнений в том, что если бы Compreno действительно существовал и работал(!), то уже ABBYY не упустили бы шанса всем его продемонстрировать через веб-морду и пожинать заслуженные лавры?

Видимо, Compreno слишком громоздок, чтобы его можно было его просто так подключить в виде веб-морды. Кроме того, в него уже вложено 400 млн., так что бесплатным он быть не может.
Хотя его можно использовать по схеме, по которой используется IBM Watson - в виде облака.
16 янв 15, 00:13    [17125004]     Ответить | Цитировать Сообщить модератору
 Re: Будущее компьютерной лингвистики  [new]
Martin114
Member

Откуда:
Сообщений: 100
В ноябре 2013-го на Хабре опубликовали статью Анатолия Старостина, руководителя группы семантического анализа и преподавателем кафедры «Компьютерная лингвистика» в МФТИ. Он рассказал о работе своей группы, направлениях компьютерной лингвистики в ABBYY и кто такие онтоинженеры: ScienceHub #06: Компьютерная лингвистика.
24 янв 15, 21:13    [17164749]     Ответить | Цитировать Сообщить модератору
 Re: Будущее компьютерной лингвистики  [new]
k.smith
Member

Откуда:
Сообщений: 7
Странно, что Вы так "прицепились" к Abbyy. В России есть множество других компаний, разрабатывающих подобные продукты (Yandex, AviComp, RCO, АйТеко, SyTech и др.), список см. Список программ, Список продуктов.

Насчёт компьютерной лингвистики (КЛ), то мне видится, что на сегодняшний день тот очень ограниченный список реально востребованных задач КЛ "поделен" между крупными игроками. Несмотря на заклинания о востребованности и перспективности, крайне трудно найти коммерчески привлекательную задачу КЛ, поскольку 99% информационных потребностей подавляющего большинства пользователей (кстати, и мои в том числе) покрывает полнотекстовый поиск. Скажем, надежды на универсальный семантический поиск, увы, не оправдались.
Можно реализовать неплохой семантический анализ, уметь прекрасно выделять именованные сущности, но зачем? И кому это надо?
Видимо, в Abbyy только сейчас озаботились этими вопросами, когда практические задачи уже расхватали другие компании, возможно, с менее качественными движками. То есть Abbyy долго делали мотор, пока остальные делали автомобили.
Вот как то так...
4 фев 15, 19:28    [17219192]     Ответить | Цитировать Сообщить модератору
 Re: Будущее компьютерной лингвистики  [new]
Martin114
Member

Откуда:
Сообщений: 100
k.smith, большое спасибо за информацию.
5 фев 15, 11:21    [17221090]     Ответить | Цитировать Сообщить модератору
 Re: Будущее компьютерной лингвистики  [new]
Martin114
Member

Откуда:
Сообщений: 100
k.smith
Странно, что Вы так "прицепились" к Abbyy. В России есть множество других компаний, разрабатывающих подобные продукты (Yandex, AviComp, RCO, АйТеко, SyTech и др.), список см. Список программ, Список продуктов.

Насчёт компьютерной лингвистики (КЛ), то мне видится, что на сегодняшний день тот очень ограниченный список реально востребованных задач КЛ "поделен" между крупными игроками. Несмотря на заклинания о востребованности и перспективности, крайне трудно найти коммерчески привлекательную задачу КЛ, поскольку 99% информационных потребностей подавляющего большинства пользователей (кстати, и мои в том числе) покрывает полнотекстовый поиск. Скажем, надежды на универсальный семантический поиск, увы, не оправдались.
Можно реализовать неплохой семантический анализ, уметь прекрасно выделять именованные сущности, но зачем? И кому это надо?

А если сделать еще один шаг вперед: пользуясь синтактико-семантическими парсерами, автоматически из текста создавать базы знаний (например, в виде онтологий)? И потом работать со знаниями: классифицировать документы, извлекать данные, даже помогать в принятии решений по документам (привет искусственному интеллекту).
6 фев 15, 13:26    [17228059]     Ответить | Цитировать Сообщить модератору
 Re: Будущее компьютерной лингвистики  [new]
guest_20040621
Guest
> крайне трудно найти коммерчески привлекательную задачу КЛ

Элементарно. В т. ч. и для модного нынче анализа социальных сетей.

> покрывает полнотекстовый поиск

Вы ошибаетесь, если думаете, что где-то реализован публичный полнотекстовый поиск.
6 фев 15, 16:14    [17229407]     Ответить | Цитировать Сообщить модератору
 Re: Будущее компьютерной лингвистики  [new]
k.smith
Member

Откуда:
Сообщений: 7
guest_20040621,
>> крайне трудно найти коммерчески привлекательную задачу КЛ
>Элементарно. В т. ч. и для модного нынче анализа социальных сетей.

Этим много кто занимается. Вопрос только в заказчике с практической задачей, которому интересен анализ сетей или что бы то ни было ещё (перевод, сентиментный анализ, структурирование данных и пр.) и который готов поручить её именно вам/нам, а не какому-нибудь АйТеко. Это - ключевой вопрос, поскольку системы развиваются только на реальных задачах. Всё остальное уже мелочи. Я занимаюсь задачами КЛ 4 года, и считаю вопрос заказчика главным.

>> покрывает полнотекстовый поиск
>Вы ошибаетесь, если думаете, что где-то реализован публичный полнотекстовый поиск.

Да ладно, та же открытая Lucene под разными платформами (Java, .Net), на этом конструкторе быстро реализуются полнотекстовые эффективные поисковики на миллионы документов (на миллиарды не проверял).
6 фев 15, 17:24    [17229875]     Ответить | Цитировать Сообщить модератору
 Re: Будущее компьютерной лингвистики  [new]
guest_20040621
Guest
> Этим много кто занимается.

Разумеется. И вы где-то правы, говоря о заказчике с практической задачей. Фишка в том, что часть таких задач - предмет текущих научных исследований, по которым нет готовых решений.

> Я занимаюсь задачами КЛ 4 года, и считаю вопрос заказчика главным.

Я так не думаю. Наиболее интересный вариант - новый рынок и массовый продукт. Это сложно, но реально.

> та же открытая Lucene

И что, есть публичный сервис с интересным для анализа хранилищем?
6 фев 15, 19:14    [17230307]     Ответить | Цитировать Сообщить модератору
 Re: Будущее компьютерной лингвистики  [new]
k.smith
Member

Откуда:
Сообщений: 7
guest_20040621,

>> Я занимаюсь задачами КЛ 4 года, и считаю вопрос заказчика главным.
>Я так не думаю. Наиболее интересный вариант - новый рынок и массовый продукт. Это сложно, но реально.

Особенность КЛ состоит в том, что массовый продукт на нём малореален в связи с тем, что массам это не надо. Возьмём самое востребованное направление - перевод. После того, как он встроен в Google и Yandex, про это направление можно забыть. Даже если сделать переводчик лучше (например, на базе Compreno, хотя тут большие сомнения), то его просто [почти] никто не купит - а зачем? Ну нет у массового пользователя потребностей, которые не решались бы полнотекстовым поиском и решались бы КЛ.

Если Вы знаете о потребности хотя бы 1% пользователей (это уже будет массовый продукт!) - свяжитесь со мной по скайпу konstantin.smith , пожалуйста. Если это стоящая идея, то найдём и ресурсы, и финансирование к взаимной выгоде.

>> та же открытая Lucene
>И что, есть публичный сервис с интересным для анализа хранилищем?

А всякие там файловые бесплатные хранилища, облака и пр.? И какой анализ? Массовому пользователю анализ не нужен. Корпоративные же системы, где возможен спеицифический анализ, не хранят свои данные в публичных хранилищах - кто ж согласится на это!
6 фев 15, 20:02    [17230546]     Ответить | Цитировать Сообщить модератору
 Re: Будущее компьютерной лингвистики  [new]
guest_20040621
Guest
> Особенность КЛ состоит в том, что массовый продукт на нём малореален

Вам так кажется, уверяю вас. Предположу, что в течение года - двух вы увидите и новый рынок, и новые продукты.

> Возьмём самое востребованное направление - перевод.

Вы, наверное, хотели сказать "самое очевидное"? Наиболее интересные задачи - в междисциплинарной области.

> хотя бы 1% пользователей

Я не говорил о потребительском рынке.

> свяжитесь со мной

Не интересно. Деньги - не проблема, просто не интересно. Вы пытаетесь заработать на технологии, тогда как на самом деле это инструмент для прикладных задач. А сформулировать эти задачи вы не можете: вы никогда не выходили за рамки конкретного заказчика. В России "платёжеспособный заказчик" очень часто синоним "тупой заказчик", есть такая особенность деловой практики.

> А всякие там

Всякие там хранилища - это хранилища, которые организовать и поддерживать стоит денег. Для удовлетворения праздного любопытства никто этим заниматься не будет.
7 фев 15, 00:43    [17231668]     Ответить | Цитировать Сообщить модератору
 Re: Будущее компьютерной лингвистики  [new]
k.smith
Member

Откуда:
Сообщений: 7
>Вам так кажется, уверяю вас. Предположу, что в течение года - двух вы увидите и новый рынок, и новые продукты.
Буду с нетерпением ждать!

>Не интересно. Деньги - не проблема, просто не интересно.
Ну если деньги - не проблема, тогда я Вас поздравляю! У меня где-то получается половина бесплатных проектов по КЛ, но без другой коммерческой половины не могу обойтись, так как живу на это. Хорошо, что хоть почти все проекты мне интересны. А мегаинтерес - когда за задачу КЛ платит заказчик, заинтересованный в результате.
7 фев 15, 15:30    [17232816]     Ответить | Цитировать Сообщить модератору
 Re: Будущее компьютерной лингвистики  [new]
sqluserX
Member [скрыт] [заблокирован]

Откуда:
Сообщений: 1
Хорошая тема
18 фев 15, 16:46    [17282910]     Ответить | Цитировать Сообщить модератору
 Re: Будущее компьютерной лингвистики  [new]
Martin114
Member

Откуда:
Сообщений: 100
k.smith
Насчёт компьютерной лингвистики (КЛ), то мне видится, что на сегодняшний день тот очень ограниченный список реально востребованных задач КЛ "поделен" между крупными игроками. Несмотря на заклинания о востребованности и перспективности, крайне трудно найти коммерчески привлекательную задачу КЛ, поскольку 99% информационных потребностей подавляющего большинства пользователей (кстати, и мои в том числе) покрывает полнотекстовый поиск. Скажем, надежды на универсальный семантический поиск, увы, не оправдались.
Можно реализовать неплохой семантический анализ, уметь прекрасно выделять именованные сущности, но зачем? И кому это надо?
Видимо, в Abbyy только сейчас озаботились этими вопросами, когда практические задачи уже расхватали другие компании, возможно, с менее качественными движками. То есть Abbyy долго делали мотор, пока остальные делали автомобили.
Вот как то так...

А как насчет задач классификации и извлечения сущностей в системах электронного документооборота, например, в системах сбора маркетинговой информации?
4 мар 15, 21:39    [17344228]     Ответить | Цитировать Сообщить модератору
 Re: Будущее компьютерной лингвистики  [new]
k.smith
Member

Откуда:
Сообщений: 7
Martin114, >А как насчет задач классификации и извлечения сущностей в системах электронного документооборота, например, в системах сбора маркетинговой информации?

Хорошие задачи, но только для конкретной системы. Увы, не получается сделать что-то универсальное, но для конкретной системы ЭД при наличии некоторой потребности (например, по тексту документа предложить типовой маршрут согласования на основе информации о прохождении подобных документов) вполне очень даже. Для этого нужно всего ничего:

1) Найти организацию, в которой есть некоторая информационная система;
2) Найти некоторую информационную потребность, на которую сейчас уходит много времени сотрудников (а, следовательно, денег);
3) Понять, насколько её можно автоматизировать и какой при этом получится выигрыш для организации;
4) Оценить стоимость работы, чтобы она была существенно меньше выигрыша;
5) Найти в организации заинтересованных лиц, готовых лоббировать решение;

Абстрактное решение этих задач, на мой взгляд, бесперспективно - слишком уж узкие потребности у конечных пользователей.
4 мар 15, 22:41    [17344346]     Ответить | Цитировать Сообщить модератору
 Re: Будущее компьютерной лингвистики  [new]
ViPRos
Member

Откуда:
Сообщений: 9629
k.smith,

эти 5 пунктов касается любой задачи
5 мар 15, 04:06    [17344784]     Ответить | Цитировать Сообщить модератору
 Re: Будущее компьютерной лингвистики  [new]
SashaMercury
Member

Откуда: Москва
Сообщений: 2653
Ни разу не встретил словосочетание "Тест Тьюринга". Разве не от него нужно скакать при обсуждении данного вопроса ?
5 мар 15, 07:23    [17344869]     Ответить | Цитировать Сообщить модератору
Топик располагается на нескольких страницах: Ctrl  назад   1 2 3 4 5 [6] 7 8   вперед  Ctrl      все
Все форумы / Разработка информационных систем Ответить