Добро пожаловать в форум, Guest  >>   Войти | Регистрация | Поиск | Правила | В избранное | Подписаться
Все форумы / Сравнение СУБД Новый топик    Ответить
Топик располагается на нескольких страницах: [1] 2 3 4 5 6   вперед  Ctrl      все
 Выбор СУБД с полнотекстовым поиском  [new]
21_01
Guest
Здравствуйте.

Помогите выбрать СУБД для программы, реализующей:
1) хранение большого количества документов (файлы Word, Excel, веб-страницы, rtf) в БД;
2) генерирование краткой аннотации к документам в автоматизированном режиме;
3) поиск хранимых документов с учетом близости слов-синонимов;
4) каталогизацию документов со схожей тематикой.

Где будет храниться документ – в базе или в файловой системе – не важно, но нужно обеспечить ссылочную целостность связанных с документом данных, которые будут храниться в БД.

Масштабы пока не известны, но скорее всего это будет 2 рабочих места: одно для автоматизированного занесения данных и одно для обработки. Ничего сложного, нужно только, чтобы были возможности развитого поиска текста.

Соответственно возник вопрос: какую СУБД выбрать для реализации этих возможностей? Пока остановился на SQL Server. Но, возможно, есть ещё варианты? Есть ли разница между SQL Server 2008 и SQL Server 2005 в этом плане? И важны лицензии – сейчас ведь 2005-ю версию уже не приобрести?
19 июл 09, 11:42    [7432966]     Ответить | Цитировать Сообщить модератору
 Re: Выбор СУБД с полнотекстовым поиском  [new]
Реалист
Member

Откуда:
Сообщений: 2540
Блог
21_01,

SQL сервер какой? SQLite или PostgreSQL или Microsoft? У Оракла тоже какой то SQL сервер есть ;-)
19 июл 09, 11:58    [7432979]     Ответить | Цитировать Сообщить модератору
 Re: Выбор СУБД с полнотекстовым поиском  [new]
21_01
Guest
Под SQL Server 2005/2008 подразумевал Microsoft SQL Server 2005/2008.
19 июл 09, 12:03    [7432986]     Ответить | Цитировать Сообщить модератору
 Re: Выбор СУБД с полнотекстовым поиском  [new]
Ggg_old
Member

Откуда: Одесса
Сообщений: 1342
Исходя из условий задачи вам не подойдет НИ ОДНА из сущесвующих СУБД.
Был недавно топик, который затрагивал эту тему. Полнотекстовый поиск в субд не учитывает близости синонимов, морфологию слов и другие озвученные фишки. Это именно полнотекстовая индексация.
Так что написать экспертную систему не вложив ни капли труда у вас не получится.
А сам full text search еть еще в Sybase SA11.
19 июл 09, 12:05    [7432989]     Ответить | Цитировать Сообщить модератору
 Re: Выбор СУБД с полнотекстовым поиском  [new]
Реалист
Member

Откуда:
Сообщений: 2540
Блог
Ggg_old,

Одну такую БД я знаю, но только она не SQL :-)
Lotus Notes Domino. Из всех мне известных систем, только в ней реализованы хотелки, озвученные в начале темы. Могу рекомендовать обратиться к LotusNotesDomino который вот тут как раз ищет возможность подработки.
Я думаю, он не откажется Вас проконсультировать, с расчетом на дальнейшее сотрудничество ;-)
19 июл 09, 12:11    [7432998]     Ответить | Цитировать Сообщить модератору
 Re: Выбор СУБД с полнотекстовым поиском  [new]
21_01
Guest
Ggg_old
Полнотекстовый поиск в субд не учитывает близости синонимов, морфологию слов и другие озвученные фишки. Это именно полнотекстовая индексация.

То есть, что MS SQL 2005, что MS SQL 2008, что Sybase SA11 примерно равны в этом плане?

Реалист, спасибо, но это только впереди, сейчас мне пока нужно лишь выбрать СУБД.
19 июл 09, 12:58    [7433052]     Ответить | Цитировать Сообщить модератору
 Re: Выбор СУБД с полнотекстовым поиском  [new]
Реалист
Member

Откуда:
Сообщений: 2540
Блог
21_01
То есть, что MS SQL 2005, что MS SQL 2008, что Sybase SA11 примерно равны в этом плане?

Реалист, спасибо, но это только впереди, сейчас мне пока нужно лишь выбрать СУБД.

И в PostgeSQL и MySQL есть полнотекстовый поиск. Странно, а мне показалось, что Вам нужно:
"1) хранения большого количества документов (файлы Word, Excel, веб-страницы, rtf) в БД;
2) генерирования краткой аннотации к документам в автоматизированном режиме;
3) поиск хранимых документов с учетом близости слов-синонимов;
4) каталогизацию документов со схожей тематикой."

СУБД это только часть решения. Выбор СУБД и Решение поставленной задачи - это разные вещи, не находите?
19 июл 09, 13:09    [7433062]     Ответить | Цитировать Сообщить модератору
 Re: Выбор СУБД с полнотекстовым поиском  [new]
Dimitry Sibiryakov
Member

Откуда:
Сообщений: 54759

21_01

Реалист, спасибо, но это только впереди, сейчас мне пока нужно лишь
выбрать СУБД.

Выбирайте Яндекс или Гугль и будет Вам счастье.

Posted via ActualForum NNTP Server 1.4

19 июл 09, 13:24    [7433074]     Ответить | Цитировать Сообщить модератору
 Re: Выбор СУБД с полнотекстовым поиском  [new]
Реалист
Member

Откуда:
Сообщений: 2540
Блог
Dimitry Sibiryakov,

ДА, действительно! Я про Яндекс совсем забыл ;-(
19 июл 09, 13:31    [7433084]     Ответить | Цитировать Сообщить модератору
 Re: Выбор СУБД с полнотекстовым поиском  [new]
21_01
Guest
Реалист
[quot 21_01]
СУБД это только часть решения. Выбор СУБД и Решение поставленной задачи - это разные вещи, не находите?

Конечно, и я рассматриваю различные СУБД, чтобы представлять возможные пути решения.
В последнем сообщении я спросил: отличаются ли возможности перечисленных СУБД в плане полнотекстового поиска. Возможно есть реализации, в которых присутствует часть требуемого функционала. Это будет плюсом - если в основе будет реляционная СУБД, то проще будет выбрать разработчика. Однако я не отметаю сразу вариант с чем-то другим, но мне нужно время на то, чтобы хотя бы в общих чертах составить представление о новой для меня системе.
19 июл 09, 13:32    [7433085]     Ответить | Цитировать Сообщить модератору
 Re: Выбор СУБД с полнотекстовым поиском  [new]
21_01
Guest
Спасибо за ссылку.
19 июл 09, 13:46    [7433098]     Ответить | Цитировать Сообщить модератору
 Re: Выбор СУБД с полнотекстовым поиском  [new]
HSergey
Member

Откуда:
Сообщений: 28
Попробуйте поисковую панель google. На локальном диске найдёт любые файлы по полнотекстовому поиску. Всякой ерунды мого, очень помогает.
20 июл 09, 13:30    [7435565]     Ответить | Цитировать Сообщить модератору
 Re: Выбор СУБД с полнотекстовым поиском  [new]
Di_LIne
Member

Откуда: Тропик Скорпиона
Сообщений: 32554
Реалист

И в PostgeSQL и MySQL есть полнотекстовый поиск.

Нету там ни какого "полнотекстового поиска" для русского языка. Не-ту!
Бо не справляются с морфологией и сообразованием.
Я тут наднясь слово сгенерил "Компраминет"
Вот Яндекс, в вот
Гугля

А у кого, из человеков не хватит ума сие слово просклонять и проспрегать?
А енти "тьху-серчь" системы с ним справятся?
- Одназначный обломись.
20 июл 09, 21:53    [7437684]     Ответить | Цитировать Сообщить модератору
 Re: Выбор СУБД с полнотекстовым поиском  [new]
Реалист
Member

Откуда:
Сообщений: 2540
Блог
Di_LIne
Реалист

И в PostgeSQL и MySQL есть полнотекстовый поиск.

Нету там ни какого "полнотекстового поиска" для русского языка. Не-ту!
Бо не справляются с морфологией и сообразованием.
Я тут наднясь слово сгенерил "Компраминет"
Вот Яндекс, в вот
Гугля

А у кого, из человеков не хватит ума сие слово просклонять и проспрегать?
А енти "тьху-серчь" системы с ним справятся?
- Одназначный обломись.
Ну нет там таких слов. А сказать то, что хотел?
20 июл 09, 22:17    [7437733]     Ответить | Цитировать Сообщить модератору
 Re: Выбор СУБД с полнотекстовым поиском  [new]
Di_LIne
Member

Откуда: Тропик Скорпиона
Сообщений: 32554
Реалист
А сказать то, что хотел?

А что, первое предложение - нихт ферштейн?...
20 июл 09, 22:25    [7437752]     Ответить | Цитировать Сообщить модератору
 Re: Выбор СУБД с полнотекстовым поиском  [new]
Реалист
Member

Откуда:
Сообщений: 2540
Блог
Di_LIne
Реалист
А сказать то, что хотел?

А что, первое предложение - нихт ферштейн?...

Там есть полнотекстовый индекс. С ним можно делать что угодно. При желание даже твое слово найти ;-)
20 июл 09, 23:38    [7437868]     Ответить | Цитировать Сообщить модератору
 Re: Выбор СУБД с полнотекстовым поиском  [new]
Di_LIne
Member

Откуда: Тропик Скорпиона
Сообщений: 32554
Реалист
Di_LIne
Реалист
А сказать то, что хотел?

А что, первое предложение - нихт ферштейн?...

Там есть полнотекстовый индекс. С ним можно делать что угодно. При желание даже твое слово найти ;-)

Ну я и говорю: - Тот же лайке, но по слову целиком.
А если слова (набора букв) такого нету, то поиск по другим морфологическим формам этого слова делает?
Какие критерии ранжирования в этом случае?
Учитывается ли Ед и Мн число исходной морфемы?
- Ась?
21 июл 09, 00:01    [7437900]     Ответить | Цитировать Сообщить модератору
 Re: Выбор СУБД с полнотекстовым поиском  [new]
Реалист
Member

Откуда:
Сообщений: 2540
Блог
Di_LIne,

Ваша подколка мне понравилась. Естественно, ни кому в голову не может придти, искать в англоязычном продукте русскоязычную морфологию. Или Вы это серьезно спрашивали? ;-))))
21 июл 09, 00:23    [7437926]     Ответить | Цитировать Сообщить модератору
 Re: Выбор СУБД с полнотекстовым поиском  [new]
Di_LIne
Member

Откуда: Тропик Скорпиона
Сообщений: 32554
Реалист
И в PostgeSQL и MySQL есть полнотекстовый поиск.

А это, типо, Вася Пупкин написал, да?
Тогда так и пишите:
- ФхулСерчь но потарабарски.
- Рашен нот применяшен!
21 июл 09, 03:33    [7438061]     Ответить | Цитировать Сообщить модератору
 Re: Выбор СУБД с полнотекстовым поиском  [new]
Ёш
Member

Откуда:
Сообщений: 2892
Di_LIne,

select to_tsvector('Компраминет') @@ plainto_tsquery('Компраминета') as match;
 match
-------
 t
select to_tsvector('Компраминет') @@ plainto_tsquery('Компраминету') as match;
 match
-------
 t
select to_tsvector('Компраминет') @@ plainto_tsquery('Компраминетов') as match;
 match
-------
 t
что не так ? :)
21 июл 09, 07:00    [7438097]     Ответить | Цитировать Сообщить модератору
 Re: Выбор СУБД с полнотекстовым поиском  [new]
Реалист
Member

Откуда:
Сообщений: 2540
Блог
Di_LIne
Реалист
И в PostgeSQL и MySQL есть полнотекстовый поиск.

А это, типо, Вася Пупкин написал, да?
Тогда так и пишите:
- ФхулСерчь но потарабарски.
- Рашен нот применяшен!

А где написано про морфологию русского языка?
21 июл 09, 07:35    [7438128]     Ответить | Цитировать Сообщить модератору
 Re: Выбор СУБД с полнотекстовым поиском  [new]
Di_LIne
Member

Откуда: Тропик Скорпиона
Сообщений: 32554
Реалист
А где написано про морфологию русского языка?

Ышо раз для бронетакистов:
Реалист
И в PostgeSQL и MySQL есть полнотекстовый поиск.

- Или он, поиск, Полный Текстовый,
- Или тот же Лайке по индексному полю.
- Ы?
21 июл 09, 09:25    [7438348]     Ответить | Цитировать Сообщить модератору
 Re: Выбор СУБД с полнотекстовым поиском  [new]
Di_LIne
Member

Откуда: Тропик Скорпиона
Сообщений: 32554
Ёш
Di_LIne, что не так ? :)

- Балбес ты, Шарик! (М)ультик
select ID,WORDS from FullSearchText('Компраминетами')
"20679999","компраминетами"
"1001"; "компраминетов"
"53","Компраминетами"
"20045", "Компраминетам"
"4000016","о компраминетах"
"32768","компраминетам"
"20679999","компраминеты"
"99999999","компраминет"
.....
и тд и тп.

-Ы?
21 июл 09, 09:33    [7438382]     Ответить | Цитировать Сообщить модератору
 Re: Выбор СУБД с полнотекстовым поиском  [new]
Di_LIne
Member

Откуда: Тропик Скорпиона
Сообщений: 32554
Ёш
Di_LIne,

select to_tsvector('Компраминет') @@ plainto_tsquery('Компраминета') as match;
 match
что не так ? :)

А если твоей ентот мутч дуже кротой и пиписко в растопырку, то пусть мне разлечит, при построении результата поиска по слову "день".
Когда оно, слово, Существительное, а когда оно же есть Глагол.
Для бабесов поясняю на прЫ мере:
1. День. При поиске учесть только морфемы: дни - дней - днями и тд и тп
2. День. При поиске учесть только морфемы: денешь - девать - девают и тд и тп
21 июл 09, 09:41    [7438420]     Ответить | Цитировать Сообщить модератору
 Re: Выбор СУБД с полнотекстовым поиском  [new]
Реалист
Member

Откуда:
Сообщений: 2540
Блог
Di_LIne,

Знаешь, мне твои посты читать противно, не зависимо от того, что ты туда написал.
Можешь сам с собой разговаривать, пока с другими людьми общаться не научишься.
"пиписко в растопырку, мля" ;-)
21 июл 09, 09:56    [7438498]     Ответить | Цитировать Сообщить модератору
Топик располагается на нескольких страницах: [1] 2 3 4 5 6   вперед  Ctrl      все
Все форумы / Сравнение СУБД Ответить