Добро пожаловать в форум, Guest  >>   Войти | Регистрация | Поиск | Правила | В избранное | Подписаться
Все форумы / Сравнение СУБД Новый топик    Ответить
Топик располагается на нескольких страницах: Ctrl  назад   1 [2] 3   вперед  Ctrl      все
 Re: Сравнение систем Full Text Search  [new]
MasterZiv
Member

Откуда: Питер
Сообщений: 34709
Я прошу господина Di_Line-a создать новый топег для апсуждения праблем сложнастей риализации
систем текставага поиска для рускава языка и там эта фсе апсуждать. Ежу ясно что без словоформ эти системы никому не нужны.
25 май 07, 11:10    [4184018]     Ответить | Цитировать Сообщить модератору
 Re: Сравнение систем Full Text Search  [new]
MasterZiv
Member

Откуда: Питер
Сообщений: 34709
Вот что нашел я
  • Про SQLOne
  • Про сфинкс
  • High-Performance-FullText-Search by Петр Зайцев сотоварищи
  • Эффективный полнотекстовый поиск по базам данных - Андрей Аксенов, Петр Зайцев
  • 25 май 07, 11:23    [4184127]     Ответить | Цитировать Сообщить модератору
     Re: Сравнение систем Full Text Search  [new]
    sergkarpenko
    Member

    Откуда: Kharkov
    Сообщений: 465
    Swish-e
    25 май 07, 13:32    [4185244]     Ответить | Цитировать Сообщить модератору
     Re: Сравнение систем Full Text Search  [new]
    Di_LIne
    Member

    Откуда: Тропик Скорпиона
    Сообщений: 32554
    MasterZiv
    Я прошу господина Di_Line-a создать новый топег для апсуждения праблем сложнастей риализации
    систем текставага поиска для рускава языка и там эта фсе апсуждать. Ежу ясно что без словоформ эти системы никому не нужны.

    Интересно, а FTS этот текст сможет разобрать?
    - Не лично, а так, тяпницей навеяно...
    25 май 07, 13:49    [4185365]     Ответить | Цитировать Сообщить модератору
     Re: Сравнение систем Full Text Search  [new]
    Di_LIne
    Member

    Откуда: Тропик Скорпиона
    Сообщений: 32554
    Особенно мне понравилось сравнение с МногоСерчем, заброшенным, имхо, в году эдак 2003-2004...
    25 май 07, 13:53    [4185393]     Ответить | Цитировать Сообщить модератору
     Re: Сравнение систем Full Text Search  [new]
    моррут
    Guest
    Di_LIne
    Особенно мне понравилось сравнение с МногоСерчем, заброшенным, имхо, в году эдак 2003-2004...


    а это что?
    8 May 2007: mnoGoSearch 3.3.3 is now available Take a look into ChangeLog
    25 май 07, 14:02    [4185460]     Ответить | Цитировать Сообщить модератору
     Re: Сравнение систем Full Text Search  [new]
    Di_LIne
    Member

    Откуда: Тропик Скорпиона
    Сообщений: 32554
    моррут
    а это что?
    8 May 2007: mnoGoSearch 3.3.3 is now available Take a look into ChangeLog

    - Ап_мишурился чуток... Лет, порядка, на пяток...
    25 май 07, 14:06    [4185490]     Ответить | Цитировать Сообщить модератору
     Re: Сравнение систем Full Text Search  [new]
    Di_LIne
    Member

    Откуда: Тропик Скорпиона
    Сообщений: 32554
    Покачивая ногой, задумчиво в потолок:
    - И какАго рожна Яндекс, Рамблер и ВебАльта выяживаются, изобретая что-то свое?...
    - Бери и юзай на полное щастьё!
    25 май 07, 14:14    [4185550]     Ответить | Цитировать Сообщить модератору
     Re: Сравнение систем Full Text Search  [new]
    DocAl
    Member

    Откуда: Оккупирую западный берег
    Сообщений: 10472
    Di_LIne
    Для уточнения.

    Рекомендую посмотреть склонения слов расейскаго языку:
    1. с беглой Ё и О - берёг>берегла; любовь>любви(д.п.); церковь>церквей(мн,р.п.) и тп.
    2 "она-нок" - ребенок>ребенка(р.п.)
    3. с беглой Е - камень>камня(р.п.); свинец>свинца(р.п.); горошек>горошка(р.п.) и тп.
    4. с беглой О - петушок>петушка(р.п.); коготь>когтя(р.п.); огонь>огня(р.п.) и тп.
    5. с беглой Ё и Й - паёк>пайку(д.п.); буёк>буйком(т.п.)
    6. существительные существующие только во мн.ч. - сласти>сластями(т.п.); бусы>бусам(д.п.)
    7. существительные м.р. на -ор с беглой о: только ед.ч. - багоР>багРа(р.п.)
    8. - земля>землЕю(т.п.); армия>армий(мн,р.п.); спальня>спален(мн,р.п.); беглец>беглецов(мн,в.п.)

    ... ну и хватит.

    Тогда вапрос: какой тарабарскмй "ХВУЛ СЁРЧЬ" с этим справиться???

    Полнотекстовый поиск используется для фильтрации результатов поиска, выдаваемых для анализа человеку. Никто по фуллтексту ракеты не наводит и ядерными реакторами не управляет, так что приемлемо частичное решение задачи, которое может вызывать как ложные срабатывания, так и пропускать часть нужных результатов. Конечно, чем лучше результаты -- тем лучше, но невозможность идеального решения не означает невостребованности частичных.
    Указанные проблемы с беглыми гласными решаются словарём, отсутствие же отдельных словоформ для полнотекстового поиска особой проблемой не является, если кроме "дощечки" будет искаться "придощечно" ничего страшного от того, что такого слова нет, не случится.
    25 май 07, 17:13    [4187098]     Ответить | Цитировать Сообщить модератору
     Re: Сравнение систем Full Text Search  [new]
    LeXa NalBat
    Member

    Откуда: Москва
    Сообщений: 2892
    DocAl
    если кроме "дощечки" будет искаться "придощечно" ничего страшного от того, что такого слова нет, не случится
    OFF: знаете, что такое "фотобарабать"? это первая форма от "фотобарабан" по используемой у нас морфологии. :-)
    25 май 07, 17:24    [4187182]     Ответить | Цитировать Сообщить модератору
     Re: Сравнение систем Full Text Search  [new]
    Di_LIne
    Member

    Откуда: Тропик Скорпиона
    Сообщений: 32554
    LeXa NalBat
    OFF: знаете, что такое "фотобарабать"? это первая форма от "фотобарабан" по используемой у нас морфологии. :-)

    - Ты, вашсродь, глаголами на выражайся и причастия нас не матери...
    25 май 07, 17:36    [4187263]     Ответить | Цитировать Сообщить модератору
     Re: Сравнение систем Full Text Search  [new]
    Di_LIne
    Member

    Откуда: Тропик Скорпиона
    Сообщений: 32554
    DocAl
    ... если кроме "дощечки" будет искаться "придощечно" ничего страшного...

    Дока_Олл, чёт (и нечет тож) у меня не палучлись про склонять и проспрягать это "придощечно"...
    - Агласте, пжаласта, весь спск....
    25 май 07, 17:38    [4187278]     Ответить | Цитировать Сообщить модератору
     Re: Сравнение систем Full Text Search  [new]
    DocAl
    Member

    Откуда: Оккупирую западный берег
    Сообщений: 10472
    Просклонять-проспрягать наречие?
    25 май 07, 20:13    [4187971]     Ответить | Цитировать Сообщить модератору
     Re: Сравнение систем Full Text Search  [new]
    Di_LIne
    Member

    Откуда: Тропик Скорпиона
    Сообщений: 32554
    DocAl
    Просклонять-проспрягать наречие?

    А-а-а... Хоть не причастие... Но на фамилий очень похоже...
    25 май 07, 20:15    [4187978]     Ответить | Цитировать Сообщить модератору
     Re: Сравнение систем Full Text Search  [new]
    iscrafm
    Member [заблокирован]

    Откуда:
    Сообщений: 35345
    MasterZiv
    Я прошу господина Di_Line-a создать новый топег для апсуждения праблем сложнастей риализации
    систем текставага поиска для рускава языка и там эта фсе апсуждать. Ежу ясно что без словоформ эти системы никому не нужны.

    а словоформы подобные кому нужны?
    27 май 07, 01:23    [4190054]     Ответить | Цитировать Сообщить модератору
     Re: Сравнение систем Full Text Search  [new]
    Cat2
    Member

    Откуда: Petroskoi, Karjala
    Сообщений: 145754
    Сравнивать-то особо нечего. Нетрудно выбрать слова, построить по им индекс в базе данных, организовать отношение многие ко многим слово - единица хранения текста.
    Сложно сделать морфолологический разбор для разных языков. Особо наблюдательные могли заметить, что на странице "Поиск" нашего любимого сайта есть чекбокс - "с учетом морфлогогии". Не помню, кто подарил Judge этот функционал. Ноблагдарен фирме, названия которой я не помню.

    Помню, что она продается за нехилые деньги, поскольку она была, а может и сейчас есть ЕДИНСТВЕННАЯ разработка для морфлогически ориентированного поиска по русскому тексту в MS SQL. С чем ее сравнивать? Есть конкурирующие продукты?
    1 июн 07, 20:34    [4221244]     Ответить | Цитировать Сообщить модератору
     Re: Сравнение систем Full Text Search  [new]
    DocAl
    Member

    Откуда: Оккупирую западный берег
    Сообщений: 10472
    Возможно, я по-разному воспринимаю англоязычный термин stemming и "морфологический разбор", но мне кажется, полноценный морфологический разбор -- штука слишком сложная и не столь необходимая для полнотекстового поиска, хотя и немного снижающая ложные срабатывания. Ну а стемминг в том же сфинксе есть, сравнивайте на здоровье.)
    1 июн 07, 21:38    [4221364]     Ответить | Цитировать Сообщить модератору
     Re: Сравнение систем Full Text Search  [new]
    Lepsik
    Member

    Откуда: glubinka
    Сообщений: 4257
    Cat2

    Помню, что она продается за нехилые деньги, поскольку она была, а может и сейчас есть


    Это 50 баксов - нехилые деньги ?

    Cat2

    ЕДИНСТВЕННАЯ разработка для морфлогически ориентированного поиска по русскому тексту в MS SQL. С чем ее сравнивать? Есть конкурирующие продукты?


    Пользуйтесь тогда MSSQL2005 - там это бесплатно. Или поиском по этому сайту - конкурирующих продуктов полно
    6 июн 07, 22:45    [4239718]     Ответить | Цитировать Сообщить модератору
     Re: Сравнение систем Full Text Search  [new]
    мимо
    Guest
    Oracle10g
    Oracle Text + RCO
    8 июн 07, 08:45    [4245719]     Ответить | Цитировать Сообщить модератору
     Re: Сравнение систем Full Text Search  [new]
    ЮВ
    Guest
    Di_LIne

    А что есть - полнотекстовый поиск? Смысла в этом словосочетании ни на грош...


    Описание полнотекстового поиска в СУБД ЛИНТЕР

    [url="FullSearch Linter"]http://www.linter.ru/lindoc/pdf_file/phrase.pdf[/url]
    8 июн 07, 19:30    [4249826]     Ответить | Цитировать Сообщить модератору
     Re: Сравнение систем Full Text Search  [new]
    Di_LIne
    Member

    Откуда: Тропик Скорпиона
    Сообщений: 32554
    ЮВ
    Di_LIne

    А что есть - полнотекстовый поиск? Смысла в этом словосочетании ни на грош...


    Описание полнотекстового поиска в СУБД ЛИНТЕР

    [url="FullSearch Linter"]http://www.linter.ru/lindoc/pdf_file/phrase.pdf[/url]

    Это то, как понимают и реализовали это предствление разработчики ЛИНТЕР...
    СУБД ЛИНТЕР со средствами фразового поиска рекомендуется использовать в проектах,
    где основными определяющими факторами являются скорость поиска и извлечения
    текста по фразе в больших хранилищах информации (например, интернет-сервер).
    Средства фразового поиска дают возможность упростить схему хранения данных в
    приложении и избежать создания некоторых дополнительных таблиц.
    Система фразового поиска обеспечивает:
    • варианты поиска слов: по началу, окончанию, части слова, целому слову, поиск с
    использованием символов шаблона;
    • поиск по словам, набранным с ошибками (нечеткий поиск). Поддерживаются три
    основных типа ошибок (пропуск, вставка, замена буквы);
    • поиск с учетом и без учета регистра букв;
    • поиск близкорасположенных слов и фраз с известным порядком слов;
    • поиск по названию и значению атрибута в файлах с гипертекстовой разметкой;
    • автоматическое определение кодировки русскоязычного текста.
    В СУБД ЛИНТЕР версии 6.0 и выше дополнительно обеспечивается:
    • поддержка многобайтных кодировок и иероглифических символов;
    • хранение информации в кодировке UNICODE.


    ... и ни слова о поиске по морфоформа того же слова.
    8 июн 07, 19:56    [4249886]     Ответить | Цитировать Сообщить модератору
     Re: Сравнение систем Full Text Search  [new]
    assa
    Member [заблокирован]

    Откуда: мы сами не местные
    Сообщений: 3444
    Di_LIne
    ... и ни слова о поиске по морфоформа того же слова.
    а чо только морфоформы?
    а синонимическим поиском и поиском "по смыслу" кто-нито занимается?
    А то сплошь и рядом нужен поиск доков, касающихся вполне определенного контекста, но какими словесами этот контекст будет оформлен - предположить бывает трудно. Да и если и есть предположения - количество иных контекстов, обвязанных теми же словесами - подчас пугающе велико.
    9 июн 07, 11:20    [4251426]     Ответить | Цитировать Сообщить модератору
     Re: Сравнение систем Full Text Search  [new]
    ЮВ
    Guest
    Di_LIne

    ... и ни слова о поиске по морфоформа того же слова.


    Если под термином "морфоформа" понимается вариант словоизменения, то там описаны следующие модификаторы шаблона поиска:

    SENSITIVE Задает чувствительный к регистру поиск
    PARTIALLY Задает поиск документов, в которых заданный шаблон поиска может встречаться в любом месте слова
    AT_BEGIN Задает поиск документов, в которых заданный шаблон поиска может встречаться только в начале слов
    AT_END Задает поиск документов, в которых заданный шаблон поиска может встречаться только в конце слов
    FUZZY Задает нечеткий поиск

    Т. е. конструкции типа "искать по всем морфоформам", например, слова "РЕЛЯЦИОННАЯ", нет.
    Если имеется ввиду что-то иное - уточните.
    9 июн 07, 13:41    [4252126]     Ответить | Цитировать Сообщить модератору
     Re: Сравнение систем Full Text Search  [new]
    Di_LIne
    Member

    Откуда: Тропик Скорпиона
    Сообщений: 32554
    ЮВ
    SENSITIVE Задает чувствительный к регистру поиск
    PARTIALLY Задает поиск документов, в которых заданный шаблон поиска может встречаться в любом месте слова
    AT_BEGIN Задает поиск документов, в которых заданный шаблон поиска может встречаться только в начале слов
    AT_END Задает поиск документов, в которых заданный шаблон поиска может встречаться только в конце слов

    Ну и что? Тот же ЛАЙКЕ с вариациями...
    И это называют ФулСерчем?....


    ЮВ

    Если имеется ввиду что-то иное - уточните.

    Развернытый пример я уже приводил тут...
    9 июн 07, 16:20    [4252941]     Ответить | Цитировать Сообщить модератору
     Re: Сравнение систем Full Text Search  [new]
    just me
    Guest
    Вообще-то делают так:

    The Verity thesaurus operator expands a search to include the specified word
    and its synonyms (for information on using the thesaurus operator, see
    “thesaurus” on page 57). You can create a custom thesaurus that contains
    application-specific synonyms to use in place of the default thesaurus.
    For example, the default English language thesaurus contains these words as
    synonyms for “money:” “cash,” “currency,” “lucre,” “wampum,” and
    “greenbacks.” You can create a custom thesaurus that contains a different set
    of synonyms for “money,” such as: ”bid,” “tokens,” “credit,” “asset,” and
    “verbal offer.”
    To create a custom thesaurus:
    ...
    9 июн 07, 16:26    [4252973]     Ответить | Цитировать Сообщить модератору
    Топик располагается на нескольких страницах: Ctrl  назад   1 [2] 3   вперед  Ctrl      все
    Все форумы / Сравнение СУБД Ответить