Добро пожаловать в форум, Guest  >>   Войти | Регистрация | Поиск | Правила | В избранное | Подписаться
Все форумы / Microsoft SQL Server Новый топик    Ответить
 фонетический поиск  [new]
Alexander Us
Member

Откуда:
Сообщений: 1107
Предположим, есть 2 таблицы с названиями улиц.
В названиях улиц могут быть сокращения, опечатки и т.д.

Необходимо найти совпадения.

Какие аглоритмы посоветуете?
Какие аглоритмы посоветуете для сравнения имён?

Примечания:
-тынцы приветсвуются.
-soundex и кёльнский способ уже просмотрел: простовато будет.
-желательна применимость к нем. языку.
22 июн 09, 15:25    [7328968]     Ответить | Цитировать Сообщить модератору
 Re: фонетический поиск  [new]
tpg
Member

Откуда: Novosibirsk
Сообщений: 23902
FTS...
23 июн 09, 06:12    [7331172]     Ответить | Цитировать Сообщить модератору
 Re: фонетический поиск  [new]
Alexander Us
Member

Откуда:
Сообщений: 1107
tpg
FTS...
К сожалению не знаю эту абривиатуру.
Не молги бы Вы привести полное название или тынц?
23 июн 09, 09:50    [7331469]     Ответить | Цитировать Сообщить модератору
 Re: фонетический поиск  [new]
iap
Member

Откуда: Москва
Сообщений: 46975
Alexander Us
tpg
FTS...
К сожалению не знаю эту абривиатуру.
Не молги бы Вы привести полное название или тынц?
Full Text Search, видимо...
23 июн 09, 09:53    [7331489]     Ответить | Цитировать Сообщить модератору
 Re: фонетический поиск  [new]
tpg
Member

Откуда: Novosibirsk
Сообщений: 23902
Alexander Us
tpg
FTS...
К сожалению не знаю эту абривиатуру.
Не молги бы Вы привести полное название или тынц?
Бдынц
23 июн 09, 09:54    [7331492]     Ответить | Цитировать Сообщить модератору
 Re: фонетический поиск  [new]
iap
Member

Откуда: Москва
Сообщений: 46975
На этом форуме искали?
https://www.sql.ru/forum/actualsearch.aspx?search=%ED%E5%F7%B8%F2%EA%E8%E9+%EF%EE%E8%F1%EA&sin=0&a=&ma=0&bid=1&dt=-1&s=1&so=1
23 июн 09, 09:58    [7331508]     Ответить | Цитировать Сообщить модератору
 Re: фонетический поиск  [new]
Alexander Us
Member

Откуда:
Сообщений: 1107
Всем спасибо
23 июн 09, 12:35    [7332491]     Ответить | Цитировать Сообщить модератору
 Re: фонетический поиск  [new]
Alexander Us
Member

Откуда:
Сообщений: 1107
Реализовал алгоритм Левенштайна на .NET.

Знает ли кто как его можно ускорить?
Есть ли более быстрые алгоритмы?

Буду очень признателен за советы и ссылки.
8 июл 09, 17:19    [7392870]     Ответить | Цитировать Сообщить модератору
 Re: фонетический поиск  [new]
Winnipuh
Member [заблокирован]

Откуда: Київ
Сообщений: 10428
Alexander Us
Реализовал алгоритм Левенштайна на .NET.

Знает ли кто как его можно ускорить?
Есть ли более быстрые алгоритмы?

Буду очень признателен за советы и ссылки.


а что не устраивает?
8 июл 09, 17:50    [7393070]     Ответить | Цитировать Сообщить модератору
 Re: фонетический поиск  [new]
Alexander Us
Member

Откуда:
Сообщений: 1107
Winnipuh
а что не устраивает?

Не устраивает производительнось:

Мне надо сравнивать строки в 2 таблицах(массивах при реализации вне SQL Server) и подбирать строки, наименее отличающиеся друг от друга.
В каждой таблице/массиве могут быть десятки тысяч строк. Каждая строка из одной таблицы сравнивается в каждой строкой в другой.
В релультате производительность существенно ниже того, что хотелось бы иметь.
8 июл 09, 18:02    [7393176]     Ответить | Цитировать Сообщить модератору
 Re: фонетический поиск  [new]
Winnipuh
Member [заблокирован]

Откуда: Київ
Сообщений: 10428
Alexander Us
Winnipuh
а что не устраивает?

Не устраивает производительнось:

Мне надо сравнивать строки в 2 таблицах(массивах при реализации вне SQL Server) и подбирать строки, наименее отличающиеся друг от друга.
В каждой таблице/массиве могут быть десятки тысяч строк. Каждая строка из одной таблицы сравнивается в каждой строкой в другой.
В релультате производительность существенно ниже того, что хотелось бы иметь.


ясное дело, если таблица с таблицей...

а SOUNDEX?
8 июл 09, 18:09    [7393216]     Ответить | Цитировать Сообщить модератору
 Re: фонетический поиск  [new]
Alexander Us
Member

Откуда:
Сообщений: 1107
Winnipuh
а SOUNDEX?
В данном случае надо сравнивать строки похожие по написанию, а не звучанию.
Например, серийные номера, номера автомобилей и т.д.
8 июл 09, 18:29    [7393307]     Ответить | Цитировать Сообщить модератору
 Re: фонетический поиск  [new]
Alexander Us
Member

Откуда:
Сообщений: 1107
Например, одна из возможных модификаций алгоритма(с целью ускорения) Левенштейна могла бы быть:

функция с 3 аргументами
LevenschteinDistance (String1 as String, String1 as String, MaxDistance as Integer) as boolean

В этом случае выход из функции мог бы происходить при достижении количества несовпадений в MaxDistance.

Наверняка всего этот велосипед уже изобретён.
Может ли кто сказать, где он лежит или поделиться кодом?
8 июл 09, 18:49    [7393429]     Ответить | Цитировать Сообщить модератору
 Re: фонетический поиск  [new]
Winnipuh
Member [заблокирован]

Откуда: Київ
Сообщений: 10428
Alexander Us
Например, одна из возможных модификаций алгоритма(с целью ускорения) Левенштейна могла бы быть:

функция с 3 аргументами
LevenschteinDistance (String1 as String, String1 as String, MaxDistance as Integer) as boolean

В этом случае выход из функции мог бы происходить при достижении количества несовпадений в MaxDistance.

Наверняка всего этот велосипед уже изобретён.
Может ли кто сказать, где он лежит или поделиться кодом?


есть еще алгоритм, являющийся усовершенствованием данного.
8 июл 09, 18:50    [7393438]     Ответить | Цитировать Сообщить модератору
 Re: фонетический поиск  [new]
Winnipuh
Member [заблокирован]

Откуда: Київ
Сообщений: 10428
Alexander Us
Winnipuh
а SOUNDEX?
В данном случае надо сравнивать строки похожие по написанию, а не звучанию.
Например, серийные номера, номера автомобилей и т.д.


вы тему назвали "фонетический поиск", потому и вопрос возник ;-)
8 июл 09, 18:52    [7393447]     Ответить | Цитировать Сообщить модератору
 Re: фонетический поиск  [new]
Alexander Us
Member

Откуда:
Сообщений: 1107
Winnipuh
есть еще алгоритм, являющийся усовершенствованием данного.

Приведите пожалуйста ссылку или хотя бы название алгоритма.
8 июл 09, 18:59    [7393484]     Ответить | Цитировать Сообщить модератору
Все форумы / Microsoft SQL Server Ответить