Добро пожаловать в форум, Guest  >>   Войти | Регистрация | Поиск | Правила | В избранное | Подписаться
Все форумы / Microsoft SQL Server Новый топик    Ответить
 Нечеткое сравнение строк (join)  [new]
Alibek B.
Member

Откуда:
Сообщений: 3567
Есть две базы (одинаковой структуры), в них есть таблицы, отличаемые по содержанию.
В таблицах есть идентификатор записи и имя записи. Для некоторых записей имена совпадают, для некоторых несколько отличаются (например "Участники ВОВ" и "Уч.ВОВ").
Как их можно сопоставить друг с другом (наиболее схожие строки)?

Я собираюсь создать временную таблицу, в которой будет указан идентификатор, имя записи и соответствующее имя записи из другой базы. Эту таблицу я перепроверю вручную, после чего обновлю имена в соответствии с новыми значениями. Но чтобы не заполнять ее полностью вручную (там порядка 800 записей), хотелось бы подставить хотя бы наиболее схожие строки.
________________________
Мы смотрим с оптимизмом...
...в оптический прицел.
27 ноя 09, 01:38    [7985178]     Ответить | Цитировать Сообщить модератору
 Re: Нечеткое сравнение строк (join)  [new]
muk07
Member

Откуда: Челябинск
Сообщений: 1842
Существует классическая задача
longest common subsequence
см. например
http://en.wikipedia.org/wiki/Longest_common_subsequence_problem
Но ей богу, вручную будет быстрее.
27 ноя 09, 06:43    [7985266]     Ответить | Цитировать Сообщить модератору
 Re: Нечеткое сравнение строк (join)  [new]
Дедушка
Member

Откуда: Город трёх революций
Сообщений: 5111
то Alibek B.
попробуйте SSIS (Fuzzy Lookup).
--------------------------------------------------------------
Дьявол кроется в деталях.
27 ноя 09, 09:25    [7985470]     Ответить | Цитировать Сообщить модератору
Все форумы / Microsoft SQL Server Ответить