Добро пожаловать в форум, Guest  >>   Войти | Регистрация | Поиск | Правила | В избранное | Подписаться
Все форумы / Microsoft SQL Server Новый топик    Ответить
 MS SQL 2008 FTS по XML в BLOB поле  [new]
YSnake
Member

Откуда: Орел
Сообщений: 65
В BLOB поле храняться различные документы, в том числе и XML. По этому полю настроен полнотекстовый индекс, word breaker - Russian, в "Data type column" для XML данных храним расширение ".xml".

Содержимое XML файла на русском и английском языке.
Полнитектовый поиск по русским словам не работает (по английским работает)?
По русским словам других документов (.doc, .xls и т.д.) полнотектовый поиск работает.
Не пойму в кодировке ли проблема, в какой кодировке нужно сохранить, что бы поиск работал по обоим языкам?
11 июн 09, 16:04    [7291302]     Ответить | Цитировать Сообщить модератору
 Re: MS SQL 2008 FTS по XML в BLOB поле  [new]
YSnake
Member

Откуда: Орел
Сообщений: 65
Странно, но получилось так, что с кадировкой Windows-1251 все работает.
Интересно почему с utf-16 не работает?
11 июн 09, 16:30    [7291430]     Ответить | Цитировать Сообщить модератору
 Re: MS SQL 2008 FTS по XML в BLOB поле  [new]
Алексей2003
Member

Откуда: Москва
Сообщений: 5645
может потому что UTF-16 не кириллица была?

для спящего время бодрствования равносильно сну
11 июн 09, 16:50    [7291562]     Ответить | Цитировать Сообщить модератору
 Re: MS SQL 2008 FTS по XML в BLOB поле  [new]
YSnake
Member

Откуда: Орел
Сообщений: 65
То что это различные кодировки это понятно.
Но UTF-16 так же может хранить кирилические символы. К примеру если мне будет неоходимо хранить русские и китайские (а что более возможно русские (1251) и румынские(1250) и въетнамские (1258)) символы я вижу выход использовать UTF-16, но в моем случае полнотектовый поиск не работает по этой кодировке.
11 июн 09, 17:26    [7291786]     Ответить | Цитировать Сообщить модератору
 Re: MS SQL 2008 FTS по XML в BLOB поле  [new]
Алексей2003
Member

Откуда: Москва
Сообщений: 5645
в том и вся загвозка, Вы сами правильно сказали "может хранить". как utf-8 есть кирилический и т.д. или Вы хотите сказать что если написано utf-16, то это означает что он хранит буквы всех языков мира в себе?

для спящего время бодрствования равносильно сну
11 июн 09, 17:29    [7291803]     Ответить | Цитировать Сообщить модератору
 Re: MS SQL 2008 FTS по XML в BLOB поле  [new]
YSnake
Member

Откуда: Орел
Сообщений: 65
т.е. есть UTF-16 кириллический, а есть без кириллицы?
11 июн 09, 17:52    [7291897]     Ответить | Цитировать Сообщить модератору
 Re: MS SQL 2008 FTS по XML в BLOB поле  [new]
Алексей2003
Member

Откуда: Москва
Сообщений: 5645
1. есть 2 вида UTF16, но я так понял они на x86 используется одна и таже кодировка. прошу прощения.
2. вполне возможно (в силу того, что чудес не бывает) что когда сравнивается col_utf16 = "АБВГД", вот это "АБВГД" сначала представляется как utf-8, и в дальнейшем сравнивается utf16 с utf8... а там скорее всего не соответствие...

для спящего время бодрствования равносильно сну
11 июн 09, 18:02    [7291935]     Ответить | Цитировать Сообщить модератору
Все форумы / Microsoft SQL Server Ответить