Добро пожаловать в форум, Guest  >>   Войти | Регистрация | Поиск | Правила | В избранное | Подписаться
Все форумы / Сравнение СУБД Новый топик    Ответить
Топик располагается на нескольких страницах: Ctrl  назад   1 2 [3] 4 5 6   вперед  Ctrl      все
 Re: Вопросы сравнения XML-БД и плоскотабличных БД...  [new]
c127
Guest
vadiminfo

Вообще-то есть широко известные требования Кодда исключительно к РСУБД, а не СУБД вообще. (Пусть даже РСУБД - СУБД второго покаления, но есть и первое).


Еще раз большими буквами: ЕСТЬ ОПРЕДЕЛЕНИЕ КОДДА ДЛЯ СУБД. Ссылки указаны. Никакого РСУБД там нет, оно есть в других местах, это другое опрдеделение. Версант не удовлетворяет тому определению, на которое я сослался. Акцесс ему тоже не удовлетворяет. Если они СУБД, то по-какому-то другому определению, но не по этому. Если оракл ему тоже не удовлетворяет, то оракл тоже не СУБД по этому определению.

vadiminfo

Почему Вы ничего не говорите о том, что СУБД вообще появилось раньше 1970 года и предложено группой Кодасил? Их вроде как бы слово первое что есть СУБД вообще. Вряд ли Кодд это оспаривал.
Может тока СУБД второго покаления или будущие.


История вопроса в данном случае меня не интересует. Я обсуждаю соответсвие продуктом конкретному определению. Не знаю откуда оно взялось, оно есть, остальное не важно.

vadiminfo

Парадокс означает, что в терии выводятся взаимоисключающие утверждения. Это удар по тероии. Повод для ее пресмотра. Основания там имеют проблемы из-за бесконечного.


Там не было теории, точнее то что построил Кантор ни на чем не базировалась, что-то взятое с потолка, хоть и довольно удачно. Это взятое с потолка в очень редких и специфических случаях приводило к противоречиям. Не знаю почему, но эти противоречия не повлияли на то что было построено на основе взятой с потолка основы.

vadiminfo

Вот тут без философии, и не обойтись. Основания таких фундаментальных наук как математика - это как раз выход на философию, так как никаких других наук над математикой нет.


Некоторые довольно серьезные люди матлогику считают не совсем математикой, а именно тем что над математикой. Так что не только философия претендует на эту позицию.

Классические философы в разрешении парадоксов теории множеств ничем не помогли, что разумеется совершенно закономерно. При построении парадоксов Рассел на философские знания не опирался, он опирался на математические знания, никакой философии.

vadiminfo

О том, например, что про одного автора в листе дерева написаны ФИО слитно, а для другого отделно три листа (Ф, И, О) и еще четвертый про гонорар. Полхо формализованная модель.


Такая модель бессмысленна. Я уже говорил, что чем меньше работы на этапе проектирования тем больше на других этапах. Предположим записали Вы все, и что потом с этими неструктурированными данными делать? Как найти автора по фамилии Арнольд, или может всех с именем Арнольд, там же все свалено в кучу? Сложить данные не фокус, фокус с ними потом работать.

vadiminfo

Затолкать это в 6 рел таблиц, наверное, можно, а отобразить на рел модель сложновато будет, и модель получится корявая. А потом схему постоянно менять придется? А тех 6 табл самих по себе не достаточно, нужно все равно знать про ту модель что внутри у них, чтобы извлекать нужные данные как можно проще. Например, найти все книги автора


Тех 6 таблиц достаточно для полного отображения ХМЛ-я. Если ХМЛ несет в себе иноформацию о структуре данных, то ее туда можно записать элементарно. Т.е. ПОЛНОЕ вложение, простите за тавталогию. Но Вы не называете эту структуру реляционной.

То что требуются дополнительные средства поиска, так ведь и в ХМЛ-е они требуются. Как ни крути, а достоинств у ХМЛ-я пока не видно, кроме того что это стандарт.
16 июн 05, 04:47    [1623490]     Ответить | Цитировать Сообщить модератору
 Re: Вопросы сравнения XML-БД и плоскотабличных БД...  [new]
mir
Member

Откуда: Томск
Сообщений: 1027
2 vadiminfo
Вадим, мне кажется тебе надо хотя бы временно приостановить спор и призадуматься о некоторых важных понятиях. Пока такое чувство, что споришь «из принципа», при этом делая необдуманные заявления. Вот несколько примеров:
vadiminfo
В отличии от других моделей (в этом топике обозначенными под именем "плоские"), данные в "полуструктурированных" модели самодостаточны: схема представления содержится в них самих.
Ошибка. Нет никакого «отличия». В любой реляционной базе данных содержатся все необходимые метаданные. То есть РБД самодостаточна: ее схема содержится в ней самой. Никакого «преимущества» XML здесь нет.
vadiminfo
Во всех других моделях данные подчиняются фиксированной схеме, описываемой отдельно и загодя, и функции каждого элемента данных неявно регламентируются схемой как таковой.
Ошибка. Документ XML обязан подчиняться фиксированной схеме, например DTD или XML-Schema. Эта схема описывается загодя, и функции каждого элемента данных ей регламентируются.
vadiminfo
Кстати одно из достоинств ХМЛ, что существуют стандартизованные методы его отображения во многие форматы в достаточны выразительном виде.
А что, данные из РБД уже нельзя вывалить в любой нужный формат? Штатными средствами самой СУБД? К примеру, DTS в MS SQL Server. А уж в XML формате сейчас только ленивый не умеет выдавать результаты запросов. То есть и здесь никакого «достоинства XML» нет.
Ну а теперь целая группа фраз про «модели» и «форматы».
vadiminfo

Но отображение форматов одной модели в форматы другой. Но это не есть отображение моделей одной в другую. А если просто что-то забабахать в рел таблы, то это просто реляционный формат.
...
Структуру назваю реляционной. Формат называю реляционным, даже если затолкали в Йексесль, но реляционную таблу.
...
Модель должна отображаться в модель, а не в формат,
Здесь очевидна серьезное непонимании разницы физического и логического уровней представления информации. Понятие «формат» относится сугубо к физическому уровню хранения (биты, байты и т.п.). Понятие «модель данных» является сугубо логическим и не имеет абсолютно никакой связи с физическим форматом хранения. Например, для одной и той же реляционной МД разные СУБД предлагаю совершенно разные форматы хранения этих БД. Даже сами принципы организации хранения могут принципиально отличаться. Так, одни SQL-СУБД хранят данные «по строкам», и другие «по столбцам».
Таким образом, во-первых, термин «реляционный формат» является бессмысленным, а во-вторых, смешивать «форматы» с «моделями данных» недопустимо, ибо это понятия несопоставимые.
В этом, кстати, одна из принципиальных проблем XML-СУБД. Ведь сам по себе XML есть язык разметки. Это способ именно описывать данные на физическом уровне. Это ни что иное, как формат. Такой же, как какой-нибудь PostScript или там PDF. Но невежды на пару с коммерсантами пытаются придать формату видимость модели данных. Это сразу влечет смешение физического и логического уровней и общую кашу в голове. Причем сам формат-то принципиально иерархический, то есть изначально ограничен. И это нам преподносят как новое слово, как божий дар. А это, в общем-то, г@вно.
16 июн 05, 08:12    [1623589]     Ответить | Цитировать Сообщить модератору
 Re: Вопросы сравнения XML-БД и плоскотабличных БД...  [new]
Bald
Member

Откуда:
Сообщений: 52
Любой формат изначально ограничен. Интересно, а что в настоящий момент
можно было бы считать божьим даром ?
16 июн 05, 11:26    [1624231]     Ответить | Цитировать Сообщить модератору
 Re: Вопросы сравнения XML-БД и плоскотабличных БД...  [new]
vadiminfo
Member

Откуда: Обнинск
Сообщений: 4802
c127

ЕСТЬ ОПРЕДЕЛЕНИЕ КОДДА ДЛЯ СУБД. Ссылки указаны.

Если оно и есть, то
а) не широко известно, в отличии от его 12 правилах о том, что относить к РСУБД, а что нет - оное повторено во многих источниках. Кодд - автор рел модели. Мнение Кодда конечно важно по всем вопросам, но авторы идей, придумавших те или иные понятия, тоже имеют значение.
в) Может претендолвать только на СУБД второго поколения и выше, поскольку авторстово за первым и за самой идеей принадлежит другим.

Хорошо. Для Вас Оракл и Аксцесс не СУБД, для меня СУБД (более того РСУБД - как минимум) - мы пользуемся разными способами классификации программных систем. Разными определениями. Я в основном общепризнанные, проверенные временем предпочитаю по возможности.
Выбор классификации может быть удачным или не удачным.




c127

Там не было теории, точнее то что построил Кантор ни на чем не базировалась, что-то взятое с потолка, хоть и довольно удачно. Это взятое с потолка в очень редких и специфических случаях приводило к противоречиям. Не знаю почему, но эти противоречия не повлияли на то что было построено на основе взятой с потолка основы.

У меня другие сведения - была и еще какая. Базировалась и сама была и есть (но уже пересмотренная) величайшим открытием.

c127

Классические философы в разрешении парадоксов теории множеств ничем не помогли, что разумеется совершенно закономерно. При построении парадоксов Рассел на философские знания не опирался, он опирался на математические знания, никакой философии.

Как посмотреть. В математике есть теперь несколько подходов по признаку отношения к бесконечному (Актуальный, Конструктивистский). Если не философия, то что здесь поможет понимать как ко всему этому относиться?

c127

Такая модель бессмысленна.

Мне бы Вашу способность к смелым утверждениям.

c127

Предположим записали Вы все, и что потом с этими неструктурированными данными делать? Как найти автора по фамилии Арнольд, или может всех с именем Арнольд, там же все свалено в кучу? Сложить данные не фокус, фокус с ними потом работать.

В том то и фокус, что раз это все-таки это модель то, есть и способ найти (разумеется навигационный). Иначе, конечно, никто бы (в толстых уважаемых книгах) не говорил как минимум о модели данных.

c127

Тех 6 таблиц достаточно для полного отображения ХМЛ-я. Если ХМЛ несет в себе иноформацию о структуре данных, то ее туда можно записать элементарно. Т.е. ПОЛНОЕ вложение, простите за тавталогию. Но Вы не называете эту структуру реляционной.

Будьте, пожалуйста, внимательней. Я называю произовольную совокупность реляционных табл реляционной структурой. Я второй раз Вас об этом пишу, а Вы мне приписываете всякое. Вы же не намерено искажаете мой текст? Я рел моделью не все называю у чего есть реляционная структура. Т.е. рел структура необходима для рел модели, но не достаточна. Вы же математик - значит должны понимать точный смысл подобных текстов.

c127


То что требуются дополнительные средства поиска, так ведь и в ХМЛ-е они требуются.

Вот именно требуются дополнительные средства поиска ХМЛ модели данных.
Потому в данном случае ХМЛ - модель данных данной ПО, а те 6 табл сами по себе нет, а тока реляционная структура, в которую затолкали другую модель.
В частности, в нее могли затолкать и другую реляционную модель. Давайте затолкаем в эти 6 табл все рел БД. А потом будем
с помощью дополнительных средств поиска все бум там искать.
Есть парни, которые так и поступают. Забивают на семантическую сторону моделирования данных (Про нормализацию уже не говорю). Используют просто структуры, поддерживаемые СУБД, как удобные форматы для данных.

mir

Пока такое чувство, что споришь «из принципа», при этом делая необдуманные заявления.

Однако, стараюсь не спорить, а просто обсуждать и защищать какие-то мысли. Потому что верю, что сам при этом лучше узнаю предмет. Но может не получается.

mir

В любой реляционной базе данных содержатся все необходимые метаданные. То есть РБД самодостаточна: ее схема содержится в ней самой. Никакого «преимущества» XML здесь нет.


Я не ставил под сомнение самодостаточности. Не говорил, что полуструктурированые более самодостаточны. Говорил, что более гибки. В них проще затолкать "Реальный мир". Но, может быть, сложнее извлекать инфу. Када говорил, что описательная инфа отдельно, то имел ввиду не то, что она вне базы, а то что в заголовках таблы (чтобы понять смысл нужно найти имя клонки). А в полуструктурированной непосредственно с данными, почти как в тексте.

Это просто говорит, что мы смысл текстов друг друга понимаем не точно. Разные книжки читали.

mir

Документ XML обязан подчиняться фиксированной схеме, например DTD или XML-Schema. Эта схема описывается загодя, и функции каждого элемента данных ей регламентируются.

Для документа, который нужно отобразить в другие. И сами DTD или XML-Schema разные, а докумен один.
А для БД они обязательны? Они описывают описатели - котрые хранятся таки вместе с данными - теги. В тегах Вы можете написать - <Автор>Сидоров</Автор>. И ясно что Сидоров это автор, а не слесарь. К примеру.

mir

Здесь очевидна серьезное непонимании разницы физического и логического уровней представления информации.

Возможно. Возможно отличного панимания.


mir

Понятие «модель данных» является сугубо логическим и не имеет абсолютно никакой связи с физическим форматом хранения.

Вот Вы сами говорите о физическом формате. Значит есть не физический? Какой? Вообще наскока термин формат однозначен? Раньше структурированные БД назавали БД фиксированного формата.

mir

Например, для одной и той же реляционной МД разные СУБД предлагаю совершенно разные форматы хранения этих БД.

Хорошо. Из этого что следует? Что термин "формат" нельзя применять во фраз типа отформатированный текст? Или что? Пока не въехал.

mir

Даже сами принципы организации хранения могут принципиально отличаться. Так, одни SQL-СУБД хранят данные «по строкам», и другие «по столбцам».

Еще менее ясно, что это проясняет.

mir

Таким образом, во-первых, термин «реляционный формат» является бессмысленным, а во-вторых, смешивать «форматы» с «моделями данных» недопустимо, ибо это понятия несопоставимые.

А я все еще вижу смысл. Например у Йексель формат электронных табл, в РСУБД рел формат. Это имеет смысл када, мы, например, импортируем данные их Аксцесс в Йексель. Да и форматы у разных РСУБД таки отличаетчся. Что имеет значение при их взаимодействии или импорте. Разве нет? Так по-моему это называют.
Т.е. термин рел формат упортебляется все еще и по делу.
Не убедили пока меня отказаться от этого термина.

Так я не смешивал. Наоборот, делал большую разницу. Те шесть табл обозвал форматом, и не согласился называть моделью.
Где же их смешивание? Наоборот разделение галимое.


mir

В этом, кстати, одна из принципиальных проблем XML-СУБД. Ведь сам по себе XML есть язык разметки. Это способ именно описывать данные на физическом уровне. Это ни что иное, как формат. Такой же, как какой-нибудь PostScript или там PDF. Но невежды на пару с коммерсантами пытаются придать формату видимость модели данных. Это сразу влечет смешение физического и логического уровней и общую кашу в голове. Причем сам формат-то принципиально иерархический, то есть изначально ограничен. И это нам преподносят как новое слово, как божий дар. А это, в общем-то, г@вно.

Язык - это уже признак логического уровеня представления информации. Стал быть на логическом уровне описывает. Про байты там ни слова, зато можно понть интерпретировать данные.
Ну есть там формат. Тока не везде где есть формат больше ничего нет.
Имеет значение, что написано на том языке, а не тока как он называется.
Названия в инфотехнолгиях могут отражать представления на момент создания понятия.
Невежды еще до появления ХМЛ создали понятие полуструктурированных данных. Слаботипизированных моделей данных. И их уже не остановить.
Так все ограничено. Структурированные ограничены схемой, а полуструктурированные менее ограничены. Тексты, например, еще менее ограничены.
Если бы нашли что-то не ограниченное во всех отношениях. Во це было бы Да.
16 июн 05, 12:51    [1624645]     Ответить | Цитировать Сообщить модератору
 Re: Вопросы сравнения XML-БД и плоскотабличных БД...  [new]
Sarin
Member

Откуда: Земля, Солнечная система.
Сообщений: 14485
fanat_FOXa

Поздно я приджонился.
В каком аспекте интересует?
Если локальный клиент в одном экземпляре, то в Делфе есть фишка соответствующая. Очень меня в своё время впечатлила.
16 июн 05, 15:00    [1625436]     Ответить | Цитировать Сообщить модератору
 Re: Вопросы сравнения XML-БД и плоскотабличных БД...  [new]
S.G.
Member

Откуда: cartoon network
Сообщений: 30611
vadiminfo
В математике есть теперь несколько подходов по признаку отношения к бесконечному (Актуальный, Конструктивистский). Если не философия, то что здесь поможет понимать как ко всему этому относиться?
Немного off-top. Был такой очень хороший фильм - "История мира", режиссер- Мел Брукс. Там такой диалог:
1: Чем занимаешься?
2: Я - философ!!!
1: А, bullshit-master /непреводимая игра слов/ :)

Действительно, я как-то не замечал чтобы философия, во всяком случае в том виде в каком мы ее изучали, способствовала познанию мира. Математика, физика, химия- да. Благодаря им, мы сегодня живем лучше. А в философии, общие суждения типа "электрон также неисчерпаем, как и атом" - простите, для такого вывода не нужны уж очень сильные умственные усилия.
Естественные науки самодостаточны, им не нужна некая сверхнаука, которая бы указывала им путь, и интерпретировала бы результаты.

автор
Невежды еще до появления ХМЛ создали понятие полуструктурированных данных
Странно, что все еще не существует СУБД на основе HTML ...
16 июн 05, 15:52    [1625739]     Ответить | Цитировать Сообщить модератору
 Re: Вопросы сравнения XML-БД и плоскотабличных БД...  [new]
Sarin
Member

Откуда: Земля, Солнечная система.
Сообщений: 14485
S.G.
Естественные науки самодостаточны, им не нужна некая сверхнаука, которая бы указывала им путь, и интерпретировала бы результаты.

Очень сомнительно. Я, вообще-то, технарь. И философию не люблю. Но она нужна.
16 июн 05, 16:10    [1625849]     Ответить | Цитировать Сообщить модератору
 Re: Вопросы сравнения XML-БД и плоскотабличных БД...  [new]
mir
Member

Откуда: Томск
Сообщений: 1027
2 vadiminfo
Такое чувство, что ты либо читаешь «отрывками», либо игнорируешь смысл прочитанного. Ну, например, вот твоя фраза:
vadiminfo
В отличии от других моделей (в этом топике обозначенными под именем "плоские"), данные в "полуструктурированных" модели самодостаточны: схема представления содержится в них самих.

Здесь тобой недвусмысленно утверждается, что тот факт, что схема представления содержится в самих данных 1) есть признак их «самодостаточности» и 2) это есть отличие модели «полуструктурированных данных» от реляционной МД.
Я четко указал, что это не так по п.2, то есть реляционная БД тоже содержит в себе свою схему, то есть тоже «самодостаточна» в указанном смысле, то есть никакого отличия здесь нет. Точка. Ты мог либо признать свою ошибку, либо оспорить мои аргументы. Но ты предпочел третий путь:
vadiminfo
Не говорил, что полуструктурированые более самодостаточны. Говорил, что более гибки.
Это неправда. Цитирую еще раз: «В отличии от других моделей… данные в "полуструктурированных" модели самодостаточны». То есть даже не «более самодостаточны», а вообще «самодостаточны» и именно «в отличие». Ну зачем врать-то, а? Ведь любой может просто пересчитать эти слова выше и все будет ясно. Про «более гибки» вообще в цитате ничего нет, да и я об этом в своем ничего не говорил.
И вот так буквально по всем пунктам. У меня нервы не железные, я в таком духе говорить не хочу.
16 июн 05, 16:24    [1625942]     Ответить | Цитировать Сообщить модератору
 Re: Вопросы сравнения XML-БД и плоскотабличных БД...  [new]
vadiminfo
Member

Откуда: Обнинск
Сообщений: 4802
S.G.

Странно, что все еще не существует СУБД на основе HTML ...

Там все теги фиксированные, и не могут описывать смысл самих данных.
Там тока формат есть. Там <Автор> Сидоров </Автор>, скорее всего не прокатит.


mir

Здесь тобой недвусмысленно утверждается, что тот факт, что схема представления содержится в самих данных 1) есть признак их «самодостаточности» и 2) это есть отличие модели «полуструктурированных данных» от реляционной МД.

Здесь самодостаточность понимается как то, что интерпритация данных не отделена от данных. В структурированных отделена и хранится в схеме.

Вы употребили его в смымле, наличия метаданных в БД.
Вот Ваш текст
mir

В любой реляционной базе данных содержатся все необходимые метаданные. То есть РБД самодостаточна: ее схема содержится в ней самой. Никакого «преимущества» XML здесь нет.


Это другой смысл термина самодостаточности. Я с этим смыслом термина согласился. Его, действительно, и так и так употребляют - его мысл уточняется контекстом. Но отвечал про метаданные.
В этом смысле РМД, естественно, самодостаточна. А отличие, о котором я говорил остается. Данные полуструктурированной модели самодостаточны в смысле, что либо не нуждаются в схеме (shema-less), либо описывают сами себя (self-describing). Специально для Вас уточняю- речь идет о полуструктурированных (слабоструктурированных) моделях вообще, а не только XML. Ведь всегда считалось, что текст достаточно выразителен - там интерпритация вместе с данными. Это можно считать дальнейшим ослаблением структуры. Вот полуструктурированные - компромисс. Ближе к текстовым, но еще имеют структурированность, обеспечивающую манипулирование, большее чам в текстах.

Ошибок признать готов скока угодно, отказаться пока от того, что у слабоструктурированных данных есть свои преимущества - не вижу оснований.

Ваши замечания насчет вранья отношу на Вашу эмоциональность. Но считаю ее недостатком в техническом обсуждении. Впрочем, как хотите. Мне все равно как Вы будете думать про эти модели. Мне важно как мне самому думать о них - для этого и участвую в обсуждении. Меня сейчас эта тема интересует, а участие в форуме стимулирует. Приходится, например, читать литру, да и другие точки зрения интересны. А так бы уже давно болтался бы на теннисных кортах.
16 июн 05, 19:39    [1626792]     Ответить | Цитировать Сообщить модератору
 Re: Вопросы сравнения XML-БД и плоскотабличных БД...  [new]
Андрей Леонидович
Guest
vadiminfo здесь, мне кажется, единственный человек, который "спорит" не из принципа. И видно, что его представления о реляционной теории и о теории баз данных вообще существенно изменились за последние год-два...
И вовсе не "очевидна серьезное непонимании"... А, наоборот, очевидно более глубокое понимание. Надеюсь, что и с127, и mir "заклинило" не навсегда...
Когда vadiminfo говорил о "формате" и "модели", он "модель" "относил" к концептуально-лигической сфере, так сказать (напоминая об окружающем мире), а "формат" - к абсолютно логической (кортежи отношений), а вовсе не к физической. И чтобы этого не понять, нужно быть очень упорным. В своем непонимании реляционной теории и теории баз данных вообще...
16 июн 05, 19:57    [1626845]     Ответить | Цитировать Сообщить модератору
 Re: Вопросы сравнения XML-БД и плоскотабличных БД...  [new]
c127
Guest
vadiminfo

Если оно и есть, то
а) не широко известно, в отличии от его 12 правилах о том, что относить к РСУБД, а что нет - оное повторено во многих источниках. Кодд - автор рел модели. Мнение Кодда конечно важно по всем вопросам, но авторы идей, придумавших те или иные понятия, тоже имеют значение.
в) Может претендолвать только на СУБД второго поколения и выше, поскольку авторстово за первым и за самой идеей принадлежит другим.


Еще раз: есть определение. Оно непротиворечиво в разумных пределах и конструктивно, т.е. позволяет определить соответствует ли ему продукт или нет. Не важно чье, хоть мое собственное. Ссылка дана, сказано, что СУБД понимается в смысле именно этого определения и никакого другого. Какие вопросы? Не нравится это определение - приведите свое и мы обсудим соответствие Версанта и Акцеса этому определению. Тогда будет конструктивный разговор. А говорить что определение появилось позже чего-то или оно неизвестно - не имеет смысла.

vadiminfo

У меня другие сведения - была и еще какая. Базировалась и сама была и есть (но уже пересмотренная) величайшим открытием.


Теории основ быть не может, Бурбакисты на это напоролись. Основы берутся с потолка. Возьмите Кантора почитайте. Там теория кардинальных чисел, но самые основы теории множеств не формализованы.

vadiminfo

Как посмотреть. В математике есть теперь несколько подходов по признаку отношения к бесконечному (Актуальный, Конструктивистский). Если не философия, то что здесь поможет понимать как ко всему этому относиться?


Никак не нужно относиться. Берем одни правила вывода - получаем классическую математику, ограничиваем правлила вывода - получаем конструктивисткую математику. Никакой философии. Как говорили классики: "ловкость рук и никакого мошенничества" (С).

vadiminfo

c127

Такая модель бессмысленна.

Мне бы Вашу способность к смелым утверждениям.


Достигается тренировками.

vadiminfo

В том то и фокус, что раз это все-таки это модель то, есть и способ найти (разумеется навигационный). Иначе, конечно, никто бы (в толстых уважаемых книгах) не говорил как минимум о модели данных.


Значит она структурирована, просто структура запрятана более хитро. Если это так, то все разговоры о слабоструктурированности - развод лохов.

vadiminfo

Будьте, пожалуйста, внимательней. Я называю произовольную совокупность реляционных табл реляционной структурой. Я второй раз Вас об этом пишу, а Вы мне приписываете всякое. Вы же не намерено искажаете мой текст?


Нет, вообще не искажаю, просто я ориентируюсь на Ваше высказывание: "В ОЛАПе тоже могут использоваться схема звезда или снежинка. Из реляционных табл. Тока это уже не реляционная модель." (vadiminfo, 12 июн 05, 00:41, [1615958])



S.G.


1: Чем занимаешься?
2: Я - философ!!!
1: А, bullshit-master /непреводимая игра слов/ :)


Наверное можно нестрого перевести как "повелитель чепухи/чуши", но не претендую.

S.G.

А в философии, общие суждения типа "электрон также неисчерпаем, как и атом" - простите, для такого вывода не нужны уж очень сильные умственные усилия.


Да, мне это высказываение про электрон тоже всегда казалось верхом идиотизма.

S.G.

Естественные науки самодостаточны, им не нужна некая сверхнаука, которая бы указывала им путь, и интерпретировала бы результаты.


Согласен, все решается своими силами. Но вот что является наблюдаемым фактом, это то что ни разу так называемая философия ничего путного естественным наукам не подсказала. Разве что задним числом да и то так хитро, что легко можно было бы вывести прямо противоположное предсказанному. В чистом виде подгонка к результату.

Лучше всего о таких ученых по-моему написал Лем в "Гласе господа", что смысл их науки состоит в болтании языком и если вдруг кто-то принесет им простое решение их проблем, он станет их злейшим врагом, поскольку лишит их смысла существования а самое главное - куска хлеба с маслом. Правда Лем говорил о психологах, но у философов дела даже еще хуже.

Не зря на западе философия как наука в чистом виде давно вымерла и у нас тоже вымирает довольно быстрыми темпами. Это называется естественный отбор.
17 июн 05, 01:04    [1627157]     Ответить | Цитировать Сообщить модератору
 Re: Вопросы сравнения XML-БД и плоскотабличных БД...  [new]
Михаил Михайлович
Member [заблокирован]

Откуда: Москва(Зеленоград)
Сообщений: 955
Короче я понял так !

1) Есть РСУБД, которые нефига не поддерживают XML, и дяди, которым нечего делать валют куски текстов в блобы а потом вытаккивают и скрещивают с парсерами XSL и разной чумой;

2) Есть РСУБД, где декларируется поддержка XML на уровне "удобно достать" и "удобно запихнуть", но где тут "секс" я всёравно не пойму;

3) Есть современные СУБД, где клиентские куски можно держать в XML и (может быть) повторно их мучить SQL-запросами (или этого нет ? )

4) Есть разные там GOXML , к промышленным вещам вроде и не относящиеся, о которых мало изместно.

5) Есть число движки для работы с форматом XML (не парсеры!) , но об этом я вобще не слышал.

Ничего не пропустил?
P.S. XQuery не предлагать!
17 июн 05, 01:46    [1627171]     Ответить | Цитировать Сообщить модератору
 Re: Вопросы сравнения XML-БД и плоскотабличных БД...  [new]
Rus000
Member

Откуда: Красноярск
Сообщений: 317
vadiminfo

Официально XML декларируется как полуструктурированная модель данных, и ведущие производители СУБД спешат втюхать ее поддрержку в свои системы.


Господа, многие споры заканчиваются когда стороны начинают одинаково трактовать термины и определения.

Приведу несколько цитат из весьма уважаемой мной книги "Модели данных", Д.Цикритзис,Ф.Лоховски, Москва "Финансы и статистика",1985

1. "Модель данных - это средство абстакции, которое дает возможность увидеть "лес" (информационное содержание данных), а не "отдельные деревья" (конкретные значения данных) ..."
2. "Модель данных определяет правила, в соответствии с которыми структурируются данные. Однако структурные спецификации не обеспечивают полной интерпретации семантики данных и способа их использования.Должны быть также специфицированы операции над данными ..."

3. "Определим модель данных M как множество правил порождения G и множества операций O. Множество правил порождения выражает статические свойства модели данных и соотностится с языком описания данных (ЯОД). Средствами ЯОД определяются допустимые структуры данных - объектов и связей, а также допустимые реализации данных. Динамические свойства реального мира выражаются множеством операций O, которые соотносятся с языком мнанипулирования данными (ЯМД)

4. "... существует потенциальная возможность определения множества различных моделей данных, однако не все из них полезны на практике, что подтверждается весьма малым числом моделей, получившим широкое распространение."

5."...Некоторые придерживаются мнения о возможности существования такой супермодели данных, которая бы разрешила все проблемы моделирования. Убедительно доказать, что некоторая модель данных во всем является наилучшей, весьма трудно. Каждая модель данных имеет свои преимущества в конкретной сфере применения и для определенного контингента проектировщиков схемы."

Некая классификация моделей из той же книги (обратите внимание - везде используется множественное число "модели", а не просто "модель")
1. Реляционные модели
2. Сетевые модели
3.Иерархические модели
4.Бинарные модели
5.Семантические сети
6.Инфологические модели


Есть еще несколько тезисов касательно выбора модели данных. Если интересно - выложу


Возвращаясь к теме обсуждения, наверное правильнее сказать, что XML не есть модель данных как таковая, а только лишь средство (язык) для ее описания.
17 июн 05, 05:28    [1627219]     Ответить | Цитировать Сообщить модератору
 Re: Вопросы сравнения XML-БД и плоскотабличных БД...  [new]
gardenman
Member

Откуда: С-Петербург
Сообщений: 2347
[url=http://]http://www.crn.com/showArticle.jhtml;jsessionid=SW5RIMFPXRWSOQSNDBCCKHSCJUMEKJVN?articleID=55800858&flatPage=true[/url]
17 июн 05, 10:18    [1627636]     Ответить | Цитировать Сообщить модератору
 Re: Вопросы сравнения XML-БД и плоскотабличных БД...  [new]
Bald
Member

Откуда:
Сообщений: 52
c127

Значит она структурирована, просто структура запрятана более хитро. Если это так, то все разговоры о слабоструктурированности - развод лохов.


Страшно подумать, но существуют не только слабоструктурированные данные, но и вообще неструктурированные :) . Т.е. их структура заранее априори неизвестна. И есть системы, которые умеют с этим работать. Структура выявляется и формируется параллельно с заполнением базы данными. До
этого они являются слабо или неструктурированными.
17 июн 05, 10:27    [1627669]     Ответить | Цитировать Сообщить модератору
 Re: Вопросы сравнения XML-БД и плоскотабличных БД...  [new]
1024
Member

Откуда: Нижний Новгород
Сообщений: 14267

бла-бла-бла

"не четал" (ц)

1.Нет.

a. Можно закачать в нормальную БД и делать выборки. Процесс закачки обычно
представляет собой указание помещение одного файла в одну таблицу (ноды
становятся записями, атрибуты вносятся в поля)

б. Можно распарсить в память компа и выбирать данные с использованием языка
XPath

в. Можно преобразовывать (т.е. выбирать, например из всех данных только те
где ИНН на 1234 начинается и т.д.) данные с помощью XSL-шаблонов

2.нет

никаких вариантов

3.не выше а ниже.

если по пункту 1а то скорость ниже на то время пока закачиваются данные, по
пунктам 1б и 1в скорость ниже не в разы а на порядки.

4.не понятно что значит "разработка"

если схема БД то те же что и для нормальных. Если непосредственно внесение
данных то можно хоть в блокноте. Есть XML Spy, в VS можно но всё равно
неудобно.


--------------------
вывод - гуано полное, уж не обессудьте.




"fanat_FOXa" <nospam@sql.ru> wrote in message news:1607876@sql.ru...
Привет всем!
Несколько общеобразовательных вопросов к мемберам, имеющим опыт создания баз
данных, использующих для хранения данных XML-файлы.
1) Можно ли делать выборки из таких БД с помощью SQL?
2) Поддерживают ли такие БД оптимальную индексацию для ускорения выборки?
3) Насколько выше/ниже (в общем случае) скорость выборки из таких БД по
сравнению с выборкой из плоских таблиц (dbf) ?
4) Какое ПО пригодно для разработки подобных БД?
Понимаю, что некоторые вопросы выглядят наивно, но я до сегодняшнего дня
работал с плоскими таблицами, и не имею опыта работы с иерархическими БД.
Заранее благодарен за ответы.
Тема Ответить


Posted via ActualForum NNTP Server 1.2

17 июн 05, 15:59    [1629759]     Ответить | Цитировать Сообщить модератору
 Re: Вопросы сравнения XML-БД и плоскотабличных БД...  [new]
mir
Member

Откуда: Томск
Сообщений: 1027
Bald
Страшно подумать, но существуют не только слабоструктурированные данные, но и вообще неструктурированные :) . Т.е. их структура заранее априори неизвестна. И есть системы, которые умеют с этим работать. Структура выявляется и формируется параллельно с заполнением базы данными. До этого они являются слабо или неструктурированными.
Это все игра слов. Сошлюсь на мнение Дейта и Паскаля, многократно ими выраженное. Если понимать «данные» как закодированную информацию, то словосочетание "неструктурированные данные" внутренне противоречиво. Данные, не обладающие структурой, являются случайным шумом и не могут кодировать информацию, следовательно, и не являются данными. "Неструктурированные данные" — оксюморон, это «сухая вода», это «живой труп».
Не следует путать наличие структуры и степень ее известности, как это сделали вы. Если структура данных неизвестна, это не равноценно тому, что ее нет. Поэтому призываю всех совсем не использовать термин "неструктурированные данные" как безграмотный.
Другое дело, что иногда говорят, что данные «неструктурированы», имея в виду лишь то, что они не представлены сами по себе в виде таблиц, то есть как бы противопоставляя «неструктурированные» «реляционным».
Но это тоже безграмотно, так как при этом в очередной раз путают уровни представления: внешний и логический. То, что некоторые данные пользователь не видит в форме таблиц, вовсе не означает, что они «неструктурированы». Они обязательно имеют некоторую структуру. И эту структуру можно всегда смоделировать реляционным образом в виде набора отношений и значений, хранящихся в них.
Теперь по поводу систем, которые «умеют выявляеть и формировать априори неизвестную структуру». Не сомневаюсь, что такое есть. Любой архиватор воспринимает поток байтов и выявляет в нем закономерности (то есть выявляет «структуру»), чтобы преобразовать в менее избыточную форму. Но дело то не в этом. Вопрос в том, является ли эта найденная структура во-первых, правильной, а во-вторых той, которая «нужна». С которой, к примеру, хотел бы работать человек, если бы сам эту структуру описывал.
Найденная программой «псевдоструктура» может быть тупо неверной, ибо массив данных ограничен и могут быть выявлены случайные «закономерности», «псевдозакономерности». Найденная программой «псевдоструктура» будет скорее всего слишком «низкоуровневой», более близкой к понятию «формат», чем к понятию «логическая модель». Поэтому такая «псевдоструктура» будет малопригодной для решения задач, для который изобретены базы данных. Все это очень интересно, но вообще мало имеет связь с обсуждаемыми проблемами.
17 июн 05, 16:15    [1629848]     Ответить | Цитировать Сообщить модератору
 Re: Вопросы сравнения XML-БД и плоскотабличных БД...  [new]
Bald
Member

Откуда:
Сообщений: 52
"Неструктурированные данные" - общепринятый термин.

A new IBM hybrid database geared for handling structured and unstructured data is in the hands of about 30 alpha testers, an IBM executive said Friday.

"The intention here is to really build a hybrid database that handles both native relational and native XML [data]," Janet Perna, general manager of IBM Software's Information Management Group, told CRN in an interview Friday.
- с сайта, на который дал ссылку gardenman

mir
Не следует путать наличие структуры и степень ее известности, как это сделали вы[/quot]
Не путал. Имел в виду, что она заранее неизвестна.

mir
...И эту структуру можно всегда смоделировать реляционным образом в виде набора отношений и значений, хранящихся в них.
[/quot]
Можно, но не всегда нужно.

Найденная программой «псевдоструктура» будет скорее всего слишком «низкоуровневой», более близкой к понятию «формат», чем к понятию «логическая модель»[/quot] Согласен. И ошибки бывают. Главное, что
возможные разделители известны заранее.
17 июн 05, 18:27    [1630302]     Ответить | Цитировать Сообщить модератору
 Re: Вопросы сравнения XML-БД и плоскотабличных БД...  [new]
Alexey Rovdo
Member

Откуда: Москва
Сообщений: 913
Михаил Михайлович
Короче я понял так !

1) Есть РСУБД, которые нефига не поддерживают XML, и дяди, которым нечего делать валют куски текстов в блобы а потом вытаккивают и скрещивают с парсерами XSL и разной чумой;

2) Есть РСУБД, где декларируется поддержка XML на уровне "удобно достать" и "удобно запихнуть", но где тут "секс" я всёравно не пойму;

3) Есть современные СУБД, где клиентские куски можно держать в XML и (может быть) повторно их мучить SQL-запросами (или этого нет ? )

4) Есть разные там GOXML , к промышленным вещам вроде и не относящиеся, о которых мало изместно.

5) Есть число движки для работы с форматом XML (не парсеры!) , но об этом я вобще не слышал.

Ничего не пропустил?


6) Еще есть ООСУБД, которые прекрасно решают все проблемы работы с XML-данными также, как описано в п.2.

Вообще есть мнение, что XML-БД совершенно не нужны, поскольку по своему функционалу дублируют возможности ООСУБД (причем далеко не полностью), но при этом страшно тормозят, поскольку формат XML - далеко не лучший, когда надо обеспечить быструю обработку запросов, индексацию и навигацию по данным. Любые XML-данные прекрасно ложатся в объектные хранилища.

Что же касается структурированности/полуструктурированности, то скажу следующее. Структура реляционных хранилищ обычно достаточно проста. Когда же данные имеют очень сложную структуру (а такие данные, поскольку их сложная структура вовсе не очевидна, иногда и относят к полуструктурированным или неструктурированным), запихнуть их в РСУБД бывает очень трудно. Объектные же системы приспособлены к этому гораздо лучше, поскольку замечательно справляются со структурами неимоверной сложности (в т.ч. и динамическими).
17 июн 05, 18:40    [1630341]     Ответить | Цитировать Сообщить модератору
 Re: Вопросы сравнения XML-БД и плоскотабличных БД...  [new]
Андрей Леонидович
Guest
"Если понимать "данные" как закодированную информацию..."
Замечательно ! А как понимать "информацию" и "кодирование" ?

Термин "неструктурированные данные" может быть и "нормальный", но не в сфере баз данных. mir прав в том, что В СФЕРЕ БАЗ ДАННЫХ данные могут быть только "сложноструктурированные" или "простоструктурированные", но не мугут быть "слабоструктурированными" или "неструктурированными". Они могут быть, всего лишь, "слабонормализованными" или "ненормализованными".

Причем "слабонормализованными" могут быть не только "сложноструктурированные" данные, но и "простоструктурированные". Например, фамилию человека ("простоструктурированные" данные) обычно не подвергают дальнейшей нормализации, хотя можно было бы...

Конечно, приятно было бы работать со "сложноструктурированными" данными так же "просто", как и со стороками, числами и датами. Это, можно сказать, голубая мечта всего сообщества теоретиков и разработчиков баз данных...
... В СП.АРМ проводились работы по "самоструктурирующимся БД". Я в успех этих работ не верю...
... Упомянутая Rus000 книга была неплохой для своего времени, но даже тогда она не помогала, мягко говоря, "сторонам одинаково трактовать термины и определения"...
17 июн 05, 19:39    [1630457]     Ответить | Цитировать Сообщить модератору
 Re: Вопросы сравнения XML-БД и плоскотабличных БД...  [new]
S.G.
Member

Откуда: cartoon network
Сообщений: 30611
c127

Но вот что является наблюдаемым фактом, это то что ни разу так называемая философия ничего путного естественным наукам не подсказала.
Совершенно согласен. Любая наука через свои законы должна не только объяснять существующие факты, но и предсказывать новые явления. Философия, увы, таким свойством не обладает, и немного похожа в этом плане на религию, которая с большим трудом пытается увязать новые открытия естественных наук, с Библией (т.е. вроде там уже все было сказано...)


c127

Не зря на западе философия как наука в чистом виде давно вымерла и у нас тоже вымирает довольно быстрыми темпами. Это называется естественный отбор.
Yep.


vadiminfo

S.G
Странно, что все еще не существует СУБД на основе HTML ...

Там все теги фиксированные, и не могут описывать смысл самих данных.
Там тока формат есть. Там <Автор> Сидоров </Автор>, скорее всего не прокатит.
это была шутка.


p.s. Сорри за оффтоп.
17 июн 05, 23:56    [1630765]     Ответить | Цитировать Сообщить модератору
 Re: Вопросы сравнения XML-БД и плоскотабличных БД...  [new]
vadiminfo
Member

Откуда: Обнинск
Сообщений: 4802
Alexey Rovdo

Вообще есть мнение, что XML-БД совершенно не нужны, поскольку по своему функционалу дублируют возможности ООСУБД (причем далеко не полностью)

Есть как мы видим много разных мнений. И уж если они не нужны то, маловероятно, что это связано с ООСУБД, поскольку:
1) последние несмотря на все их достоинства в плане моделерования сложных ПО, все равно являются структурированными.
2) имеют еще свои пока проблемы. Например, нет общепринятой модели, сложеность, и т.д. Так что дублирования ее не достаточно в настоящее время, что быть не нужной.
3)Есть еще ОРСУБД, которые тоже претендуют, на те же специальные задачи, что и ООСУБД. На типовых пока все держит РСУБД. И потому, если структурированных достаточно, чтобы обойтись без ХМЛ, то это не обязательно ООСУБД.
По крайней мере, таково положение дел на сегодня.

Alexey Rovdo

Что же касается структурированности/полуструктурированности, то скажу следующее. Структура реляционных хранилищ обычно достаточно проста. Когда же данные имеют очень сложную структуру (а такие данные, поскольку их сложная структура вовсе не очевидна, иногда и относят к полуструктурированным или неструктурированным), запихнуть их в РСУБД бывает очень трудно. Объектные же системы приспособлены к этому гораздо лучше, поскольку замечательно справляются со структурами неимоверной сложности (в т.ч. и динамическими).

Но Вы здесь сравниваете между собой тока структурированные (РСУБД и ООСУБД, кста опять забыли про ОРСУБД). А про полуструктурированные ни слова нет. Солжная структура не равна полуструктурированной. Хоть в ООСУБД поддерживаются средства эволюции схемы, это ничего не меняет. В полуструктрированной изменчивость обычное дело.

S.G.

Философия, увы, таким свойством не обладает, и немного похожа в этом плане на религию, которая с большим трудом пытается увязать новые открытия естественных наук, с Библией (т.е. вроде там уже все было сказано...)

Как посмотреть. Во первых, философия (любовь к мудрости) - это больше часть мировозрения, чем наука. Во вторых, диалектика дает методы познания. А это не мало.
Мы тут приводили примеры, что многие важные идеи в математике принадлежат людям, имеющим глубокие познания в философии. А Вы говорите.

Кстати, про религию. Большинство гениев были верующими людьми. Например, Кантор был глубоко набожным человеком, насколько мне известно. Дарвин - был церковным старостой, Ньютн снимал шляпу только при одном упоминании о Боге. Так что пока она с большим трудом увязывает, ее прихожане делали наиболее важные из открытий не тока естествееных, но и всех прочих наук.
Возможно, все дело в том, что у нас есть всего три источника знаний: эмперический, рациональный (оба важны для естественных наук) и третий - Божественное откровение. Кому-то мало двух, кому-то достаточно одного и менее.

S.G.

это была шутка.

Я тоже пытался пошутить.
18 июн 05, 02:10    [1630865]     Ответить | Цитировать Сообщить модератору
 Re: Вопросы сравнения XML-БД и плоскотабличных БД...  [new]
c127
Guest
Bald

Страшно подумать, но существуют не только слабоструктурированные данные, но и вообще неструктурированные :) .


Думать не страшно, но кто не робовал не поймет. Шутка.

Например блобы есть неструктутрированные данные. Тяжело указать РСУБД которая их НЕ поддерживает.

Bald

И есть системы, которые умеют с этим работать.


Это точно. Работа сводится к трем операциям: записать, прочитать, удалить как целое. Обновление сводится к удалению и последующей записи. Без знания структуры Вы больше ничего не сделаете. Так это известно уже лет 300 и столько же этим все пользуются. В чем новизна?

Если не согласны то расскажите подробнее о работе с неструктурированными данными.
18 июн 05, 03:27    [1630880]     Ответить | Цитировать Сообщить модератору
 Re: Вопросы сравнения XML-БД и плоскотабличных БД...  [new]
S.G.
Member

Откуда: cartoon network
Сообщений: 30611
vadiminfo
Мне просто неудобно больше оффтопить. Я лучше почитаю про полунеструктурированные данные.
18 июн 05, 13:09    [1631022]     Ответить | Цитировать Сообщить модератору
 Re: Вопросы сравнения XML-БД и плоскотабличных БД...  [new]
Андрей Леонидович
Guest
Общие подходы к работе с "неструктурированными" данными (вне баз данных) или с ненормализованными данными (в среде баз данных) действительно известны, но ясных методов пока нет. В среде баз данных, по крайней мере...

Предположим, что нам нужно хранить фамилии, имена и отчества (идентифицированных) людей. Это можно сделать так:

ФИО = Сергеев Николай Петрович

А можно так:

Фамилия = Сергеев
Имя = Николай
Отчество = Петрович

...

Далее почти аналогично. Предположим, что нам нужно хранить записи песен, и получать (помимо прослушивания этих записей), например, такую информацию:
"Список песен, записанных в тональности до-мажор, у которых в партии бас-гитары более одного раза встречается нота си."
Как вы поступите:

1. Будете ПОМИМО самой записи хранить "структурированную" в соответствии с используемой моделью данных дополнительную информацию об этой песне (записи) ?
2. Будете извлекать нужную информацию из записи с помощью специальных алгоритмов и вообще НЕ ХРАНИТЬ дополнительную "структурированную" информацию ?
3. Будете прослушивать запись, динамически собирая ее из "структурированных" данных, то есть вообще НЕ ХРАНИТЬ саму запись, как единое целое ?

Вот, собственно, известные "300 лет" общие подходы...

Что касается "эффективной работы" со "структурами неимоверной сложности" в среде ООСУБД... Похоже только Cache дает ясное представление о хранении подобных данных. "Возьмите" Cache, и решите для себя насколько практически целесообразно применять переопределение базовых структуры хранения и методов индексации для работы со "сложноструктурированными" данными (объектами). Конечно, для этого нужно знать MUMPS. То есть знать основы баз данных... А чем плохо знать основы баз данных ? Сейчас, ведь, уже целое поколение разработчиков баз данных появилось, которые создают приложения в Cache и, при этом, не знают MUMPS. Это, конечно, великое маркетинговое и технологическое достижение Intersystems, но "не до такой же степени"...
Сразу вспоминается упомянутая здесь статья про строки в Си. Вот это из той же оперы. Даже "хуже": заниматься базами данных, и не знать MUMPS - это все равно что заниматься шахматами, например, и не знать ни одного дебюта, начинающегося ходом e4...
18 июн 05, 18:00    [1631239]     Ответить | Цитировать Сообщить модератору
Топик располагается на нескольких страницах: Ctrl  назад   1 2 [3] 4 5 6   вперед  Ctrl      все
Все форумы / Сравнение СУБД Ответить