Содержание
-
Каждой нормальной форме соответствует некоторый определенный набор ограничений, и отношение находится в некоторой нормальной форме, если удовлетворяет свойственному ей набору ограничений. Примером набора ограничений является ограничение первой нормальной формы - значения всех атрибутов отношения атомарны. Поскольку требование первой нормальной формы является базовым требованием классической реляционной модели данных, мы будем считать, что исходный набор отношений уже соответствует этому требованию.
-
Процесс проектирования производится методом последовательных приближений к удовлетворительному набору схем отношений. Исходной точкой является представление предметной области в виде одного или нескольких отношений, и на каждом шаге проектирования производится некоторый набор схем отношений, обладающих лучшими свойствами. Процесс проектирования представляет собой процесс нормализации схем отношений, причем каждая следующая нормальная форма обладает свойствами лучшими, чем предыдущая.
-
СТРУКТУРА НОРМАЛИЗАЦИИ:
В теории реляционных баз данных обычно выделяется следующая последовательность нормальных форм: первая нормальная форма (1NF); вторая нормальная форма (2NF); третья нормальная форма (3NF); нормальная форма Бойса-Кодда (BCNF); четвертая нормальная форма (4NF); пятая нормальная форма, или нормальная форма проекции-соединения (5NF или PJ/NF). Нормализация таблиц базы данных - первый шаг на пути проектирования структуры реляционной базы данных. База данных считается нормализованной, если ее таблицы представлены как минимум в третьей нормальной форме. Часто многие таблицы нормализуются до четвертой нормальной формы, иногда, наоборот, производится денормализация. Главная цель нормализации базы данных - устранение избыточности и дублирования информации. В идеале при нормализации надо добиться, чтобы любое значение хранилось в базе в одном экземпляре, причем значение это не должно быть получено расчетным путем из других данных, хранящихся в базе.
-
Первая нормальная форма:
Дети не являются элементарными данными, следовательно, таблицу нельзя вводить таким образом, её необходимо преобразовать
-
Первая нормальная форма
Теперь все ячейки таблицы являются элементарными неделимыми (атомарными) данными и таблица может быть помещена в БД
-
Аномалия вставки:
Волков не может быть внесён в базу данных, т.к. у него нет детей, а эта информация входит в состав ключа
-
Аномалия модификации
Зайцева сменила фамилию. Если не принять специальных мер, изменение базы может быть произведено не полностью, и в базе данных окажется противоречивая информация.
-
Аномалия удаления
Дети, достигшие совершеннолетия, удаляются из БД. Однако, вместе с удалением Саши, ребенка Иванова, мы удалили и информацию о самом Иванове.
-
Основные определения:
Наиболее важные на практике нормальные формы отношений основываются на фундаментальном в теории реляционных баз данных понятии функциональной зависимости. Для дальнейшего изложения потребуются несколько определений. Определение 1.Функциональная зависимость В отношении R атрибут Y функционально зависит от атрибута X (X и Y могут быть составными) в том и только в том случае, если каждому значению X соответствует в точности одно значение Y: R.X --> R.Y. Определение 2.Полная функциональная зависимость Функциональная зависимость R.X --> R.Y называется полной, если атрибут Y не зависит функционально от любого точного подмножества X.
-
Определение 3.Транзитивная функциональная зависимость Функциональная зависимость R.X --> R.Y называется транзитивной, если существует такой атрибут Z, что имеются функциональные зависимости R.X --> R.Z и R.Z --> R.Y и отсутствует функциональная зависимость R.Z --> R.X. (При отсутствии последнего требования мы имели бы "неинтересные" транзитивные зависимости в любом отношении, обладающем несколькими ключами.) Определение 4.Неключевой атрибут Неключевым атрибутом называется любой атрибут отношения, не входящий в состав первичного ключа. Определение 5.Взаимно независимые атрибуты Два или более атрибута взаимно независимы, если ни один из этих атрибутов не является функционально зависимым от других.
-
Вторая нормальная форма:
Определение: Отношение R находится во второй нормальной форме (2NF) в том и только в том случае, когда оно находится в 1NF, и каждый неключевой атрибут функционально полно зависит от ключа R.
-
-
Третья нормальная форма:
Предположим, что в кабинете № 35 изменился телефон. Изменения требуется синхронно внести в две строки, следовательно, существует аномалия модификаций. Пусть есть кабинет, который ещё не занят, тогда невозможно (без сотрудника) внести информацию о телефоне в этом кабинете. Следовательно, существует аномалия вставки Существует аномалия удаления (если в кабинете капитальный ремонт, то необходимо убрать сотрудников, следовательно, теряются данные о телефоне).
-
Причина существования аномалий в том, что № телефона не зависит от ключа (точнее, зависит от ключа транзитивно, через № кабинета). В отношении существует зависимость между неключевыми атрибутами.
-
Определение: Отношение R находится в третьей нормальной форме (3NF) в том и только в том случае, если находится во 2NF, и каждый неключевой атрибут не является транзитивно зависимым от какого-либо ключа R. На практике третья нормальная форма схем отношений достаточна в большинстве случаев, и приведением к третьей нормальной форме процесс проектирования реляционной базы данных обычно заканчивается.
-
-
Основные свойства нормальных форм:
каждая следующая нормальная форма в некотором смысле лучше предыдущей; при переходе к следующей нормальной форме свойства предыдущих нормальных свойств сохраняются.
-
НАЗНАЧЕНИЕ НОРМАЛИЗАЦИИ
Устранить аномалии обновления отношений (При проведении нормализации базы данных происходитустранение или серьезное сокращение избыточности, дублирования данных): 1. Аномалии вставки 2. Аномалии удаления 3. Аномалия обновления Значительно сокращается вероятность появления противоречивых данных. Облегчается администрирование базы и обновление информации в ней, сокращается объем занятого базой дискового пространства.
-
Зачастую, чтобы извлечь информацию из нормализованной базы данных, приходится конструировать очень сложные запросы, которые к тому же, бывает, работают довольно медленно - из-за, главным образом, большого количества соединений таблиц. Поэтому, чтобы увеличить скорость выборки данных и упростить программирование запросов, нередко приходится идти на выборочную денормализацию базы.
Нет комментариев для данной презентации
Помогите другим пользователям — будьте первым, кто поделится своим мнением об этой презентации.