Основные операции
Основные операции, производимые с B-деревьями:
-
поиск элемента;
-
добавление элемента;
-
удаление элемента.
При рассмотрении этих основных операций будут разбираться небольшие деревья, хотя в реальности B-деревья применяются при работе с большими массивами информации. Кроме того, для наглядности, на рисунках будут опускаться поля указателей.
Поиск будем начинать с корневой вершины. Если искомый элемент присутствует в загруженной вершине, то завершаем поиск с положительным ответом, иначе загружаем следующую вершину, и так до тех пор, пока либо найдем искомый элемент, либо не окажется следующей вершины (пришли в лист B-дерева).
Посмотрим на примере, как это реализуется (см. Рисунок 20).
Будем искать элемент 11. Сначала загрузим корневую вершину. Эта вершина содержит элементы 5 и 13. Искомый элемент больше 5, но меньше 13. Значит, следует идти по ссылке, идущей от элемента 5. Загружаем следующую вершину (с элементами 8 и 10). Эта вершина тоже не содержит искомого элемента. Замечаем, что 11 больше 10, следовательно, двигаемся по ссылке, идущей от элемента 10. Загружаем соответствующую вершину (с элементами 11 и 12), в которой и находим искомый элемент. Итак, в этом примере, чтобы найти элемент, потребовалось три раза обратиться к внешней памяти для чтения очередной вершины.
Рисунок 20. Поиск элемента в B-дереве
Если бы в примере осуществлялся поиск, допустим, элемента 18, то, просмотрев 3 вершины (последней была бы с элементом 17), было бы обнаружено, что от элемента 17 нет ссылки на поддерево с элементами большими 17, и на основании этого сделали бы вывод, что элемента 18 в дереве нет.
Теперь приведем точно сформулированный алгоритм поиска элемента Item в B-дереве, предположив, что функция LookFor возвращает номер первого большего или равного элемента вершины (фактически производит поиск в вершине).
function BTree_Search(Item: ItemType, BTree: PBTreeNode): boolean;
var
CurrentNode: PBTreeNode;
Position: integer;
begin
BTree_Search := False;
CurrentNode := BTree;
repeat
{Ищем в текущей вершине}
Position := LookFor(CurrentNode, Item);
if (CurrentNode.Count >= Position) and
(CurrentNode.Items[Position].Value = Item) then begin
{Элемент найден}
BTree_Search := True;
Exit;
end;
if CurrentNode.Items[Position-1].NextNode = nil then
{Элемент не найден и дальше искать негде}
break
else
{Элемент не найден, но продолжаем поиск дальше}
CurrentNode := CurrentNode.Items[Position-1].NextNode;
until False;
end;
Здесь пользуемся тем, что, если ключ лежит между Items[i].Value и Items[i+1].Value, то во внутреннюю память надо подкачать вершину, на которую указывает Items[i].NextNode.
Заметим, что для ускорения поиска ключа внутри вершины (функция LookFor), можно воспользоваться бинарным поиском (см. п. 3.3.1.2).
Учитывая то, что время обработки вершины есть величина постоянная, пропорциональная размеру вершины, временная сложность T(n) алгоритма поиска в B-дереве будет пропорциональна O(h), где h – глубина дерева.
Теперь рассмотрим добавление элемента в B-дерево
Для того чтобы B-дерево можно было считать эффективной структурой данных для хранения множества значений, необходимо, чтобы каждая вершина заполнялась хотя бы наполовину. Дерево строится снизу. Это означает, что любой новый элемент добавляется в лист. Если при этом произойдет переполнение (на этот случай в каждой вершине зарезервирован лишний элемент), то есть число элементов в вершине превысит NumberOfItems, то надо будет разделить вершину на две вершины, и вынести средний элемент на верхний уровень. Может случиться, что при этой операции на верхнем уровне тоже получится переполнение, что вызовет еще одно деление. В худшем случае эта волна докатится до корня дерева.
В общем виде алгоритм добавления элемента Item в B-дерево можно описать следующей последовательностью действий:
-
Поиск среди листьев вершины Node, в которую следует произвести добавление элемента Item.
-
Добавление элемента Item в вершину Node.
-
Если Node содержит больше, чем NumberOfItems элементов (произошло переполнение), то
-
делим Node на две вершины, не включая в них средний элемент;
-
Item := средний элемент Node;
-
Node := Node.PreviousNode;
-
Переходим к пункту 2.
Заметим, что при обработке переполнения надо отдельно обработать случай, когда Node – корень, так как в этом случае Node.PreviousNode=nil.
Рассмотрим пример. Возьмем дерево (см. Рисунок 21.а) и добавим в него элемент 13.
Рисунок 21. Добавление элемента в B-дерево
Двигаясь от корня, найдем лист, в который следует добавить искомый элемент. Таким узлом в нашем случае окажется лист, содержащий элементы 11 и 12. Добавим в него элемент 13 (см. Рисунок 21.б).
Понятно, что при этом получается переполнение. При его обработке вершина, содержащая элементы 11, 12 и 13 разделится на две части: вершину с элементом 11 и вершину с элементом 13, – а средний элемент 12 будет вынесен на верхний уровень (см. Рисунок 21.в).
Опять получилось переполнение, при обработке которого вершина, содержащая элементы 8, 10 и 12 разделится на две вершины: вершину с элементом 8 и вершину с элементом 12, – а средний элемент 10 будет вынесен на верхний уровень (см. Рисунок 21.г).
Получилось переполнение в корне дерева. Как оговаривалось ранее, этот случай надо обработать отдельно. Это связано с тем, что здесь необходимо создать новый корень, в который, во время деления, будет вынесен средний элемент. Теперь полученное дерево не имеет переполнения (см. Рисунок 21.д).
В этом случае, как и при поиске, время обработки вершины есть величина постоянная, пропорциональная размеру вершины, а значит, временная сложность T(n) алгоритма добавления в B-дерево будет также пропорциональна O(h), где h – глубина дерева.
Теперь рассмотрим удаление элемента из B-дерева.
Удаление элемента из B-дерева предполагает успешный предварительный поиск вершины, содержащей искомый элемент. Если такая вершина не найдена, то удаление не производится.
При удалении, так же, как и при добавлении, необходимо делать так, чтобы число элементов в вершине лежало между NumberOfItems/2 и NumberOfItems. Если при добавлении могла возникнуть ситуация переполнения вершины, то при удалении можно получить порожнюю вершину. Это означает, что число элементов в вершине оказалось меньше NumberOfItems/2. В этом случае надо посмотреть, нельзя ли занять у соседки слева или справа («перелить» часть элементов от нее) некоторое количество элементов так, чтобы их (элементов) стало поровну, и не было порожних вершин. Такое переливание возможно, если суммарное число элементов у данной вершины и ее соседки больше или равно NumberOfItems.
Если переливание невозможно, то объединяем данную вершину с ее соседкой. При этом число элементов в родительской вершине уменьшится на единицу и может статься, что опять получаем порожнюю вершину. В худшем случае волна объединений дойдет до корня. Случай корня надо обрабатывать особо, потому что в корне не может быть менее одного элемента. Поэтому если в корне не осталось ни одного элемента, надо сделать корнем тот единственную вершину, на который ссылается корень через ссылку Node.Items[0].NextNode, а старый корень удалить.
Приведем алгоритм удаления элемента Item из B-дерева:
-
Поиск вершины Node, которая содержит элемент Item. Если такой вершины нет, то удаление невозможно.
-
Если Node – лист, то удалить из Node элемент Item иначе заменить элемент Item узла Node на самый левый элемент правого поддерева элемента Item (тем самым сохраняется упорядоченность дерева: аналогично можно заменять элемент Item на самый правый элемент левого поддерева), Node := вершина, из которой был взят элемент для замены.
-
Если в Node меньше NumberOfItems/2 элементов (получилась порожняя вершина), то
-
выбрать 2 соседние вершины Neighbor1 и Neighbor2: одна из них – Node, вторая – ее левая или правая соседка;
-
если в Neighbor1 и Neighbor2 в сумме меньше чем NumberOfItems элементов, то слить вершины Neighbor1 и Neighbor2 иначе перераспределить элементы между Neighbor1 и Neighbor2 так, чтобы количество элементов в них не отличалось больше чем на единицу. Node := родительская вершина Neighbor1 и Neighbor2.
-
Если Node не корень дерева, то переход к пункту 3.
-
Если корень дерева пуст, то удалим его. Новым корнем дерева будет та единственная вершина, на которую осталась ссылка в старом корне.
Рассмотрим работу алгоритма на примере. Для примера возьмем дерево, получившееся в предыдущем примере после добавления элемента (см. Рисунок 22.а).
Будем удалять из этого дерева элемент 10. Сначала надо, двигаясь от корня, найти вершину дерева, содержащую этот элемент. Он находится в корне. Теперь поскольку элемент находится не в листовом узле, надо заменить его, например, на самый левый элемент правого поддерева. Делаем один шаг вправо и попадаем в корень правого поддерева. Теперь пока не достигнем листа, переходим на самого левого потомка.
Таким образом, найдем вершину, из которой позаимствуем элемент для замены удаленного элемента 10. В найденной вершине возьмем самый левый элемент. Таковым оказывается 11. Произведем замену элемента 10 на 11 и удалим элемент 11 (см. Рисунок 22.б).
Теперь проверим вершину, из которой был удален элемент, не стала ли она порожней. Число элементов в вершине равно нулю. Это меньше половины размера вершины. Следовательно, вершина порожняя. Выберем две соседние вершины: одна – та, из которой было удалено 11, вторая – соседняя вершина с числом 13. Суммарное число элементов в этих вершинах не превышает максимального размера вершины, значит, нам следует произвести слияние вершин. При слиянии элемент 12 родителя попадает в результирующий узел и удаляется из родителя (см. Рисунок 22.в).
Рисунок 22. Удаление элемента из B-дерева
Теперь переходим к родителю, из которого был удален элемент, и проверяем, не является ли он порожним. Опять имеем порожнюю вершину, и необходимо выбрать две соседние вершины (в данном случае: вершину, из которой был удален элемент 12 и вершину с элементом 17) и произвести слияние двух вершин. При слиянии получается вершина с элементами 14 и 17, где 14 позаимствовано у родителя. Естественно, элемент 14 из родителя удаляется (см. Рисунок 22.г).
Поскольку опять был удален элемент родителя, то переходим к родителю, и повторяем процесс проверки и слияния. Получаем вершину с элементами 5 и 11, где 5 позаимствовано у родителя и удалено из него (см. Рисунок 22.д).
Опять переходим к родителю. Поскольку родитель оказывается корнем, то цикл обработки порожних вершин заканчивается. Осталось проверить, не пуст ли корень дерева. Корень дерева пуст, поэтому его можно удалить. Новым корнем дерева будет та единственная вершина, на которую есть ссылка в старом корне. Это вершина с элементами 5 и 11 (см. Рисунок 22.е).
В этом случае, как и при поиске, время обработки вершины есть величина постоянная, пропорциональная размеру вершины, а значит, временная сложность T(n) алгоритма удаления из B-дерева будет также пропорциональна O(h), где h – глубина дерева.
- Содержание
- Основные сведения
- Понятия алгоритма и структуры данных
- Анализ сложности и эффективности алгоритмов и структур данных
- Структуры данных
- Элементарные данные
- Данные числовых типов
- Данные целочисленного типа
- Данные вещественного типа
- Операции над данными числовых типов
- Данные символьного типа
- Данные логического типа
- Данные типа указатель
- Линейные структуры данных
- Множество
- Линейные списки
- Линейный однонаправленный список
- Линейный двунаправленный список
- Циклические списки
- Циклический однонаправленный список
- Циклический двунаправленный список
- Разреженные матрицы
- Матрицы с математическим описанием местоположения элементов
- Матрицы со случайным расположением элементов
- Очередь
- Нелинейные структуры данных
- Мультисписки
- Слоеные списки
- Спецификация
- Реализация
- Деревья
- Общие сведения
- Обходы деревьев
- Спецификация двоичных деревьев
- Реализация
- Основные операции
- Организация
- Представление файлов b-деревьями
- Основные операции
- Общая оценка b-деревьев
- Алгоритмы обработки данных
- Методы разработки алгоритмов
- Метод декомпозиции
- Динамическое программирование
- Поиск с возвратом
- Метод ветвей и границ
- Метод альфа-бета отсечения
- Локальные и глобальные оптимальные решения
- Алгоритмы поиска
- Поиск в линейных структурах
- Последовательный (линейный) поиск
- Бинарный поиск
- Хеширование данных
- Функция хеширования
- Открытое хеширование
- Закрытое хеширование
- Реструктуризация хеш-таблиц
- Поиск по вторичным ключам
- Инвертированные индексы
- Битовые карты
- Использование деревьев в задачах поиска
- Упорядоченные деревья поиска
- Случайные деревья поиска
- Оптимальные деревья поиска
- Сбалансированные по высоте деревья поиска
- Поиск в тексте
- Прямой поиск
- Алгоритм Кнута, Мориса и Пратта
- Алгоритм Боуера и Мура
- Алгоритмы кодирования (сжатия) данных
- Общие сведения
- Метод Хаффмана. Оптимальные префиксные коды
- Кодовые деревья
- Алгоритмы сортировки
- Основные сведения. Внутренняя и внешняя сортировка
- Алгоритмы внутренней сортировки
- Сортировка подсчетом
- Сортировка простым включением
- Сортировка методом Шелла
- Сортировка простым извлечением.
- Древесная сортировка
- Сортировка методом пузырька
- Быстрая сортировка (Хоара)
- Сортировка слиянием
- Сортировка распределением
- Сравнение алгоритмов внутренней сортировки
- Алгоритмы внешней сортировки
- Алгоритмы на графах
- Алгоритм определения циклов
- Алгоритмы обхода графа
- Поиск в глубину
- Поиск в ширину (Волновой алгоритм)
- Нахождение кратчайшего пути
- Алгоритм Дейкстры
- Алгоритм Флойда
- Переборные алгоритмы
- Нахождение минимального остовного дерева
- Алгоритм Прима
- Алгоритм Крускала
- 190000, Санкт-Петербург, ул. Б. Морская, 67