Дерево это в информатике кратко

Обновлено: 02.07.2024

Абстрактный тип данных, моделирующий иерархическую древовидную структуру и представленный в виде набора связанных узлов.

Общая и, следовательно, небинарная, несортированная, с дублированием некоторых меток, произвольная диаграмма дерева. На этой диаграмме узел с меткой 7 имеет трех дочерних узлов с меткой 2, 10 и 6 и один родительский элемент с меткой 2. Корневой узел наверху не имеет родителя.

В Информатика, а дерево широко используется абстрактный тип данных который моделирует иерархический древовидная структура, с корневым значением и поддеревьями потомков с родительский узел, представленный как набор связанных узлы.

Содержание

Общее использование

  • Представляя иерархический такие данные как:
      для компьютерных языков для человеческих языков из XML и HTML документы и YAML документы в обработке
    • А двоичное дерево поиска это тип двоичное дерево

    Терминология

    А узел - это структура, которая может содержать значение или условие или представлять отдельную структуру данных (которая может быть собственным деревом). Каждый узел в дереве имеет ноль или более дочерние узлы, которые находятся под ним в дереве (условно деревья рисуются растущими вниз). Узел, у которого есть дочерний элемент, называется дочерним родительский узел (или же начальство). Узел имеет не более одного родителя, но возможно много узлы-предки, например родительский родитель. Дочерние узлы с одним и тем же родителем родственные узлы.

    An внутренний узел (также известный как внутренний узел, индекс для краткости, или узел ответвления) - это любой узел дерева, имеющий дочерние узлы. Точно так же внешний узел (также известный как внешний узел, листовой узел, или же конечный узел) - это любой узел, не имеющий дочерних узлов.

    Самый верхний узел в дереве называется корневой узел. В зависимости от определения может потребоваться, чтобы у дерева был корневой узел (в этом случае все деревья непустые), или может быть разрешено быть пустым, и в этом случае оно не обязательно имеет корневой узел. Будучи самым верхним узлом, корневой узел не будет иметь родителя. Это узел, с которого начинаются алгоритмы в дереве, поскольку в качестве структуры данных можно переходить только от родителей к потомкам. Обратите внимание, что некоторые алгоритмы (например, поиск в глубину после упорядочения) начинаются с корня, но сначала посещают листовые узлы (получают доступ к значению листовых узлов), посещают только корень последним (т. Е. Сначала обращаются к дочерним элементам корня. , но доступ только к значению корня последним). Все остальные узлы могут быть доступны из него, следуя края или же ссылки. (В формальном определении каждый такой путь также уникален.) На диаграммах корневой узел обычно рисуется вверху. На некоторых деревьях, например кучи, корневой узел имеет особые свойства. Каждый узел в дереве можно рассматривать как корневой узел поддерева, укорененного в этом узле.

    В высота узла - это длина самого длинного нисходящего пути к листу от этого узла. Высота корня - это высота дерева. В глубина узла - это длина пути к его корню (т.е. корневой путь). Это обычно необходимо при манипулировании различными самобалансирующимися деревьями, AVL деревья особенно. Корневой узел имеет нулевую глубину, листовые узлы имеют нулевую высоту, а дерево только с одним узлом (следовательно, и корнем, и листом) имеет нулевую глубину и высоту. Обычно пустое дерево (дерево без узлов, если таковые разрешены) имеет высоту -1.

    А поддерево дерева Т дерево, состоящее из узла в Т и все его потомки в Т . [а] [1] Таким образом, узлы соответствуют поддеревьям (каждый узел соответствует своему поддереву и всем его потомкам) - поддерево, соответствующее корневому узлу, является всем деревом, а каждый узел является корневым узлом поддерева, которое он определяет; поддерево, соответствующее любому другому узлу, называется правильное поддерево (по аналогии с правильное подмножество).

    Другие термины, используемые с деревьями:

    Родитель или ребенок. Узел, достижимый путем повторного перехода от дочернего к родительскому. Узел, достижимый повторным переходом от родителя к потомку. Также известный как младший ребенок. Узел по крайней мере с одним дочерним элементом. Для данного узла его количество дочерних элементов. Лист обязательно имеет нулевую степень. Степень дерева - это степень его корня. Степень корня. Количество ребер на кратчайшем пути между двумя узлами. 1 + количество ребер между узлом и корнем, т.е. (глубина + 1) [ сомнительный – обсуждать ] Количество узлов на уровне. Количество листьев. Набор п ≥ 0 непересекающихся деревьев. Корневое дерево, в котором для дочерних элементов каждой вершины указан порядок. Количество узлов в дереве.

    Дерево — одна из наиболее широко распространённых структур данных в информатике, эмулирующая древовидную структуру в виде набора связанных узлов. Является связанным графом, не содержащим циклы. Большинство источников также добавляют условие на то, что рёбра графа не должны быть ориентированными. В дополнение к этим трём ограничениям, в некоторых источниках указываются, что рёбра графа не должны быть взвешенными.

    Содержание

    Определения

    • Корневой узел — самый верхний узел дерева.
    • Корень — одна из вершин, по желанию наблюдателя.
    • лист, листовой или терминальныйузел — узел, не имеющий дочерних элементов.
    • Внутренний узел — любой узел дерева, имеющий потомков, и таким образом, не являющийся листовым узлом.

    Дерево считается ориентированным, если в корень не заходит ни одно ребро.

    • Полный сцепленный ключ — идентификатор записи, который образуется путём конкатенации всех ключей экземпляров родительских записей (групп).

    Узел является экземпляром одного из двух типов элементов графа, соответствующим объекту некоторой фиксированной природы. Узел может содержать значение, состояние или представление отдельной информационной структуры или самого дерева. Каждый узел дерева имеет ноль или более узлов-потомков, которые располагаются ниже по дереву (по соглашению, деревья 'растут' вниз, а не вверх, как это происходит с настоящими деревьями). Узел, имеющий потомка, называется узлом-родителем относительно своего потомка (или узлом-предшественником, или старшим). Каждый узел имеет не больше одного предка. Высота узла — это максимальная длина нисходящего пути от этого узла к самому нижнему узлу (краевому узлу), называемому листом. Высота корневого узла равна высоте всего дерева. Глубина вложенности узла равна длине пути до корневого узла.

    Корневые узлы

    Поддеревья

    Упорядочивание деревьев

    Существует два основных типа деревьев. В рекурсивном дереве или неупорядоченном дереве имеет значение лишь структура самого дерева без учёта порядка потомков для каждого узла. Дерево, в котором задан порядок (например, каждому ребру, ведущему к потомку, присвоены различные натуральные числа) называется деревом с именованными рёбрами или упорядоченным деревом со структурой данных, заданной перед именованием и называемой структурой данных упорядоченного дерева.

    Упорядоченные деревья являются наиболее распространёнными среди древовидных структур. Двоичное дерево поиска — одно из разновидностей упорядоченного дерева.

    Представление деревьев

    Существует множество различных способов представления деревьев. Наиболее общий способ представления изображает узлы как записи, расположенные в динамически выделяемой памяти с указателями на своих потомков, предков (или и тех и других), или как элементы массива, связанные между собой отношениями, определёнными их позициями в массиве (например, двоичная куча).

    Деревья как графы

    Методы обхода

    Пошаговый перебор элементов дерева по связям между узлами-предками и узлами-потомками называется обходом дерева. Зачастую, операция может быть выполнена переходом указателя по отдельным узлам. Обход, при котором каждый узел-предок просматривается прежде его потомков называется предупорядоченным обходом или обходом в прямом порядке (pre-order walk), а когда просматриваются сначала потомки, а потом предки, то обход называется поступорядоченным обходом или обходом в обратном порядке (post-order walk). Существует также симметричный обход, при котором посещается сначала левое поддерево, затем узел, затем — правое поддерево, и обход в ширину, при котором узлы посещаются уровень за уровнем (N-й уровень дерева — множество узлов с высотой N). Каждый уровень обходится слева направо.

    Граф-дерево является очень распространенным видом графов в информатике. Они нужны для хранения какой-либо информации в нелинейной структуре в иерархическом порядке.

    Граф — это структура, состоящая из множества вершин, соединенных ребрами. Все в своей жизни видели транспортные схемы (передвижение автобусов или метро). Если эти схемы смоделировать в компьютере, то остановки и станции — это будут вершины графа, а маршрут транспорта между остановками/станциями — ребра графа.

    В зависимости от того, каким образом расположены вершины, какое отношение между ними и каким способом они соединяются между собой ребрами, различают различные виды графов. Граф-дерево — это всего лишь один из множества видов графов.

    Граф-дерево

    • в самом низу вы писали свое имя и имена ваших братьев и сестер;
    • чуть выше вы записывали имена ваших родителей и соединяли ваши имена с их именами линиями;
    • еще выше вы писали имена ваших дедушек и бабушек, которые являются родителями ваших родителей;
    • потом записывали имена всех ваших родственников: дядей и тетей, двоюродных братьев и сестер, прадедушек и прабабушек и т. д.

    Самое главное, все имена вы соединяли линиями зависимости между собой. Например, свое имя соединили с именами братьев и сестер и с именами своих родителей. Имена ваших родителей вы соединили с именами их братьев и сестер и с их родителями и т. д.

    В информатике, граф-дерево выглядит точно так же, как и ваше генеалогическое дерево, только вместо имен — вершины, а вместо линий, связывающих имена — ребра.

    Охарактеризовать граф-дерево в информатике можно так — это связный граф, где между двумя вершинам есть единственный связный путь. Вернемся к нашему дереву. Ваше имя будет связано линиями только с вашими родителями и вашими братьями/сестрами, с другими именами дерева у вас нет прямой связи. Например, с вашими дядями, тетями, бабушками и дедушками вы будете связаны только через ваших родителей, а не напрямую. А с вашей прабабушкой или вашим прадедушкой вы будете связаны только через родителей и бабушек с дедушками.

    Граф-дерево в информатике

    Граф-дерево в информатике: термины

    Заключение


    Какую выгоду можно извлечь из такой структуры данных, как дерево? В этой статье мы расскажем о данных в виде дерева, рассмотрим основные определения, которые следует знать, а также узнаем, как и зачем используется дерево в программировании. Спойлер: бинарные деревья часто применяют для поиска информации в базах данных, для сортировки данных, для проведения вычислений, для кодирования и в других случаях. Но давайте обо всем по порядку.

    Основные термины

    Дерево — это, по сути, один из частных случаев графа. Древовидная модель может быть весьма эффективна в случае представления динамических данных, особенно тогда, когда у разработчика стоит цель быстрого поиска информации, в тех же базах данных, к примеру. Еще древом называют структуру данных, которая представляет собой совокупность элементов, а также отношений между этими элементами, что вместе образует иерархическую древовидную структуру.


    Каждый элемент — это вершина или узел дерева. Узлы, соединенные направленными дугами, называются ветвями. Начальный узел — это корень дерева (корневой узел). Листья — это узлы, в которые входит 1 ветвь, причем не выходит ни одной.

    Общую терминологию можно посмотреть на левой и правой части картинки ниже:


    Какие свойства есть у каждого древа:

    — существует узел, в который не входит ни одна ветвь;

    — в каждый узел, кроме корневого узла, входит 1 ветвь.

    На практике деревья нередко применяют, изображая различные иерархии. Очень популярны, к примеру, генеалогические древа — они хорошо известны. Все узлы с ветвями, исходящими из единой общей вершины, являются потомками, а сама вершина называется предком (родительским узлом). Корневой узел не имеет предков, а листья не имеют потомков.

    Также у дерева есть высота (глубина). Она определяется числом уровней, на которых располагаются узлы дерева. Глубина пустого древа равняется нулю, а если речь идет о дереве из одного корня, тогда единице. В данном случае на нулевом уровне может быть лишь одна вершина – корень, на 1-м – потомки корня, на 2-м – потомки потомков корня и т. д.

    Ниже изображен графический вывод древа с 4-мя уровнями (дерево имеет глубину, равную четырем):


    Следующий термин, который стоит рассмотреть, — это поддерево. Поддеревом называют часть древообразной структуры, которую можно представить в виде отдельного дерева.

    Идем дальше. Древо может быть упорядоченным — в данном случае ветви, которые исходят из каждого узла, упорядочены по некоторому критерию.

    Степень вершины в древе — это число ветвей (дуг), выходящих из этой вершины. Степень равняется максимальной степени вершины, которая входит в дерево. В этом случае листьями будут узлы, имеющие нулевую степень. По величине степени деревья бывают:

    — двоичные (степень не больше двух);

    — сильноветвящиеся (степень больше двух).

    Деревья — это рекурсивные структуры, ведь каждое поддерево тоже является деревом. Каждый элемент такой рекурсивной структуры является или пустой структурой, или компонентом, с которым связано конечное количество поддеревьев.

    Когда мы говорим о рекурсивных структурах, то действия с ними удобнее описывать посредством рекурсивных алгоритмов.

    Обход древа

    Чтобы выполнить конкретную операцию над всеми вершинами, надо все эти узлы просмотреть. Данную задачу называют обходом дерева. То есть обход представляет собой упорядоченную последовательность узлов, в которой каждый узел встречается лишь один раз.

    В процессе обхода все узлы должны посещаться в некотором, заранее определенном порядке. Есть ряд способов обхода, вот три основные:

    — прямой (префиксный, preorder);

    — симметричный (инфиксный, inorder);

    — обратный (постфиксный, postorder).

    Существует много древовидных структур данных: двоичные (бинарные), красно-черные, В-деревья, матричные, смешанные и пр. Поговорим о бинарных.

    Бинарные (двоичные) деревья

    Бинарные имеют степень не более двух. То есть двоичным древом можно назвать динамическую структуру данных, где каждый узел имеет не большое 2-х потомков. В результате двоичное дерево состоит из элементов, где каждый из элементов содержит информационное поле, а также не больше 2-х ссылок на различные поддеревья. На каждый элемент древа есть только одна ссылка.


    У бинарного древа каждый текущий узел — это структура, которая состоит из 4-х видов полей. Какие это поля:

    — информационное (ключ вершины);

    — служебное (включена вспомогательная информация, однако таких полей может быть несколько, а может и не быть вовсе);

    — указатель на правое поддерево;

    — указатель на левое поддерево.

    Самый удобный вид бинарного древа — бинарное дерево поиска.

    Что значит древо в контексте программирования?

    Мы можем долго рассуждать о математическом определении древа, но это вряд ли поможет понять, какие именно выгоды можно извлечь из древовидной структуры данных. Тут важно отметить, что древо является способом организации данных в форме иерархической структуры.

    В каких случаях древовидные структуры могут быть полезны при программировании:

    Дерево – структура данных, представляющая собой древовидную структуру в виде набора связанных узлов.

    Бинарное дерево — это конечное множество элементов, которое либо пусто, либо содержит элемент ( корень ), связанный с двумя различными бинарными деревьями, называемыми левым и правым поддеревьями . Каждый элемент бинарного дерева называется узлом . Связи между узлами дерева называются его ветвями .

    Бинарное дерево

    Способ представления бинарного дерева:

    • A — корень дерева
    • В — корень левого поддерева
    • С — корень правого поддерева

    Корень дерева расположен на уровне с минимальным значением.

    Узел D , который находится непосредственно под узлом B , называется потомком B . Если D находится на уровне i , то B – на уровне i-1 . Узел B называется предком D .

    Максимальный уровень какого-либо элемента дерева называется его глубиной или высотой .

    Если элемент не имеет потомков, он называется листом или терминальным узлом дерева.

    Остальные элементы – внутренние узлы (узлы ветвления).

    Число потомков внутреннего узла называется его степенью . Максимальная степень всех узлов есть степень дерева.

    Число ветвей, которое нужно пройти от корня к узлу x , называется длиной пути к x . Корень имеет длину пути равную 0 ; узел на уровне i имеет длину пути равную i .

    Бинарное дерево применяется в тех случаях, когда в каждой точке вычислительного процесса должно быть принято одно из двух возможных решений.

    Имеется много задач, которые можно выполнять на дереве.

    Распространенная задача — выполнение заданной операции p с каждым элементом дерева. Здесь p рассматривается как параметр более общей задачи посещения всех узлов или задачи обхода дерева.

    Если рассматривать задачу как единый последовательный процесс, то отдельные узлы посещаются в определенном порядке и могут считаться расположенными линейно.

    Способы обхода дерева

    Пусть имеем дерево, где A — корень, B и C — левое и правое поддеревья.

    Дерево

    Существует три способа обхода дерева:

    • Обход дерева сверху вниз (в прямом порядке): A, B, C — префиксная форма.
    • Обход дерева в симметричном порядке (слева направо): B, A, C — инфиксная форма.
    • Обход дерева в обратном порядке (снизу вверх): B, C, A — постфиксная форма.

    Реализация дерева

    Узел дерева можно описать как структуру:

    struct tnode <
    int field; // поле данных
    struct tnode *left; // левый потомок
    struct tnode *right; // правый потомок
    >;

    При этом обход дерева в префиксной форме будет иметь вид

    void treeprint(tnode *tree) <
    if (tree!= NULL ) < //Пока не встретится пустой узел
    cout tree->field; //Отображаем корень дерева
    treeprint(tree->left); //Рекурсивная функция для левого поддерева
    treeprint(tree->right); //Рекурсивная функция для правого поддерева
    >
    >

    Обход дерева в инфиксной форме будет иметь вид

    void treeprint(tnode *tree) <
    if (tree!= NULL ) < //Пока не встретится пустой узел
    treeprint(tree->left); //Рекурсивная функция для левого поддерева
    cout tree->field; //Отображаем корень дерева
    treeprint(tree->right); //Рекурсивная функция для правого поддерева
    >
    >

    Обход дерева в постфиксной форме будет иметь вид

    void treeprint(tnode *tree) <
    if (tree!= NULL ) < //Пока не встретится пустой узел
    treeprint(tree->left); //Рекурсивная функция для левого поддерева
    treeprint(tree->right); //Рекурсивная функция для правого поддерева
    cout tree->field; //Отображаем корень дерева
    >
    >

    Бинарное (двоичное) дерево поиска – это бинарное дерево, для которого выполняются следующие дополнительные условия (свойства дерева поиска):

    • оба поддерева – левое и правое, являются двоичными деревьями поиска;
    • у всех узлов левого поддерева произвольного узла X значения ключей данных меньше, чем значение ключа данных самого узла X ;
    • у всех узлов правого поддерева произвольного узла X значения ключей данных не меньше, чем значение ключа данных узла X .

    Данные в каждом узле должны обладать ключами, на которых определена операция сравнения меньше.

    Как правило, информация, представляющая каждый узел, является записью, а не единственным полем данных.

    Для составления бинарного дерева поиска рассмотрим функцию добавления узла в дерево.

    Добавление узлов в дерево

    struct tnode * addnode( int x, tnode *tree) <
    if (tree == NULL ) < // Если дерева нет, то формируем корень
    tree = new tnode; // память под узел
    tree->field = x; // поле данных
    tree->left = NULL ;
    tree->right = NULL ; // ветви инициализируем пустотой
    > else if (x field) // условие добавление левого потомка
    tree->left = addnode(x,tree->left);
    else // условие добавление правого потомка
    tree->right = addnode(x,tree->right);
    return (tree);
    >

    Удаление поддерева

    void freemem(tnode *tree) <
    if (tree!= NULL ) <
    freemem(tree->left);
    freemem(tree->right);
    delete tree;
    >
    >

    Пример Написать программу, подсчитывающую частоту встречаемости слов входного потока.

    Поскольку список слов заранее не известен, мы не можем предварительно упорядочить его. Неразумно пользоваться линейным поиском каждого полученного слова, чтобы определять, встречалось оно ранее или нет, т.к. в этом случае программа работает слишком медленно.

    Один из способов — постоянно поддерживать упорядоченность уже полученных слов, помещая каждое новое слово в такое место, чтобы не нарушалась имеющаяся упорядоченность. Воспользуемся бинарным деревом.

    В дереве каждый узел содержит:

    • указатель на текст слова;
    • счетчик числа встречаемости;
    • указатель на левого потомка;
    • указатель на правого потомка.


    Рассмотрим выполнение программы на примере фразы

    now is the time for all good men to come to the aid of their party

    now is the time for all good men to come to the aid of their party

    При этом дерево будет иметь следующий вид

    Результат выполнения: бинарное дерево

    Результат выполнения

    Читайте также: