Реферат на тему машинное обучение

Обновлено: 02.07.2024

Доклад будет из трех частей. Первая часть будет содержать общую информацию о машинном обучении. Во второй части я попытаю кратко рассказать о методах и алгоритмах. Третья часть будет содержать интересные факты, связанные с машинным обучением.

Я попытаюсь не занять много времени у вас. После моего доклада будет время для вопросов.

Итак, давайте начнем.

1. Машинное обучение считается этапом развития искусственного интеллекта. Основная идея машинного обучения заключается в том, чтобы компьютер не просто использовал написанный алгоритм, а сам обучился решению поставленной задачи.

Технологию машинного обучения можно условно отнести к одному из трех уровней доступности. Первый уровень — технология доступна только технологическим гигантам уровня Google или IBM. Второй уровень — технологию может использовать любой студент.

Третий уровень — технологию может использовать даже бабуля.

В данный момент машинное обучение находится на стыке второго и третьего уровней.

Например, у нас есть данные о десяти тысяч квартирах в Москве, причём известны такие характеристики: площадь каждой квартиры, количество комнат, этаж, район, наличие парковки, расстояние до ближайшей станции метро, известна стоимость каждой квартиры и так далее.

Нам необходимо создать модель, которая на основе данных характеристик будет предсказывать стоимость квартиры. Это классический пример обучения с учителем, где у нас есть данные (десять тысяч квартир и различные параметры для каждой квартиры, называемые признаками) и отклики (стоимость квартиры). Такая задача называется задачей регрессии. Другие примеры: на основании различных медицинских показателей предсказать наличие у пациента рака. Или на основании текста электронного письма предсказать вероятность того, что это спам. Такие задачи являются задачами классификации. На этом моменте я хочу закончить вторую часть.

3. Эта часть доклада самая увлекательная. Приведём несколько интересных и не совсем очевидных примеров использования машинного обучения в реальной жизни.

Машинное обучение – это направление в науке, а с недавних пор и в технологиях, которое решает задачу обучения компьютера. Важно заметить, что не предполагается никакого полноценного обучения, которое можно было бы сравнить с обучением человека. Машинное знание, которое сформировалось в процессе обучения не может принимать по-настоящему интеллектуальных решений, как это может сделать человек. И, несмотря на это, в последнее время потребность в машинном обучении резко выросла. Машинное обучение выходит из сферы только математиков и алгоритмистов, и все глубже проникает в мир IT бизнеса, а затем и в мир простых обывателей. Технологии машинного обучения приносят человеку огромную пользу, и в скором времени каждый человек так или иначе будет ими пользоваться.
Машинной обучение активно применяется в таких сферах, как:
1. IT-сфера: разработка приложений (распознавание речи, обнаружение спама).
2. Рекламные компании (предсказание увеличения или уменьшения аудитории).
3. Маркетинговые исследования.
4. Медицинская диагностика (анализируя истории болезней пациентов, можно обнаруживать незаметные для человека связи и устанавливать неизвестные ранее симптомы опасных заболеваний).
Целью данной работы является изучение машинного обучения.
Для достижения поставленной цели, требуется решить следующие задачи:
1. Описать машинное обучение, выделить методы и алгоритмы.
2. Определить для чего используется машинное обучение.
3. Изучить применение прикладной статистики в машинном обучении.
4. Изучить спецификации в машинном обучении.

Рисунок SEQ Рисунок \* ARABIC 2 – Линейная регрессия
Например: Y = B0+ B1 * XЗная X, необходимо найти Y, и цель линейной регрессии заключается в поиске значений коэффициентов B0 и B1.
Для оценки регрессионной модели используются различные методы вроде линейной алгебры или метода наименьших квадратов.
2.2 Логистическая регрессияЛогистическая регрессия – ещё один алгоритм, пришедший в машинное обучение прямиком из статистики. Её хорошо использовать для задач бинарной классификации (это задачи, в которых на выходе мы получаем один из двух классов).
Логистическая регрессия похожа на линейную тем, что в ней тоже требуется найти значения коэффициентов для входных переменных. Разница заключается в том, что выходное значение преобразуется с помощью нелинейной или логистической функции.
Логистическая функция выглядит как большая буква S и преобразовывает любое значение в число в пределах от 0 до 1. Это весьма полезно, так как можно применить правило к выходу логистической функции для привязки к 0 и 1 (например, если результат функции меньше 0.5, то на выходе получаем 1) и предсказания класса. Пример логистической функции представлен на рисунке 3.
Рисунок SEQ Рисунок \* ARABIC 3 – Логистическая регрессия
Благодаря тому, как обучается модель, предсказания логистической регрессии можно использовать для отображения вероятности принадлежности образца к классу 0 или 1. Это полезно в тех случаях, когда нужно иметь больше обоснований для прогнозирования.
2.3 Линейный дискриминантный анализ (LDA)Логистическая регрессия используется, когда нужно отнести образец к одному из двух классов. Если классов больше, чем два, то лучше использовать алгоритм LDA (Linear discriminant analysis).
Представление LDA довольно простое. Оно состоит из статистических свойств данных, рассчитанных для каждого класса. Для каждой входной переменной это включает:
1. Среднее значение для каждого класса;
2. Дисперсию, рассчитанную по всем классам.
Рисунок SEQ Рисунок \* ARABIC 4 – Линейный дискриминантный анализ
Предсказания производятся путём вычисления дискриминантного значения для каждого класса и выбора класса с наибольшим значением. Предполагается, что данные имеют нормальное распределение, поэтому перед началом работы рекомендуется удалить из данных аномальные значения. Это простой и эффективный алгоритм для задач классификации.
2.4 Деревья принятия решенийДерево решений можно представить в виде двоичного дерева, знакомого многим по алгоритмам и структурам данных. Каждый узел представляет собой входную переменную и точку разделения для этой переменной (при условии, что переменная – число).

Рисунок SEQ Рисунок \* ARABIC 5 – Деревья принятия решений
2.5 Наивный Байесовский классификаторНаивный Байес – простой, но удивительно эффективный алгоритм.
Модель состоит из двух типов вероятностей, которые рассчитываются с помощью тренировочных данных:
1. Вероятность каждого класса.
2. Условная вероятность для каждого класса при каждом значении x.
После расчёта вероятностной модели её можно использовать для предсказания с новыми данными при помощи теоремы Байеса. Если в наличии вещественные данные, то, предполагая нормальное распределение, рассчитать эти вероятности не составляет особой сложности.
Рисунок SEQ Рисунок \* ARABIC 6 – Наивный Байесовский классификатор
Наивный Байес называется наивным, потому что алгоритм предполагает, что каждая входная переменная независимая. Это сильное предположение, которое не соответствует реальным данным. Тем не менее данный алгоритм весьма эффективен для целого ряда сложных задач вроде классификации спама или распознавания рукописных цифр.
2.6 K-ближайших соседей (KNN)К-ближайших соседей – очень простой и весьма эффективный алгоритм. Модель KNN (K-nearest neighbors) представлена всем набором тренировочных данных.
Предсказание для новой точки делается путём поиска K ближайших соседей в наборе данных и суммирования выходной переменной для этих K экземпляров.
Вопрос лишь в том, как определить сходство между экземплярами данных. Если все признаки имеют один и тот же масштаб (например, сантиметры), то самый простой способ заключается в использовании евклидова расстояния – числа, которое можно рассчитать на основе различий с каждой входной переменной.

  • Для учеников 1-11 классов и дошкольников
  • Бесплатные сертификаты учителям и участникам

V районная научно-исследовательская конференция

Обучающихся общеобразовательных организаций

Октябрьского муниципального района

Тема работы

Машинное обучение

Автор: Сагатдинов Эмиль Эдуардович

Руководитель: Сычёва Ольга Ивановна,

Что такое машинное обучение ………………………..……..4

Алгоритмы машинного обучения ………………………. 5-7

История машинного обучения …………………………. 7-10

Применение машинного обучения в социальной сфере.10-11

Применение машинного обучения для исследования…..11-12

Перспективы машинного обучения ……………………. 12-13

Проблемы машинного обучения …………………………13-14

Список литературы и других источников…………..……. 18

(Michel, 1996)

В окружающем нас мире происходит невероятный технологический прорыв. И название ему – машинное обучение.

Мы живём в эпоху алгоритмов. Сегодня алгоритмы проникли во все уголки нашей жизни. Технология машинного обучения открывает широкие возможности для автоматизации, компьютеры учатся видеть текст, обрабатывают огромные массивы данных, упрощая жизнь людям. Алгоритмы нашли себе место в мобильных телефонах и ноутбуках, в автомобилях, квартирах, бытовой технике, игрушках и многом другом.

Я заинтересовался машинным обучением, так как это самая востребованная технология настоящего и близкого обозримого будущего.

Многие люди опасаются данной технологии, утверждая, что машинное обучение опасно и из-за него в будущем может произойти повторения сюжета некоторой научной фантастики – захват человечества искусственным интеллектом.

Цель исследования - изучение возможностей машинного обучения как метода превращения данных в знания, истории его возникновения и знакомство с передовыми технологиями в этой области.

Определение основных подходов к пониманию, что такое машинное обучение.

Изучение алгоритмов машинного обучения.

Знакомство с историей машинного обучения.

Изучение применение машинного обучения.

Изучение перспектив машинного обучения.

Анализ проблем машинного обучения.

Гипотеза работы: Очевидно, машинное обучение не станет причиной порабощения человечества искусственным интеллектом.

Анализ, синтез, обобщение справочной и научной литературы, представленной в различных источниках.

Составление и проведение социологического опроса.

Обработка полученных результатов и формулировка выводов.

Продукт моего исследования - брошюра с рассказом о том, что же такое машинное обучение.

Что такое машинное обучение

В связи с тем, что в России, как и во всем остальном мире, чрезвычайно востребовано машинное обучение, знание принципов машинного обучения и программирования для выбора будущей профессии является актуальным.

По опубликованным данным, в США в 2018 году имелся дефицит специалистов по машинному обучению в 140 -190 тысяч человек. О нашей стране такие сведения не публиковались.

Машинное обучение – подраздел искусственного интеллекта, изучающий создание алгоритмов, способных к самообучению. Существует два типа машинного обучения: индуктивное обучение, которое основано на анализе данных и выявлению общих закономерностей, и дедуктивное обучение, при котором знания экспертов переносится в компьютер в виде базы данных. Для машинного обучения требуется две вещи: данные, на которых будет обучаться алгоритм, и цель, которой требуется достичь .

При обучении без учителя у нас есть только данные, закономерности в которых мы и хотим найти.

В отличии от обычных алгоритмов, которые используя данные, поступающие в него, выдает определенный результат, машинное обучение используя данные и желаемый результат, создает алгоритмы, которые используя полученные данные приходят к желаемому результату, а после полученный алгоритм можно использовать для подобных задач и получения нового результата.

Благодаря этому, у программистов отпадает необходимость, каждый раз писать подобные алгоритмы, ведь можно написать программу, которая решит за него поставленную задачу. Не зря говорят, что если вы ленивый и не слишком сообразительный компьютерщик, то машинное обучение для вас - идеальная специальность.

hello_html_1263566e.jpg

Таким образом,в рамках рассматриваемой гипотезы, можно сделать вывод машинное обучение – это самосовершенствующийся алгоритм, который создаётся для решения конкретной задачи по обработке данных и не может быть равным интеллекту человека.

Алгоритмы машинного обучения

В машинном обучении применяются методы, созданные задолго до его появления, каждый из которых предназначен для узкого спектра задач, к примеру, задачи классификации, регрессии или кластеризации. И целью программиста, использующего эти алгоритмы, является обучение алгоритма под его нужды.

Наиболее простым и понятным алгоритмом машинного обучения является линейная регрессия. Математически данный алгоритм можно представить в виде уравнения прямой, наиболее точно отражающей взаимосвязь между входными переменными (х) и выходными переменными ( y ), для составления данного уравнения необходимо найти некие коэффициенты b . К примеру: y=* x +. Зная х нам нужно найти y , и цель данного алгоритма заключается в поиске значений и . Для оценки используются методы вроде линейной алгебры и метода наименьших квадратов[1].

hello_html_m2a186c35.jpg

Деревья принятия решений можно представить в виде двоичного дерева. Каждый узел этого дерева представляет собой входную переменную, а также точку разделения для этой переменной. Листовые узлы данного дерева – это выходные переменные, которые используются для предсказания. Предсказания осуществляются проходом по дереву от корневого узла к листовым и выводом значений на данном узле. Деревья легко обучаются и делают прогнозы, они точны для большого спектра задач и не нуждаются в особой подготовке данных.

hello_html_7a1472d3.jpg

Нейронные сети - алгоритм машинного обучения, созданный на основе организации и функционирования биологических нейронных сетей, данное понятие возникло при изучении процессов, происходящих в головном мозге. Первой попыткой были нейронные сети Питтса и Маккалока.[2] Искусственная нейронная сеть является системой соединенных и взаимодействующий между собой искусственных нейронов. Этот вид алгоритмов используется для прогнозирования, распознавания образов, управления и т. д.

hello_html_m2bbbbcbf.jpg

Локально-зависимое хеширование – алгоритм понижения размерности многомерных данных. Суть этого алгоритма заключается в том, чтобы сгенерировать хеш-функцию для некоторых векторов так, чтобы подобные точки с наивысшей вероятностью оказывались в одной группе. Применяется данный метод в задачах кластеризации и поиске ближайшего соседа.

hello_html_m29947028.jpg

Наивная байесовская классификация – это простые вероятностные классификаторы, которые берут начало из теоремы Байеса, которая в данном случая рассматривает данные как независимые друг от друга.

hello_html_m7da697a1.jpg

Это лишь первый основной список существующих алгоритмов, на практике же их применяется гораздо больше, более того, регулярно появляются новые алгоритмы, созданные под специфические задачи. Отсюда следует вывод, что машинное обучение направлено на решение специфических, а не универсальных задач. Основная цель машинного обучения – освободить человека от выполнения рутинных функций по сравнению, подбору, контролю данных. Решение универсальных задач – это область деятельности человеческого мозга. Машина, какой бы совершенной она не была, не может генерировать идеи.

История машинного обучения

Попытки создания искусственного интеллекта и управления им активно предпринимались в 40-х годах прошлого века:

В 1943 году Уоррен Мак-Калок и Уолтер Питтс формализовали понятие нейронной сети и представили его в виде электрической цепи.

В 1948 году Норберт Винер опубликовал книгу о кибернетике, основной идеей которой было представление сложных биологических процессов математическими моделями.

В 1949 Дональд Хебб предложил первый алгоритм обучения.

Первопроходцами машинного обучения были Артур Сэмюэль, Джозеф Вейцбаум и Фрэнк Розенблатт, в 1958 году создавший однослойный перцептрон, первую искусственную нейронную сеть, его разработка обрела известность в распознавании образов и прогнозирования погоды. Первый получил широкую известность созданием в 1952 году самообучающейся программы Checkers-playing, умевшей, как следует из названия, играть в шашки.

Значимым оказалось его участие вместе с Дональдом Кнутом в проекте TeX, результатом которого стала система компьютерной верстки, вот уже почти 40 лет не имеющая себе равных для подготовки математических текстов. Второй в 1966 году написал виртуального собеседника ELIZA, способного имитировать (а скорее, пародировать) диалог с психотерапевтом; очевидно, что своим названием программа обязана героине из пьесы Бернарда Шоу. А дальше всех пошел Розенблатт, он в конце 50-х в Корнельском университете построил систему Mark I Perceptron, которую можно признать первым нейрокомпьютером.

В 1969 М. Минский опубликовал формальное доказательство ограниченности перцептрона, показав, что некоторые задачи, связанные с инвариативностью представлений, он решить не способен, после этого интерес к нейронным сетям падает.

За последующие 30-40 лет усилиями академически ориентированных ученых машинное обучение было превращено в самостоятельную математическую дисциплину.

Начало первого десятилетия XXI века оказалось поворотной точкой в истории машинного обучения, и объясняется это тремя синхронными тенденциями, давшими в совокупности заметный синергетический эффект.

Первая — Большие Данные. Данных стало так много, что новые подходы были вызваны к жизни не любознательностью ученых, а практической необходимостью.

Вторая — снижение стоимости параллельных вычислений и памяти. Эта тенденция обнаружилась в 2004 году, когда компания Google раскрыла свою технологию MapReduce, за которой последовал ее открытый аналог Hadoop (2006), и совместно они дали возможность распределить обработку огромных объемов данных между простыми процессорами. Тогда же Nvidia совершила прорыв на рынке GPU: если раньше в игровом сегменте ей могла составить конкуренцию AMD/ATI, то в сегменте графических процессоров, которые можно использовать для целей машинного обучения, она оказалась монополистом. И в то же время заметно уменьшилась стоимость оперативной памяти, что открыло возможность для работы с большими объемами данных в памяти и, как следствие, появились многочисленные новые типы баз данных, в том числе NoSQL. И, наконец, в 2014 году появился программный каркас Apache Spark для распределенной обработки неструктурированных и слабоструктурированных данных, он оказался удобен для реализации алгоритмов машинного обучения.

Последующие годы отмечены интенсивной работой многих ученых в области глубинных нейронных сетей (Deep Neural Network, DNN), однако детальный и желательно объективный анализ событий этого периода еще ждет своего исследователя. Считается, что собственно термин deep learning был предложен в 1986 году Риной Дехтер, хотя история его появления, видимо, сложнее .

В 2017 году компания Яндекс открыла для использования в свободном доступе свою систему машинного обучения – CatBoost . На сегодняшний день ей может воспользоваться любой желающий, на данный момент ее применяют внутри самой компании для ранжирования поисковой выдачи. Также данную систему используют в анализе данных Большого Адронного Коллайдера.

Вся история машинного обучения и уровень современных достижений в этой области подтверждает справедливость рассматриваемой гипотезы о том, что машинное обучение не станет причиной порабощения человечества искусственным интеллектом.

Применение машинного обучения в социальной сфере

Гост

ГОСТ

Общие сведения о машинном обучении

Искусственный интеллект – это совокупность различных технологических и научных решений и методов, позволяющих разрабатывать программы, действующие подобно человеческому интеллекту.

Машинное обучение – это набор методов в области искусственного интеллекта, предоставляющих алгоритмы для создания машин, обучающихся на собственном опыте. То есть это наука о том, как научить искусственный интеллект действовать подобно человеку, а также сделать так, чтобы он сам постоянно улучшал свои способности и принципы собственного обучения на основе предоставленных ему известных данных о реальном мире.

В качестве обучения машина обрабатывает огромные массивы входных данных в поиске определённых закономерностей. То есть, машина может находить различные закономерности в сложных и многопараметрических задачах (которые мозг человека не способен решить), отыскивая в результате более точные ответы на поставленные задачи.

С помощью применения методов машинного обучения можно научить компьютеры решать задачи, для которых не был предварительно построен человеком алгоритм их решения.

Иерархическая структура технологий искусственного интеллекта представлена на следующем рисунке:

Рисунок 1. Иерархическая структура технологий искусственного интеллекта. Автор24 — интернет-биржа студенческих работ

Глубокое обучение – это направление в области искусственного интеллекта (и, в частности, машинного обучения), которое основано на применении нейронных сетей, а также включает в себя исследование и разработку алгоритмов для машинного обучения.

Готовые работы на аналогичную тему

Методы глубокого обучения позволяют правильно организовывать представление данных на нескольких уровнях абстракции. Системы глубокого обучения за последние десять лет добились особых успехов в таких областях, как обнаружение и распознавание объектов, преобразование текста в речь и поиск информации.

Нейронная сеть позволяет при помощи искусственных нейронов моделировать работу человеческого мозга (нейронов), решающего конкретную задачу, а также самообучаться с учётом предыдущего опыта, с каждым разом совершая всё меньше ошибок.

Основные этапы исторического развития машинного обучения

В 1960-х годах проводились исследования, связанные с применением компьютерного зрения и использованием простых шаблонов распознавания.

Далее машинное обучение продолжало своё развитие и в 1997 году был создан компьютер Deep Blue, который сумел обыграть в шахматы чемпиона мира Гарри Каспарова.

В 21 веке появилось такое понятие, как глубокое обучение, а также было разработано много алгоритмов для распознавания содержимого на фотографиях и в видеороликах.

В 2016 году появилась программа AlphaGo, разработанная компанией DeepMind от Google, которая смогла победить чемпиона мира по игре в го Ли Седоля.

Также изучались вопросы, связанные с применением машинного обучения для анализа неструктурированных данных.

Современные результаты в области машинного обучения

Итак, с помощью машинного обучения искусственный интеллект может выполнять такие задачи, как:

  • анализ данных,
  • запоминание информации,
  • составление различных прогнозов,
  • воспроизведение готовых моделей,
  • выбор наиболее подходящих вариантов из предложенных.

Искусственный интеллект по многим параметрам превосходит возможности человека, но по-прежнему не способен сам ставить себе новые задачи и решать их, подбирая нужные данные и условия.

В настоящее время машинное обучение постоянно развивается, позволяя создавать компьютеры, которые могут обучаться, т. е. они могут делать то, на что не были изначально запрограммированы. Это поможет эффективно использовать компьютеры при решении рутинных и затратных операций.

Таким образом, машинное обучение – это эффективная технология будущего, которая будет полезной в различных сферах нашей жизни, таких как образование, здравоохранение, бизнес, экономика и др.

Получи деньги за свои студенческие работы

Курсовые, рефераты или другие работы

Автор этой статьи Дата написания статьи: 01 09 2021

Сергей Андреевич Дремук

Автор24 - это сообщество учителей и преподавателей, к которым можно обратиться за помощью с выполнением учебных работ.

Читайте также: