ПРАКТИКА ПРЕПОДАВАНИЯ ДИСЦИПЛИНЫ "МЕТОДЫ МАШИННОГО ОБУЧЕНИЯ" МАГИСТРАНТАМ ИТ-НАПРАВЛЕНИЙ

Прием тезисов завершен. Вы можете только разместить черновик.
Авторы: Сараев Павел Викторович, Доктор технических наук, Доцент, Галкин Александр Васильевич, Кандидат технических наук, Доцент
Липецкий государственный технический университет
В магистратуре по ИТ-направлениям в ЛГТУ читается курс «Методы машинного обучения». Дисциплина призвана привить магистрантам навыки применения методов математического моделирования, статистики к анализу реальных данных. Для повышения понимания сути дисциплины предлагаются курсовые работы по решению реальных практических задач. Данные можно взять их открытых источников, например, UCI Machine Learning. В ходе обучения решались и реальные задачи Липецкого филиала ПАО "РосТелеком".

В настоящее время в Липецком государственном техническом университете выпускники ИТ-направлений бакалавриата могут продолжить обучение по двум основным ИТ-направлениям магистратуры. К ним относятся направления 09.04.01 «Информатика и вычислительная техника» и 01.04.04 «Прикладная математика».

Оба направления магистратуры реализуются на разных кафедрах одного факультета – автоматизации и информатики. В целях оптимизации учебного процесса определены общие дисциплины, которые реализуются в одинаковом объеме магистрантам обоих направлений. К одной из таких дисциплин с 2015/2016 учебного года относится дисциплина «Методы машинного обучения» в объеме 4 зачетных единиц. Дисциплина призвана привить магистрантам навыки применения методов математического моделирования, статистики, многомерного анализа данных, интеллектуальных систем к анализу реальных данных.

В данной дисциплине выделены следующие разделы: основные задачи машинного обучения, методы классификации данных, методы кластеризации данных, нейронные сети, снижение размерности описания данных, программное обеспечение для машинного обучения. Некоторая часть материала изучается студентами в дисциплинах бакалавриата, однако, это не является обязательным. Основные входные требования к магистрантам: знание и понимание основных методов современной математики и владением методами алгоритмизации и программирования. Данные компетенции развиваются, в частности, при обучении по всем ИТ-направлениям бакалавриата.

Основное внимание уделяется не реализации методов машинного обучения и анализа данных, а умению искать, выбирать, применять и анализировать результаты стандартных методов. Для решения этой задачи в учебном процессе по дисциплине применяется специальное открытое программное обеспечение для анализа данных – язык R. К его достоинствам относится реализация многих мощных и удобных функций для предварительной обработки массивов данных. В настоящее время реализовано огромное количество пакетов с функциями машинного обучения и анализа, доступных, например, на CRAN.

Для повышения понимания сути дисциплины магистрантам предлагаются курсовые работы по решению реальных практических задач. Многие из задач можно взять их открытых источников, в частности, из базы UCI Machine Learning. Недостатком данных задач является оторванность большинства их них от интересов российского студенчества. Также сложность вносит языковой барьер и отсутствие консультанта-специалиста в некоторой предметной области.

В ходе обучения решались также реальные задачи, поставленные руководством липецкого филиала ПАО «РосТелеком». На предприятиях-телекоммуникационных предприятиях, как нигде, многие задачи включают огромные массивы данных. В частности, решались задачи определения уровня и характера отказов в IP-телевидении. На основе огромного массива данных о событиях и дефектах качества передачи, замираний и рассыпаний, требовалось разработать алгоритм и систему для анализа, на каком уровне происходят сбои – на уровне конкретного пользователя, узла, кросса, канала и т.д.

Другой задачей был задача определения причин оттока абонентов на основе данных о качестве предоставления услуг, жалоб пользователей. К сожалению, в данной задаче не было возможности учесть различные тарифы планов компаний-конкурентов, что не позволило построить достоверную классификационную модель причин оттока абонентов.

Еще одной задачей являлось определение абонентов, пользующихся услугами ADSL, для которых возможен переход на тариф с более высокой скоростью передачи информации. При этом существенным моментом являлся учет технических возможностей оборудования. При решении данных задач идентифицировались сопутствующие проблемы, связанные, например, с некорректностью ввода информации, вносимой операторами соответствующих информационных систем.

Все задачи решались с использованием средств языка R и его пакетов. Следует отметить, что при работе над реальными задачами обязательна связка «студент-преподаватель-специалист».

Вид представления доклада  Устное выступление и публикация
Уровень  Магистратура
Ключевые слова  магистратура, практика преподавания, машинное обучение, взаимодействие с работодателями

По вопросам спонсорского участия, оплаты участия коммерческих компаний, а также иным организационно-информационным вопросам просьба обращаться в организационный комитет по адресу: dea@ito.edu.ru, edu@apkit.ru или по телефону: +7 (925) 514-33-74.