ПРАКТИКА ПРЕПОДАВАНИЯ ДИСЦИПЛИНЫ "МЕТОДЫ МАШИННОГО ОБУЧЕНИЯ" МАГИСТРАНТАМ ИТ-НАПРАВЛЕНИЙ
В настоящее время в Липецком государственном техническом университете выпускники ИТ-направлений бакалавриата могут продолжить обучение по двум основным ИТ-направлениям магистратуры. К ним относятся направления 09.04.01 «Информатика и вычислительная техника» и 01.04.04 «Прикладная математика».
Оба направления магистратуры реализуются на разных кафедрах одного факультета – автоматизации и информатики. В целях оптимизации учебного процесса определены общие дисциплины, которые реализуются в одинаковом объеме магистрантам обоих направлений. К одной из таких дисциплин с 2015/2016 учебного года относится дисциплина «Методы машинного обучения» в объеме 4 зачетных единиц. Дисциплина призвана привить магистрантам навыки применения методов математического моделирования, статистики, многомерного анализа данных, интеллектуальных систем к анализу реальных данных.
В данной дисциплине выделены следующие разделы: основные задачи машинного обучения, методы классификации данных, методы кластеризации данных, нейронные сети, снижение размерности описания данных, программное обеспечение для машинного обучения. Некоторая часть материала изучается студентами в дисциплинах бакалавриата, однако, это не является обязательным. Основные входные требования к магистрантам: знание и понимание основных методов современной математики и владением методами алгоритмизации и программирования. Данные компетенции развиваются, в частности, при обучении по всем ИТ-направлениям бакалавриата.
Основное внимание уделяется не реализации методов машинного обучения и анализа данных, а умению искать, выбирать, применять и анализировать результаты стандартных методов. Для решения этой задачи в учебном процессе по дисциплине применяется специальное открытое программное обеспечение для анализа данных – язык R. К его достоинствам относится реализация многих мощных и удобных функций для предварительной обработки массивов данных. В настоящее время реализовано огромное количество пакетов с функциями машинного обучения и анализа, доступных, например, на CRAN.
Для повышения понимания сути дисциплины магистрантам предлагаются курсовые работы по решению реальных практических задач. Многие из задач можно взять их открытых источников, в частности, из базы UCI Machine Learning. Недостатком данных задач является оторванность большинства их них от интересов российского студенчества. Также сложность вносит языковой барьер и отсутствие консультанта-специалиста в некоторой предметной области.
В ходе обучения решались также реальные задачи, поставленные руководством липецкого филиала ПАО «РосТелеком». На предприятиях-телекоммуникационных предприятиях, как нигде, многие задачи включают огромные массивы данных. В частности, решались задачи определения уровня и характера отказов в IP-телевидении. На основе огромного массива данных о событиях и дефектах качества передачи, замираний и рассыпаний, требовалось разработать алгоритм и систему для анализа, на каком уровне происходят сбои – на уровне конкретного пользователя, узла, кросса, канала и т.д.
Другой задачей был задача определения причин оттока абонентов на основе данных о качестве предоставления услуг, жалоб пользователей. К сожалению, в данной задаче не было возможности учесть различные тарифы планов компаний-конкурентов, что не позволило построить достоверную классификационную модель причин оттока абонентов.
Еще одной задачей являлось определение абонентов, пользующихся услугами ADSL, для которых возможен переход на тариф с более высокой скоростью передачи информации. При этом существенным моментом являлся учет технических возможностей оборудования. При решении данных задач идентифицировались сопутствующие проблемы, связанные, например, с некорректностью ввода информации, вносимой операторами соответствующих информационных систем.
Все задачи решались с использованием средств языка R и его пакетов. Следует отметить, что при работе над реальными задачами обязательна связка «студент-преподаватель-специалист».
Вид представления доклада | Устное выступление и публикация |
Уровень | Магистратура |
Ключевые слова | магистратура, практика преподавания, машинное обучение, взаимодействие с работодателями |
По вопросам спонсорского участия, оплаты участия коммерческих компаний, а также иным