• 26 ноября 2018, понедельник
  • Москва, Доброслободская, 5

Курс "Машинное обучение в R-Studio"

Регистрация на событие закрыта

Извините, регистрация закрыта. Возможно, на событие уже зарегистрировалось слишком много человек, либо истек срок регистрации. Подробности Вы можете узнать у организаторов события.

Другие события организатора

Школа Больших данных
2001 день назад
с 9:30 26 ноября до 17:30 30 ноября 2018
Москва
Доброслободская, 5

Данный курс предназначен для изучения алгоритмов машинного обучения с практическим применением техник машинного обучения реализованных в R. Рассматриваются понятия Data Mining, измерения производительности и уменьшения размерности, регрессионные модели, байессовская модель, SVM и ассоциативные правила для анализа. После успешного завершения данного курса вы сможете понимать и объяснять принципы работы алгоритмов машинного обучения и применять данные алгоритмы на реальных задачах в больших данных.

Предварительный уровень подготовки

Скачать подробную информацию можно на сайте 

www.bigdataschool.ru/bigdata/machin... 

Программа курса

  1. Основы статистики и простая линейная регрессия
    • Что такое ваши данные?
    • Статистические выводы
    • Введение в машинное обучение
    • Простая линейная регрессия
    • Диагностика и трансформация
    • Коэффициент определенности
    • Методы оценки моделей и производительности
  2. Базовое программирование с R (опционально)
    • Введение в R
    • Что такое R?
    • R-Studio, пакеты и рабочая область
    • Основные элементы языка R
    • Типы объектов данных
    • Введение функций и управляющих операторов
    • Функции
    • Программирование функций
    • Подключение библиотек в R-Studio
  3. Подготовка данных (опционально)
    • Принципы формирование Dataset (набор данных)
    • Локальный импорт / экспорт данных
    • Работа с отсутствующими данными (NA)
    • Категориальные данные
    • Формирование обучающего и тестового набора данных
    • Вопросы масштабирования и автоматизации
    • Препроцессинг данных
  4. Линейная регрессия и обобщенная линейная модель 
    • P-value – ошибки первого рода
    • Допущения и диагностика
    • Оценка максимального правдоподобия
    • Интерпретация модели
    • Оценка соответствия модели
    • Обобщенные линейные модели:
      • Простая линейная регрессия
      • Множественная линейная регрессия
      • Логистическая регрессия
      • Полиномиальная регрессия
    • Метод опорных векторов (SVR) и деревья решений
    • Деревья решений
    • Bagging
    • Случайные леса
    • Boosting
    • Важность переменной
    • Сортировка полей и поддержка векторного классификатора
    • Метод опорных векторов
    • Оценка производительности регрессионной модели
    • Коэффициенты линейной регрессии
  5. Алгоритмы классификации
    • Логистическая регрессия
    • Алгоритм ближайших соседей
    • Алгоритм K-ближайших соседей. Выбор К и меры расстояния
    • Наивный байессовский анализ и “проклятие размерности”
      • Условная вероятность: теорема Байеса
      • Оценка Лапласа
      • Уменьшение размерности
      • Процедура PCA
      • Ridge и регрессия Лассо
      • Перекрестная проверка.
    • Классификация с помощью деревьев решений
    • Классификация методом случайных деревьев
    • Оценка производительности классификационной модели
  6. Кластерный анализ
    • Кластерный анализ
    • K-means кластеризация
      • Выбор количества кластеров
      • Типовые ошибки при кластеризации
    • Иерархическая кластеризация. Принципы построения дендрограмм
  7. Ассоциативные правила
    • Правила Априори алгоритма
    • Основные приниципы и построение модели в R
  8. Машинные алгоритмы с переобучением (Reinforcement learning)
    • Верхняя граница достоверности (UCB – Upper Confidence Bound)
    • Примеры по Томпсону
    • Сравнение алгоритмов
    • Реализация алгоритмов в R
  9. NLP алгоритмы (Алгоритмы текстовой обработки)
    • Основы Natural Language Proccesing
  10. Глубокое Обучение (Deep Learning)
    • Отличие машинного обучение( Machine Learning) от глубокого обучения (Deep Learning)
    • Искуственные Нейронные Сети (Artificial Neural Networks):
      • План атаки
      • Нейроны
      • Активация нейронов
      • Как работают нейронные сети и персептроны
      • Сигмоидные нейроны
      • Сетевая топология и скрытые функции
      • Метод обратного распространения ошибки с градиентным спуском

Регистрация

Рекомендуемые события

Организуете события? Обратите внимание на TimePad!

Профессиональная билетная система, статистика продаж 24/7, выгрузка списков участников, встроенные инструменты продвижения, личный кабинет для самостоятельного управления и еще много чего интересного.

Узнать больше