Программа курса
Часть 1. ОСНОВЫ РАБОТЫ С R
1. Введение в R
02.09.2015 История R. Краткий обзор возможностей. Литература. Установка. Арифметические операции. Имена объектов. Типы данных. Векторы, матрицы и массивы. Установка и запуск пакетов расширений. Последовательные операции (magrittr). Справка (?, виньетки, rdocumentation.org). Лабораторная работа №1.
2. Векторизация и управляющие структуры языка. Простейшее рисование
09.09.2015 Логическая индексация. Векторизация вычислений. Циклы и условные операторы. Функция plot. Параметры графика (par). Работа в среде (рабочее пространство, история команд, setwd, getwd). Функции, созданные пользователем. Строки: конкатенация (paste, paste0), разделение. Лабораторная работа №2.
3. Списки и таблицы
16.09.2015 Списки. Создание списков. Изучение содержимого (class, str). Доступ к элементам. Групповые операции (lapply, sapply). Списки как основа для таблиц. Таблицы. Создание. Объединение таблиц. Имена строк и столбцов. Выбор элементов. Наборы данных, поставляемые с R. Лабораторная работа №3.
4. Ввод и вывод данных. Продолжение графики
23.09.2015 Чтение строк из текстовых файлов (readLines). Чтение таблиц (read.table) и файлов специального вида (csv). Запись таблиц данных (write.table). Запись данных в текстовый файл (write). Запись и сохранения состояния произвольного объекта (save, load). Несколько графиков в общих осях и в разных осях. Графики в отдельных окнах. Графические устройства. Сохранение результатов рисования в файл. Строки: выделение, поиск и замена подстроки. Лабораторная работа №4.
5. КОНТРОЛЬНАЯ РАБОТА №1
07.10.2015
Часть 2. ИЗВЛЕЧЕНИЕ ДАННЫХ
6. Постановка задачи. Основные проблемы
30.09.2015 Примеры задач с Upwork.com. Необходимые навыки для их решения. Использование структуры документа. Виды задач по степени структурированности. Дальнейшая программа лекций. Литература по извлечению данных. HTTP-запрос. Динамическая генерация страниц. Основы HTML.
7. XPath и rvest
21.10.2015 Поиск информации по XPath. Абсолютный и относительный пути. Класс и идентификатор элемента. Пакет rvest. Основные функции. Пример работы. Лабораторная работа №5.
8. CSS-селекторы
28.10.2015 CSS. Элементы div и span. СSS-селекторы. Поиск их в браузере (Firefox, Firebug, Firepath). Пакет rvest - поиск по CSS-селекторам. Основы языков поисковых сервисов Google и Яндекс. Лабораторная работа №6.
9. Аутентификация. Регулярные выражения.
04.11.2015 Аутентификация в rvest. Регулярные выражения (base). Лабораторная работа №7.
10. Отображение данных на карте. Анализ текстов
11.11.2015 Пакет leaflet. Геокодирование (ggmap). Анализ текста (пакет tm). Стемминг. Создание простейшей поисковой системы. Лабораторная работа №8.
11. Управление браузером. Получение данных через API интернет-сервисов
25.11.2015 Управление браузером с помощью RSelenium. Авторизация с помощью OAuth. Создание приложения. Анализ твитов.
12. КОНТРОЛЬНАЯ РАБОТА №2
02.12.2015
Часть 3. ХВОСТЫ
13. Подведение итогов курса. Пересдача контрольной работы
09.12.2015
14. ЭКЗАМЕН
16.12.2015
Комментарии
comments powered by Disqus