Магистерская программа по специальности “Наука о данных”

Программы магистратуры по специальности “Анализ данных” в торговле, бизнесе и финансах 2º

Мадридский университет Комплутенсе

Программа

Модуль I: Реляционные базы данных

Что такое база данных и как ею управлять? Введение от проектирования до моделирования и архитектуры. Изучение языка структурированных запросов (SQL) и таких инструментов, как Server Management Studio

Модуль II: Языки программирования

В данном модуле студент продвигается в области статистического и прогнозного анализа в специализации эксперта по большим данным. Этот модуль предлагает полное погружение в основы программирования, без необходимости предварительных знаний.

Модуль III: Базы данных NoSQL

Как использовать и моделировать базы данных NoSQL структурированного хранилища? Различные модели NoSQL, для чего они используются и когда это необходимо, оперативная установка моделей MongoDB; проекция полей в результатах и операциях CRUD.

Модуль IV: Бизнес аналитика

Работа с аналитическими навыками студента и его умение вести себя в бизнес среде. Предварительный анализ и визуализация данных – основное направление этого модуля.

Модуль V: Основы статистики

Статистика позволяет проанализировать извлеченные данные. Данный модуль – посвящен инструменту, который специалист по большим данным должен освоить, уделяя особое внимание описательной статистике и логическому выводу, который позволит студенту идентифицировать свойства набора из небольшой выборки.

Модуль VI: Технологии больших данных

Благодаря большим данным происходит огромный прорыв в сфере Интернета вещей (IoT). Модели взаимодействия с другими источниками данных через посредники и концентраторы сообщений: ознакомление с системой Spark для показа отображения шаблонов программирования и в Hadoo, которая управляет большими данными. Введение в визуализацию данных.

background banner

Модуль VII: Hadoop and Spark

Студенты в течение данного модуля приобретут панорамное видение HDFS, его архитектуры и использования через командную строку. На сегодняшний день это фундаментальная система хранения в мире больших данных, поэтому студенту нужно изучить его и работать с ним. 

Модуль VIII: Сбор данных и Прогнозирующее моделирование

Невозможно понять значение Больших Данных в рамках бизнеса без их прогностических моделей. Студенты будут продвигаться в знании и практике инструментов сбора и анализа данных, алгоритмов линейной регрессии и логистики, неконтролируемой классификации кластера, кластерного анализа, системы показателей…

Модуль IX: Машинное обучение

Введение в методы автоматического обучения – область, которая предоставляет большие возможности для управления, автоматизации и анализа обогащенных данных. Изучение деревьев решений, случайных лесов, алгоритма KNN, нейронных сетей и глубокого обучения.

Модуль X: Глубокое обучение

Процесс машинного обучения происходит посредством использования искусственной нейронной сети, состоящей из нескольких иерархических уровней. Данный модуль разделен на 4 части: нейронные сети, сверточные сети, рекуррентные сети и автоэнкодеры. Более глубокое погружение в предмет приветствуется.

Модуль XI: Сбор текста

Обработка текстов как анализ неструктурированной или наполовину структурированной информации. Извлечение данных из письменных источников является одним из наиболее быстро развивающихся сфер благодаря таким инструментам, как язык R. Практика в методах анализа настроения, тематических моделей или анализа мнений.

Модуль XII: Социальные медиа и большие данные

Мнения, собранные с социальных сетей, предлагают ценную информацию для бизнеса. Бесплатное программное обеспечение, такое как Paiek, облегчает анализ данных  социальных сетей, позволяя классифицировать или измерять агентов  каждой соц.сети.

Модуль XIII: Scala

Scala – это язык программирования, ориентированный на объекты, похож на Java, обладает характеристиками функционального языка. Spark- одна из платформ, которые используются для обработки данных в Big Data, построена с помощью Scala.

Модуль XIV: Расширенная визуализации и инструменты

Специалист по большим данным сможет извлечь максимальную пользу из своей работы, только если научится правильно передавать ее. Этот модуль посвящен инструментам визуализации: дизайну карты с помощью R, интерактивному представлению с помощью Shiny, графической грамматике с помощью Ggplot2, введению в D3 и Tableau.

Модуль XV: Data Science применяемый к бизнесу и предпринимательству в бизнесы больших данных

Студенты будут обучаться в реальных бизнес-ситуациях: создание научных команд и организация проекта по обработке данных. Они разработают стартап, который использует большие данные в качестве ценностного предложения.

i

Модуль XVI: Окончание конечного проекта магистерской программы

Чтобы усвоить все полученные знания, студент должен разработать целостную стратегию интеллектуального анализа данных для организации, используя как можно больше инструментов и процессов, которым он обучался.

Степень магистра 360º - образование, которое открывает двери в лучшие компании; и опыт, который вы смело можете применить в самых престижных компаниях индустрии

*** NTIC Master оставляет за собой право редактировать, удалять и обновлять программу.