thumb
Фото: insblogs.com

28 мая 2015 года в Высшей школе экономики прошла лекция профессора Технического университета Эйндховена  Вила ван дер Аалста по теме  «Data Science: The Science of Big Data». По мнению эксперта, для решения задач анализа данных современные высшие учебные заведения должны готовить кадры по принципиально новым учебным программам. Именно поэтому во всем мире развивается синтетическая профессия «исследователь данных». Исследователи данных должны обладать навыками и знаниями из нескольких разнородных областей: компьютерных наук и программирования, математических методов, а также бизнес-администрирования и управления. Подобные синтетические специальности всегда очень востребованы, но и сложны в освоении. Ключевыми методами анализа данных сегодня являются машинное обучение, data mining, process mining, визуальная аналитика, анализ временных рядов и другие. Таким образом, науки о данных, по мнению эксперта, как бы заполняют собой разрыв между классической математикой и прикладными компьютерными методами.

Актуальность и востребованность зарождающейся специальности подтверждается постоянно увеличивающимся спектром предложений в сфере онлайн-образования. На онлайн-платформе Coursera размещено 12 образовательных программ по освоению специальностей, так или иначе связанных с big data, а также несколько десятков отдельных курсов, ориентированных на изучение и использование инструментов анализа больших данных.

С февраля по май 2015 года в центре «Digital October» проходил  трехмесячный интенсив для IT-специалистов по программе «Специалист по большим данным», программа которого строилась на трех практических кейсах:

  1. Создание мультиклассных классификаторов
  2. Анализ социальных графов
  3. Разработка рекомендательных систем.

Преподавателями программы стали представители Яндекса, Сбербанка, Spotify, Data-Centric Alliance, МТС, Oracle и многих других компаний.

Специалисты Агентства стратегических инициатив в опубликованном в 2015 году «Атласе новых профессий» в качестве одной из наиболее перспективных профессий также отмечают «Разработчика моделей Big Data». В «Атласе» он описывается как «специалист, который проектирует системы сбора и обработки больших массивов данных, получаемых через Интернет, разрабатывает интерфейсы сборки и сами аналитические модели».

Интерес к новой профессии проявляется сейчас не только среди организаций и учреждений, предоставляющих образовательные услуги, но и со стороны бизнес-сообщества. По данным HeadHunter, в настоящее время порядка 2500 тысяч компаний находятся в поиске специалистов, работа которых так или иначе может быть связана с большими данными.

Тренд исследования и использования инструментов Big Data начал распространятся в научной среде с 2008 года после серии публикаций в журнале Nature, и уже с 2010 года в IT-бизнесе, после выпуска первых продуктов и инструментов обработки больших данных.

В сфере высшего образования данную тенденцию подхватили зарубежные университеты и небольшая часть российских вузов, но в целом сфера высшего образования в России пока остается в стороне от данного значимого тренда, напрямую связанного с происходящей цифровой революцией.

О Big Data:

По мнению специалистов компании «Конструктивная кибернетика», чтобы система была отнесена к классу Big Data, недостаточно только гигантского объёма данных и высокого темпа их поступления в систему. Важный критерий – это неструктурированность и гетерогенность поступающих в систему данных. Методы и алгоритмы Больших Вычислений ориентируются на глубокую обработку данных, пытаясь выяснить не только статистически значимые закономерности, но и построить содержательные модели явления (объясняющую, предсказательную). Таким образом, тренд по обработке Больших Данных лежит в области осмысления, понимания сути явления, выраженного в массиве неструктурированных и гетерогенных данных.    

Текст подготовлен Дадашевой В.А.