Наука о данных – факты и мифы

Информация окружает нас повсюду. Она поступает постоянно с растущей скоростью, и ее объем постоянно растет. Каждый раз, когда вы используете свой смартфон, делаете покупки в магазине или в Интернете, или смотрите что-нибудь по телевизору, вы создаете потенциально полезные данные или цифровую информацию.

Этот огромный ресурс, называемый «большие данные», иногда характеризуют как “новая нефть” цифровой экономики. Он содержит ценность, которую можно превратить в мощный инструмент эффективного развития практически любой организации и любого сегмента экономики 21 века.

Чтобы использовать эту ценность, нужны специалисты, умеющие обрабатывать и анализировать массивы разнородной информации из разных источников. Они выявляют логические связи и скрытые закономерности, обнаруживают ключевые факторы и тенденции, делают выводы и прогнозы и извлекают полезную информацию и знания для принятия обоснованных решений.

По прогнозам аналитической компании IDC, к 2025 году объем всех данных в мире составит 163 зеттабайт, а еще в 2006 году объем всей информации за всю историю человечества составил 0,16 зеттабайт (для справки: 1 зеттабайт равен 10²¹ байтов). Поскольку объем информации продолжает расти, нам нужно больше специалистов, способных в большей степени раскрыть и использовать потенциал полезной и ценной информации, содержащейся в данных.

Быть специалистом по работе с данными – значит заставить данные работать и приносить пользу в решении практических задач. Неудивительно, что специальности, связанные с наукой о данных, относятся к самым популярным и высоко востребованным в 21 веке. Несмотря на это, науку о данных и профессии этой сферы окружает много путаницы и мифов.

Давайте внесем ясность.


1. Для работы с данными нужно быть выдающимся математиком.
Это Миф

Для работы с данными необходим набор навыков, который не так уж часто встречается в одном человеке. Однако математические сверхспособности здесь вовсе не требуются. Знание математики и понимание статистики, действительно, очень полезны, так как специалисты по данным применяют математические модели и методы статистического анализа. Кроме того, математика развивает способность мыслить логически и решать задачи, что крайне важно для выявления неочевидных связей и закономерностей и прогнозирования, которые помогают извлечь из массива данных полезную информацию для дальнейшего принятия обоснованных решений. Однако работа с данными требует гораздо большего, в частности, понимания специфики сферы постановки задачи (будь то банковский сектор, страхование, медицина или любая другая отрасль), без которого полученные результаты будут практически бесполезны.

2. Работа с данными и программирование – это одно и то же.

Это Миф

Недаром говорят, что специалисты по работе с данными программируют лучше статистиков и разбираются в статистике лучше программистов. Программирование - важный и ожидаемый при устройстве на работу навык для работы с данными, но главным его назвать нельзя. Более того, не требуется и глубоких всесторонних знаний в этой области – достаточно, во всяком случае, на начальном уровне, знать один из языков программирования, например, очень популярный и широко используемый Pithon, легкий в изучении и к тому же содержащий библиотеки для работы с данными и машинным обучением.

В набор основных навыков, необходимых для работы с данными, на равных правах входят математика, статистика, программирование, умение работать с базами данных, применять методы машинного обучения для решения практических задач и визуализировать данные для передачи результатов.

3. Для работы с данными нужны только технические навыки.

Это Миф

Технических навыков недостаточно. Работа с данными требует целого ряда гибких навыков. Один из ярких примеров - коммуникативные навыки. Они жизненно необходимы для работы с данными. И в этом нет ничего удивительного. Специалисты по данным, как правило, работают в командах, в которые входят люди как технических, так и не технических специальностей. Они общаются с клиентами, а также профессионалами предметной области, гораздо лучше разбирающимися в различных аспектах задачи, которую надо решить с помощью данных. И, наконец, им нужно понятно и убедительно представить результаты своей работы, объяснив, как и почему они принесут пользу, иначе работа проделана зря.

4. Инженер данных, администратор данных, аналитик данных, исследователь данных – это разные названия одной и той же специальности.

Это Миф

Эти специальности и в самом деле во многом пересекаются, но между ними есть целый ряд важных отличий.  

  •  Инженеры данных занимаются проектированием, созданием, тестированием и обслуживанием инфраструктуры для работы с данными и разрабатывают конвейеры обработки данных для аналитиков и исследователей данных.
  •  Администраторы данных  занимаются управлением баз данных и отвечают за доступность и безопасность данных.
  •  Аналитики данных занимаются сбором и подготовкой (выборка, очистка, сортировка) данных к анализу для поиска закономерностей и трендов, а также визуализацией результатов с целью представления ценной информации для дальнейшего принятия решений.
  •  Исследователи данных, как и аналитики, занимаются поиском закономерностей в наборах данных и визуализацией данных, но в большей степени используют модели и алгоритмы машинного обучения и других подвидов искусственного интеллекта для прогнозов на основе данных.

Узнайте больше о ролях и обязанностях в мире данных >>

5. Работа с данными популярна, перспективна и хорошо оплачиваема.

Это Факт

Работа с данными считается одной из самых привлекательных профессий 21 века. Она постоянно возглавляет рейтинги высоко востребованных вакансий, и, по прогнозам экспертов, это долговременная тенденция. Объем информации продолжает расти, и, учитывая, что по оценкам, на сегодняшний день проанализировано менее 1% всей имеющейся информации, а защищено менее 20%, работы для специалистов по данным хватит на многие годы и десятилетия. Они уже работают во многих отраслях и организациях, которые принимают ключевые решения на основе данных. Проверьте подходит ли вам работа с данными , тем более, что спрос все еще превышает предложение. 


 

Познакомьтесь с ключевыми понятиями при работе с данными и узнайте больше о ролях и обязанностях различных специалистов, работающих в этой сфере, в бесплатном онлайн - курсе Основы данных в Azure: ключевые понятия при работе с данными на платформе Microsoft Learn