Дата-сайентист
«Вопрос, который я ставлю, очень прост: почему конфиденциальность нашей личной информации в интернете должна отличаться от конфиденциальности того, что мы храним в ящике стола? Не может быть никакой разницы между цифровой информацией и информацией физической. Но США и многие другие страны стремятся эту разницу узаконить».
Эдвард Сноуден, бывший сотрудник АНБ США
Дата-сайентист — профессия относительно новая, но уже сегодня она становится все более востребованной. Так, по версии рекрутинговой веб-платформы Glassdoor, в 2020 году эта специальность заняла второе место в рейтинге самых перспективных и высокооплачиваемых профессий в США.
Понятие data science настолько обширно и универсально, что сложно дать ему краткое определение. Чтобы представить себе, что это, вообразите следующую картину: существует некий огромный архив с личным делом на каждого интернет-пользователя, куда заносится не только информация из профилей социальных сетей, но и любая деятельность человека в веб-пространстве. Посещаемые сайты, интернет-покупки, электронные письма, геолокация и даже платежные операции по банковской карте — все заносится в вашу «папку». В архиве хранятся миллионы, если не миллиарды личных дел. Что же делать с таким объемом информации? В этом и состоит задача дата-саентиста.
Властитель данных
Интернет помнит все
Личные переписки тоже становятся источником прибыли для крупных IT-компаний. Если вы ознакомитесь с любым соглашением конфиденциальности Google, то узнаете, что компания читает все ваши электронные письма при помощи автоматизированных алгоритмов. Делается это для того, чтобы контекстно собирать информацию о предпочтениях пользователя.
«Экономика внимания» в данный момент стала основной бизнес-моделью успешных корпораций, и все мы так или иначе в ней участвуем. Помните цитату из документального фильма Netflix The Social Dilemma: если мы не платим за товар, то товаром становимся мы сами? Пожалуй, данное высказывание лучше всего описывает алгоритм «экономики внимания». Пользуясь любым приложением или сервисом, мы всегда заключаем сделку, в которой платой становятся наши данные, позже используемые в target-стратегиях. И, что самое интересное, все это прописано в лицензионных соглашениях, с которыми мы обычно соглашаемся, даже не читая. Для неподготовленных пользователей это становится откровением. Но ведь и сами пользователи порой забывают, что получают в обмен на свои данные огромный спектр возможностей! Чем больше сервисов вы используете, тем больший «фидбек» получаете от IT-корпораций.
Профессия дата-сайентиста напрямую связана со сбором и сортировкой данных. Опытный профессионал может не только отыскать в базе любую мелочь, но и на основе найденной информации составить прогноз о поведении пользователя. Но эта специальность не связана с бизнес-аналитикой, а лишь является ее вспомогательным и теперь уже неотъемлемым инструментом. Вместе со спросом на профессионалов в сфере data science возрастает также и уровень их ответственности.

Полезные ссылки
1. Хотите увидеть как Обама читает рэп или нейросеть пишет музыку? Да-да, это тоже работа дата-сайентиста — https://www.youtube.com/watch?v=Ac6kDNMQK3c
2. Что нужно сделать, чтобы стать дата-сайентистом? Эксперт отвечает на 13 главных вопросов — https://zeh.media/praktika/professiya/8634052-khochu-stat-data-sayentistom-chto-nuzhno-delat-15-glavnykh-voprosov-o-tom-kak-uchitsya-data-science
3. Что выбрать, чтобы стать дата-сайентистом: самообразование, онлайн-курсы или вуз? В статье вы также найдете крутые теоретические книги о профессии — https://blog.skillfactory.ru/chto-vybrat-chtoby-stat-data-sajentistom-samoobrazovanie-onlajn-kursy-ili-vuz/
Крутые теоретические книги по профессии:
1. «(Не)совершенная случайность», Леонард Млодинов. Увлекательная книга о теории вероятности, роли случая и закономерности в нашей жизни.
2. «Голая статистика», Уилан Чарльз. Автор доказывает, что статистика — совсем не скучная, и на живых примерах конкретных компаний объясняет, как работают большие данные.
https://www.mann-ivanov-ferber.ru/books/golaya-statistika/
3. «О чем говорят цифры», Том Дэвенпорт и Ким Джин Хо. Книга о том, как сбор данных пригождается в реальной жизни и бизнесе.
https://www.mann-ivanov-ferber.ru/books/o_chem_govoryat_cifry/