Дата-сайентист

«Вопрос, который я ставлю, очень прост: почему конфиденциальность нашей личной информации в интернете должна отличаться от конфиденциальности того, что мы храним в ящике стола? Не может быть никакой разницы между цифровой информацией и информацией физической. Но США и многие другие страны стремятся эту разницу узаконить».

Эдвард Сноуден, бывший сотрудник АНБ США

Дата-сайентист — профессия относительно новая, но уже сегодня она становится все более востребованной. Так, по версии рекрутинговой веб-платформы Glassdoor, в 2020 году эта специальность заняла второе место в рейтинге самых перспективных и высокооплачиваемых профессий в США. 

Понятие data science настолько обширно и универсально, что сложно дать ему краткое определение. Чтобы представить себе, что это, вообразите следующую картину: существует некий огромный архив с личным делом на каждого интернет-пользователя, куда заносится не только информация из профилей социальных сетей, но и любая деятельность человека в веб-пространстве. Посещаемые сайты, интернет-покупки, электронные письма, геолокация и даже платежные операции по банковской карте — все заносится в вашу «папку». В архиве хранятся миллионы, если не миллиарды личных дел. Что же делать с таким объемом информации? В этом и состоит задача дата-саентиста.

Властитель данных

Профессия дата-сайентиста предполагает знание важнейших основ взаимодействия с электронной информацией. Мы живем в цифровую эпоху, и в основном наша коммуникация происходит в интернет-пространстве. Поэтому стоит помнить основные правила поведения в сети.

Наверняка многие не раз сталкивались с новостями, что какая-то медийная личность, будь то артист или политик, руководствуясь эмоциональным порывом или же просто не подумав, поделилась в соцсетях какой-либо информацией, о чем позже могла пожалеть. После моментального редактирования личного профиля нежелательный пост исчезал со страницы владельца. Но не из интернета (как минимум, благодаря скриншотам)! Подобные прецеденты относятся не только к знаменитостям: любая информация, которая фигурировала в сети, навсегда останется в чьих-то руках.

Поэтому не стоит забывать о личной безопасности. Интернет уже тесно связан с нашей жизнью, а это значит, что информация всегда может попасть не в те руки. Количество и качество киберпреступлений возрастает с каждым годом, и на сегодняшний день любой благоразумный пользователь интернета должен уметь защищать свою информацию. Для этого уже существует множество сервисов по защите личных данных. Помните: если дата-сайентисту ничего не стоит узнать о ваших предпочтениях, то мошенникам будет легко ими воспользоваться.

Интернет помнит все

Личные переписки тоже становятся источником прибыли для крупных IT-компаний. Если вы ознакомитесь с любым соглашением конфиденциальности Google, то узнаете, что компания читает все ваши электронные письма при помощи автоматизированных алгоритмов. Делается это для того, чтобы контекстно собирать информацию о предпочтениях пользователя.

«Экономика внимания» в данный момент стала основной бизнес-моделью успешных корпораций, и все мы так или иначе в ней участвуем. Помните цитату из документального фильма Netflix The Social Dilemmaесли мы не платим за товар, то товаром становимся мы сами? Пожалуй, данное высказывание лучше всего описывает алгоритм «экономики внимания». Пользуясь любым приложением или сервисом, мы всегда заключаем сделку, в которой платой становятся наши данные, позже используемые в target-стратегиях. И, что самое интересное, все это прописано в лицензионных соглашениях, с которыми мы обычно соглашаемся, даже не читая. Для неподготовленных пользователей это становится откровением. Но ведь и сами пользователи порой забывают, что получают в обмен на свои данные огромный спектр возможностей! Чем больше сервисов вы используете, тем больший «фидбек» получаете от IT-корпораций.

Профессия дата-сайентиста напрямую связана со сбором и сортировкой данных. Опытный профессионал может не только отыскать в базе любую мелочь, но и на основе найденной информации составить прогноз о поведении пользователя. Но эта специальность не связана с бизнес-аналитикой, а лишь является ее вспомогательным и теперь уже неотъемлемым инструментом. Вместе со спросом на профессионалов в сфере data science возрастает также и уровень их ответственности. 

Полезные ссылки

1. Хотите увидеть как Оба­ма чи­та­ет рэп или ней­ро­сеть пи­шет му­зы­ку? Да-да, это тоже работа дата-сайентиста  https://www.youtube.com/watch?v=Ac6kDNMQK3c

2. Что нужно сделать, чтобы стать дата-сайентистом? Эксперт отвечает на 13 главных вопросов — https://zeh.media/praktika/professiya/8634052-khochu-stat-data-sayentistom-chto-nuzhno-delat-15-glavnykh-voprosov-o-tom-kak-uchitsya-data-science

3. Что выбрать, чтобы стать дата-сайентистом: самообразование, онлайн-курсы или вуз? В статье вы также найдете крутые теоретические книги  о профессии  — https://blog.skillfactory.ru/chto-vybrat-chtoby-stat-data-sajentistom-samoobrazovanie-onlajn-kursy-ili-vuz/

Крутые теоретические книги по профессии:

1. «(Не)совершенная случайность», Леонард Млодинов. Увлекательная книга о теории вероятности, роли случая и закономерности в нашей жизни.

https://www.ozon.ru/product/ne-sovershennaya-sluchaynost-kak-sluchay-upravlyaet-nashey-zhiznyu-26353552/?sh=ygWfEzwP

2. «Голая статистика», Уилан Чарльз. Автор доказывает, что статистика — совсем не скучная, и на живых примерах конкретных компаний объясняет, как работают большие данные.

https://www.mann-ivanov-ferber.ru/books/golaya-statistika/

3. «О чем говорят цифры», Том Дэвенпорт и Ким Джин Хо. Книга о том, как сбор данных пригождается в реальной жизни и бизнесе.

https://www.mann-ivanov-ferber.ru/books/o_chem_govoryat_cifry/