Большие или умные данные?

Каждый клик в Сети оставляет за нами цифровой след: не важно – искали ли вы значение нового мема, поставили лайк соседскому коту или смотрели новую серию любимого сериала. И чем больше мы проводим времени в интернете, тем больше данных о нас собирают. В итоге «мистер Гугл» знает о вас куда больше, чем лучшие друзья.

«Данные – новая нефть» – это выраже­ние встречается довольно часто в совре­менном обществе. А почему бы и нет? Ведь без этой информации онлайн-сервисы просто не смогут функционировать. Да и мы в погоне за персонализированными приложениями сами с удовольствием делимся своими данными. А тут еще и интернет вещей все глубже внедряется в нашу жизнь. Тостер и тот с удовольствием дополняет ваш цифровой образ.

Как и зачем собираются данные, пожа­луй, не самый сложный вопрос. Конечно, для персонализации, таргетинга и всего другого. С развитием искусственного интеллекта эти данные стало возможным использовать в куда более полезных целях – в новых интеллектуальных сервисах. Так, например, какой-нибудь агростартап на основе полученных данных сможет подсказать где, когда и сколько нужно сеять пшеницы. При этом тенденция умных сервисов продолжает расти: увеличива­ются вычислительные мощности, деше­веют датчики и железо, разрабатываются мощные инструменты для машинного обучения и т. д. Важно отметить, что все эти решения доступны на рынке. Однако дале­ко не каждый сервис будет рад поделиться своим самым важным ресурсом – данны­ми. В открытом доступе находится пример­но 20% данных, остальные же хранятся на внутренних ресурсах компаний.

Вся чудодейственная сила данных заключается в возможности усовершен­ствовать продукт и привлечь пользо­вателей, причем не важно, торгуете ли вы цветными карандашами в Сети или стараетесь продвинуть свое приложе­ние в App Store. Лидерство касательно развития ИИ таких гигантов, как Amazon, Google и Facebook, во многом объясня­ется количеством данных, которыми они владеют для создания и обучения «ум­ных» алгоритмов. При этом такие компа­нии всегда стараются приобрести другие организации, в том числе из-за необхо­димой им базы данных пользователей. Так поступил Facebook, купив Instagram и Whatsapp.

Пользователи практически не задумы­ваются, как на них влияет этот процесс, ведь он проходит практически незаметно. Сервисы становятся удобнее, а контент – интереснее. Посмотрел видеоролик в игре – получил бесплатные монетки. Но не за­бывайте, что взамен вы отдаете ни много ни мало, но информацию о себе. При этом платные сервисы тоже собирают данные для создания новых продуктов и акций. Уже сегодня активно ведется борьба за то, кто должен владеть этими данными, а кто нет. Стоит вспомнить недавний случай с утечкой данных из Facebook, из-за кото­рой М. Цукербергу пришлось расстаться с определенной суммой денег и извиняться за свою ошибку. Возможно, теперь соц­сеть задумается, кому стоит предоставлять информацию и для каких целей. И хорошо, что все хорошо закончилось, ведь дан­ные пользователей могли использовать и перепродать еще несколько раз, а это, в свою очередь, несет угрозу нецелевого использования информации и возмож­ное причинение вреда пользователю. Но вот в чем загвоздка: зачастую люди даже не понимают, какие данные и кому они предоставляют, подписываясь под непро­читанными пользовательскими соглаше­ниями. И совершенно понятно, что люди не перестанут пользоваться бесплатными сервисами и соцсетями.

Если компания хочет развиваться и процветать, ей нужно собирать и исполь­зовать большие данные. На первом этапе – это правильный ход. Но дальше эти данные необходимо превратить из боль­ших в умные. Большие данные – это всего лишь куча необработанной информации, которая содержит сведения без практиче­ского значения для бизнеса. Эти сведения фильтруются и анализируются интеллекту­альными алгоритмами систем, и в итоге мы можем видеть общую картину и направле­ние, по которому нужно работать. Как это работает на практике? Например, Amazon, анализируя историю ваших покупок, мо­жет предположить, какие товары заинтере­суют вас позже. Затем запускается реклам­ное предложение, и вуаля – товар уже в вашей корзине. Именно такого эффекта (продаж) хотят добиться бизнесмены, переходящие из века «бумажных стопок» в век ИИ. Но даже если вы установите са­мую дорогую систему, это не гарантирует вам золотые горы. Платформы позволяют собирать большие данные, алгоритмы – их структурировать, остальное дело за вами – понять и применить.

А если нет данных, где их взять? Если компания родилась не сегодня, то у нее уже должны быть данные, и не важно, за­писаны они в многочисленных блокнотах или где-то еще. Зачастую для получения дополнительной базы компании обмени­ваются или продают информацию о своих потребителях. При этом речь не идет о передаче персональных данных – для анализа нужны социально-демографиче­ские и потребительские характеристики покупателей.

Что можно извлечь из больших, но умных данных? Во-первых, можно сфор­мировать детальный портрет потребителя. Во-вторых, спрогнозировать реакцию пользователей на продукт или рекла­му. В-третьих, возможно быстро создать предложение с высокой степенью персо­нализации.

Большие данные – это важный ресурс, без которого продвинуться дальше до­вольно сложно. Поэтому уже сегодня стоит задуматься о смене тренда Big Data на Smart Data и постоянно работать с инфор­мацией.