Каждый клик в Сети оставляет за нами цифровой след: не важно – искали ли вы значение нового мема, поставили лайк соседскому коту или смотрели новую серию любимого сериала. И чем больше мы проводим времени в интернете, тем больше данных о нас собирают. В итоге «мистер Гугл» знает о вас куда больше, чем лучшие друзья.
«Данные – новая нефть» – это выражение встречается довольно часто в современном обществе. А почему бы и нет? Ведь без этой информации онлайн-сервисы просто не смогут функционировать. Да и мы в погоне за персонализированными приложениями сами с удовольствием делимся своими данными. А тут еще и интернет вещей все глубже внедряется в нашу жизнь. Тостер и тот с удовольствием дополняет ваш цифровой образ.
Как и зачем собираются данные, пожалуй, не самый сложный вопрос. Конечно, для персонализации, таргетинга и всего другого. С развитием искусственного интеллекта эти данные стало возможным использовать в куда более полезных целях – в новых интеллектуальных сервисах. Так, например, какой-нибудь агростартап на основе полученных данных сможет подсказать где, когда и сколько нужно сеять пшеницы. При этом тенденция умных сервисов продолжает расти: увеличиваются вычислительные мощности, дешевеют датчики и железо, разрабатываются мощные инструменты для машинного обучения и т. д. Важно отметить, что все эти решения доступны на рынке. Однако далеко не каждый сервис будет рад поделиться своим самым важным ресурсом – данными. В открытом доступе находится примерно 20% данных, остальные же хранятся на внутренних ресурсах компаний.
Вся чудодейственная сила данных заключается в возможности усовершенствовать продукт и привлечь пользователей, причем не важно, торгуете ли вы цветными карандашами в Сети или стараетесь продвинуть свое приложение в App Store. Лидерство касательно развития ИИ таких гигантов, как Amazon, Google и Facebook, во многом объясняется количеством данных, которыми они владеют для создания и обучения «умных» алгоритмов. При этом такие компании всегда стараются приобрести другие организации, в том числе из-за необходимой им базы данных пользователей. Так поступил Facebook, купив Instagram и Whatsapp.
Пользователи практически не задумываются, как на них влияет этот процесс, ведь он проходит практически незаметно. Сервисы становятся удобнее, а контент – интереснее. Посмотрел видеоролик в игре – получил бесплатные монетки. Но не забывайте, что взамен вы отдаете ни много ни мало, но информацию о себе. При этом платные сервисы тоже собирают данные для создания новых продуктов и акций. Уже сегодня активно ведется борьба за то, кто должен владеть этими данными, а кто нет. Стоит вспомнить недавний случай с утечкой данных из Facebook, из-за которой М. Цукербергу пришлось расстаться с определенной суммой денег и извиняться за свою ошибку. Возможно, теперь соцсеть задумается, кому стоит предоставлять информацию и для каких целей. И хорошо, что все хорошо закончилось, ведь данные пользователей могли использовать и перепродать еще несколько раз, а это, в свою очередь, несет угрозу нецелевого использования информации и возможное причинение вреда пользователю. Но вот в чем загвоздка: зачастую люди даже не понимают, какие данные и кому они предоставляют, подписываясь под непрочитанными пользовательскими соглашениями. И совершенно понятно, что люди не перестанут пользоваться бесплатными сервисами и соцсетями.
Если компания хочет развиваться и процветать, ей нужно собирать и использовать большие данные. На первом этапе – это правильный ход. Но дальше эти данные необходимо превратить из больших в умные. Большие данные – это всего лишь куча необработанной информации, которая содержит сведения без практического значения для бизнеса. Эти сведения фильтруются и анализируются интеллектуальными алгоритмами систем, и в итоге мы можем видеть общую картину и направление, по которому нужно работать. Как это работает на практике? Например, Amazon, анализируя историю ваших покупок, может предположить, какие товары заинтересуют вас позже. Затем запускается рекламное предложение, и вуаля – товар уже в вашей корзине. Именно такого эффекта (продаж) хотят добиться бизнесмены, переходящие из века «бумажных стопок» в век ИИ. Но даже если вы установите самую дорогую систему, это не гарантирует вам золотые горы. Платформы позволяют собирать большие данные, алгоритмы – их структурировать, остальное дело за вами – понять и применить.
А если нет данных, где их взять? Если компания родилась не сегодня, то у нее уже должны быть данные, и не важно, записаны они в многочисленных блокнотах или где-то еще. Зачастую для получения дополнительной базы компании обмениваются или продают информацию о своих потребителях. При этом речь не идет о передаче персональных данных – для анализа нужны социально-демографические и потребительские характеристики покупателей.
Что можно извлечь из больших, но умных данных? Во-первых, можно сформировать детальный портрет потребителя. Во-вторых, спрогнозировать реакцию пользователей на продукт или рекламу. В-третьих, возможно быстро создать предложение с высокой степенью персонализации.
Большие данные – это важный ресурс, без которого продвинуться дальше довольно сложно. Поэтому уже сегодня стоит задуматься о смене тренда Big Data на Smart Data и постоянно работать с информацией.