Контакты

Юрий Овчаренко: Данные, как горная порода, – бесполезны без извлекающих золото специалистов и технологий

CNews - 02 августа 2016

- В последние пару лет аналитика во многом ассоциировалась с большими данными. Сегодня, по мнению Gartner, термин Big Data уже не актуален. Вы с этим согласны?

- Отсутствие Big Data в кривой Gartner вызвало вопросы. На мой взгляд, в этом был некоторый момент провокации, который достиг цели и привлек внимание рынка. Объяснение, что сейчас все данные являются большими по определению и поэтому нет смысла в выделении отдельного стека технологий, справедливо. Но не думаю, что термин Big Data уйдет в прошлое. Скорее, он еще долго будет использоваться как ИТ-поставщиками, так и их заказчиками. Каждая уважающая себя крупная компания, которая хочет быть конкурентной и не остаться на свалке истории, должна активно работать с информацией. Сегодня Big Data  - это уже не о хранении и сборе данных (хотя и эту задачу решили далеко не все), а об умении и способности работать с ними, извлекать из них выгоду. 

- Какие тенденции, по вашему мнению, определяют внедрение аналитических решений в России?

- В первую очередь, это быстрое изменение внешней среды – коньюнктуры рынка, поведения и потребностей клиентов, политики регуляторов  – в сочетании с географической распределенностью и неповоротливостью многих компаний, особенно крупных. Используется очень много систем, применяются разные подходы к сбору информации, что для бизнес-руководства становится серьезной проблемой. В результате сохраняется спрос на внедрение централизованных хранилищ данных и технологий, которые помогают быстро собирать данные, обрабатывать их и принимать решения. По-прежнему актуально построение единой системы отчетности для планирования продаж, логистики, финансовых потоков. Еще одно интересное и популярное на Западе, но только набирающее силу в России направление – это внедрение предикативной аналитики, которая позволяет снизить риски, выстраивать модели поведения клиентов и решать еще целый спектр задач. К примеру, для одного из клиентов в ритейле мы реализовали проект, где аналитика, связанная с мониторингом погоды, использовалась для более точного прогнозирования и планирования продаж в магазинах. В результате компания добилась не только роста продаж, но и сокращения излишних запасов товаров на складах. Перспективы у предикативной аналитики колоссальны.

Если говорить о сферах бизнеса, то мы видим огромный интерес к аналитическим решениям со стороны компаний, чья деятельность связана с интернетом. К ним относятся ритейлеры, туристические компании, банки и многие другие. Интернет дает возможность получать самые разные данные о клиенте, его поведении, интересах, предпочтениях, покупках и затем использовать эту информацию для дополнительных продаж и более качественного  взаимодействия. Поскольку количество клиентов и источников информации огромно, мы получаем еще больший объем данных для обработки и анализа.

Кроме того, отличные перспективы есть у использования Big Data в таком сегменте, как медицина и биотехнологии – мы видим это по нашим западным проектам. Например, для решения задачи анализа генома человека и разработке персональных рекомендаций для предотвращения риска заболеваний. Правда, это все пока реализуется только для западных заказчиков.

- Какие из тенденций в сегменте аналитики характерны для развитых рынков, по пока не пришли в Россию?

- На мой взгляд, это аналитика, связанная с интернетом вещей. Возьмите, к примеру, технологические процессы в химическом производстве или нефтегазовой сфере. Компании используют огромное количество датчиков, которые контролируют добычу газа или нефти, транспортировку по трубопроводам. В результате генерируется большой объем информации и появляется потребность в ее обработке, в том числе в режиме реального времени для предотвращения внештатных ситуаций. Технологии Big Data позволяют быстро заметить остановку датчиков или ошибки в их работе и принять меры. Кроме того, накопленный массив данных можно анализировать и использовать для формирования шаблонов поведения, по которым мы сможем заранее выявлять предпосылки внештатных ситуаций, высылать бригады для ремонта или проводить внеплановое теобслуживание. Любые сбои – это деньги, а в случаях вроде всем известной аварии в Мексиканском заливе, деньги колоссальные, поэтому это направление сейчас активно растет на Западе и, надеюсь, появится и в России.

Еще одна интересная тема - это обработка и аналитика транзакций для мониторинга и предотвращения мошенничества. В первую очередь, в финансовой сфере, хотя у нас количество случаев мошенничества значительно меньше, чем на Западе: сказываются жесткие требования регуляторов, повсеместное использование 3D Security и систем риск-менеджмента. Тем не менее аналитические решения здесь могут найти свою нишу, и речь может идти не только о банках. Один из заказчиков EPAM – глобальная туристическая компания – добился роста выручки на 15% после внедрения автоматической системы противодействия мошенничеству, построенной с использованием технологий машинного обучения. Система анализирует поведение посетителей веб-сайта компании в процессе онлайн-бронирования туров и на основе определенных ранее паттернов поведения сигнализирует о мошенничестве. Здесь проблема заключалась даже не в том, что бронирование проводилось, например, по украденной кредитке и затем эти деньги нужно было возвращать, а в том, что компания несла накладные расходы на процессинг транзакций. И если потом транзакция «откатывалась», то деньги на ее обработку все равно уже были потрачены. Ну и дополнительный минус заключался в том, что до отмены нечестно забронированного тура его не получится продать другим клиентам. В общем чем позже вы узнаете о мошенничестве, тем больше потери. Сейчас система использует накопленные и вновь поступающие данные, чтобы предотвращать такие ситуации.  

- Может ли проект в сфере аналитики и больших данных быть быстрым, иметь срок окупаемости, выраженных в месяцах?

- Да, может. При правильном внедрении технологий результат заметен достаточно быстро, особенно, если мы говорим об использовании аналитики для оптимизации, к примеру, хранения товаров, выстраивания цепочек поставок или для повышения конверсии в интернет-продажах. Но здесь не менее важную роль играет и координация действий различных подразделений.

Компании, которые активно используют современные технологии обработки данных, гораздо быстрее разиваются и оставляют позади те организации, где эти технологии не внедрены. Данные – это возможность понять своего клиента, предложить интересный именно ему контент, сформировать персональное предложение, от которого он не сможет отказаться, и тем самым повысить конверсию. Посмотрите на пример Google или Amazon: используя и анализируя информацию о текущих и потенциальных потребителях своих услуг, они не только смогли продвинуть свой бизнес вперед, но и успешно работать в новых для себя областях, совсем не в тех, где они начинали. Подобные примеры вдохновляют другие компании. 

- Что мешает компаниям реализовать проекты в сфере аналитики?

- В России, на мой взгляд, это географическая распределенность многих компаний и, скажем так, некоторая местячковость. Бывает, что региональные подразделения живут сами по себе, у них нет мотивации своевременно предоставлять данные в головной офис в единое хранилище. Информация может модифицироваться, искажаться или показывать не всю картину. Есть вопросы и с точки зрения качества данных, поскольку не всегда внедрена система управления ими и используются единые классификаторы и справочники. Кроме того, достаточно часто мы сталкиваемся с ситуацией, когда модели организации данных, предлагаемые вендорами, мало соответствуют особенностям наших компаний. Нужен опыт для того, чтобы правильно спроектировать и внедрить процессы и подходы к сбору, обработке и трансформации информации. Это даже не столько вопрос технологий, сколько вопрос правильной организации, которой зачастую нет.

Отдельная тема – позиция внутреннего ИТ-подразделения при реализации проектов. Не все ИТ-подразделения охотно идут на внедрение новых решений, поскольку это может означать снижение зависимости бизнеса от текущих систем и снижение роли ИТ-специалистов как людей, владеющих экспертизой по этим системам. Бывают случаи тихого саботажа и сопротивления, вызванные желанием продолжить использование старых решений, которые требуют множества рутинных опеарций и большого штата ИТ. Это очень сложный вопрос, который приходится решать топ-менеджменту.

Не редкость и прямо противоположная ситуация, когда внутреннее ИТ-подразделение пытается полностью взять на себя выполнение проекта, при этом не имея подходящего опыта. Интересные идеи, новые заманчивые технологии – почему бы не «поиграть» с ними? Но с виду кажущиеся простыми технологии на самом деле требуют серьезного времени на освоение, на прохождение пути проб и ошибок. EPAM неоднократно приходилось «подхватывать» такого рода проекты, когда спустя год после старта энтузиазм пропадал, а задачи оставались нерешенными. Баланс между участием собственных специалистов и привлечением внешней команды очень важен.

- По вашим оценкам, как изменились бюджеты клиентов на внедрение аналитических решений? Можно ли сказать, что кризис сделал развитие аналитики одной из стратегических бизнес-задач?

- Сейчас многие заказчики пришли к пониманию, что у нас нет кризиса, а есть новая непростая реальность. Она надолго, в ней надо жить, а при возможности даже попробовать сделать качественный рывок и встать выше на ступеньку или две. Правильная обработка данных и извлечение по-настоящему ценной информации помогает повышать продажи, оптимизировать внутренние процессы. Даже в таких абсолютно рутинных задачах, как, например, управление персоналом и обработка резюме потенциальных сотрудников, применение аналитических решений может дать эффект. Так что – да, аналитика и Big Data остаются в числе приоритетов компаний.

При этом, конечно, экономию никто не отменял и бюджеты на ИТ не увеличиваются. Это объясняет рост востребованности open source-технологий. Оправданно это или нет – вопрос к обсуждению, везде есть свои плюсы и минусы. Можно взять платформу от вендора и загубить весь проект. Можно построить прекрасное решение полностью на открытых технологиях, если знать, как это решение работает и как взаимодействовать с коммьюнити, которое занимается его развитием и поддержкой. Но есть и обратные примеры.

- Если разложить проект в сфере больших данных на составляющие – «железо», ПО, специалисты и т.д., то какие компоненты обходятся заказчику дороже всего? И где не стоит экономить?

- С точки зрения важности для проекта я бы ранжировал так: на первом месте – специалисты, затем ПО и далее «железо». Большинство аналитических приложений, в том числе для работы с большими данными, способно работать на совершенно простеньком оборудовании. Большое количество простых систем, собранных в кластеры, позволяет решать задачи астрономического масштаба. По такому принципу в свое время шли Yahoo, Google, Amazon. Во многих проектах речь в принципе не идет о «железе», поскольку используются облака и речь идет лишь о стоимости сервиса.

Самое важное в проектах Big Data – это люди, не технологии. Во-первых, специалисты-айтишники, которые смогут правильно построить архитектуру и внедрить решение именно так, как это необходимо бизнесу. Во-вторых, специалисты, которые благодаря особому набору своих компетенций и знаний, смогут извлекать как можно больше пользы из тех данных, которые есть у компании. Данные – это как золотоносная порода или песок,  ценность которого не представляет интереса до тех пор, пока люди со специальными навыками не начнут извлекать из него золото. Данные одного и того же типа в одной компании могут лежать бесполезным грузом, а в другой -  активно приносить профит, поскольку нашлись люди, которые увидели в них неочевидные и неординарные возможности для развития.

- Вы говорите о технических специалистах?

- Это новая категория специалистов – data scientists, ученые по данным, люди, которые обладают уникальной комбинацией навыков и знаний. Во-первых, для них обязательно наличие хорошей технической квалификации, знание различных языков программирования и баз данных, технологий и платформ Big Data. Во-вторых, от ученых по данным требуется хорошее понимание математики и статистических методов обработки информации. В-третьих, не менее важны такие soft skills, как интерес к данным, желание найти решение проблемы, креативность в сочетании с образом мышления хакера, умение взаимодействовать с заказчиком на С-уровне. И, наконец, самое главное – это понимать специфику бизнеса и  мыслить в терминах добавочной стоимости, не просто придумывать какой-либо красивый алгоритм анализа данных, но и осознавать, для чего это делается и какой бизнес-результат будет получен. 

Когда мы говорим просто об автоматизации сбора данных, построении хранилища или внедрении единой аналитической системы, то потребности в привлечении data scientists нет. У нас есть конкретные задачи и понимание, как их решать. Но затем, когда данные собраны и есть огромное количество возможностей для сегментации и классификации, выявления зависимостей и моделей поведений клиентов и мы хотим использовать весь потенциал, скрытый в этом объеме информации, то без участия ученых по данным уже не обойтись. Это все равно как вы можете увидеть в куске породы небольшие крупинки золота, вытащить их и пойти дальше, при этом не заметив, что в глубине скрыт огромный золотой пласт. Data scientists как раз нужны для того, чтобы исследовать горную породу – ваши данные – от и до.

- Насколько развит рынок таких специалистов в России?

- Пока таких специалистов в России единицы, поскольку солидного багажа успешно реализованных проектов по Big Data еще нет, а без проектного опыта нет и data scientists. При этом потребность в них постоянно растет. В EPAM, в том числе в российском офисе, действует программа, направленная на привлечение и обучение такого рода специалистов, мы ищем их как внутри компании, так и во внешней среде. Конечно, нам помогает наличие большого опыта проектов в сфере аналитики и Big Data на Западе и наличие специалистов с хорошим бизнес- и технологическим бэкграундом.  Тем не менее воспитание data scientists -  трудный и требующий индивидуального подхода процесс, выстроить конвейер здесь не получится. Мы активно инвестируем в это направление, поскольку уверены, что за ним будущее. 

- Насколько перспективен для вас сейчас российский рынок с учетом приобретения новых зарубежных активов и какие стратегические цели ставит перед собой EPAM с точки зрения расширения присутствия в сегменте аналитики в России?

- Все приобретения EPAM связаны с желанием не только выйти на новые позиции на западном и азиатском рынках, но и серьезно расширить свои компетенции в тех или иных областях. Эти компетенции становятся доступными всем нашим заказчикам, включая клиентов в России. Действительно, из-за падения отечественной валюты вклад российского EPAM в общий бизнес компании снизился, хотя если смотреть показатели в рублях, то по сравнению с прошлым годом наша выручка в России выросла на неплохие 15%. Количество  персонала, больше половины которого задействована на западных проектах, увеличилось на 25%, превысив цифру в 2700 человек. EPAM по-прежнему интересен российский рынок. Сейчас в процентном отношении мы зарабатываем в России и Ближнем Зарубежье больше, чем другие глобальные игроки, работающие в схожих сегментах бизнеса.

Если говорить именно о сегменте аналатики и Больших Данных, то здесь мы придерживаемся прагматичного похода. Мы не планируем запускать какие-либо масштабные инвестиционные программы и стимулировать развитие рынка. Но если есть спрос, интересные проекты и участие в этих проектах выгодно компании, то мы с удовольствием беремся за них. Замечу, что в России у нас активно развивается Центр компетенции по BI, Big Data и Data Science, специалисты которого успешно работают в том числе и на западных проектах и готовы поделиться своим опытом с российскими заказчиками.

Оригинал публикации