Skip navigation EPAM

Data and Analytics практика

13+

лет опыта в области данных

100+

успешно выполненных проектов

40+

внутренних тренингов

500+

Data-специалистов в России

НАПРАВЛЕНИЯ ПРАКТИКИ

BIG DATA

 

Инженеры Big Data занимаются разработкой распределенных программных решений по обработке и анализу информации. Используемые технологии Big Data гарантируют специалистам больших данных постоянное развитие и востребованность в самых разных сферах разработки ПО.

В EPAM меня привлекает общение с иностранными заказчиками и рост, как профессиональный, так и личностный. Ориентированность на результат и интересные решения – это ощущается во всем, с чем доводится иметь дело в компании. Здесь не стоишь на месте, а ставишь цели и достигаешь новых уровней. Участвуя в разработке продуктов с мировым именем, становишься частью значимых событий и вносишь вклад в развитие человечества. EPAM – это не просто работа, а огромное сообщество профессионалов с ценностями, соответствующими моим взглядам на жизнь.

Евгений Кожевников

Solution Architect in Big Data 

DEVOPS IN DATA

 

Системные инженеры в Data-практике интегрируют новый функционал в реализованные проекты, настраивают и автоматизируют релизный цикл, проектируют и создают дата-платформы. Стоит отметить, что DevOps в Data, в отличие от  Cloud & DevOps, кроме стандартных облаков и Ansible/Jenkins/Bash работают с Hadoop, NoSQL и миграциями. 

 

У каждого свой DevOps. Для кого-то это инженер, для кого-то методология. У кого-то рамки «девопса» заканчиваются Jenkins, у кого-то – командной ответственностью. На мой взгляд, это совокупность парадигмы “You build it, you run it” с неким парным программированием. DevOps-инженер подсказывает разработчикам, как лучше внедрить решение задачи в общую систему платформы, не дает забыть о monitoring & maintenance. Также он занимается автоматизацией для повышения воспроизводимости. В целом, «девопс» делает все, чтобы разработчику было удобно и приятно воплощать идеи в жизнь.

Александр Чиковани

Senior Systems Engineer

DATA SCIENCE

 

Data Science специалисты проектируют математические модели и алгоритмы, позволяющие извлекать бизнес-инсайты из данных и автоматизировать когнитивные бизнес-процессы. В проектах применяются как классические методы машинного обучения, так и нейронные сети и обучение с подкреплением.

Находясь на пересечении бизнеса, математики и программирования, специалисты дата сайенс создают прогрессивные аналитические решения, существенно повышая эффективность и конкурентоспособность клиентов. Мы занимаемся предиктивной аналитикой, детекцией аномалий, построением рекомендательных систем, обработкой естественного языка (NLP), компьютерным зрением и оптимизационными задачами.

Михаил Толмачев

Руководитель центра компетенций Data Science

DATA QUALITY

 

В задачи тестировщиков данных входит проверка информации в системе на предмет ее соответствия бизнес-требованиям, удобства использования и установленным метрикам качества. Инженеры Data Quality также выстраивают процессы автоматических проверок данных на разных уровнях и этапах их обработки.

Data Quality — молодое перспективное направление, быть частью которого означает быть частью некоего стартапа. Попав в Data Quality, вы окунетесь в большое количество современных востребованных технологий, но самое главное — перед вами откроются огромные возможности для генерирования и реализации своих идей. Вы сможете использовать подход постоянного улучшения не только на проекте, но и для себя, непрерывно развиваясь как специалист.

Глеб Калинин

Data Quality Engineer 

BUSINESS INTELLIGENCE

 

BI-инженеры помогают клиентам построить систему, позволяющую анализировать важные для бизнеса параметры и KPI. Процесс включает в себя три части. Warehousing: организация аналитического хранилища данных. ETL: настройка процессов сбора информации из множества источников, ее очистка и приведение к необходимому формату. Reporting: подготовка визуализаций и представление табличных данных в графиках.

На сегодняшний день все больше компаний рассматривают данные, как основной ресурс для дальнейших действий. BI помогает бизнесу получать информацию в структурированном и понятном виде, учитывая, что человек лучше воспринимает визуальные данные. Это позволяет компании своевременно извлекать из данных полезную информацию и принимать правильные стратегические решения.

Ирина Сетина

Senior Business Intelligence Engineer

BUSINESS ANALYSIS

 

Задачи аналитиков могут быть бизнес- или системно-ориентированными и меняться в зависимости от масштаба и специфики проекта. Бизнес-ориентированные задачи выясняют потребности заказчика. Тогда как системно-ориентированные требуют проанализировать информацию и создать модель данных или даже верхнеуровнево спроектировать систему.

В первую очередь профессия бизнес-аналитика интересна тем, что фокус работы направлен на потребности и проблемы бизнеса. Это позволяет изучать различные домены и бизнес-процессы. Приходится работать с множеством технологий, за счет чего ты начинаешь лучше понимать возможности продукта и предлагать более оптимальные решения. Зачастую зона ответственности аналитика четко не закреплена, поэтому всегда можно расти и брать большую ответственность.

Иван Голованов

Senior Business Analyst 

BIG DATA

Инженеры Big Data занимаются разработкой распределенных программных решений по обработке и анализу информации. Используемые технологии Big Data гарантируют специалистам больших данных постоянное развитие и востребованность в самых разных сферах разработки ПО.

DEVOPS IN DATA

Системные инженеры в Data-практике интегрируют новый функционал в реализованные проекты, настраивают и автоматизируют релизный цикл, проектируют и создают дата-платформы. Стоит отметить, что DevOps в Data, в отличие от  Cloud & DevOps, кроме стандартных облаков и Ansible/Jenkins/Bash работают с Hadoop, NoSQL и миграциями. 

 

DATA SCIENCE

Data Science специалисты проектируют математические модели и алгоритмы, позволяющие извлекать бизнес-инсайты из данных и автоматизировать когнитивные бизнес-процессы. В проектах применяются как классические методы машинного обучения, так и нейронные сети и обучение с подкреплением.

DATA QUALITY

В задачи тестировщиков данных входит проверка информации в системе на предмет ее соответствия бизнес-требованиям, удобства использования и установленным метрикам качества. Инженеры Data Quality  также выстраивают процессы автоматических проверок данных на разных уровнях и этапах их обработки.

BUSINESS INTELLIGENCE

BI-инженеры помогают клиентам построить систему, позволяющую анализировать важные для бизнеса параметры и KPI. Процесс включает в себя три части. Warehousing: организация аналитического хранилища данных. ETL-процессы: настройка процессов сбора информации из множества источников, ее очистка и приведение к необходимому формату. Reporting: подготовка визуализаций и представление табличных данных в графиках.

BUSINESS ANALYSIS

Задачи аналитиков могут быть бизнес- или системно-ориентированными, и меняться в зависимости от масштаба и специфики проекта. Бизнес-ориентированные задачи выясняют потребности заказчика. Тогда как системно-ориентированные требуют проанализировать информацию и создать модель данных или даже верхнеуровнево спроектировать систему.

МЕТАПРОЕКТ DATA AND ANALYTICS ПРАКТИКИ

МЕТАПРОЕКТ DATA AND ANALYTICS ПРАКТИКИ

МЕТАПРОЕКТ DATA AND ANALYTICS ПРАКТИКИ

ПРИМЕРЫ ПРОЕКТОВ

Проект для фармацевтической компании

Задача – создание платформы подготовки данных для обучения на их основе моделей machine learning. Технически это кластер Kubernetes, поднимающийся на AWS с несколькими микросервисами. Kubernetes находится в основе Open Source проектов компании EPAM — Legion, адаптированных под нужды конкретного заказчика.

ETL-процессы организованы при помощи Apache Airflow и перемещают данные из Salesforce системы в AWS S3. На платформу развертывается Docker-образ модели машинного обучения. Она обучается на свежих данных и по REST API-интерфейсу выдаёт предсказания, интересующие бизнес.

Проект для международной сети магазинов здоровья и красоты

Заказчик – сеть магазинов здоровья и красоты мирового уровня, работающая более чем в 25 странах. Проект – система распознавания и отслеживания действий покупателя в магазинах с помощью камер наблюдения, которые используются аналитиками для оптимизации работы магазина. Наш продукт – смесь глубоких сверточных сетей для детекции и классических алгоритмов трекинга объектов. Основой технологического стека стали Python и TensorFlow.

ПРИМЕРЫ ПРОЕКТОВ

Проект по мониторингу состояния автомобилей

Цель – создание платформы на Snowflake, позволяющей при помощи обработки данных мониторить состояние парка автомобилей и строить предсказания о состоянии машин. Платформа позволяет получать прогнозы о том, какую единицу стоит отправить на техосмотр или даже срочно продать, потому что в ближайший месяц ее ремонт будет стоить больше ожидаемой прибыли. ETL был построен на Talend и Spark, визуализация – на SAP BO.

Проект для фармацевтической компании

Задача – создание платформы подготовки данных для обучения на их основе моделей machine learning. Технически это кластер Kubernetes, поднимающийся на AWS с несколькими микросервисами. Kubernetes находится в основе Open Source проектов компании EPAM — Legion, адаптированных под нужды конкретного заказчика.

ETL-процессы организованы при помощи Apache Airflow и перемещают данные из Salesforce системы в AWS S3. На платформу развертывается Docker-образ модели машинного обучения. Она обучается на свежих данных и по REST API-интерфейсу выдаёт предсказания, интересующие бизнес.

Проект для крупного онлайн-аукциона

Заказчик – один из крупнейших онлайн-аукционов, специализирующийся на продаже редких и коллекционных товаров. Особенностью является наличие команды экспертов, оценивающих лоты в различных категориях. Проект – автоматизация работы экспертов с помощью алгоритмов машинного обучения. Используя накопленные данные, необходимо автоматизировать как можно больше рутинной работы экспертов, помогая им сосредоточиться на самых редких и специфических лотах. Помимо этого, в проект входит построение полноценной аналитической платформы для обеспечения жизненного цикла моделей машинного обучения.

Проект для международной сети магазинов здоровья и красоты

Заказчик – сеть магазинов здоровья и красоты мирового уровня, работающая более чем в 25 странах. Проект – система распознавания и отслеживания действий покупателя в магазинах с помощью камер наблюдения, которые используются аналитиками для оптимизации работы магазина. Наш продукт – смесь глубоких сверточных сетей для детекции и классических алгоритмов трекинга объектов. Основой технологического стека стали Python и TensorFlow.

СТЕК ИСПОЛЬЗУЕМЫХ ТЕХНОЛОГИЙ

ВОЗМОЖНЫЕ ПУТИ РАЗВИТИЯ КАРЬЕРЫ

ВОЗМОЖНЫЕ ПУТИ РАЗВИТИЯ КАРЬЕРЫ

ВНЕПРОЕКТНАЯ ДЕЯТЕЛЬНОСТЬ

ПРОФЕССИОНАЛЬНОЕ РАЗВИТИЕ

Сертификация 

  • Amazon Web Services
  • Google Cloud Platform 
  • Microsoft Azure
  • Databricks
  • Snowflake

Курсы

  • Порталы Learn и Courses с корпоративными образовательными программами и видеокурсами 
  • Доступ к 7500+ курсам на LinkedIn Learning (Lynda.com)
  • Курсы английского и разговорные клубы

Карьерные возможности

  • Программы повышения квалификации для специалистов высокого уровня: Delivery Management School, Solution Architecture School и Solution Architecture University
  • Прозрачные условия карьерного роста: матрицы компетенций, фидбек-сессии
  • Программы менторинга

УЮТНАЯ АТМОСФЕРА

ПРИСОЕДИНЯЙТЕСЬ

Спасибо, резюме принято к рассмотрению. Пожалуйста, проверьте почту, чтобы узнать о дальнейших действиях.

Упс, что-то пошло не так. Пожалуйста, попробуйте еще раз. Приносим извинения за временные неудобства.

Добавьте свое резюме (не более 10 Мбайт)

*Обязательные поля