Впечатления о Virtual Kubecon EU 2021 (day 3)

Эта статья продолжает мой рассказ про крутой event Virtual Kubecon EU 2021. Впечатления от первого и второго дня я уже описал ранее. Сегодня речь пойдет про третий день.

An Introduction to the Financial Services User Group — Scott Surovich, HSBC & Michael Lieberman

Интересный доклад на тему того, как помочь финансовым организациям с принятием cloud native технологий. Этим занимается Financial Service User Group (FSUG)в составе CNCF. В этом докладе рассказывается про:

  • вызовы, которые возникают перед компаниями с финансовыми сервисами при использовании cloud native подходов
  • зачем нужна отдельная группа FSUG
  • в чем ее отличие от технических SIG групп внутри CNCF
  • и чего FSUG планирует достичь в результате своей работы.

И начнем мы с вызовов:

  • финансовые сервисы очень сильно зарегулированы во всех странах мира — это связано с законами и рисками
  • у крупных финансовых корпораций обычно комплексные требования, для которых сложно придумать общее решение
  • крупные организации обычно имеют набор унаследованного софта, систем и инфраструктуры
  • один из самых больших вызовов организационный — технологическая трансформация в сторону cloud native затрагивает не только IT, но и всех стейкхолдеров, меняя процессы и подходы, уменьшая стоимость технологий и ускоряя изменения

Дальше спикер приводит примеры конкретных вызовов и в конце декларируется цель группы FSUG

The primary aim of this group is to foster interest and engagement from the finance industry to address security, regulatory and compliance related issues when using cloud native platforms. This would include the preparation of agreed best practices for the use of cloud native technologies in a regulated financial services context including interaction with common regulators and auditors.

Примеры тем, которые обсуждаются членами группы:

  • мультиарендность (multitenancy)
  • разработчики как непривилегированные пользователи
  • управление в open source разработке (aka governance)
  • безопасность в cloud native
  • безопасность в цепочках поставки (supply chain)

Следующие шаги этой группы:

  • написать white paper
  • разработать и рассказать про лучшие практики и подходы
  • сделать более техническую презентацию к следующему Kubecon

Building and Managing a Centralized ML Platform with Kubeflow at CERN — Ricardo Rocha & Dejan Golubovic, CERN

Интересный рассказ о том, как ЦЕРН (Европейская организация ядерных исследований), крупнейшая в мире лаборатория физики высоких энергий, использует cloud native технологии для сбора, хранения и анализа экспериментальных данных в виде централизованной ML платформы. Цель платформы — менеджмент всего жизненного цикла для ML. Схема такая:

В качестве основы, ребята используют kubeflow, который деплоят по своему — отпилили cert manager, istio, knative, оставив в виде зависимостей.

Кластер гетерогенный и имеет вид:

  • порядка сотни нод с виртуализированными четвертинками GPU NVIDIA Tesla T4
  • порядка десятка нод с полным доступом к GPU NVIDIA Tesla T4
  • порядка тысяч нод с доступом к CPU

Ну и напоследок было демо того, как удобно пользоваться этой ML платформой.

Achieving the Tipping Point for Open-source Software: Making the Business Value Obvious for Upper Management — Joshua Grose, Splunk

Крутой доклад на тему бизнес ценности от использования open source software (OSS). Доклад можно рассматривать как

  • шаблон продажи open source, если вы технарь
  • фреймворк оценки того, что вам продают, если вы менеджер

За последний год темпы роста open source проектов на GitHub 25%.

Характеристиками переломного момента (tipping point) являются

Закон малых чисел (The Law of the Few)

Очень много крутых людей контрибьютят в open source проекты в общем и CNCF проекты в частности. Они привлекают не только разработчиков, но и представителей бизнеса.

Фактор прилипчивости (The Stickiness Factor)

Активная работа с потребителями, которые начали использовать проекты CNCF. В итоге, открытое и отзывчивое community, которое участвует в формировании вектора развития проектов CNCF.

Сила обстоятельств (The Power of Context)

Контейнеры и обвязка вокруг них позволили ускорить процесс доставки ценности. Причем сделать это можно без капитальных затрат. В итоге, это новый стандарт для CI/CD.

Кажется, что бизнес ценность open source проектов должна быть очевидна. Но на самом деле часто менеджмент смотрит на эти вопросы по другому. Для того, чтобы показать ценность open source для руководителей надо снизить риски OSS (de-risk OSS). В случае CNCF мы можем ориентироваться на

  • зрелость проектов
  • активность по проектам
  • участие корпораций
  • рост коммьюнити
  • появление новых контрибьюторов
  • звездочки на GitHub у проектов CNCF

Нам важно понимать о чем беспокоятся менеджеры, когда выбирают как будет реализована система

  • критичность для бизнес результатов
  • скорость, с которой можно его реализовать
  • риски и как их можно смягчить

И дальше автор дает фреймворк, который помогает правильно продумать какие технологии рекомендовать для использования в рамках проекта, над которым вы работаете

Этот список вопросов слишком хорош для того, чтобы я его оставил без перевода

  1. Как то, над чем я работаю связано с непосредственными целями компании? Можно ориентироваться на миссию компании, OKR или спросить насчет целей вышестоящего менеджера.
  2. Какой результат я ожидаю получить с помощью указанного решения? Результат должен соответсвовать ожиданиям менеджмента иначе смысла затевать проект нет.
  3. По каким принципам проектирования (design principles) я оценивал решение? Например, масштабирование, стоимость, скорость, … Менеджмент может оценить насколько эти design принципы важны и если есть более важные, вы сможете это обсудить.
  4. Какие другие варианты я рассмотрел? Проводилось ли в действительно due diligence и какие варианты сравнивались?

Дальше автор приводит три отличных примера ситуации, где такой анализ очень помогает:

  • Уменьшение MTTD (Mean Time to Detection)
  • Рефакторинг проекта
  • Построение мульти облачного SaaS

Кажется, что это очень много работы — зачем нам ее делать? На самом деле это приносит пользу как компании, так и вам. Вам это позволит:

  • получить больше влияния
  • заслужить уважение
  • завязать дружеские связи
  • прокачать ваш профессиональный бренд

А компании это позволит:

  • достичь лучших результатов
  • дать больше возможностей разработчикам
  • выстроить бренд, который воспринимается как инновационный
  • расширить пул талантов

В общем, очень крутой доклад. Мне он показался крайне полезным.

Thursday Keynote Sessions

Kubernetes Project Update — Stephen Augustus, KubeCon + CloudNativeCon Europe 2021 Co-Chair

Анонс новой периодичности релизов — теперь это 3 раза в год. До этого за год было обычно 4 релиза — скорость падает. Теперь для релизов будет использоваться opt-in процесс, в рамках которого SIG (Special Interests Group) должны будут сообщать о своих планах релизной команде. Также добавятся ежегодные отчеты для SIG и асинхронность в коммуникациях. Достаточно интересные новости.

A Pathway to CNCF Citizenship — via Communitybridge — Darshan Chaudhary & Ken Owens, Mastercard

Достаточно скучный доклад про программы менторства в CNCF. В общем, имеет смысл смотреть, если вы хотели бы поучаствовать в такой программе:)

Sponsored Keynote: Day 2 with Kubernetes — This Is Fine! — Vaibhav Kamra, Chief Technology Officer

Рассказ про вызовы второго дня при эксплуатации K8s: безопасность, бэкапы, … Докладчик дает рекомендации, что shift left надо планировать заранее, а также автоматизировать, автоматизировать, автоматизировать …

Для непрерывности бизнеса важно иметь план, … и иметь бэкап. В общем, логичный посыл в спонсорском докладе от провайдера систем для бэкапов:)

Linkerd vs. COVID-19: Addressing the global Pandemic with a Service Mesh — William Morgan, CEO

Доклад про community проекта Linkerd и как оно помогало в борьбе с Covid 19. Оставлю без комментариев.

Sponsored Keynote: Smoothing the onramp to Kubernetes with Knative — Brenda Chan, Director

Тезисы доклада такие:

  • k8s крутой
  • k8s сложный
  • knative достаточно прост снаружи

How Deutsche Telekom Technik Built Das Schiff for Sailing the Cloud Native Seas — Vuk Gojnic

Интересный доклад про service platform и network functions. Проект называется “Das schiff”. В рамках него используется Cluster API и Flux CD для GitOps подхода в рамках управления инфраструктурой. По-факту, в итоге получилась составная k8s платформа для 5g телекомов. Подробнее можно изучить на GitHub.

Resource Requests and Limits Under the Hood: The Journey of a Pod Spec — Kohei Ota, Hewlett Packard Enterprise & Kaslin Fields, Google

Базовый рассказ о том, как работают Requests&Limits в K8s. По-факту, в k8s есть следующие классы обслуживания (QoS):

  • гарантированный (guaranteed), когда requests=limits
  • burstable, когда requests < limits
  • best effort, когда requests и limits не установлены

Вот интересная sequence diagram относительно того, как работают лимиты

При превышении лимитов:

  • over CPU — начиниется throttling
  • over Memory — приходит OOM killer

В k8s requests и limits реализованы следующим образом

  • cpu requests — cpu.shares in cgroups
  • cpu limits — cpu.cfs_period_us и cpi.cfs_quota_us
  • memory limit — memory.limit_in_bytes
  • cpu.shares — это относительное значение

Есть 2 рантайма:

  • CRI (High Level) — runtime run with k8s
  • OCI (Low Level) — runtime run with Linux Kernel

Понимание того, как работают requests и limits может помочь с пониманием что такое pod autoscaling и какие они бывают:

  • VPA — vertical pod autoscaling
  • HPA — horizontal pod autoscaling

В общем, получился отличный доклад про основы.

Live Experiments with K8s Applications: Pitfalls and How to Avoid Them — Fabio Oliveira & Srinivasan Parthasarathy, IBM Research

Крутой доклад на тему современных подходов к доставке кода на production. Докладчики поддерживают и развивают проект iter8.tools. Доклад состоит из двух частей:

  • принципов автоматизации релизов
  • демо платформы iter8.tools, которая позволяет запускать поверх k8s эксперименты при выкладке нового кода

Принципы показались мне интересными:

  • нужно быть осторожными с данными/метриками — они должны быть точными и повторяемыми
  • рассматривайте результаты комплексно — учитывайте как попадание сервисами в SLOs, так и бизнес результаты (конверсия, выручка, …)
  • для экспериментов используются A/B тесты — традиционный вариант ориентируется на бизнес-результаты, а cloud native вариант позволяет еще отслеживать SLO сервисов и автоматически переключать трафик на победителя.

Для реализации правильного подхода нужна платформа с достаточно сложными алгоритмами. Авторы предлагают использовать их open source проект iter8.tools и напоследок показывают демо запуска A/B/n эксперимента.

Итоги

Первые три дня меня не разочаровали — конференция реально получилась интересная. Впечатления от первого и второго дня я уже описал ранее. Осталось рассказать про последний четвертый день.

Director of digital ecosystem development department at Tinkoff. Bachelor at applied math, Master at system analysis, Postgraduate studies at economics.

Get the Medium app

A button that says 'Download on the App Store', and if clicked it will lead you to the iOS App store
A button that says 'Get it on, Google Play', and if clicked it will lead you to the Google Play store