Про машинне навчання в Booking.com

У цьому випуску подкасту Тех-Ток Денис спілкується з Максом Борейком, ML Engineer в компанії Booking.com, про його шлях у світ технологій, різницю між AI та машинним навчанням, боротьбу з шахрайством у Booking та майбутнє AI-індустрії.

Слухати на YouTube • Слухати на Spotify • Слухати на Apple Podcasts

Зміст

Шлях від радіофізики до ML
Перший досвід у стартапі
Кар’єрна криза та перехід до Machine Learning
AI vs ML - що насправді є що
Роль ML Engineer та різниця з Data Scientist
Боротьба з фродом у Booking.com
Робочі будні та планування у великій компанії
Моніторинг моделей - найбільша біль
Очікування vs реальність у Booking
Софтскіли важливіші за технології
AI у роботі та страх автоматизації
Проблема джуніорів та поріг входу
Deep Learning та майбутнє AGI
AI on the Edge та Defense
Регуляції в ЄС та їх вплив
Поради для розвитку

Шлях від радіофізики до ML

Денис: Макс, ти навчався на фізичному факультеті. Розкажи про свій шлях від навчання до машинного навчання.

Макс: Це окремий подкаст треба робити! Але серйозно - я не на фізичному, а на радіофізичному факультеті навчався в університеті Тараса Шевченка. Моя магістратура - медична фізика. Мав би займатися розробкою апаратів типу МРТ, КТ, УЗД.

Ми вчили майже все - механіку, електроніку, квантову фізику, ядерну. Плюс сильна математика та програмування. Базове, звісно - C#, C++, embedded програмування на Arduino. Навіть на медичній фізиці свій МРТ томограф будували на лабораторних.

Денис: А як від цього до backend developer та ML?

Макс: Я два роки працював інженером-електроніком, зовсім не пов’язано з програмуванням. У компанії, яка розробляла рентгенівські спектрометри. Там прям потрібна була квантова фізика, ядерна - розуміти, як працює атомна оболонка, електрони. Це було круто, що знайшов компанію, де університетські знання реально потрібні.

Перший досвід у стартапі

Макс: Випадково зайшов у стартап, де один з фаундерів був моїм науковим керівником. Кардіологічний стартап - досі існує, хоча це було 2017 року. Нас запросили розробляти алгоритми для обробки кардіограм. Софт, який би автоматично аналізував кардіограму замість лікаря.

Але я не знав нічого з програмування! Прийшов і не розумів, про що люди говорять. Не розумів REST методи - все пхав у GET з різними іменами. Мені казали: “Чувак, це фігня”. Але це був стартап, всім було байдуже. Сьогодні не розумію, завтра розумію. Потрошку втягувався.

Денис: На чому писали?

Макс: На всьому! Починав з Delphi - якийсь алгоритм, написаний дідами 15 років тому. Потім backend на Java зі Spring Framework. Frontend на старому JQuery без React. Android на Java теж багато писав.

Денис: Динозаври-технології!

Макс: Так. Зараз подумав - наскільки циклічне використання технологій. Колись популяризували Python, високорівневі мови. Але якщо потрібна швидкість та ефективність - всі повертаються до плюсів.

Кар’єрна криза та перехід до Machine Learning

Денис: Як дійшло до ML?

Макс: Був у стартапі 5 років. Досвід як CTO - їздив у Берлін на Startup Bootcamp, пічив інвесторам ідею. Багато менеджерського досвіду, ведення бізнесу, розуміння користувачів та ринку. Це дало класний скіл - розуміти, що бізнес first. Технології - це круто, але вони мають вирішувати задачу. Якщо можеш вирішити if-else алгоритмом - навіщо ML?

Але потім у стартапі були проблеми з грошима - не було зарплати по три місяці. Народжувалася дитина, треба було більше надійності. Плюс я перестав вірити в ідею стартапу. Багато людей звільнили.

Подивився на себе - я насправді ні в чому не спеціаліст. Щось тикався - backend, mobile, менеджмент, але реально знаю не дуже. Пішов на співбесіду на backend - мене розвалили на шматки. Зрозумів, що маю поганий рівень знань. Коли працюєш сам або з менш скіловими людьми - немає в кого вчитися, ніхто не показує, що робиш фігню.

Денис: Дуже знайомо!

Макс: Не був нормальним backend-щиком, не був нормальним mobile-щиком. Як менеджер теж не впевнений. Стан: спеціаліст ні в чому. Знаю все, але нічого не знаю достатньо добре. Думав, як з цього вийти.

Мене зацікавив ML. Почав намагатися робити проекти всередині стартапу. Обробка кардіограм - топ застосування, де ML працює краще за звичайні алгоритми. Пройшов кілька курсів на Coursera від Stanford University. Підкачав теорію. Плюс університетська освіта дала базу - алгебра, чисельні методі. Матриці перемножити - без проблем. Людям без технічного бекграунду це може бути важко.

AI vs ML - що насправді є що

Денис: Багато людей не розуміють різницю між AI, ML, Deep Learning. Можеш пояснити простими словами?

Макс: AI - artificial intelligence - це дуже широка сфера. ChatGPT - це AI. Але AI - це не тільки ChatGPT. По суті, будь-яка автоматизована система може називатися AI. Якщо напишеш if-else алгоритм - це теж якоюсь мірою AI. Просто дуже простий.

ML - це підрозділ AI. Один з видів, який означає, що алгоритм вчиться сам. If-else не вчиться ні на чому - як написав, так працює. А machine learning - є дані, спостереження. Netflix бачить, що ти любиш дивитися певні серіали, вчиться на твоїх даних і пропонує нове. Це ML - система навчається самостійно на існуючих даних.

Денис: Тобто ML - про алгоритми та навчання системи на даних робити передбачення?

Макс: Так, крім “передбачення” - це один з різновидів. Можеш робити класифікацію - спам чи не спам. Або передбачення. Багато варіантів. Система навчається на даних і робить щось завгодно.

Денис: Чому саме ML зацікавив?

Макс: Не дуже подобалось чисте програмування. Воно про тулзи - вчиш фреймворки, бібліотеки. Зараз той самий ChatGPT знає це так само добре, як ти. ML більш не сумнівне. Науковий грант, алгоритми. Вимагає більше думати. Дуже багато стратегії до побудови процесів.

Коли програмуєш - завжди є визначений результат. Запрограмую - працює. У ML часто не буває так. Можеш побудувати модель, але ніколи не можеш бути впевненим, що спрацює. Купа різних варіантів зробити одне і те саме. Це надбудова над інженірингом. Більше науки. Можу краще використати свої скіли, бути конкурентним на ринку. Це моя сильна сторона.

Роль ML Engineer та різниця з Data Scientist

Денис: Що взагалі робить ML Engineer? Яка різниця з Data Scientist?

Макс: Коли заходив у сферу, мій title був Data Scientist Engineer. Помітив великий shift за останні 5 років. Раніше всі хотіли алгоритми, ML, data science. Люди це робили, але ніколи не могли використати в продакшені. Схоже на те, що зараз з LLM та GenAI - круто працює, але зробити реальний кейс не так просто і не дешево.

Так само 5 років тому - всі робили алгоритми, дуже класно працювало на папері, в sandbox. Але як запхати в продакшн? Люди, які це робили, не знали. Тому з’явився ML Ops - задача запхати ML моделі в production, щоб працювало ефективно.

У теорії моя робота така: є людина-науковець, займається дослідженнями, шукає нові моделі, робить це в sandbox, у ноутбуці, без розуміння, чи це може запрацювати в продакшені. Потім приходжу я: “Давай покажи, що зробив”. Дивлюсь, чи можна імплементувати в продакшені, чи буде дешево і швидко.

Коротко - задача ML інженера: вивести моделі в продакшн.

Денис: Дуже співзвучне з DevOps! Була теж аналогія - розробники писали класний код, але не вдупляли, що відбувається на сервері. Спочатку були опси, потім DevOps поєднали розробку і продакшн. Те, що ти говориш - схожа історія.

Макс: Повністю згоден!

Боротьба з фродом у Booking.com

Денис: Чим займаєшся у Booking? Який твій проект?

Макс: Наш департамент - Trust, Safety and Fraud. Важко уявити зовні, але десятки команд займаються превенцією та детекцією різного фроду. Це велика проблема такого масштабу, що виправдовує десяток команд, сотні людей. Досі є великою проблемою.

Люди використовують вкрадені кредитні картки для бронювань або роблять бронювання і потім запитують chargeback з банку. Частина чарджбеків пройдуть, і Booking платить за це.

У моїй команді - market fraud. Шукаємо ситуації, коли люди намагаються отримати кешбеки, ваучери недозволеним шляхом. Якесь шахрайство, щоб отримати 10 євро кешбеку, при цьому не заплатити або намахати систему, щоб на цьому заробляти.

Масштаб великий. Є навіть цілі ботоферми. Більшість походить з Росії. Surprise!

Денис: Surprise!

Макс: Колись показували Telegram канали - цілі інструкції, як об’юзити Booking, зробити бронювання, щоб отримати кешбек. Цілі інструкції. Люди займаються цим професійно, роблять ботів. Недурні люди працюють над цим, щоб заробляти на великій компанії. У масштабах Booking - це великі гроші.

Денис: Ви білим хакінгом займаєтесь - намагаються обійти ваші механізми, ви вичисляєте і закриваєте дірки?

Макс: Краще завжди бути попереду, а не закривати дірки. Але це складно, бо проти нас працюють люди професійно. Задача - не допустити поганих акторів на платформу, але при цьому не створювати перешкод хорошим користувачам. Це завжди trade-off. Чим більше блокуєш поганих, тим більше можеш заблокувати хороших. Треба завжди знаходити баланс. Залежить від бізнес-потреб, вартості помилок.

Денис: Як працюєте на випередження? Є окремий R&D центр?

Макс: Досить хаотично. Коли є планування маркетингових кампаній, люди з маркетингу узгоджують з нами умови цих кампаній, щоб не було очевидних лазівок. Або якщо вони є - щоб ми знали і могли налаштувати алгоритми відповідним чином.

Робочі будні та планування у великій компанії

Денис: Як структурована твоя робота? Є спринти? Скільки людей у команді?

Макс: Звісно, є спринти. Зараз складне питання, скільки людей - половина кудись пішла, хтось на sick leave. Але десь 8-10 людей - типовий розмір команди.

Рівень планування на максималках. Компанія такого масштабу планує на рік вперед, по кварталах, по спринтах. Ти працюєш не один. Це було складно звикнути. Раніше звик: “Я хочу так - отак зробимо”. У маленькій команді, маленькому продукті. Тут так не працює.

Купа залежностей. Ми робимо маленьку частинку fraud detection. Є команда, яка робить окрему сторінку мобільного аплікейшна. Є команда для платформи готелів. Настільки багато команд і департаментів, треба синхронізувати ваш pace. Якщо хочеш щось зробити - залежиш від іншої команди.

Денис: Болі, як в айтішці зазвичай. Масштаб компанії обумовлює багато планування. Всі хейтять, звісно, але це як демократія - погана система, але кращої немає.

Макс: Повністю розумію!

Моніторинг моделей - найбільша біль

Денис: Що найчастіше у вас проблеми? Тести ламаються, інфраструктура, баги? Що в ML такі bottleneck?

Макс: Часто це моніторинг. Моніторинг перформансу моделі. Є поширене питання: що краще - мати модель, яка працює, але ти не знаєш, наскільки добре? Чи не мати взагалі ніякої моделі?

Денис: Напевно, не мати моделі?

Макс: У нас навпаки. Гірше, коли маєш щось, але не можеш виміряти. Коли не маєш нічого - нормально. Коли не можеш виміряти - не знаєш, що може воно навпаки приносить збитки продукту.

Поширена проблема - як налаштувати моніторинг перформансу. Наприклад, скільки поганих фростерів блокуємо за певний час - це KPI. Або скільки хороших блокуємо помилково - теж KPI, який намагаємося зменшити.

Для цього завжди потрібно мати ground truth - знати, що якби модель не існувала, що сталося би з цим бронюванням? Чи воно було хороше, чи погане? Але ти цього не знаєш, якщо модель вже використовується - вона вже зробила рішення. Дуже складна штука - evaluation цих моделей у продакшені.

Це легко робити на паперчику. Велика різниця між роботою науковців - у них вже є історичні дані, результати. А коли працюєш у продакшені - не знаєш, що станеться з цим бронюванням через три місяці. Чи людина з’явиться в готелі, чи відмінить, чи запитає chargeback. Це велика біль.

Очікування vs реальність у Booking

Денис: Порівняй Booking з попередніми компаніями. Що відрізняє Booking?

Макс: У мене були очікування від Booking. Багато не справдились. Деякі справдились. В моїй голові було: прийду в Booking, там все ідеально, все по патернах, задокументовано, люди роблять все без tech debt.

Прийшов - ситуація навпаки. Був шокований. Зараз розумію, чому це відбувається - це норма для компанії такого масштабу, яка так довго працює. Рівень технічної якості часто кращий у маленьких компаніях, коли починаєш з нуля, ніж у старих, як Booking, де купа Legacy. Компанії 27 років, є код, якому 27 років. Людина, яка писала - може вже немає. Не те що в компанії - в живих може немає. Знайти ці ниточки дуже складно.

Зараз стає краще. Нещодавно Booking мігрував у Cloud - AWS. Використовується Snowflake як data платформа. Є хороший пост на сайті Snowflake про колаборацію Booking та Snowflake.

Це стає набагато краще в плані структурованості. Коли прийшов - було хаотично. Не один data source, а 30, які мають приблизно однакові дані, але різні. Зробили різні команди, майтять різні команди. Ніхто не гарантує якість, наповненість. Зараз краще - у кожного data source є власник, є quality control, quality check.

Софтскіли важливіші за технології

Макс: Люди в Booking - напевно найбільша перевага. Реально всі або майже всі люди - крім того що розумні, у них софтскіли на високому рівні.

Після компаній, в яких працював раніше - outstaff, де люди часто були інженерно хороші, але по софтскілам слабенькі. Було байдуже на продукт, не могли спілкуватись у команді.

Тут видно, що дуже серйозно при відборі кандидатів. Люди готові допомагати, готові слухати, вміють працювати в команді. Це було одним з найскладніших - дуже багато комунікації.

Навіть якщо ти просто інженер - від тебе очікується комунікація. Не як в українському контексті - ти інженер, ні з ким не говориш крім ліда, а лід за тебе вирішує питання. Тут не так. Навіть якщо джуніор - від тебе очікується комунікація з людьми з іншої команди, запитувати питання, домовлятись. Це частина роботи. Нелегко, але дуже класно прокачує.

Денис: Два моменти. Перший - про очікування від великої компанії з іменем. Думаєш: “Це мастодонти, люди, які ведуть за собою IT”. У мене теж таке було - трішки розчаровувався. Розумію, компанія заробляє мільярди, але приходиш - процеси, які 50 років не працюють, інструменти, які давно треба викинути. Дуже знайома історія.

Другий момент - про софтскіли. Часта біль в айтішці - невміння комунікувати. Частково через це навіть DevOps виник - культура, яка сприяє взаємодії між розробниками і опсами.

AI у роботі та страх автоматизації

Денис: Минулого літа були звільнення - між 200 і 1000 людей. Представник Booking говорив про оптимізацію, зменшення бюрократизації. Називалось layoffs. З розвитком AI, генерації коду - наскільки це вбудовано в твою роботу? Чи використовуєш AI? Чи думав, що AI почнуть самі себе писати?

Макс: Точно очікував такого запитання! Зараз всі на хвилі хайпу AI. Booking не виключення. Один з пріоритетів - вбудовування AI. Є AI Trip Planner від Booking - не знаю, чи доступний в Нідерландах, але точно в англомовних країнах. У conversational режимі можеш забронювати готель - хочеш поїхати з сім’єю кудись на Новий рік у теплу країну. Він рекомендує локації, потім готелі. Головний AI-продукт від Booking.

Крім цього багато різних фіч. І куди ж без чатботів! Зараз найбільш страждає customer support. Очевидно, багато забирає AI. Відповідно, людей у customer support часто звільняють. Чи це найкраще - не знаю. У мене був досвід - коли маєш розумне питання, це не допомагає абсолютно. Для дурних питань працює. Якщо питання складне - це ускладнює доступ до реальної людини.

На роботі особисто використовую тільки coding helpers - GitHub Copilot. Booking використовує щось інше, але схожа ідея. Чи допомагає? Допомагає. Чи реально пришвидшує роботу? Об’єктивно ні. Маленька частинка від всього, що роблю, що непомітно. Може я швидше напишу код, але чи буде він деплоїти потім кудись?

Як DevOps теж розумієш - написання коду це маленька частинка циклу розробки. Все інше дуже складно автоматизувати, принаймні зараз.

Можливо, коли з’являться API інтерфейси для агентів - не як зараз UI або командна строка, а система агентів, який зможе викликати певну LLM модель. Можливо тоді стане реалістичним, що моделі зможуть робити повний цикл - не тільки написання коду, але й deployment, моніторинг.

Поки що моя роль у безпеці!

Проблема джуніорів та поріг входу

Денис: Як це вплине на джуніорів? Чи поріг входу збільшився?

Макс: Блін, не заздрю цим людям. Це тяжко. Очевидно не секрет - на ринку дуже тяжко джуніорам. Компанії на хайпі. Очікування, що джуніор-девелопери вже не потрібні, що це роблять AI. Думаю, це не зовсім так, але в думках тих, хто приймає рішення вище по щаблях - саме таке відбувається. Тому скорочують найми джуніорів. Джуніорам зараз важко.

У ML немає джуніорів насправді.

Денис: Як попасти?

Макс: Майже не бачив вакансії Junior ML Engineer. У Booking теж такого нема. Замкнуте коло виходить.

Більшість ML-інженерів - це суміжні ролі. Backend-щики, як у моєму випадку, або data scientist вивчив додаткові скіли і перейшов. Можливо DevOps перейде, якщо підтягнути алгоритми.

Так відбувається - люди переходять з чогось суміженого. Не було університетів або курсів, які б навчали. Зараз думаю вже є. Але переважно люди вже мають experience в якійсь іншій сфері і переходять.

Deep Learning та майбутнє AGI

Денис: Що таке Deep Learning з технічної сторони?

Макс: Це теж частина machine learning. Якщо є AI, підрозділ AI - це ML, а підрозділ ML - один з них Deep Learning. Називається Deep тому, що використовуються нейронні мережі з багатою кількістю шарів всередині, які можуть дуже складні паттерни вивчати.

Наприклад, наші моделі ChatGPT - це якоюсь мірою deep learning, бо це велика нейромережа, яка може складні паттерни вивчати, складні тексти. Головна перевага - ідея, що можеш стравити цьому алгоритму сирі дані, як вони є.

Денис: Що зараз відбувається в темі ML? Що на слуху? Куди рухається сфера?

Макс: Помічаю колоби грошей. Не експерт фінансовий, не можу сказати, чи це фінансова бульбашка. Але що очевидно - люди очікують певного return цих інвестицій. Дуже багато грошей вбухали великі компанії в AI. Як будь-який інвестор, очікуєш прибутку. Чим більше часу проходить і прибутку немає - настрої інвесторів погіршуються.

Якщо найближчим часом не з’явиться більше компаній - той самий OpenAI досі збитковий. Якщо не знайдуть можливість монетизувати AI - скоріш за все сповільниться процес розробки. Зараз є багато інвестицій і грошей, відповідно є ресурс дуже швидко прогресувати, нові моделі випускати кожен місяць.

Якщо дуже швидко не створити на цьому реальний продукт - боюсь, може сповільнитись і залишитись десь, де зараз є. Мати модель, яка розумна на рівні PhD студента, але не може робити комплексні задачі. Головна проблема всіх моделей - відсутність комплексного мислення і багатокрокового.

Денис: Це AGI - Artificial General Intelligence?

Макс: Так. Це те, що називається справжнім інтелектом - багатозадачність і багатоконтекстність. З мого розуміння, потрібні величезні ресурси, на чому це запускати.

AI on the Edge та Defense

Макс: Окрема тема - AI on the edge, на смартфонах, портативних девайсах, дронах. Ці моделі, LLM дуже потужні, вони раняться на серверах, на Nvidia відеокартах здоровезних. Запускати локально дуже технічно складно.

Окрема сфера - NPU, Neural Processing Unit. Цілі акселератори, чіпи, спеціально зроблені, щоб дуже ефективно запускати нейромережі, відповідно LLM. Досі є гравці, але досі не працює ідеально. Не можеш запустити будь-яку модель, щоб гарантовано працювала. Дуже крута галузь, яка буде розвиватись 100%, особливо для defense.

Денис: Окрема тема - як це працює в Defense. Machine Vision, наведення дронами.

Регуляції в ЄС та їх вплив

Денис: Куди рухається Booking у всій цій гонці AI?

Макс: AI - дуже великий пріоритет для компанії. Всередині є хороші можливості імплементувати AI - не тільки для зовнішніх користувачів, навіть всередині для оптимізації роботи. Є цілий GenAI framework всередині компанії, який дозволяє швидко запустити в продакшн. Дає платформи, не треба самостійно хостити модель або займатись RAG - Retrieval Augmented Generation. Можеш думати більше про use case і менше про інфраструктуру.

Але треба розуміти легальний фреймворк. Всі use case мають проходити перевірку легальних команд, бо ми в ЄС. Booking працює на ринку, тому всі чули GDPR, DMA, DSA. Ці акти регуляції створюють багато friction, особливо для великої компанії. Якщо мала компанія інколи може пропітляти - велика компанія зобов’язана дотримуватись закону. Всі нові use case, особливо GenAI, особливо якщо відправляєш дані в OpenAI - третю сторону - це має проходити 1000 перевірок. Це сповільнює процес.

Є доля правди в словах Макрона, що в Європі перерегульовують, недоінвестовують. Я це помічаю - багато часу витрачаю на те, щоб відповідати регуляціям, нормативним актам.

Денис: Чи є в цьому сенс та плюс?

Макс: Складний баланс. Є переваги, є недоліки. Один з прикладів - DMA, Digital Markets Act, націлений зменшити вплив великих компаній-монополістів. Реальний кейс - Apple Store або Google Play. Коли заходиш шукати аплікейшни - перші в списку аплікейшни від Google або Apple. Вони мають монополію на Play Store. З DMA це робити вже незаконно. Мають показувати список не за порядком, яким хочуть, а за порядком, який обирає користувач.

Це добре. Зменшує вплив монополістів. Дає меншим гравцям можливість вийти на ринок. Але для великих компаній - багато перешкод. Для малих компаній часто ці регуляції не дають навіть на ринок вийти, бо це коштує великі гроші. Особливо коли працював у стартапі з Healthcare - відчув, що стартапам у Healthcare дуже важко. Дуже зарегульовано, потрібно мати великі гроші, щоб вийти на ринок. Але регуляції в Healthcare теж потрібні.

Десь є баланс. Це більше про комунікацію між бізнесом, між людьми, хто приймає рішення і пише ці закони. Має комунікуватись, щоб всім було прийнятно.

Поради для розвитку

Денис: Як тримати руку на пульсі? Як прокачуєш скіли? Достатньо того, що вивчив в універі?

Макс: Був би радий мати більше часу на self-development. Через особисті обставини дуже тяжко. Хоча розумію, що зараз дуже необхідно.

Зараз читаю книжку “Designing ML Engineering” від Chip Huyen. Дуже крута книжка, яка описує, як будувати реальні продукти, використовуючи AI. Продукти, які приносять користь бізнесу. Дуже класний фреймворк, як підходити до процесу - від визначення проблеми до імплементації.

Також тієї самої авторки є книжка “Designing Machine Learning Systems”. Попередня версія, більше про ML алгоритми, не про сучасні AI-аплікейшни. Теж дуже хороша, дає розуміння процесу. Для мене це була фундаментальна робота, після якої прийшов на інтерв’ю в Booking. В голові склалися пазлики - знав багато з різних речей, з різних частин. Дає картину, як реально будувати продукти, використовуючи ML або AI. Це було дуже корисно.

Денис: Дві книжки - база. Є щось для людей не зі сфери? Попростіше?

Макс: YouTube - можна знайти все. Але краще мати персональні рекомендації. Часто намагаюсь, якщо є конференції, відвідувати. Наприклад, нещодавно був Snowflake World Tour в Амстердамі. AWS проводить свої конференції в Амстердамі. Зазвичай безкоштовні конференції для тих, хто працює в індустрії. Є спікери. Можеш послухати, над чим люди працюють. Дає inspiration. Часто є записи, якщо фізично неможливо потрапити - можна знайти доступ.

Ключові висновки

ML Engineering - це про продакшн - основна задача ML інженера не просто створити модель, а вивести її в production так, щоб працювала ефективно і приносила бізнес-цінність.
Софтскіли критичніші за технології - у великих компаніях типу Booking вміння комунікувати, працювати в команді, розуміти бізнес-потреби важливіше за знання конкретних фреймворків.
ML ≠ AI - AI це широка сфера (навіть if-else), ML - підрозділ AI, де система вчиться на даних, Deep Learning - підрозділ ML з нейронними мережами.
Моніторинг моделей - найбільша біль - найскладніше не створити модель, а оцінити її ефективність у продакшені без ground truth, особливо коли не знаєш, що сталося би без моделі.
Fraud detection вимагає балансу - постійний trade-off між блокуванням шахраїв та збереженням доступу для чесних користувачів, проти вас працюють професіонали з ботофермами.
Legacy існує навіть у топових компаніях - Booking з 27-річною історією має код такого ж віку, техдепт, хаотичні процеси, але поступово мігрує в cloud та покращує структурованість.
AI поки не замінить ML інженерів - coding helpers пришвидшують написання коду, але це маленька частинка циклу розробки, весь інший процес (deployment, моніторинг) дуже складно автоматизувати.
Джуніорам у ML важко - немає вакансій Junior ML Engineer, більшість приходить з суміжних ролей (backend, data scientist, DevOps) після здобуття додаткових скілів.
AI-бульбашка може лопнути - величезні інвестиції в AI очікують повернення, якщо найближчим часом не з’являться прибуткові продукти (OpenAI досі збитковий), процес розробки може сповільнитись.
Регуляції ЄС - палка о двох кінцях - GDPR, DMA, DSA зменшують вплив монополістів та дають шанси малим гравцям, але створюють величезні перешкоди для інновацій та виходу на ринок стартапів.
Три стовпи успішного ML інженера - software engineering, data science та доменна експертиза (наприклад, кардіологія або fraud detection), комбінація хоча б двох з трьох робить тебе цінним фахівцем.
AI on the Edge - майбутнє галузі - запуск моделей локально на девайсах (смартфони, дрони) вимагає спеціальних NPU чіпів, особливо критично для defense, але досі не працює ідеально.