Taralas209 - Blog about ML


Channel's geo and language: not specified, not specified
Category: not specified


Python Developer & AI Enthusiast.
Пишу о своём пути в ML. Сейчас прохожу буткемп от DataScientes на ML Engineer при парижском университете Сорбонны
Более подробно о чём канал смотри в первом сообщении в канале (оно запинено)

Related channels  |  Similar channels

Channel's geo and language
not specified, not specified
Category
not specified
Statistics
Posts filter


Очень крутое видео про GPT и как GPT-подобные работают под капотом. Автор детально разбирает принципы работы трансформеров, а самое главное – понятно и наглядно.

Моя любимая часть про эмбеддинги, "как получить из суши братвурст (немецкую сосиску)".

Спасибо YouTube (его алгоритму) за это!

P.S.: Плейлист 'Нейронные сети' от этого же канала. Я уже добавил себе в 'посмотреть позже'.


Ну что, наконец-то Google выпустили что-то по-настоящему крутое? Или нет?

Gemini 1.5 Pro с возможностью анализировать до 1 миллиона токенов, и все это с пониманием сложных контекстов и мультимодальностью данных (изображения, видео, файлы, доки и т.д.)

Вот ссылка на блог-пост от Google, где представлены крутые примеры понимания контекста: 400 страниц книги/документа, изображения, видео продолжительностью 44 минуты, где модель находит нужный кадр. Выглядит прям очень круто, рекомендую посмотреть!

Видео 1, Видео 2, Видео 3

В конце блог-поста есть ссылка на Google AI Studio, где можно это потрогать своими руками, чем я прямо сейчас и займусь.

P.S.: Немецкий IP не сработал, я включил VPN и выбрал IP-адрес США, теперь все работает.


Салют 👋

Три недели назад закончилась часть обучения по Data Science на буткемпе ML Engineer. Я успешно сдал все экзамены, и моя команда успешно защитила наш проект. Сегодня я получил сертификат (диплом) от организаторов буткемпа. В течение двух месяцев мне должен прийти официальный документ от Сорбонны, парижского университета.

С прошлой недели началась вторая часть по MLOps, и в пятницу мы уже должны получить проект на 2 месяца.

Теперь я типо Data Scientist, можете меня поздравить :)

135 0 0 17 23

Video is unavailable for watching
Show in Telegram
Всем привет 👋

Пока модельки по проекту обучаются (см. видео), есть время поделиться с вами своими мыслями:

Этот блог всё ещё будет о моём пути в МЛ, но я буду писать больше о себе (хобби, увлечения, мысли, инсайты и т.д).

Вчера утром я поймал себя на мысли, что за все свои почти 35 лет я играл с фанатизмом и полным интересом всего в 4 игры:

- Шахматы (с 10 лет)
- Ogame (с 15 лет)
- Dota (с 16 лет)
- Покер (с 18 лет)

Я до сих пор увлекаюсь ими и периодически играю (кроме Ogame, в неё я уже 10 лет не играю, так как победил всех и ушёл, но об этом я расскажу в другой раз).

А знаете, что именно мне нравится во всех этих играх? Возможность просчитывать и искать наилучший план игры, то есть, какую стратегию нужно придерживаться или какой план, чтобы с наибольшей вероятностью победить. Отсюда появляется желание погружаться в детали игры, пытаться понять суть игры, увидеть её ДНК.

Победа, как таковая, для меня вообще не важна. Это лишь индикатор или показатель того, насколько хорошо работает мой план, насколько хорошо я разобрался в игре.

Интересно, кто-то увлекается или может увлекался какой-то из этих игр? Если да, то чем она/они вам нравятся? В чём причина, почему вы играете в них? Жду в комментариях :)


"Как быстро я найду место работы в качестве ML Engineer после завершения буткемпа?
Poll
  •   в течение месяца
  •   1-3 месяца
  •   3-6 месяцев
  •   9-12 месяцев
  •   больше года
36 votes


Всем привет! 👋

Давно тут ничего не писал, спасибо тем, кто остался и не покинул чат 😉

Осталось 2 недели до завершения части буткемпа по Data Science, 19-го февраля будет защита нашего проекта, потом 2 недели перерыва и 2 месяца буткемпа по MLOps.

На прошлой неделе мне пришла мысль, что главная цель обучения на ML Engineer - это вообще-то трудоустройство после его окончания. Для многих наверное банальная мысль, но я люблю запариться и учиться ради учёбы…

Поэтому с 20-го февраля начну активно рассылать резюме на разные позиции, а вчера был созвон с парнем из Career Team от буткемпа, прошли с ним по моему LinkedIn. Буду над ним тоже работать, пока он выглядит вот так

Надеюсь, до скорого 🙂


Подводил итоги года и вот какой скрин презентации Валерия Бабушкина нашёл


Skill Matrix.jfif
271.2Kb
Матрица скиллов для ML Engineer, Data Engineer, Data Architect.

Я увидел это изображение у Евгения, который является Data Scientist в сфере рекламных технологий, и он также ведет свой авторский канал. Но в отличие от меня, он регулярно выкладывает разные полезности и делится своим опытом в области ML, DE, MLOps и исследований. Кому интересно, можете заглянуть к нему и сами оценить контент.

Теперь о матрице скиллов. Это изображение опубликовал Andreas Kretz у себя на LinkedIn, и подробно объяснил его в своём стриме на YouTube. Я быстро посмотрел его на 2х скорости и останавливался на интересных моментах. Ниже приведены идеи, которые мне показались важными для тех, кто, как и я, делает первые шаги в мире ML.

- Разнообразие ролей: В мире инженерии данных существует множество ролей, каждая из которых требует уникального набора навыков и опыта.

- Путь роста: Чтобы развиваться в этой сфере, неплохо было бы понимать, какие навыки необходимы на каждом этапе карьеры и как они эволюционируют от начинающего инженера до архитектора данных.

- Технические навыки: автор уделяет особое внимание техническим аспектам - от программирования и работы с базами данных до понимания CI/CD и облачных платформ.

Как завещал великий Ленин:
"Учиться, учиться и еще раз учиться!"

Я в очередной раз услышал о необходимости непрерывного обучения и адаптации своих навыков под эволюцию технологий.


Привет и с наступившим НГ всех! Пожелаю каждому в 2024 году стать лучшей версией себя 💪😎

Я не писал здесь ничего последние 3 недели, и это связано с тем, что перед католическим Рождеством было много работы над проектом + экзамены по буткемпу, а также заболели мои домочадцы.

Затем наступили праздники. Мы поехали к моим родителям, затем к родственникам и друзьям, и так продолжалось до вчерашнего дня. Я просто отдыхал, проводил время с семьей и близкими, наслаждаясь этим. Осознанно не потреблял никакого контента, кроме подкастов Лекса Фридмана с Йошуа Бахом. Я посмотрел оба выпуска, которые взорвали мой мозг. Такие ощущения были 4 года назад, когда я прочитал книги Харари, которые также изменили моё мировоззрение.

Много думал о будущем, о планах на 2024 год, вспоминая, как прошёл 2023. Я подвёл итоги года в голове и наметил планы на предстоящий год. На этой неделе планирую структурировать всё это на листах бумаги или в Notion.

Учёба в буткэмпе продолжится со следующей недели, но сегодня был созвон с парнем из Career Team, и мы разбирали мой профиль на LinkedIn и немного стратегию поиска работы. На эту тему есть свои мысли, и в ближайшие дни поделюсь ими.

Всем добра и гоу врываться в новый 2024 год!


Смотрели сериал «Мир дикого запада» от HBO (тот что WestWorld)
Poll
  •   Кончено
  •   Нет
34 votes


Video is unavailable for watching
Show in Telegram
Если кто-то ещё не видел :)

Я когда посмотрел и увидел шагающего робота гуманоида на фоне кибер-траков, то перепроверил на всякий случай, не сплю ли я 😁

Хотя может, это просто красивое видео, как у Gemini, а на самом деле лишь одно из 1.000 яиц остаётся целым

Но если это реальное видео или близко к реальности, или хотя бы такое станет реальностью через пару лет, то это 🤯

А ещё удивляет тот факт (о котором пишет автор канала Сиолошная), что все навыки робота не программировались, а он учится этому в симуляции!

Подумал, что надо пересмотреть сериал WestWorld, там много про роботов и симуляции.


dataset trustpilot.png
110.5Kb
Привет, ребята!

У меня идёт двухнедельный спринт, который должен завершиться в эту пятницу, и после этого я расскажу о нем больше. А пока напишу немного о проекте, над которым мы работаем в команде.

Цель проекта - извлечь информацию из отзывов о компании(или продукте) на сайтах, таких как Trustpilot, и использовать эту информацию для обучения модели машинного обучения. После обучения модель должна будет выполнять три основные задачи:
1. Классификация и оценка удовлетворенности: Определение уровня удовлетворенности клиентов на основе текста отзыва (в идеале, на любом сайте) путем присвоения рейтинговой оценки (количество звезд).

2. Идентификация ключевых аспектов отзывов: Классификация отзывов по категориям, таким как проблемы с доставкой, качество продукта, обслуживание клиентов и т.д.

3. Выявление конкретных проблем и предложений: Анализ отзывов на предмет конкретных вопросов или предложений по улучшению.

Что мы успели сделать за первую неделю:
У нас не было датасета, и задача проекта также была сформулирована довольно обще, поэтому мы долго не могли определиться, какой датасет мы хотим собрать и с ним потом работать. В конечном итоге мы решили взять 5 крупных онлайн-маркетплейсов на TrustPilot с общим количеством отзывов в 500.000 (смотреть скрин к посту). Мы спарсили все отзывы и хотим проанализировать каждый датасет на наличие каких-то закономерностей до четверга (созвон с ментором).

Я написал скрипт, который двое суток скрейпил все полмиллиона отзывов с одного IP, обходя блокировки Trustpilot. Получил дикое удовольствие от написания скрипта и его улучшения. Прикольно видеть слабости своего алгоритма и думать, как его можно улучшить и сделать удобнее.

Вот такие дела :)
Желаю всем продуктивной недели (их кстати всего 3 в этом году осталось), а если хочется спросить/узнать что-то, то всегда вэлком в комментарии.

P.S.: Спасибо за комменты к предыдущему посту про IDE. Я решил пока продолжить пользоваться PyCharm, но чаще открывать VS Code и там тоже кодить, что-то запускать + думаю CoPilot приобрести.


Какую среду разработки вы используете для работы/ учебы?
Poll
  •   PyCharm
  •   VS Code
  •   Jupyter Notebook
  •   RStudio
  •   Другое (укажите плиз в комментариях)
  •   Что такое IDE?
66 votes


PyCharm vs. VS Code

Почти год я использовал PyCharm, когда кодил на Python, и совсем иногда переключался на VS Code для проектов по вебу. Теперь, обучаясь на курсе ML Engineer, мне советуют перейти на VS Code. И я решил вникнуть и изучить вопрос о предпочтениях в выборе IDE среди специалистов в области DS/ML.

Хочу узнать ваше мнение и опыт в этом вопросе. Какую среду разработки вы используете для работы/ учебы?

Буду рад, если вы ещё в комментариях кратко напишете причины выбора той или иной IDE


Закончился третий спринт, и я получил проект.

📚 Учебные модули: Virtual Machine, Linux & Bash, Git & GitHub, Unit Testing и AWS Cloud Practitioner.

💡 Впечатления: Почти всю неделю я работал с терминалом, и для меня это какое-то другое ощущение, чем написание кода в какой-то IDE. Как будто ты общаешься с машиной на её языке напрямую, и вот написал команду, и как бы создал папку или файл.

👨‍💻 Проект: На прошлой неделе я выбрал три интересные мне темы (вот тут про это), и сегодня узнал, что мне и ещё трём студентам досталась тема "Цепочка поставок - удовлетворенность клиентов" (ссылка на проект). Темой я доволен, и с этой недели уже начинаем работать над проектом. Спасибо, кстати, всем, кто давал советы по выбору тем.

На первом спринте были полезные шпаргалки (Cheat Sheets) по Python for Data Science. Поделюсь ими с вами, может, кому-то пригодятся. Скачать pdf-ку можно здесь.

Всем отличной и продуктивной недели! 💪🦾


Сегодня ДР ChatGPT, 1 год!

На всякий случай поздравлю, мало ли :) вдруг зачтётся потом.

🥳 - если тоже хочешь плюс к карме отмечаешь


В субботу я слушал подкаст с конференции о ИИ. Участники беседы были следующими:

- Илон Маск
- Грег Брокман (Co-Founder OpenAI)
- Макс Тегмарк (профессор в MIT)
- Биньямин Нетаньяху (премьер-министр Израиля)

Мысль Макса Тегмарка, которая запомнилась мне больше всего и о которой я размышлял последние дни: "Технологии - это НЕ игра с нулевой суммой."

Игра с нулевым значением – это ситуация, в которой выигрыш одного участника равен потере другого. То есть общий выигрыш или потеря остаются неизменными, независимо от действий участников, в то время как с технологиями всё наоборот.

На мой взгляд именно технологии и инновации (а не политические системы) повышают уровень жизни людей и увеличивают их благосостояние, а политические структуры играют важную роль в распределении этих благ. Некоторые из них делают это более справедливо между всеми участниками, а некоторые менее, но они не создают новые блага.
--------------------------------

Согласны ли вы с мыслью о том, что инновации являются ключевым фактором улучшения уровня жизни?


Cheat Sheets для визуальзации данных

На втором спринте нам выдали полезные шпаргалки (Cheat Sheets) для визуализации данных:

- Matplotlib
- Seaborn
- Какой вид визуализации данных выбрать?

P.S.: Перейдя по ссылкам, можно скачать PDF-версии каждой из этих шпаргалок.


Нужен совет по выбору проекта. Завершил второй спринт.

📚 Учебные модули: 4 модуля по визуализации данных с использованием библиотек: Matplotlib, Seaborn и Plotly.

💡 Впечатления: Сначала изучали Matplotlib, и я подумал, какие крутые графики и диаграммы можно здесь создавать. Затем мы перешли к Seaborn, и визуализировать данные стало ещё удобнее. А когда мы начали работать с Plotly, я был сильно удивлён, сколько там интерактивных возможностей.

👨‍💻 Проект: Через неделю у нас начнется большой проект в рамках буткемпа, и сегодня нам дали 5 тем на выбор. Нужно выбрать 3, которые наиболее интересны и в зависимости от выбора других, нас разделять на группы по 3-4 человека, и каждая группа будет работать над своим проектом до конца февраля.

Я собрал все проекты вместе, перевел описание и задание на русский язык (через Deepl) и загрузил их сюда. Выбор проекта ответственный момент, и ваш совет может мне пригодился. В конечном счете, я хочу выбрать проект, который будет не только интересен, но и привлекателен для будущих работодателей, а также расширит мои знания и навыки в области машинного обучения.

🤔 Какие ключевые факторы, по вашему мнению, следует учитывать при выборе проекта? Как понять, какой проект лучше всего подходит для укрепления портфолио ML-щика?


Всем привет 👋

Я тут решил написать небольшой пост-навигатор для всех новоприбывших в мой канал и добавить его в закреп.

Вот несколько публикации, которые помогут вам быстрее узнать, о чем этот канал:

- Обо мне, моей миссии и пути к машинному обучению

- Зачем я создал этот канал

- О выборе пути в ML (раз, два, три )

- Полезные материалы для ML Engineer

- Моя статья на Хабре про ChatGPT

- Зарплаты ML Engineer в Германии

- Разбираюсь в понятиях, что такое DS, ML & AI (раз, два)

➡️ Прямо сейчас я прохожу обучение "Bootcamp ML Engineer" и еженедельно делюсь итогами каждого спринта. Все обновления о буткемпе можно найти под хэштегом #bootcamp_mle

🤖 Ещё я активно использую ChatGPT и время от времени делюсь своими находками и идеями, которые можно найти по хэштегу #chatgpt

20 last posts shown.

151

subscribers
Channel statistics