فرهنگ معین


Channel's geo and language: not specified, not specified
Category: not specified


در مورد هوش مصنوعی، پزشکی و دیگر علایقم.
ارتباط با من:
@channel_operator

https://www.linkedin.com/in/moein-shariatnia/
https://medium.com/@moein.shariatnia
https://github.com/moein-shariatnia

Related channels  |  Similar channels

Channel's geo and language
not specified, not specified
Category
not specified
Statistics
Posts filter


Video is unavailable for watching
Show in Telegram
این ویدیو هم خیلی داره شیر میشه، شاید دیده باشینش تا الان.
یه مروریه به ابزارهای جالبی که تا الان داریم روی دیتای ویدیو.

اون دو مورد آخر که ترجمه به زبان‌های دیگه‌اس خیلی جذابه به نظرم؛ چقدر به‌درد شرکتایی مثل نتفلیکس می‌خوره!

و البته به قول Andrew Ng که هی توی کورساش می‌گفت:
with great power comes great responsibility

یادمون باشه که از این ابزارا متاسفانه خیلی راحت برای سانسور هم میشه استفاده کرد (مثل همون dialogue removal یا replacement)؛ و این دردناکه واقعا اگه دست نااهلش بیفته!

@farhangemoein


خوبی این کار اینه که دیگه لازم نیست هزینه و وقت خیلی زیادی برای لیبل کردن دیتا صرف کنیم؛ از همون لیبل آماده که این‌جا میشه ریپورت هر گرافی برای آموزش دادن مدل استفاده میشه.

توی این پروژه از دیتاستی با حدود 370,000 تصویر CXR و ریپورت همراهش برای train مدل استفاده کردن و نشون دادن که مدلشون در لول رادیولوژیست میتونه اون پاتولوژی‌ها رو تشخیص بده.

این پست قبلی کانال هم مربوط به این حیطه میشه:
https://t.me/farhangemoein/20

@farhangemoein


ترند این‌روزهای ریسرچ دیپ‌لرنینگ، بیشتر به سمت مدل‌هایی رفته که انواع مدالیته‌ها (تصویر، متن، صوت و ...) رو درک بکنن و از مدل‌های اختصاصی برای هر کدوم از این مدالیته‌ها داریم فاصله می‌گیریم.

از طرف دیگه بحث self-supervised learning هم همچنان داغه که کمک می‌کنه بتونیم بدون هزینه‌ی زیاد برای لیبل کردن، به نحوی از بخشی از دیتامون به عنوان لیبل استفاده کنیم.

حالا توی این مقاله کار جالبی کردن که ترکیب دوتا ترند بالاست.

به جای این‌که برای هر Chest X-ray بیان از رادیولوژیست‌ها بخوان که برای پاتولوژی‌های مختلف لیبلش کنن، مستقیما از همون ریپورت خام همراه گرافی (که متن انگلیسی عادی هست) به عنوان سورس supervision استفاده کردن.

در ادامه هم مدلی رو train کردن که همزمان تصویر و متن ریپورت رو می‌بینه و یادمی‌گیره که فاصله‌ی representation تصویر و متن مرتبط رو توی اون فضای N بعدی یادگیریش نزدیک‌تر کنه. (توی پادکست قبلی راجع به این مورد کامل توضیح دادم). در واقع همون کاری که پیپر CLIP از OpenAI انجام می‌داد.


@farhangemoein




اینو الان دیدم توییتر؛ حیفم اومد نذارمش این‌جا. خیلی حس خوبی بهم داد.

اون Viz.ai رو هم که تگ کرده چک کنین. بیشتر علت این حس خوبو می‌فهمین 🙂

@farhangemoein

645 0 11 9 18

همین امروز، deeplearning.ai تخصص جدید خودش برای ریاضیات مورد نیاز در ماشین‌لرنینگ و دیتاساینس رو ریلیز کرد.

"Mathematics for Machine Learning and Data Science"

https://www.coursera.org/specializations/mathematics-for-machine-learning-and-data-science

همون‌طور هم که انتظار می‌رفت، سه تا کورس داره با این عناوین:
1. Linear Algebra
2. Calculus
3. Probablitiy & Statistics

خودم به شدت مشتاقم که هرچه سریع‌تر برم سراغشون تا بعد یه مدت نسبتا زیاد، مروری بشه و کلی چیز جدید هم یاد بگیرم. به شما هم خیلی توصیه می‌کنم که بگذرونینشون اگه علاقه دارین عمیق‌تر یادبگیرین اتفاقاتی که پشت مدلا میفته رو.

@farhangemoein

542 0 34 2 24

#tools

https://mailtrack.io/en/

و نکته‌ی مهم‌تر برای ما هم این‌که خیلی از فیچر‌های خوبش (از جمله همین کار اصلیش برای اطلاع از دیده شدن ایمیل) رایگانه :)

@farhangemoein


#tools

می‌خوام از این بعد یه‌سری ابزارهای باحالی که خودم استفاده می‌کنم رو هم معرفی کنم این‌جا.

برای اولیش با Mailtrack شروع می‌کنم.
احتمالا برای شما هم پیش اومده که می‌خواین ایمیلی به استاد یا جای مهمی بزنین و خیلی براتون مهمه که بفهمین ایمیل رو باز کرده و دیده یا نه هنوز باز نشده.

این اپ که یک اکستنشن برای Gmail هست، این امکان رو ایجاد می‌کنه؛ بدون این‌که گیرنده‌ی ایمیل از روی ظاهر پیام‌تون بفهمه که این ایمیل track شده.

طوری که کار می‌کنه هم اینجوریه که در واقع میاد یه تصویر / فایل خیلی کوچیک رو توی ایمیلی که ارسال میشه قرار میده (در ظاهرش قابل تشخیص نیست و جای خالی هم توی ایمیل به‌وجود نمیاره) و اگه گیرنده ایمیل رو باز کنه، باید اون تصویر / فایل لود بشه؛ پس در واقع یک ریکوئست به سروری که تصویر روی اون قرار داره میره (که همون سرورهای این اپ هستن) و این‌جوری این اپ میفهمه که حتما یه نفر باز کرده ایمیل رو که این تصویر خواسته دانلود بشه.

قبل این‌که برای گیرنده‌های اصلی استفاده کنم با دوتا از ایمیل‌های خودم تست کردم و اوکی بود؛ قابل تشخیص نبود که ایمیل track میشه و وقتی هم که باز می‌کردم بلافاصله توی ایمیل ارسال کننده‌م مشخص میشد که ایمیل دیده شده. تا الان هم چندبار به صورت واقعی برای ایمیل‌های مهم‌ترم استفاده کردم و مشکلی نبوده.

https://mailtrack.io/en/

@farhangemoein

538 0 38 6 25

فکر کردن به این‌که پشت تمام این‌ کارها، ریاضیات و پردازش کامپیوترهاییه که تصویر و متن رو یه سری عدد می‌بینن برام خیلی جذابه.

نمی‌دونم دیدن این کاربردها و کارایی که مدلا تا همین چندسال پیش حتی نزدیکش هم نمی‌تونستن بشن داره براتون عادی میشه یا نه؛ ولی به نظرم حیفه اینا رو ببینیم و تعجب نکنیم از اتفاق عجیبی که داره میفته.

(اینم اضافه کنم که چقدر مقالات فنی جذاب‌تر و رنگی‌رنگی‌ترن از مقالات علوم پزشکی :) )

لینک

@farhangemoein


این عدد در مورد آیفون هم ۷۴ روز بوده.

محصولی که توی ۵ روز اینقدر استفاده میشه و یوزر پیدا می‌کنه، احتمالا حالاحالاها پیش ماست :)

@farhangemoein




این پیپر هم چند وقت پیش از Google و DeepMind معرفی شد که مدل PaLM گوگل با 540 میلیارد پارامتر رو برای حل سوالات پزشکی تغییراتی دادن. نتیجه‌ی کار اونا هم مشابه بود و دیدن که مدل میتونه دیتاست سوالات آزمون USMLE رو با دقت ۶۷ درصد پاسخ بده که ۱۷ درصد از بهترین مدل که چندماه پیش اومده بود بهتره!

لینک

@farhangemoein


توی این پیپر که چندوقت پیش چاپ شده، ChatGPT رو برای حل سوالات USMLE (آزمون لایسنس پزشکی آمریکا) استفاده کردن. مدل تونسته هرسه تا استپ رو با دقت‌های حدود ۶۰ درصد پاس بکنه!

دقت کنین که این Language Model با دیتای پابلیک اینترنت و کتاب‌های نه‌چندان تخصصی پزشکی train شده و توی این پروژه هم نیومدن اون رو منحصرا برای حل سوالای این آزمون آماده کنن (fine tuning انجام نشده اصطلاحا).

نکته‌ی جالب دیگه هم این‌که اسم ChatGPT به عنوان نویسنده کنار باقی اسامی قرار داره 🙂

ممنون از مهرسای عزیز که مقاله رو برام فرستاد.
لینک

@farhangemoein




حجم منابع ارزشمند و به‌روزی که توی کامیونیتی machine learning به رایگان ارائه میشه باورکردنی نیست. به نظر من، یکی از علل پیشرفت سریع این حوزه (در حدی که حتی یه ماه دور بودن ازش باعث میشه حس غربت داشته باشی وقتی برمی‌گردی!) دقیقا همین share کردن بی‌حدوحصر منابع با هم دیگه‌اس.

حالا Pranav Rajpurkar که قبلا دانشجوی Andew Ng توی لب هوش‌مصنوعی Stanford بود و الان خودش استاد شده و لب خودشو توی هاروارد داره، اومده این کتاب (تقریبا ۲۵۰ ص) ای رو شیر کرده از تجربه‌هاش در زمینه‌ی ریسرچ AI (که البته احتمالا به فیلدهای دیگه هم بشه تعمیمش داد).

سکشن‌های مختلف کتاب رو که نگاه می‌کنم، اکثرش این‌طوریه که یه بخش مربوط به خود ریسرچ و اسکیل‌های مربوط به اون داره و بعدش میاد راجع به hard skill های کدزنی و پیشرفت‌های اخیر AI صحبت می‌کنه؛ فکر می‌کنم این حالت این منبع رو برای قشر بزرگتری میتونه ارزشمند کنه چون صرفا تمرکزش روی یه حیطه نیست.

توی صفحه‌ی اول یه خلاصه از مباحثی که بهشون اشاره می‌کنه گذاشته و خود همین لیست یه منبع خیلی مهمه برای کسایی که میخوان وارد این حیطه بشن و سوال دارن که ما چی باید یاد بگیریم؛ یه چندتا از این تاپیک‌هایی که نام برده رو مثال میزنم این‌جا:

Large Language Models, VSCode, Reading AI papers, HuggingFace, Transformer, W&B, Paper Writing, AWS, Statistical Testing, PyTorch, GPU Training, ...
(ترتیب خاصی نداره، صرفا همینجوری چندتاش که به چشمم خورد رو انتخاب کردم.)

من از دیروز شروع کردم خوندنشو و امیدوارم شما هم شروع کنین به زودی و لذت ببرین.


https://docs.google.com/document/d/1uvAbEhbgS_M-uDMTzmOWRlYxqCkogKRXdbKYYT98ooc/edit#

@farhangemoein


اگه میخواین اخبار و پیپرای مهم حیطه‌ی AI و سلامت رو دنبال کنین، این سایت و مخصوصا newsletter ‌اش رو پیشنهاد میدم.

نویسنده‌هاش هم که دیگه نیاز به معرفی ندارن.

اگه شما هم منابع دیگه‌ای می‌شناسین توی کامنتا بگین حتما.

https://doctorpenguin.com/

(خب الان یه چیزی دیدم توی لینکدین بعد این‌که این پست رو گذاشتم که یکم تامل برانگیزه. کامنتا رو ببینین)

@farhangemoein

675 0 20 5 16

مقاله‌ای که دیروز توی Nature چاپ شد و در مورد Long COVID اطلاعات جالبی رو ارائه میده.

طبق این مقاله، Long COVID و حدود ۲۰۰ تا علایم شناخته‌شده‌اش میتونه تا سال‌ها و حتی تا آخر عمر بعد از فاز حاد خود COVID باقی بمونه (البته مشابه این حالت در یه سری دیگه از بیماری‌های حاد وایرال هم دیده شده قبلا).

تخمین زده میشه که حدود ۶۵ میلیون نفر توی دنیا درگیر این حالت باشن (۱۰ درصد کیس‌های شناخته شده).

تصویر اول مقاله رو میذارم که گستردگی علایم و سایت‌هایی که میتونه درگیر بکنه رو نشون میده.

https://www.nature.com/articles/s41579-022-00846-2
❤️ برای نویسنده‌های دوست‌داشتنیش :)


@farhangemoein


#music

اینم soundtrack مورد علاقه‌ام از سریال House of Dragon.
یه چیز عجیبی راجع به یه سری موزیکا هست که به طرز جالبی به دل آدم میشینن، همون دفعه‌ی اولی که می‌شنویم. این اون ویژگی رو داره برام کاملا.


معرفی تخصص AI In Healthcare

این specialization که توسط Stanford روی کورسرا ارائه میشه، پنج تا کورس داره که پایین میذارم عنوان‌هاش رو.

این کورس برای بچه‌هایی که میخوان راجع به AI و کاربرداش توی پزشکی و سلامت بیشتر بدونن ولی خیلی نمیخوان یا علاقه‌ندارن که از مسیر فنی و کدزدن واردش بشن، منبع خوبیه (خودم نگذروندمش ولی با توجه به ارائه‌دهنده‌هاش و امتیازش میشه پیش‌بینی کرد که کورس خوبیه).

من خودم راجع به این موضوع که “می‌خوام هوش‌مصنوعی یاد بگیرم ولی نمی‌خوام کد بزنم” یه سری نقد دارم ولی چون خودم biased ام به مسیری که اومدم، فعلا چیزی نمی‌گم 😀.

تایتل کورس‌هاش:
1. Intro to healthcare
2. Intro to clinical data
3. Fundamentals of machine learning for healthcare
4. Evaluations of AI applications in healthcare
5. Capstone project


https://www.coursera.org/specializations/ai-healthcare

@farhangemoein


احتمالا سایت radiopaedia رو می‌شناسین (اگه بک‌گراند پزشکی دارین) که گرافی کیس‌های مختلف رو می‌ذاره و اطلاعات خوبی ارائه میده.

الان دیدم که یه سری کیس‌های annotated هم داره که برای یادگرفتن خوندن CT خیلی می‌تونه کمک کنه؛ توی این کیس‌ها اومده اسلایس به اسلایس آیتم‌هایی که دیده میشه رو با رنگ مشخص کرده.

مثلا این مورد رو برای خوندن abdomen CT چک کنین:
https://radiopaedia.org/cases/how-to-read-a-ct-of-the-abdomen-and-pelvis

برای بقیه‌ی نواحی بدن هم از این کیس‌های annotated داره و خیلی کمک‌ می‌کنن.

@farhangemoein

863 0 43 2 29
20 last posts shown.

799

subscribers
Channel statistics