Data world with Mina


Channel's geo and language: not specified, not specified
Category: not specified


minarabti32@gmail.com
منبع مطالب يادگيري ماشين،پايتون ،داده كاوي ،هوش مصنوعي، دانلود داده، فيلم هاي آموزشي رايگان، داده
ارتباط با ادمین
@Datalook_mina
اینستاگرام:mina.rabti

Related channels  |  Similar channels

Channel's geo and language
not specified, not specified
Category
not specified
Statistics
Posts filter






Forward from: پانته‌آ وزیری
این روزها درگیر سبک سنگین کردن قدمهای بعدی مسیر شغلی هستم.

شما فرض کنید کلی آدم به شما میگن لیاقت شما نشستن در یک جایگاه شغلی خاص هست. نتایج ارزیابی‌های داخلی شرکت هم نشان می‌دهد که شما برای این سطح بالای شغلی آماده هستید.

اما مشاغلی که به شما پیشنهاد می‌شود در اون سطح نیست. چرا؟ چون من جایی هستم که مشاغل اون سطح به تعداد انگشت‌های یک دست هم نیست و هیچکدام خالی نیست.‌

بعد من دیدم خیلی درونی احساس سرافکندگی - shame - را تجربه میکنم. مونده بودم چرا؟

خیلی فکر کردم و دیدم برای اینه که احساس شِیم میکنم که نتونسته‌ام الان اون شغلی که همه فکر می‌کنند باید پیدا کنم رو پیدا کنم. یعنی خودم رو از دید اونها نگاه میکنم.

در صورتیکه مسیر زندگی هیچوقت سرراست نیست. هیچوقت نبوده. برای اکثر ما آدمهای معمولی آپشنهامون اکثر اوقات با لیاقتهامون دقیق جور در نمیاد.

وقتی خودمون رو از دید دیگران قضاوت میکنیم به اون منِ ساخته شده از دید دیگران - ایگو- بیش از خودمون در شرایط الان اهمیت دادیم‌. از لحاظ استراتژیکی این یک اشتباه مهلکه. چون ما برای جنگی که فقط توی کله‌مونه مهره‌هامون رو میچینیم نه جنگی که واقعا داره اتفاق میفته. اگر از غرور جریحه دار شده‌مون بگذریم میتونیم با آپشنهایی که داریم بهترین تصمیم رو بگیریم.

این بکگراند تلفن رو دادم مانیشا با این جمله‌ای که از جایی شنیده بودم طراحی کرد. برای شما هم میگذارم ...هدیه 🌱

Everything you want is on the other side of ego.


آموزش پذیر باش. همیشه تو درست نمیگی. همیشه حق با تو نیست. این جمله سر لوحه من تو کارم، روابطم و خیلی چیزاست.
🌹🌹

634 0 12 2 32

Git Notes 📝.pdf
61.8Mb
📚 آموزش کامل Git و ابزارهای کاربردی آن
اگر می‌خواهید مدیریت نسخه‌ها و همکاری تیمی در پروژه‌هایتان را به سطح جدیدی ببرید، Git ابزاری است که نباید از آن غافل شوید! 🚀

در این فایل آموزشی، همه چیز از مبانی Git تا ابزارهای حرفه‌ای برای توسعه‌دهندگان به زبان ساده توضیح داده شده است.

🔗 دانلود آموزش در فایل پیوست
💡 سوالات و تجربیات خود را در کامنت‌ها با ما به اشتراک بگذارید!

#Git #توسعه_دهندگان #آموزش_فنی #مدیریت_نسخه


🚨Data Science Interview Questions


1.     Multiple Linear Regression?

3.     OLS vs MLE?

4.     R2 vs Adjusted R2?
During Model Development which one do we consider?

5.     Lift chart, drift chart

6.     Sigmoid Function in Logistic regression

7.     ROC what is it? AUC and Differentiation?

8.     Linear Regression from Multiple Linear Regression

9.     P-Value what is it and its significance? What does P in P-Value stand for? What is Hypothesis Testing? Null hypothesis vs Alternate Hypothesis?

10.  Bias Variance Trade off?
11.  Over fitting vs Underfitting in Machine learning?

12.  Estimation of Multiple Linear Regression

13.  Forecasting vs Prediction difference? Regression vs Time Series?

14.  p,d,q values in ARIMA models
      1.     What will happen if d=0
      2.     What is the meaning of p,d,q values?

16.  How to find the node to start with in a Decision tree.

17.  TYPES of Decision trees - CART vs C4.5 vs ID3

18.  Gini index vs entropy

19.  Linear vs Logistic Regression

20.  Decision Trees vs Random Forests

21.  Questions on liner regression, how it works and all
22.  Asked to write some SQL queries

23.  Asked about past work experience

24.  Some questions on inferential statistics (hypothesis testing, sampling techniques)

25.  Some questions on table (how to filter, how to add calculated fields etc)


27.  What certification Have u done?

28.  What is a Confidence Interval?

29.  What are Outliers? How to Detect Outliers?

30.  How to Handle MissingValue?


Forward from: STeam
Video is unavailable for watching
Show in Telegram
⏰ زمان محدود است، پس همین حالا ثبت‌نام کنید تا از این تحول بزرگ بی‌نصیب نمانید!

🔗 برای ثبت‌نام در بخش ارائه های اسانسوری و کسب اطلاعات بیشتر، با شماره تماس  زیر در ارتباط باشید:

09302364570 سرکار خانم فتحی

❤🧡💛 این یک فرصت استثنائی است که نباید از دست بدید!

🔗 لینک ثبت‌نام حضار در رویداد :
http://Evand.com/events/pandora3-ai

https://t.me/paradisehub

علی رشیدی
بنیانگذار استارتاپ شبکه اجتماعی استیم (STeam)


واقعیت پشت شغل یک دانشمند داده 💡

تفاوت بین انتظارات و واقعیت در شغل یک دانشمند داده. در اینجا یک مرور کلی آورده شده است:

📝 انتظارات:

80٪ یادگیری ماشین: بسیاری تصور می‌کنند که بیشتر کار یک دانشمند داده حول ساخت مدل‌های پیچیده یادگیری ماشین می‌چرخد.

20٪ یادگیری عمیق: همچنین انتظار دارند که یادگیری عمیق بخش کوچک اما قابل‌توجهی از نقش را تشکیل دهد.


🔍 واقعیت:

30٪ درک مسئله: بخش قابل‌توجهی از کار، درک عمیق مسئله‌ای است که قرار است حل شود.

20٪ جمع‌آوری داده: جمع‌آوری و آماده‌سازی داده‌های مرتبط از منابع مختلف.

20٪ نگهداری: به‌روزرسانی مدل‌ها و اطمینان از اینکه سیستم‌ها همان‌طور که باید عمل می‌کنند.

10٪ پاکسازی داده: آماده‌سازی داده‌ها برای اطمینان از اینکه برای تحلیل مناسب هستند—که اغلب به عنوان خسته‌کننده‌ترین بخش شناخته می‌شود.

10٪ مهندسی ویژگی: ایجاد ویژگی‌هایی که به مدل‌ها کمک می‌کند مؤثرتر یاد بگیرند.

10٪ یادگیری ماشین/عمیق: برخلاف انتظارات، وظایف مربوط به یادگیری ماشین و یادگیری عمیق تنها بخش کوچکی از نقش را تشکیل می‌دهند.

@datalook_ir
#هوش_مصنوعی #دانشمند_داده
#دیتا_ساینس #یادگیری_ماشین

873 0 40 3 22



Forward from: Data world with Mina
کپشن پست رویداد



🌟 به جمع فعالان هوش مصنوعی بپیوندید! 🌟

آیا شما نیز به دنبال فرصتی برای گسترش شبکه ارتباطی‌تان و یادگیری از بهترین‌های صنعت هستید؟ ما به شما رویداد منحصر به فرد «شبکه‌سازی صنایع با فعالان هوش مصنوعی» را معرفی می‌کنیم! 🤖✨

🌟رویداد رایگان هست ،ولی جهت ورود به رویداد باید ثبت‌نام انجام گیرد🌟

📅 تاریخ: ۲۱ و ۲۲ آذرماه
📍 محل برگزاری: تهران - ونک - صندوق نوآوری و شکوفایی ریاست جمهوری
🕒 زمان: ۹ الی ۱۷

💡 چرا باید شرکت کنید؟ 
- یادگیری از برترین‌ها: تجربه‌های ناب و آموزنده از مدرسان و متخصصان برجسته در زمینه هوش مصنوعی.
- شبکه‌سازی ارزشمند: ارتباط با فعالان و کارآفرینان موفق این حوزه و تبادل ایده‌ها.
- فرصت‌های همکاری: شناسایی و ایجاد همکاری‌های جدید که می‌تواند به رشد حرفه‌ای شما کمک کند.

✨ این یک فرصت استثنائی است که نباید از دست بدهید! ثبت‌نام کنید و با ما به سوی آینده‌ای روشن‌تر حرکت کنید. ✨

🔗 اینجا ثبت‌نام کنید: http://Evand.com/events/pandora3-ai

ما منتظرتان هستیم! بیایید در کنار هم آینده‌ساز باشیم! 💪🌐

#هوش_مصنوعی #شبکه‌سازی #فرصت_یادگیری #کارآفرینی #هوشمندانه


2411.10109v1.pdf
2.9Mb
محققان نشان دادند: هوش مصنوعی می‌تواند شخصیت افراد را تقلید کند.

پژوهشی جدید نشان داده مصاحبه‌ای ۲ ساعته با هوش مصنوعی برای تقلید شخصیت افراد و آشنایی با علایق و ارزش‌های آنها کفایت می‌کند.

طبق مقاله جدیدی که پژوهشگران دانشگاه استنفورد و بخش دیپ‌مایند شرکت گوگل منتشر کرده‌اند، یک مدل هوش مصنوعی می‌تواند فقط طی ۲ ساعت، از شخصیت افراد الگوبرداری و تقلید کند. طی زمان گفته‌شده، اطلاعات گوناگونی از فرد خواسته می‌شود که شامل خاطرات، افکار و نظرات درباره موضوعات مختلف است. برای چنین مدلی هوش مصنوعی مقلد نام برازنده‌ای به نظر می‌رسد که در مقابل هوش مصنوعی مولد قرار می‌گیرد.

هزار نفر با سن، جنسیت، نژاد، سطح سواد و سوگیری سیاسی متفاوت در پژوهش اخیر که یکی از دانشجویان دکترای دانشگاه استنفورد آن را هدایت کرده است. به هر فرد ۱۰۰ دلار پرداخت شد تا با هوش مصنوعی مصاحبه کند و مدلی از شخصیت آنها ساخته شد. در ادامه مجموعه‌ای از پرسش‌ها و نظرسنجی‌ها انجام شد تا هماهنگی مدل مجازی و شخصیت حقیقی فرد سنجیده شود. نتایج نشان می‌دهد هوش مصنوعی توانسته به‌صورت میانگین تا ۸۵ درصد انتخاب‌های افراد را به‌درستی پیش‌بینی کند.


اثری شنیدنی از استاد بابک بیات
موسیقی بی‌کلام
❤️❤️❤️❤️

🗓️ ۵ آذر، سالگرد درگذشت بابک بیات

@ChelcheraghMag


کپشن پست رویداد



🌟 به جمع فعالان هوش مصنوعی بپیوندید! 🌟

آیا شما نیز به دنبال فرصتی برای گسترش شبکه ارتباطی‌تان و یادگیری از بهترین‌های صنعت هستید؟ ما به شما رویداد منحصر به فرد «شبکه‌سازی صنایع با فعالان هوش مصنوعی» را معرفی می‌کنیم! 🤖✨

🌟رویداد رایگان هست ،ولی جهت ورود به رویداد باید ثبت‌نام انجام گیرد🌟

📅 تاریخ: ۲۱ و ۲۲ آذرماه
📍 محل برگزاری: تهران - ونک - صندوق نوآوری و شکوفایی ریاست جمهوری
🕒 زمان: ۹ الی ۱۷

💡 چرا باید شرکت کنید؟ 
- یادگیری از برترین‌ها: تجربه‌های ناب و آموزنده از مدرسان و متخصصان برجسته در زمینه هوش مصنوعی.
- شبکه‌سازی ارزشمند: ارتباط با فعالان و کارآفرینان موفق این حوزه و تبادل ایده‌ها.
- فرصت‌های همکاری: شناسایی و ایجاد همکاری‌های جدید که می‌تواند به رشد حرفه‌ای شما کمک کند.

✨ این یک فرصت استثنائی است که نباید از دست بدهید! ثبت‌نام کنید و با ما به سوی آینده‌ای روشن‌تر حرکت کنید. ✨

🔗 اینجا ثبت‌نام کنید: http://Evand.com/events/pandora3-ai

ما منتظرتان هستیم! بیایید در کنار هم آینده‌ساز باشیم! 💪🌐

#هوش_مصنوعی #شبکه‌سازی #فرصت_یادگیری #کارآفرینی #هوشمندانه




گوگل با هوش مصنوعی سایت‌های ناشر محتوایی با «سئوی انگلی» را تنبیه می‌کند


گوگل به‌عنوان بزرگ‌ترین موتور جست‌وجوی جهان، همواره تلاش می‌کند تا کیفیت نتایج جستجو را بهبود بخشد و تجربه کاربری را بهینه‌سازی کند. در همین راستا، این شرکت اخیراً تغییرات قابل‌توجهی در الگوریتم‌های خود اعمال کرده که هدف اصلی آن‌ها، مقابله با محتوای بی‌کیفیت و سئو انگلی (parasite SEO) است.

درواقع، سئو انگلی به محتوایی گفته می‌شود که به‌جای تمرکز بر نیازهای کاربران و ارائه‌ی اطلاعات مفید، صرفاً برای بهبود رتبه در نتایج جستجو تولید می‌شود. این نوع محتوا معمولاً کم‌کیفیت، تکراری و فاقد ارزش محسوب می‌شوند و تجربه‌ی کاربری نامطلوبی را برای کاربران ایجاد می‌کند.

یکی‌از نمونه‌های بارز محتوای سئو انگلی، انتشار مقالات و صفحاتی است که ارتباط کمی با موضوع اصلی سایت دارند، اما بیش‌از‌حد از کلمات کلیدی پرکاربرد استفاده می‌کنند. همچنین، تولید انبوه محتواهای تکراری با تغییر جزئی در کلمات و عبارات، از دیگر روش‌های رایج سئو انگلی محسوب می‌شود.

گوگل با به‌روزرسانی‌های اخیر الگوریتم‌های خود، به‌شدت روی شناسایی و کاهش رتبه‌ی این نوع محتوا تمرکز کرده است. غول دنیای جست‌و‌جو با استفاده از هوش مصنوعی پیشرفته، قادر است محتوای باکیفیت را از محتوای بی‌کیفیت تشخیص دهد و سایت‌هایی را که از روش‌های سئو انگلی استفاده می‌کنند با اعمال جریمه، تنبیه کند. همچنین، گوگل به سایت‌هایی که از خدمات تولید محتوا به‌صورت انبوه و بی‌کیفیت استفاده می‌کنند نیز هشدار داده است.




🔶رانش مفهوم یا گذار مفهوم
  (Concept Drift)

تغییر تدریجی مفهوم_Concept Drift در یادگیری ماشین به معنی تغییر ویژگی‌های آماری متغیر مورد مطالعه است به طوری که مدل در طول زمان به صورت پیش‌بینی نشده‌ای تغییر می‌کند. رانش مفهوم باعث می‌شود که پیش‌بینی‌ها با گذر زمان دقت خود را از دست بدهند.

✅ این پدیده می‌تواند باعث کاهش دقت و عملکرد مدل یادگیری ماشین شود، زیرا روابطی که مدل در زمان آموزش یاد گرفته است دیگر با الگوهای داده‌های جدید مطابقت ندارند.
🔶 انواع تغییر مفهوم Concept Drift

1-تغییر ناگهانی: توزیع داده‌ها به طور ناگهانی تغییر می‌کند.
مثال: تغییر ناگهانی در سیاست‌های یک کسب‌وکار که رفتار مشتریان را تحت تأثیر قرار می‌دهد.
2- تغییر تدریجی: توزیع داده‌ها به مرور زمان تغییر می‌کند.
مثال: تغییرات آرام در ترجیحات مشتریان به دلیل روندهای بازار.
3-تغییر دوره‌ای: الگوها در بازه‌های زمانی مختلف تکرار می‌شوند، اغلب به صورت فصلی.
مثال: تغییرات فصلی در روند فروش محصولات. و در این حالت مدل‌های ثابت نمی‌توانند در چرخه‌های تکراری پیش‌بینی دقیقی داشته باشند.
4-تغییر پیوسته: تغییرات تدریجی و مداوم در توزیع داده‌ها.
مثال: تغییر آرام در داده‌های حسگرها به دلیل فرسودگی تجهیزات. که در این حالت مدل به مرور زمان منسوخ می‌شود.
برای مقابله با رانش داده‌ها روش‌های مختلف و متعددی موجود است. برای مثال می‌توان الگوریتم را با استفاده از روش‌های یادگیری آنلاین بر روی داده‌ها برازش کنیم. همچنین با استفاده از راهکارهای آماری و مقایسه‌ی توزیع داده‌ها با روش‌هایی مانند
روش KL Divergence
یا جنسون شنون (Jenson Shannon نمونه‌ای از داده‌های جدید را به صورت دوره‌ای با داده‌های قبلی (که الگوریتم بر روی آن‌ها یادگرفته شده است)، مقایسه کرده تا بفهمیم که آیا داده‌ها دچار رانش شده است یا خیر. با این کار می‌توانیم به صورت دوره‌ای یک مجموعه‌ی داده‌ی آموزشی ایجاد کرده و الگوریتم را هر چند وقت یک بار بر روی داده‌های جدید برازش کنیم.

🔺سایر روشهای مقابله: بازآموزی دوره‌ای مدل Periodic Model Retraining،  به‌روزرسانی مداوم پارامترهای مدل با ورود داده‌های جدید مانند الگوریتم گرادیان نزولی تصادفی (SGD)، آموزش مدل با استفاده از یک پنجره متحرک از داده‌های اخیر Window-based Approaches

#یادگیری_ماشین
#concept_drift
@datalook_ir


Forward from: Data world with Mina
🔶در #یادگیری_ماشین ، هایپرپارامترها تنظیماتی هستند که شما قبل از آموزش مدل خود پیکربندی می کنید.
برخلاف پارامترهایی که مدل شما در طول آموزش یاد می گیرد، هایپرپارامترها باید از قبل تنظیم شوند. یافتن هایپرپارامترهای مناسب می تواند عملکرد مدل شما را تا حد زیادی افزایش دهد و بهینه سازی هایپرپارامتر را ضروری می کند.

✔️فراپارامترهای بهینه سازی مناسب
می توانند دقت و قابلیت اطمینان مدل را به طور قابل توجهی افزایش دهند.
آنها به مدل شما کمک می کنند تا به خوبی تعمیم یابد و از overfitting (در مواردی که مدل بیش از حد با داده های آموزشی متناسب است) و underfitting (که در آن مدل به اندازه کافی پیچیده نیست تا الگوهای اساسی را به تصویر بکشد) اجتناب می کنند.


🔶پروژه متن باز optana توسط Preferred Networks, Inc. ایجاد شد و در سال 2018 به یک پروژه متن باز تبدیل شد. این پروژه برای مقابله با چالش های بهینه سازی هایپرپارامتر طراحی شده است و رویکردی کارآمدتر و سازگارتر از روش های قبلی ارائه می دهد. از زمان انتشار، Optuna طرفداران زیادی پیدا کرده است.

این روش Optuna چندین ویژگی برجسته را ارائه می دهد که آن را به ابزاری قدرتمند برای بهینه سازی هایپرپارامتر تبدیل می کند. جستجو برای بهترین هایپرپارامترها را خودکار می کند، حدس و گمان را از تنظیم خارج می کند و به شما امکان می دهد روی توسعه مدل خود تمرکز کنید.

در این مقاله می توانید آموزش نصب، و استفاده از متد برای بهینه سازی هایپرپارامترهای مدلهای Xgboost و شبکه عصبی با #pytorch را ببینید.

https://towardsdatascience.com/machine-learning-optimization-with-optuna-57593d700e52


استارتاپ فرانسوی Mistral از مدل‌های جدید هوش مصنوعی خود و قابلیت‌های مختلف چت‌بات Le Chat رونمایی کرد. اکنون این چت‌بات بیش‌ازپیش می‌تواند با ChatGPT رقابت کند.

براساس اعلام وب‌سایت Mistral، این شرکت از مدل بزرگ Pixtral Large خود پرده برداشت. این مدل 124 میلیارد پارامتری بر پایه مدل قبلی Mistral Large 2 که تابستان 2024 رونمایی شد و اولین مدل چندوجهی آن، Pixtral 12-B که در سپتامبر منتشر شد، توسعه یافته است.

مدل جدید با پنجره زمینه 128 هزار توکنی می‌تواند تا 30 تصویر با وضوح بالا یا کتابی 300 صفحه‌ای را در هر ورودی هندل کند که تقریباً می‌تواند با مدل‌های جدید OpenAI رقابت داشته باشد. این مدل عملکرد پیشرفته‌ای را در بنچمارک‌های مختلف ازجمله MathVista ،DocVQA و VQAv2 نشان داده است و آن را برای کارهایی مانند تفسیر نمودار، تجزیه‌وتحلیل اسناد و درک تصویر ایده‌آل می‌کند.


کتابخانه های مفید استخراج ویژگی برای سری زمانی


🔸کتابخانه Tsfresh یک کتابخانه قدرتمند است که به صورت خودکار صدها ویژگی از داده‌های سری زمانی استخراج می‌کند. این کتابخانه طیف گسترده‌ای از ویژگی‌های سری زمانی را از معیارهای آماری ساده گرفته تا الگوریتم‌های پیچیده محاسبه می‌کند.
این قابلیت باعث می‌شود که Tsfresh به ویژه برای استخراج جامع ویژگی‌ها بدون نیاز به مداخله دستی بسیار کاربردی باشد.

🔶کتابخانه SKtime یک فریمورک یکپارچه برای یادگیری ماشین با سری‌های زمانی است که شامل قابلیت‌هایی برای استخراج ویژگی نیز می‌باشد.
این فریمورک ابزارهایی برای تبدیل سری‌های زمانی و استخراج ویژگی‌های مرتبط ارائه می‌دهد.

🔺 فریمورک Featuretools یک چارچوب برای مهندسی ویژگی خودکار است که در مدیریت مجموعه داده‌های زمانی و رابطه‌ای بسیار قدرتمند عمل می‌کند.
این ابزار از روش Deep Feature Synthesis استفاده می‌کند تا به صورت خودکار ویژگی‌هایی را از چندین جدول داده مرتبط ایجاد کند و امکان تولید ویژگی‌های پیچیده از روابط وابسته به زمان را فراهم می‌سازد.

✅ کتابخانه Scipy Stats مجموعه‌ای جامع از توابع آماری و توزیع‌های احتمالی ارائه می‌دهد که برای استخراج ویژگی‌های آماری از داده‌های سری زمانی بسیار مفید است.

مجموعه Scipy.signal ابزارهای پردازش سیگنال ارائه می‌کند که برای تحلیل سری زمانی بسیار کاربردی هستند. این ابزارها شامل توابعی برای فیلترگذاری، نمونه‌برداری مجدد، و تحلیل طیفی هستند که می‌توان از آن‌ها برای استخراج ویژگی‌ها در حوزه فرکانس استفاده کرد.

🔸کتابخانه Tsfel یک کتابخانه کاربردی است که به طور خاص برای استخراج ویژگی از داده‌های سری زمانی طراحی شده است.
این کتابخانه طیف گسترده‌ای از ویژگی‌های سری زمانی را در حوزه‌های مختلف (آماری، طیفی، زمانی) ارائه می‌دهد، که آن را به ابزاری متمرکز و کارآمد برای وظایف مهندسی ویژگی سری‌های زمانی تبدیل می‌کند.

✅ کتابخانه Feature-engine یک کتابخانه عمومی برای مهندسی ویژگی است که شامل قابلیت‌هایی قابل استفاده برای داده‌های سری زمانی می‌باشد.
اگرچه این کتابخانه به طور خاص برای سری‌های زمانی طراحی نشده است، اما تکنیک‌هایی برای تبدیل متغیرها و روش‌های کدگذاری ارائه می‌دهد که می‌توانند در زمینه‌های مرتبط با سری زمانی مفید واقع شوند.
@datalook_ir

20 last posts shown.