AI Pulse


Гео и язык канала: не указан, не указан
Категория: не указана


اخبار، اموزش و معرفی ابزارهای هوش مصنوعی
لینک گروه:
https://t.me/+lDuxCM_251QxYzY8

Связанные каналы  |  Похожие каналы

Гео и язык канала
не указан, не указан
Категория
не указана
Статистика
Фильтр публикаций


خوب بریم یه پست اموزشی به صورت ELI5 (explain like I'm 5)

میخوام درمورد مفهوم RAG توی LLM ها صبحت کنم

Retrieval Augmented Generation

مدل های زبانی فعلی از نوع ترنسفورمرها هستن این مدل ها ویژگی بسیار مهمی دارن. این ویژگی "درک context یا فضایی که داخلش داره صحبت میشه" هست. یعنی چی؟
مثلا شما میگین بهش که:
یک لیوان شیر خوردم
در جنگل یک شیر دیدم

اینجا مدل های ترنسفورمر درک میکنن که اولی رو منظورتون شیر نوشیدنی هست و دومی حیوان شیر هست در صورتی که مدل های قبلی این توانایی رو نداشتن

اما خود این مدل هام محدودیت دارن و گاهی اطلاعاتی که روش ترین شدن قدیمی ان یا حتی کلا اون اطلاعات رو ندارن و یه جورایی توهم میزنن یا hallucinate میکنن.


اینجاست که RAG وارد عمل میشه چطوری؟

درواقع مدل زبانی رو با یک سیستم بازیابی اطلاعات خارج از این مدل زبانی ترکیب میکنه و اینطوری مدل به جدیدترین اطلاعات و داکیومنت ها دسترسی داره که بتونه توی جواب هاش ازش استفاده کنه


یه جورایی LLM بدون RAG شبیه یه دانشجوعه که داره امتحان معمولی میده و با RAG انگار داره امتحان اوپن بوک میده


حالا RAG چطوری اینکارو میکنه؟
درواقع خود رگ از دو بخش تشکیل شده یک مدل که اطلاعات رو بازیابی میکنه و یکی که تولید میکنه

کار بخش اول اینه که براساس سوالی که ازش پرسیده شده بره و توی یه دیتاست بزرگ اطلاعات مرتبط رو پیدا کنه


حالا وقتی این اطلاعات رو پیدا کرد مدل دوم که کارش تولید هست شروع به ایجاد یه متن قابل درک میکنه براساس اون اطلاعات میکنه

@aipulse24


✨خلاصه کل اخبار مهم هوش مصنوعی در هفته گذشته✨

✏️شرکت fineweb یک دیتاست ۱۵ ترلیون توکنی تمیز و بدون محتوای تکراری رو منتشر کرد.

✏️مایکروسافت در یک شرکت هوش مصنوعی اماراتی ۱.۵ میلیارد دلار سرمایه گذاری کرد. حوزه کاری این شرکت روی راهکارهای هوش مصنوعی در زمینه سلامت، خدمات دولتی و انرژی هست

✏️مایکروسافت مدل های Phi خودش رو منتشر کرد که ۳ مدل کوچک، متوسط و بزرگ داره و قابلیت ران شدن روی تلفن های همراه رو داره

✏️متا سیستم عامل Meta Quest OS رو برای شرکت های دیگر قابل دسترس کرد که برای شرکت های مثل ایسوس، لینوو و ایکس باکس کاربردی خواهد بود

✏️هوش مصنوعی LINGO 2 عرضه شد که کارش اتصال به سیستم های هوش مصنوعی ماشین های خودران هست تا اونها بابت تصیمیاتی که حین رانندگی میگیرن بتونن توضیح بدن و بدین شکل نگرانی راجع به این سبک خودروها کمتر بشه

✏️شرکت ادوبی هوش مصنوعی تولید عکس جدید خودش رو منتشر کرد که قابلیت های مثل تکمیل پرامپت رو داره و بدون اینکه کامل با جزییات مجبور به توضیح بشین خودش پرامپت شمارو تکمیل میکنه

✏️شرکت اسنوفلیک یک مدل جدید رو ریلیز کرده و تونسته با هزینه بسیار کمی مدلی با تعداد پارامتر ۴۸۰ میلیارد رو ترین کنه هزینه ترین این مدل فقط ۲ میلیون دلار بوده😃😃


✏️بریتانیا تحقیقاتی رو در رابطه با خریدهای بسیار زیاد شرکت های امازون و مایکروسافت اغاز کرده و معتقده که علاقه زیاد این دو شرکت به خرید مدل های بنیادی باعث انحصار در بازار میشه و ممکنه درحال نقض قوانین آنتی تراست باشن

✏️ربات mentee robotics به بازار معرفی شده که شما میتونین مثل یک منتور باهاش رفتار کنین و اون از شما یاد میگیره. این ربات مصارف خانگی و صنعتی داره.

✏️شرکت اپل مدل زبانی OpenELM رو معرفی کرده که برای استفاده در گوشی های ایفون هست و تمرکزش بر استفاده افلاین و حفظ حریم شخصی هست

@aipulse24


اگه دوست دارین با Llama3 و یک سری دیگه از مدل های اوپن سورس راحت چت کنین

میتونین از قابلیت چت سایت هاگینگ فیس استفاده کنین

هم امکان استفاده از ۷ ۸تا از مدل های عمده اوپن سورس رو دارید هم کاربرهای مختلف چیزی شبیه Custom GPT ها روی این سایت درست کردن به اسم assistant ها

میتونین از این دستیارها هم استفاده کنید. هم چنین میتونین خودتون system prompt چت رو بنویسید

منظور از system prompt یک پرامپت هدایت کننده رفتار هوش مصنوعی هست مثلا میتونین توی سیستم پرامپت بنویسین که تو یک برنامه نویس خفنی و هر سوالی ازت میپرسم باید بهترین کد رو بهم بدی

بعد دیگه هر سوالی که ازش بپرسین با این رویکرد بهتون جواب میده، البته این یک مثال خیلی ساده بود برای سیستم پرامپت.

کسایی که ایفون دارن هم میتونن اپ huggingchat رو از اپ استور دانلود کنن و اونجا از این قابلیت ها استفاده کنن

لینک چت هاگینگ فیس

لینک اپ استور


Build a career in AI_231018_235737.pdf
3.5Мб
این فایل براساس نظرات و پیشنهادات Andrew Ng برای کسانی که قصد دارن مسیر شغلی شون در زمینه هوش مصنوعی باشه نوشته شده

شامل سه بخش اصلی هست

🌕 ابزارهایی که باید بلد باشید
🌕پروژه هایی که باید انجام بدید که توی رزومه تون داشته باشید
🌕نحوه کاریابی و مصاحبه

@aipulse24


Видео недоступно для предпросмотра
Смотреть в Telegram
فیلم لایو اکشن سوپر ماریو به سبک دهه ۵۰، ساخته شده توسط
هوش مصنوعی
🔎 Source


Видео недоступно для предпросмотра
Смотреть в Telegram
رید هافمن یکی از بنیانگذاران لینکدین هست
که توی شبکه های اجتماعی و انواع تولید محتوا خیلی فعال هست
کتاب های متنوع داره، پادکست داره و ایونت های مختلفی شرکت میکنه
و از جمله بنیانگذاران inflection ai هست به همراه مصطفی سلیمان که اخیرا مایکروسافت اون رو خریداری کرد

حالا یک ورژن هوش مصنوعی ازش ساختن که براساس محتواهای موجود ازش توی اینترنت ترین شده.

توی این کلیپ ورژن واقعی و هوش مصنوعی ایشون باهم صحبت میکنن!!


مدیرعامل انویدیا اولین DGX H200 در دنیا رو به شرکت OpenAI داده.

در پستی که آقای Greg Brockman در پلتفرم ایکس گذاشته گفته شده جنسن هوانگ مدیرعامل انویدیا اولین DGX H200 دنیا رو برای کمک به پیشرفت هوش مصنوعی، رایانش و بشریت به OpenAi "تقدیم کرده".

پلتفرم DGX H200 انویدیا که فقط چندماه پیش رونمایی شده حداقل ۱.۵ برابر از نسل قبلی خودش یعنی H100 قوی تره.

پ.ن: اگه دوست داشتید بیشتر درمورد این GPU بدونید میتونید دیتاشیت‌ش رو از اینجا بخونید.

🔎 Source


To solve this problem, we need to set up an equation using the given information and then solve for the sister's age.

Given information:
- When you were 6 years old, your sister's age was half of your age.
- You are currently 70 years old.

Let's define the variables:
- Let x be your sister's age when you were 6 years old.
- Let y be your current age, which is 70.

According to the given information, when you were 6 years old, your sister's age was half of your age.
Therefore, x = 6 / 2 = 3

Now, we need to find the relationship between your current age and your sister's current age.

Since the age difference between you and your sister remains constant over time, we can write:
y - x = 70 - 3 = 67

Substituting x = 3, we get:
y - 3 = 67
y = 67 + 3
y = 70

Therefore, your sister's current age is also 70 years old.

وقتی یهو وسط کار "گودرز" پیچ میشه مدل:))))))

جواب Claude


شرکت مدرنا و اوپن ai باهم قراره کار کنن تا به توسعه درمان های مبتنی بر mRNA سرعت ببخشن

قراره یک سری GPT خاص مدرنا ایجاد بشه که در تعیین میزان دوز مناسب تا برندینگ به مدرنا کمک کنه

مدرنا قراره تمام فرایندهای کسب و کارش رو با هوش مصنوعی مجدد طراحی کنه تا به تیم ۳۰۰۰ نفرشون امکان کار درحد یه تیم ۱۰۰هزار نفره رو بده


شاهد بالاترین سطح ادا هستیم😳😳😳

یک شرکت برشته کار قهوه ( 🥸🥸 چه ترجمه ی عجیبی) با استفاده از هوش مصنوعی یه ترکیب قهوه زده!

رفتن به ChatGPT و کوپایلت اطلاعات انواع قهوه رو دادن و بعد ازش پرسیدن چه ترکیبی برای عاشقان قهوه خیلی جذابه؟

اون هم گفته دونه های برزیلی و کلمبیای و اتیوپی و گواتمالا رو ترکیب کن عالی میشه

اینام ترکیب کردن گفتن عالیه به خود GPT گفتن اسمش رو چی بزاریم اونم گفته بزار AI-conic

همین دیگه🗿🗿


اپل خیلی سوسکی و بی سرو صدا یه شرکت فرانسوی در زمینه هوش مصنوعی رو خریده که گفته میشه میتونه به هدف اپل برای داشتن هوش مصنوعی توی گوشی هاش کمک کنه

(خداروشکر ماشین حساب رو اضافه کرده به ایپد هاش بعدی دیگه هوش مصنوعیه🗿🗿)

این خرید دسامبر ۲۰۲۳ انجام شده ولی تازه خبرش رسانه ای شده

تخصص شرکت DataKalab که توسط اپل خریداری شده، الگوریتم های هوش مصنوعی هست که به صورت خیلی بهینه و بدون نیاز به قدرت پردازنده بالا کار میکنن.

اپل تو سال گذشته میلادی ۳۲ تا شرکت رو خریداری کرده که این تعداد بیشتر از بقیه شرکت های تکنولوژی بزرگ هست!!

و انتظار میره توی ایونت WWDC (کنفرانس خبری تکنولوژی که هرسال اپل برگزار میکنه) از خیلی از پیشرفت هاش پرده برداری کنه


سایت دیپ لرنینگ که متعلق به Andrew Ng هست کورس جدیدی رو با همکاری میسترال لانچ کرده


شرکت میسترال مدلهای متنوع اوپن سورس و تجاری داره.
توی این کورس که برای مبتدی ها هم مناسبه نحوه کار با API این مدل ها، انتخاب بهترین مدل برای نوع کاری که نیاز دارین و یه عالمه نکته دیگه پوشش داده شده

اینجا میتونین وارد سایت بشین و رایگان این کورس رو بگذرونین


۱۵ ترلیون توکن دیتا تمیییییز ریلیز شد 😦😦😦😦
برای اینکه حجم اهمیت این داده رو درک کنین:

مدل های Llama 3 روی ۱۵ ترلیون توکن تمییز ترین شدن!

(منظور از توکن کوچک ترین واحد داده است که توسط الگوریتم ها پردازش میشن)

(منظور از تمیز هم اینه که داده بالانس هست و محتوای تکراری توش نیست)

این حجم از داده تمیز و قابل استفاده برای اموزش مدل های زبانی چیزیه که فقط داشتنش تا الان از شرکت های بزرگ با زیرساخت های غول اسا برمیومده!

ولی حالا این داده ها اوپن سورس شده!

داده ها از سال ۲۰۱۳ به این طرف هست و برای کمک به پیشرفت و توسعه این حوزه به صورت رایگان و اوپن سورس ارائه شده!


شرکتی به اسم‌ fineweb این داده هارو منتشر کرده. اگر امکان کار کردن باهاش رو دارید:)))

این لینکش🤪

داده خفن


در چندماه اخیر که محبوبیت مدل های زبانی به اوج خودش رسیده و حالا عامه مردم میتونن خیلی راحت به اونها دسترسی داشته باشن، برای خیلی از افراد نوشتن پرامپت و اینکه پرامپت به چه نحوی نوشته بشه باعث میشه نتایج با کیفیت‌تر و بهتری بگیریم تبدیل به چالش شده.

گوگل یه سری بلاگ جدید رو شروع کرده به نام Beyond the Prompt که قراره توی این بلاگ نکاتی رو پوشش بده که باعث میشه پرامپت بهتری بنویسیم و درنتیجه استفاده بهینه تری از مدل های زبانی داشته باشیم.

گوگل توی اولین پست از این بلاگ توضیح داده که پرامپت چیه، چقدر اهمیت داره، و یک فرمول هم برای نوشتن پرامپت منتشر کرده.

همچنین برای کسایی که نمیخوان صبر کنن تا این بلاگ به مرور آپدیت بشه، گوگل یه کتاب ۴۵ صفحه‌ای هم منتشر کرده که تمام نکات پرامپت نویسی رو به طور کامل و با مثال توضیح داده که از اینجا میتونید دانلودش کنید.

🔎 Source


به نظر میرسه قراره هفته ای ۶۰۰ تا فیلم هالیوود ریلیز کنه


یک آژانس استعدادیابی هالیوود به اسم CAA پروژه ای رو شروع کرده که مشتری های شناخته شده اش میتونن یک clone از خودشون بسازن.

این آژانس با موسسات هوش مصنوعی مختلف داره همکاری میکنه تا چهره، صدا و بدن بازیگرهارو اسکن کنه که در مصارف مختلفی از جمله بدلکاری ها ازشون استفاده بشه


اکی!
برای کسایی که به کلیت هوش مصنوعی علاقه دارن ولی دانش اکادمیک ندارن (خودمم ندارم البته 😃) و دوست دارن از یه سری اصطلاحات رایج سر دربیارن
یه جور واژه نامه درست کردم که اینطوری به درک بهتر اخبار مرتبط با هوش مصنوعی هم کمک میکنه

✈️یادگیری عمیق deep learning
سبکی که کامپیوترها با ارائه مثال های متعدد اموزش میبینن مثل همونطوری که ما از تجربیاتمون یاد میگیریم. یادگیری عمیق از یک سری برنامه کامپیوتری به نام شبکه های عصبی استفاده میکنه تا بتونه در داخل داده ها نوعی الگوی تکرار شونده پیدا کنه مثلا یادمیگیره با استفاده از چه المان هایی یه گوربا🤨 رو شناسایی کنه

✈️شبکه های عصبی neural network
یه نوعی از برنامه های کامپیوتری که با استفاده از‌ گره های بهم متصل مثل مغز انسان کار میکنه.

✈️ ترنسفورمر transformer
یک نوع خاصی از شبکه های عصبی که گوگل خلقشون کرده که به خلق و درک بهتر زبان کمک میکنه مثلا کامپیوترهایی که میتونن با شما چت کنن

✈️ پارامتر Parameter
بخش های از شبکه های عصبی که در زمان ترینیگ (یادگیری) قابل تغیبر و تنظیم هستن تا اون شبکه بهتر یاد بگیره مثل تنظیم گیتار قبل نواختن

✈️(در مورد این فارسی کیلی کیلی کم😬) positional encoding
روشی است که براساس اون ترنسفرمر ها ترتیب کلمات دز جمله رو درک میکنن یعنی میفهمن "گوربا بهتر از سگ است" با "سگ بهتر از گوربا است" فرق میکنه😎

✈️جی پی تی GPT
نوعی از ترنسفورمرها که به کامپیوترها کمک میکنه تا عین انسان حرف بزنن و متن بنویسن

✈️مدل های بنیادی Foundation model
مدل های هوش مصنوعی بزرگ که میتونن برای مصارف مختلفی مورد استفاده قرار بگیرن

✈️ فاین تیون کردن fine tuning
تمرین و تنظیم یک مدل هوش منصوعی که برای یک تسک یا وظیفه خاصی بهتر عمل کنه

✈️مهندسی پرامپت نویسی prompt engineering
نحوه ارائه درخواست و اینترکت کردن با هوش مصنوعی برای اینکه درک بهتری از منظور شما داشته باشه و جواب های بهتری بده

✈️لورا LoRas
مدل های سبک و خاص که روی مدل های بزرگ سوار میشن تا برای یک ویژگی یا تسک خاص به مدل اصلی کمک کنن تا عملکرد بهتری داشته باشه مثلا یک لورا چشم ابی روی یک مدلی که عکس های انیمه تولید میکنه سوار میشه تا اون عکس‌های انیمه ها با چشم ابی جنریت بشن


✈️سوگیری Bias
وقتی یک هوش مصنوعی اشتباه میکنه چون داده ای که روش ترین شده بالانس نبوده مثلا فکر میکنه همه پزشک‌ها مرد هستن چون فقط اطلاعات پزشک‌های مرد بهش داده شده


✈️(عمرا فارسی اینو بنویسم) oobabooga 🥺🥺

مدل های هوش مصنوعی شبیه برنامه ای هستن که راه ارتباطی باهاشون نیست برای استفاده ازشون نیاز بهui وجود داره که معروف ترین ui برای مدل های تولید متن این خدا زده است!


اینا بیشتز اصطلاحات رایج مدل های متنی بود
بعدا یکی هم برای stable diffusion که عمده ترین مدل تولید عکس اوپن سورس هست مینویسم

81 2 3 15 11

مایکروسافت از مدل هوش مصنوعی VASA-1 رونمایی کرده که می‌تونه فقط با عکس شخص و صدای ضبط شده اون، ویدئوی اون شخص درحال حرف زدن یا آواز خوندن رو تولید کنه.

این مدل هوش مصنوعی که مخفف Visual Affective Skills Animator هست با استفاده از یادگیری ماشینی عکس رو آنالیز می‌کنه و بعد یک ویدئوی کاملا واقع گرایانه بر اساس اون عکس تولید میکنه.

مایکروسافت گفته از لحاظ واقعی بودن، ویدیوهایی که این مدل تولید میکنه به طرز چشمگیری بهتر از مدل‌های مشابه قبلی هستن.

همچنین از مزایای دیگه این مدل هم اینه که میتونه در لحظه ویدئوی ساخته شده رو با رزولوشن ۵۱۲×۵۱۲ پیکسل و ۴۰ فریم بر ثانیه خروجی بده که این باعث شده گزینه مناسبی برای استریم ویدئو مثلا در ویدئو کنفرانس ها باشه.

🔎 Source


✨خلاصه کل اخبار مهم مرتبط با هوش مصنوعی توی هفته گذشته✨

✏️اپل چیپ جدیداش رو معرفی کرد که عملکرد هوش مصنوعی توی مک های نسل اینده رو بهبود میده

✏️ابزار پوشیدنی 😒 جدید به اسم limitless به بازار اومده که همه مکالماتت رو برات خلاصه میکنه

✏️ گروک ۱.۵ به بازار معرفی شد که حالا تصویرو هم پردازش میکنه

✏️شرکت ادوبی قابلیت های هوش مصنوعی جدید به فایرفلای اضافه کرد از جمله تولید ویدیو توی پرمیر پرو

✏️شرکت Reka که توسط مهندسایی از شرکت های deepmind و گوگل راه اندازی شده مدل جدید به بازار داد

✏️اوپن ai یه سری تغییرات در سرویس API خودش داد از جمله کاهش ۵۰٪ هزینه

✏️مایکروسافت VASA-1 رو داد که عکس رو متحرک میکنه

✏️بوستون داینامیکس ربات تمام الکترونیک خودش رو معرفی کرد

✏️متا هم مدل جدیدش یعنی 3 Llama رو معرفی کرد.


مدل هوش مصنوعی GPT-4 موفق شده در یک رقابت با ۱۸۰ نفر از دانشجوهای روانشناسی یک دانشگاه در عربستان سعودی، همه اون هارو شکست بده.

این تست که هدف اون سنجش میزان هوش اجتماعی روانشناسان بوده، که یک امر حیاتی برای درمان بیمارانه، شامل ۶۴ سناریو بوده که هم روانشناسان و هم مدل های زبانی مختلف در این تست شرکت کردن.

مدل هوش مصنوعی GPT-4 تونسته امتیاز ۵۹ از ۶۴ رو توی این تست کسب کنه، درحالی که میانگین امتیاز روانشناسان ۳۹ بوده.

مدل های زبانی دیگه هم توی این تست به کار گرفته شدن که بینگ، بعد از GPT-4 با امتیاز ۴۸ تونسته ۹۰٪ بهتر از نمونه های انسانی عمل کنه.

گوگل بارد هم در رده آخر قرار گرفته و تونسته ۴۰ امتیاز به دست بیاره.

🔎 Source


دوتا فاکتور اساسی در رتبه بندی مدل های زبانی اهمیت دارن

🌕 میزان هزینه و پارامترها
🌕 نوع عملکردش

به طور کلی تا الان برای اینکه ما مدل هایی داشته باشیم که عملکرد بهتری دارن مجبور بودیم که تعداد پارامترهارو بیشتر کنیم و افزایش تعداد پارامتر هم یعنی افزایش هزینه های اون مدل


اما چند وقت پیش میسترال مدلی رو داد که به این مدل ها میگن MOE یا Mixture of experts منظور این هست که این مدل ها در آن واحد از همه پارامتر ها استفاده نمیکنن و براساس نیاز کاربر یک سری از پارامتر هارو فعال میکنن

این رویکرد باعث کاهش هزینه ها میشه
میسترال مدل قبلی که این سبکی داد 8×7b بود حالا اخیرا مدل 8×22b رو منتشر کرده که با افزایش خیلی کم در تعداد پارامترها و هزینه ها عملکرد بسیار بهتری داره!

توی بنچ مارک ها این مدل عملکرد بسیاااز خوبی نشون داده و از LLaMA 2 70B بسیار بهتر بوده با هزینه و پارامتری بسیار کمتر


چیزی که مشخصه هر روز داریم به سمتی میریم که هوش مصنوعی های اوپن سورس بیشتر و بیشتر در دسترس عموم قرار بگیرن و نیاز نباشه برای استفاده ازشون از کامپیوترهای خیلی قوی استفاده کرد

همون ترندی که توی اغلب تکنولوژی ها قبلا هم شاهد بودیم مثل ابزارهای ذخیره سازی داده که قبلا توی یه کامیون جا میشدن و الان توی جیب!

منتهی این سری روند این تغییرات خیلی سریع تر از تکنولوژی های قبلی هست

Показано 20 последних публикаций.

69

подписчиков
Статистика канала