مدلهای هوش مصنوعی (Artificial Intelligence Models) به الگوریتمها یا سیستمهایی گفته میشه که میتونن از دادهها یاد بگیرن، الگوها رو تشخیص بدن، و تصمیمگیری یا پیشبینی انجام بدن بدون اینکه صراحتاً برای اونها برنامهنویسی شده باشن.
چند دستهی اصلی از مدلهای هوش مصنوعی وجود داره:
1. مدلهای یادگیری ماشین (Machine Learning)
اینها بر پایهی داده و یادگیری آماری هستن. شامل:
مدلهای نظارتشده (Supervised Learning): مثل Linear Regression، Decision Tree، Random Forest، Support Vector Machine، که با دادههای برچسبدار آموزش میبینن.
مدلهای بدون نظارت (Unsupervised Learning): مثل K-Means، DBSCAN، PCA، که روی دادههای بدون برچسب کار میکنن.
مدلهای یادگیری تقویتی (Reinforcement Learning): مدل با آزمون و خطا در محیط آموزش میبینه (مثل AlphaGo یا سیستمهای بازیساز).
2. مدلهای یادگیری عمیق (Deep Learning)
زیرمجموعهای از یادگیری ماشینه و از شبکههای عصبی مصنوعی (Artificial Neural Networks) استفاده میکنه:
CNN (شبکههای کانولوشنی): مخصوص تحلیل تصاویر.
RNN و LSTM: برای دادههای ترتیبی و سریهای زمانی مثل متن یا صدا.
Transformer: مثل BERT، GPT، که مخصوص پردازش زبان طبیعی (NLP) هستن و پایهی مدلهای زبانی مدرنان.
3. مدلهای زبانی بزرگ (Large Language Models)
مدلهایی مثل:
GPT (Generative Pre-trained Transformer): مثل همین چتباتی که باهاش صحبت میکنی.
BERT، RoBERTa، T5، LLaMA، Gemini، Claude و… که برای درک و تولید زبان طبیعی طراحی شدن.
4. مدلهای مولد (Generative AI)
مدلهایی که میتونن محتوای جدید بسازن، مثل:
مدلهای تولید متن: GPT
مدلهای تولید تصویر: DALL·E، Midjourney، Stable Diffusion
مدلهای تولید صدا و ویدیو