تا همین اواخر، مدلهای هوش مصنوعی زبانی بزرگ (LLM) مانند کلود (Claude) و دیگر سیستمهای مشابه، از دید ما کاملاً جعبههای سیاهی بودند. ما میتوانستیم به آنها دستور دهیم و خروجی آنها را مشاهده کنیم، اما اینکه دقیقاً در درون آنها چه میگذرد، مبهم بود. این هفته، شرکت آنتروپیک (Anthropic)، سازنده کلود، پرده از تحقیقات […]
آرشیو نویسنده: Dr.Arman
در عصر پیشرفت سریع هوش مصنوعی، یکی از چالشهای اساسی، برقراری ارتباط بین سیستمهای مختلف هوش مصنوعی است. شرکت Anthropic با معرفی پروتکل MCP (Model Context Protocol) گامی اساسی در جهت استانداردسازی این ارتباطات برداشته است. این مقاله به بررسی جامع این پروتکل، اهمیت آن و تأثیرش بر آینده تعامل بین سیستمهای هوشمند میپردازد. MCP […]
در دنیای پرهیاهوی هوش مصنوعی، گاهی قدرتمندترین تحولات با کمترین سر و صدا رخ میدهند. استارتاپ چینی DeepSeek بهتازگی مدل زبانی بزرگ جدیدی به نام DeepSeek-V3-0324 را در سکوت کامل در پلتفرم Hugging Face منتشر کرده است؛ مدلی که میتواند معادلات قدرت در صنعت هوش مصنوعی را به کلی دگرگون سازد. این مدل ۶۴۱ گیگابایتی، […]
شرکت بایدو (Baidu)، غول فناوری چینی، به تازگی از دو مدل جدید هوش مصنوعی ارنی خود به نامهای ERNIE 4.5 و ERNIE X1 رونمایی کرده است که نشاندهنده گامی بزرگ در زمینه پردازش زبان طبیعی و استدلال ماشینی هستند. این مقاله به بررسی عمیق این دو مدل، ویژگیها، کاربردها و مقایسه آنها با سایر مدلهای […]
گوگل در تاریخ ۱۲ مارس ۲۰۲۵ به صورت رسمی از هوش مصنوعی جما (Gemma) 3، نسل جدید مدلهای متنباز خود رونمایی کرده است. این مدل جدید ادامهای بر موفقیت نسلهای قبلی جما بوده و قابلیتهای جدیدی را ارائه میدهد که میتواند تأثیر قابل توجهی در جامعه هوش مصنوعی و توسعهدهندگان داشته باشد. در این مقاله […]
سیستم هوش مصنوعی عمومی مَنِس (Manus)، هوش مصنوعی که فقط فکر نمیکند—نتیجه ارائه میدهد. در دنیای همیشه در حال تکامل هوش مصنوعی، ستارهای جدید ظهور کرده که موجی بیسابقه در دنیای فناوری ایجاد کرده است. Manus، توسعه داده شده توسط استارتاپ چینی مونیکا (Monica)، به عنوان اولین عامل هوش مصنوعی عمومی واقعی در جهان شناخته […]
جاهطلبی و قدرت، ویژگی هوش مصنوعی DeepSeek R2، جانشین مورد انتظار مدل انقلابی DeepSeek R1 است. این مدل پیشرفته استدلال هوش مصنوعی، که توسط استارتاپ DeepSeek (مستقر در هانگژو و تأسیسشده توسط لیانگ ونفنگ در سال ۲۰۲۳) توسعه یافته است، بر موفقیت R1 در ارائه عملکرد پیشرفته با هزینهای بسیار کمتر بنا شده است. R2 […]
در این مقاله کاربردی، به بررسی مدل هوش مصنوعی Wan که در گروه Alibaba (سازنده هوش مصنوعی کوئن Qwen) توسعه یافته و به عنوان یک ابزار جامع و منبع باز در زمینه تولید ویدیو شناخته میشود، خواهیم پرداخت. هوش مصنوعی ساخت ویدیو Wan چیست؟ وان یک مدل پیشرفته تولید محتوای بصری است که توسط آزمایشگاه […]
امروزه llmها یا مدلهای زبانی بزرگ هوش مصنوعی، به یکی از مهمترین دستاوردهای فناوری در حوزه پردازش زبان طبیعی تبدیل شدهاند. این مدلها که بر پایه شبکههای عصبی عمیق کار میکنند، میتوانند متنهای طولانی را درک کرده، پاسخ دهند و حتی محتوای جدید تولید کنند. در این مقاله، فرآیند ساخت و آموزش این مدلها را […]
در دنیایی که هر روز یه مصنوعی ارائه میشه، LMArena.ai یا الم آرنا به عنوان یک نیروی تحولآفرین در حوزه هوش مصنوعی (AI) ظاهر شده است و یک پلتفرم متنباز و مبتنی بر جمعسپاری برای ارزیابی مدلهای زبانی بزرگ (LLM) ارائه میدهد. این پلتفرم که توسط پژوهشگران SkyLab دانشگاه برکلی توسعه یافته است، امکان مقایسه […]









