به گزارش لینک بگیر دات کام استارت آپ هوش مصنوعی چینی دیپ سیک با ارائه جدیدترین مدل خود موجی در جامعه هوش مصنوعی سراسر جهان ایجاد کرد.
به گزارش لینک بگیر دات کام به نقل از ونچر بیت، این مدل جدید سیستمی با ۶۸۵ میلیارد پارامتر است که سلطه غول های فناوری آمریکا در این بازار را به چالش می کشد و همزمان چشم انداز رقابت در این زمینه را بوسیله دسترسی منبع باز تغییر می دهد. این شرکت چینی بی سروصدا مدل دیپ سیک V۳.۱ را در پلت فرم Hugging Face ارائه نمود. طی چند ساعت نخست بعد از عرضه مدل، تست های اولیه نشان داد امتیاز بنچمارک آن بهتر از رقبای دیگرش است که توسط شرکت های اوپن ای آی و آنتروپیک عرضه شده است.
از طرفی منبع باز بودن مدل مذکور دسترسی جهانی به آنرا بدون تنش های ژئوپولتیکی تضمین می نماید. عرضه دیپ سیک V۳.۱ تنها یک بهبود تدریجی در قابلیتهای هوش مصنوعی نیست. این رویداد نشان دهنده تغییر بنیادی در نحوه توسعه، توزیع و کنترل پیشرفته ترین سیستم های هوش مصنوعی جهان است، تغییری که می تواند نتایج عمیقی در رقابت فناورانه جاری بین آمریکا و چین داشته باشد. چند ساعت بعد از عرضه این مدل در پلت فرم Hugging Face محبوبیت آن در رده بندی ها بالا رفت و تقدیر محققانی از سراسر دنیا که آنرا دانلود و قابلیت هایش را آزمایش کرده بودند، در پی داشت.
این مدل به امتیاز ۷۱.۶ درصد در بنچمارک کد نویسی Aider را به دست آورد و خودرا به عنوان یکی از مدل هایی با عملکرد برتر تثبیت کرد و بطور مستقیم سلطه غول های هوش مصنوعی آمریکایی را به چالش کشیده است. دیپ سیک V۳.۱ دستاوردهای مهندسی قابل توجهی عرضه می کند که انتظارات از عملکرد مدلهای هوش مصنوعی را باز تعریف می کند. این سیستم قادر به پردازش ۱۲۸ هزار توکن متنی (تقریباً معادل یک کتاب ۴۰۰ صفحه ای) و سرعت پاسخگویی آن بسیار سریع تر از رقبا است. این مدل از فرمت های دقت مختلف از BF۱۶ استاندارد گرفته تا FP۸ آزمایشی پشتیبانی می کند که به توسعه دهندگان امکان می دهد عملکرد را برمبنای محدودیت های سخت افزاری خاص خود بهینه سازی کنند.
پیشرفت اصلی در چیزی است که دیپ سیک آنرا ساختار هیبریدی می نامد. برخلاف کوشش های پیشین برای ترکیب قابلیت های مختلف هوش مصنوعی که به ایجاد سیستم هایی با عملکرد ضعیف در همه چیز منجر می شد، V۳.۱ چت استدلال و قابلیت های کد نویسی را در یک مدل هماهنگ یکپارچه کرد.
استارتآپ چینی DeepSeek AI با عرضه مدل جدید DeepSeek V۳.۱، یک تحول بزرگ در دنیای هوش مصنوعی ایجاد کرده است. این مدل با ۶۸۵ میلیارد پارامتر، به طور مستقیم به رقابت با غولهای آمریکایی مانند OpenAI (سازنده ChatGPT) و Anthropic (سازنده Claude) پرداخته و نشان داده است که چین در حال نزدیک شدن به صدر این رقابت است.
چرا مدل جدید DeepSeek AI مهم است؟
قدرت بالا در عملکرد: DeepSeek V۳.۱ در بنچمارکهای مختلف، از جمله کدنویسی، امتیازات بسیار بالایی کسب کرده است. این مدل با امتیاز ۷۱.۶ درصد در بنچمارک Aider، نشان داده که تواناییهایش در حل مسائل پیچیده و کدنویسی بسیار چشمگیر است و به طور مستقیم با مدلهای برتر آمریکایی رقابت میکند.
منبعباز بودن: یکی از مهمترین ویژگیهای این مدل، منبعباز (Open-source) بودن آن است. این یعنی هر توسعهدهنده و محققی در سراسر جهان میتواند به آن دسترسی داشته باشد و از آن استفاده کند. این رویکرد به معنای دموکراتیزه کردن هوش مصنوعی پیشرفته است و برخلاف مدلهای تجاری و بسته، به نوآوری جهانی کمک میکند.
توانایی پردازش دادههای عظیم: DeepSeek V۳.۱ توانایی پردازش ۱۲۸ هزار توکن متنی را دارد که معادل یک کتاب ۴۰۰ صفحهای است. این ظرفیت فوقالعاده، آن را برای تحلیل و فهم متون طولانی بسیار مناسب میسازد.
ساختار هیبریدی پیشرفته: این مدل از یک ساختار هیبریدی استفاده میکند که به طور هوشمندانه قابلیتهای مختلفی مانند استدلال و کدنویسی را در یک سیستم واحد ترکیب میکند. این نوآوری باعث میشود عملکرد مدل در حوزههای مختلف بدون افت کیفیت کلی، بهبود یابد.
تأثیر این عرضه در آینده
انتشار DeepSeek V۳.۱ فقط یک پیشرفت فنی نیست، بلکه یک تغییر استراتژیک در رقابت جهانی هوش مصنوعی است. منبعباز بودن این مدل میتواند مزیت رقابتی جدیدی برای شرکتهای چینی فراهم کند و از سوی دیگر، دسترسی به فناوریهای پیشرفته هوش مصنوعی را در اختیار طیف گستردهتری از محققان و شرکتها قرار دهد. این اقدام میتواند به طور بالقوه مسیر توسعه و توزیع سیستمهای هوش مصنوعی پیشرفته را تغییر دهد و رقابت بین آمریکا و چین را وارد فاز جدیدی کند.
منبع: linkbegir.com