رونمائی یکی از قوی ترین مدلهای هوش مصنوعی باز
به گزارش دانلود فایل، شرکت «دیپ سیک» از مدل جدید هوش مصنوعی خود رونمایی کرده است که به نظر می آید یکی از قوی ترین مدلهای هوش مصنوعی باز تا به امروز باشد.
به گزارش دانلود فایل به نقل از ایسنا، مدل جدید هوش مصنوعی «دیپ سیک وی۳»(DeepSeek V3) که توسط شرکت «دیپ سیک» ابداع شده است، به توسعه دهندگان امکان می دهد تا آنرا برای بیشتر اپلیکیشن ها همچون اپلیکیشن های تجاری دانلود و اصلاح کنند.
به نقل از تک کرانچ، دیپ سیک وی۳ می تواند بسیاری از کارها و وظایف مبتنی بر متن را مانند کدنویسی، ترجمه و نوشتن مقاله و ایمیل با عنایت به درخواست انجام دهد.
برپایه آزمایش های داخلی شرکت دیپ سیک، دیپ سیک وی۳ هم از مدلهای قابل دانلود «باز» در دسترس و هم از مدلهای «بسته» هوش مصنوعی که فقط از راه API قابل دسترسی هستند، بهتر عمل می کند. در زیرمجموعه ای از رقابت های کدنویسی که در پلت فرم «کدفورسز«(Codeforces) میزبانی می شوند، دیپ سیک وی۳ توانست بهتر از مدلهای دیگر مانند «Llama 3.1 405B» شرکت «متا»(Meta)، «GPT-4o» شرکت «اوپن ای آی»(OpenAI) و «Qwen 2.5 72B» شرکت «علی بابا»(Alibaba) عمل می کند.
دیپ سیک اظهار داشت که دیپ سیک وی۳ روی یک مجموعه داده متشکل از ۱۴.۸ تریلیون توکن آموزش دیده است. در علم داده، توکن ها برای نمایش بیت های داده خام استفاده می شوند. یک میلیون توکن معادل حدود ۷۵۰ هزار کلمه است.
باآنکه دیپ سیک وی۳ کاربردی ترین مدل نیست اما از برخی جهات یک موفقیت به حساب می آید. دیپ سیک توانست این مدل را با استفاده از مرکز داده پردازنده های گرافیکی H800 شرکت «انویدیا»(Nvidia) در حدود دو ماه آموزش دهد. این شرکت تصریح کرد فقط ۵.۵ میلیون دلار برای آموزش دیپ سیک وی۳ هزینه کرده که کسری از هزینه توسعه مدل هایی مانند GPT-4 است.
منبع: itfile.ir
این مطلب را می پسندید؟
(1)
(0)
تازه ترین مطالب مرتبط
نظرات بینندگان در مورد این مطلب