هوش گیتهوش گیترسانه، شبکه و یادگیری AI
/ ⌘K
ورود
/ ⌘K
خانهشبکهمدل‌هایادگیریپروژه‌ها
هوش گیتهوش گیترسانه، شبکه و یادگیری AI
صفحه اصلیشبکهاخبارپژوهشمدل‌هاابزارهایادگیری
/ ⌘K
ورود

دسترسی سریع

دسترسی سریع تحریریه

خبرها، موضوعات، حساب کاربری و تنظیمات مطالعه همیشه در سمت راست در دسترس‌اند.

حساب کاربری

ورود سریع به حساب و ابزارهای شخصی‌سازی

ورود

با حساب کاربری، اعلان‌ها، ذخیره‌سازی خبرها و سطح مطالعه شخصی را فعال می‌کنید.

صفحه اصلیشبکهاخبارپژوهشمدل‌هاابزارهایادگیریفضاهاچهره‌های تخصصیسیاست‌گذاریامنیترویدادهافرصت‌های شغلیسرگرمیپروژه‌هاموضوعات
مرور موضوعات
همه
تم
درباره ماحریم خصوصیتماس با ما

مالکیت و پشتیبانی

شبکه هوشمند ابتکار ویستا

هوش‌گیت به‌عنوان رسانه و لایه دانشی این شرکت، با تمرکز بر خبر، یادگیری، همکاری حرفه‌ای و محصول‌های هوش مصنوعی توسعه داده می‌شود. تمامی حقوق مالکیت و کپی‌رایت این وب‌سایت متعلق به شبکه هوشمند ابتکار ویستا است.

این شرکت به‌صورت تخصصی در حوزه هوش مصنوعی، ساخت پلتفرم‌های AI، سامانه‌های مبتنی بر LLM، تحلیل داده، طراحی تجربه دانشی و توسعه زیرساخت‌های حرفه‌ای برای تیم‌های سازمانی فعالیت می‌کند.

مالکیت: شبکه هوشمند ابتکار ویستامدیرعامل: مسعود بخشی۰۹۱۲۴۷۳۳۲۳۴Devcodebase.dev@gmail.comHooshgate@gmail.comDevcodebase.com
v0.1.0 · c10e763-livefix12-homeperf · _51aidybsaf2ojc1qbeDa · 2026-04-29T11:19:41.000Z/api/version
آخرین خبرهاآموزشپریمیومدرباره ماتماس با ماحریم خصوصیقوانین استفادهکوکی‌هاسیاست تحریریه
App shellguest mode
خانهشبکهیادگیریپروژه‌هااعلان‌هاورک‌اسپیس
  1. خانه
  2. /
  3. اخبار
  4. /
  5. ATLAS: قوانین مقیاس بندی عملی برای مدل‌های چند زبانه
Google Researchمعتبر1404/11/07 18:58سیاست‌گذاری و حاکمیت

ATLAS: قوانین مقیاس بندی عملی برای مدل‌های چند زبانه

1) زبان مقصد،. روی چندین زبان آموزش دیده‌اند،. با هر زبان جدید،.

منبع: Google Research

سیاست‌گذاری و حاکمیتزیرساخت و محاسباتآموزش و یادگیری
نسخه مطالعهعمومی
منبعGoogle Research
انتشار1404/11/07 18:58
سطح مطالعه
اشتراک در تلگراماشتراک در Xاشتراک در LinkedIn

share-ready · لینک کمپین آماده است

متن پیش‌نمایش telegram با ۴۳۵ کاراکتر ساخته شده است.

اگر این خبر برایتان مفید بود، حساب بسازید.

با حساب هوش‌گیت می‌توانید خبرها را ذخیره کنید، موضوع‌ها و چهره‌های تخصصی را دنبال کنید و مسیر یادگیری یا پروژه مناسب خودتان را سریع‌تر پیدا کنید.

ساخت حسابورود برای ذخیره و دنبال‌کردن
ATLAS: قوانین مقیاس بندی عملی برای مدل‌های چند زبانه

پیگیری گفتگو

بازگشت سریع به همین گفتگو

این گفت‌وگو را ذخیره کن، آن را دنبال کن و اگر لازم است یک یادداشت کوتاه برای بازگشت بعدی بگذار.

لایه انسانی

نویسنده انسانی، یادداشت کارشناس و شفافیت نویسندگی

این سطح مشخص می‌کند کجا انتشار با حضور انسان تقویت شده و کجا newsroom هوش مصنوعی هنوز نقش اصلی را دارد.

لایه newsroom با کمک هوش مصنوعیبدون author انسانی عمومیreview with confidence

این خبر فعلاً بیشتر در لایه newsroom و پوشش کمک‌گرفته از هوش مصنوعی قرار دارد و هنوز نویسنده انسانی مشخصی برای آن ثبت نشده است.

جانمایی امن برای اسپانسر

امتیاز جانمایی۷۰ / 100
یادداشت‌های انسانی۰
  • منبع در سطح trusted قرار دارد.
  • trust score منبع بالاست.

قدم بعدی

بعد از خواندن این خبر چه کار کنم؟

اگر این موضوع برایت مهم است، از همین‌جا آن را ذخیره کن، گفت‌وگو را دنبال کن یا به مسیر یادگیری، چهره تخصصی و پروژه مرتبط برو.

حفظ و پیگیری

این مقاله را برای بازگشت بعدی ذخیره کن، منبعش را دنبال کن یا وارد گفت‌وگوی همین خبر شو تا موضوع از دست نرود.

رفتن به گفت‌وگو

یادگیری و action بعدی

اگر می‌خواهی از خبر به فهم عمیق‌تر برسی، مسیرهای مرتبط زیر ساده‌ترین نقطه شروع‌اند.

رفتن به هاب یادگیریپروژه مرتبط

راهنمای مطالعه

منبع اصلی، تاریخ فارسی و شاخص‌های سریع این خبر.

رفتن به منبع
تاریخ فارسی1404/11/07 18:58
داستانمستقل

نکات کلیدی

این باکس براساس سطح مطالعه شما (عمومی) تنظیم شده است.

  • بیش از 50 درصد از کاربران مدل هوش مصنوعی به زبان‌های غیرانگلیسی صحبت می‌کنند،.
  • با این حال قوانین مقیاس‌بندی در دسترس عموم عمدتاً بر زبان انگلیسی متمرکز هستند.
  • این عدم تعادل شکاف مهمی‌را در تحقیقات عمومی ایجاد می‌کند و سازندگان مدل را موظف به ارائه.
  • خدمات به میلیاردها کاربر بین‌المللی و چند زبانه می‌کند،.
  • بدون راهنمایی مبتنی بر داده برای تصمیم‌گیری‌های توسعه کلیدی در مورد کارایی،.
  • کیفیت و هزینه در هنگام ساختن برای زبان‌های غیر انگلیسی یا با مخلوط‌های زبانی خاص.
  • چند زبانه بودن» که در ICLR 2026 ارائه خواهد شد، هدف ما رفع این شکاف است.
  • ما بزرگترین مطالعه پیش‌آموزشی چندزبانه عمومی‌را تا به امروز ارائه می‌کنیم که شامل 774 دوره آموزشی در.

فهرست مطالب

  1. TL;DR
  2. چه اتفاقی افتاد
  3. چرا مهم است
  4. منبع

سیگنال تعامل

بازدید۰
کلیک۰
امتیاز0.00
دیدگاه۰

TL;DR

  • بیش از 50 درصد از کاربران مدل هوش مصنوعی به زبان‌های غیرانگلیسی صحبت می‌کنند،.
  • با این حال قوانین مقیاس‌بندی در دسترس عموم عمدتاً بر زبان انگلیسی متمرکز هستند.
  • این عدم تعادل شکاف مهمی‌را در تحقیقات عمومی ایجاد می‌کند و سازندگان مدل را موظف به ارائه.

چه اتفاقی افتاد

بیش از 50 درصد از کاربران مدل هوش مصنوعی به زبان‌های غیرانگلیسی صحبت می‌کنند،. با این حال قوانین مقیاس‌بندی در دسترس عموم عمدتاً بر زبان انگلیسی متمرکز هستند.

این عدم تعادل شکاف مهمی‌را در تحقیقات عمومی ایجاد می‌کند و سازندگان مدل را موظف به ارائه. خدمات به میلیاردها کاربر بین‌المللی و چند زبانه می‌کند،.

بدون راهنمایی مبتنی بر داده برای تصمیم‌گیری‌های توسعه کلیدی در مورد کارایی،. کیفیت و هزینه در هنگام ساختن برای زبان‌های غیر انگلیسی یا با مخلوط‌های زبانی خاص.

چند زبانه بودن» که در ICLR 2026 ارائه خواهد شد، هدف ما رفع این شکاف است. ما بزرگترین مطالعه پیش‌آموزشی چندزبانه عمومی‌را تا به امروز ارائه می‌کنیم که شامل 774 دوره آموزشی در.

مدل‌های پارامتری 10M-8B است. این شامل داده‌های بیش از 400 زبان و ارزیابی در 48 زبان است.

در نتیجه این مطالعه،. ما برآورد می‌کنیم هم‌افزایی بین 1400 جفت زبان و معرفی قوانین مقیاس‌بندی انتقال تطبیقی ​​(ATLAS) برای ساخت.

مدل‌های چندزبانه که پزشکان را قادر می‌سازد تا ترکیب زبان‌ها را در داده‌های آموزشی با اندازه مدل به‌طور. موثر متعادل کنند.

ATLAS:. یک قانون مقیاس بندی واحد که با مخلوط‌های چند زبانه سازگار است ATLAS یک رویکرد ساده و.

عملی برای تعیین اندازه مدل بهینه،. حجم داده‌ها و مخلوط زبان برای آموزش است.

برخلاف قوانین مقیاس‌گذاری سنتی که بر تنظیمات تک زبانه تمرکز دارند،. ATLAS این توصیه‌ها را برای محیط‌های پیچیده‌تر و چند زبانه‌تر ارائه می‌کند.

این به‌طور خاص عملکرد یک زبان مقصد (به‌عنوان مثال،. کاتالان) را با استفاده از داده‌ها از چندین زبان مختلف بهینه می‌کند.

ATLAS این اصول قانون مقیاس‌گذاری سنتی را از طریق سه جزء گسترش می‌دهد:. یک ماتریس انتقال بین زبانی که برای شناسایی بهترین زبان‌ها برای آموزش با هم استفاده می‌شود.

قانون مقیاس‌بندی که راهنمایی‌هایی را در مورد گسترش کارآمد اندازه مدل و داده‌ها با افزایش تعداد زبان‌های پشتیبانی‌شده. ارائه می‌دهد.

آزمایش‌های چند زبانه (با استفاده از مجموعه MADLAD-400 با بیش از 750 اجرا در بیش از 400. زبان) و سه منبع داده متمایز را شامل می‌شود:.

1) زبان مقصد،. 2) زبان‌های انتقال مشابه بر اساس تحلیل تجربی (به‌عنوان مثال،.

کاتالان ممکن است شامل زبان‌های لاتین مانند اسپانیایی،. پرتغالی و ایتالیایی باشد)،.

و 3) همه زبان‌های دیگر. این رویکرد جدید قانون را قادر می‌سازد تا بفهمد که هر منبع در واقع چقدر به زبان مقصد.

کمک می‌کند یا مانع آن می‌شود،. قابلیتی که قوانین قبلی از آن پشتیبانی نمی‌کردند.

ارزیابی ما از مجموعه داده‌های MADLAD-400 برای ارزیابی اینکه ATLAS عملکرد یک مدل را در اندازه‌های مدل جدید،. مقادیر متفاوت داده‌های آموزشی یا ترکیب‌های زبانی جدید پیش‌بینی می‌کند،.

استفاده کردیم. برای انجام این کار،.

ما عملکرد را با استفاده از از دست دادن واژگان حساس در بیش از 750 اجرا مستقل در. تنظیمات تک زبانه،.

دوزبانه و انبوه چند زبانه اندازه‌گیری می‌کنیم. ارزیابی‌های ما نشان می‌دهد که ATLAS به‌طور مداوم از کارهای قبلی بهتر عمل می‌کند.

برای شش زبان - انگلیسی (EN)،. فرانسوی (FR)،.

روسی (RU)،. چینی (ZH)،.

هندی (HI) و سواحیلی (SW) - ما تحلیل کردیم که چگونه ATLAS اندازه مدل بهینه (N) و اندازه. داده (D) را باید مقیاس‌بندی کرد.

هنگامی‌که ما این مسیرهای مقیاس بهینه را در بین زبان‌ها مقایسه کردیم، دو مشاهده انجام دادیم. منحنی‌ها به‌طور قابل توجهی مشابه به نظر می‌رسند،.

اما آموزش با واژگان چند زبانه یا داده‌های کاملاً چند زبانه همراه با مالیات بر بهره وری. محاسبه است - به ویژه برای انگلیسی.

زبان‌های کم منبع نشان می‌دهد با تمام شدن داده‌ها به سمت بالا خم می‌شود. و مدل در تلاش برای یادگیری از تکرار داده‌ها است.

ATLAS به صراحت این اثرات را مدل می‌کند. نقشه انتقال بین زبانی سپس،.

هم‌افزایی زبان به زبان و تداخل را در مقیاس اندازه‌گیری کردیم،. و ماتریسی تولید کردیم که میزان آموزش زبان A به زبان B کمک می‌کند (یا به آن آسیب.

می‌زند). نتایج ما نتایج بسیار شهودی را نشان می‌دهد:.

نروژی عمدتاً توسط سوئدی و آلمانی،. مالایی توسط اندونزیایی و عربی توسط عبری کمک می‌شود.

انگلیسی،. فرانسوی و اسپانیایی مفیدترین زبان‌هایی هستند که احتمالاً به دلیل کیفیت ذاتی،.

ناهمگونی و کمیت متن در این زبان‌ها که در وب یافت می‌شوند،. مفیدترین زبان‌ها هستند.

تجزیه و تحلیل نشان می‌دهد که بزرگترین پیش‌بینی‌کننده انتقال مثبت اشتراک‌گذاری یک خط و/یا خانواده زبان (مثلاً خط. لاتین) است که از نظر آماری با p <.

001 معنی‌دار است. انگلیسی به بسیاری از زبان‌ها، اما نه همه، کمک می‌کند.

و انتقال همیشه متقارن نیست (A می‌تواند بیشتر از B به A کمک کند). این اندازه‌گیری‌ها «قوزها» را به گزینه‌های ترکیبی زبان مبتنی بر داده تبدیل می‌کنند.

رمزگشایی "نفرین چندزبانگی" با قوانین مقیاس بندی واضح «نفرین چندزبانگی» پدیده‌ای است که در آن مدل‌هایی که بر. روی چندین زبان آموزش دیده‌اند،.

به دلیل ظرفیت محدود مدل،. با هر زبان جدید،.

عملکردشان کاهش می‌یابد. ما این مشکل را با یک قانون مقیاس‌بندی رسمی‌می‌کنیم که نه تنها اندازه مدل (N) و مقدار.

داده‌های آموزشی (D) بلکه تعداد زبان‌های موجود در آن داده (K) را در نظر می‌گیرد. با تطبیق این قانون با بسیاری از آزمایش‌ها،.

متوجه شدیم که در حالی که افزودن زبان‌ها مالیات بر ظرفیت ملایمی‌را به همراه دارد،. درجه بالایی از انتقال مثبت وجود دارد.

این بدان معناست که اگر می‌خواهیم مدلی را آموزش دهیم که دو برابر زبان‌ها (2·K) را پشتیبانی کند،. باید اندازه مدل را 1.

18 برابر و کل داده‌ها را 1. 66x افزایش دهیم.

این معادل 83 درصد از داده‌ها در هر یک از زبان‌های 2K است. اگرچه داده‌های کمتری برای هر زبان وجود دارد،.

اما هم افزایی مثبت حاصل از یادگیری در همه آنها به این معنی است که محدودیت‌های ظرفیتی که. باعث کاهش عملکرد می‌شوند،.

جبران می‌شوند. زمان پیش‌آموزش در مقابل تنظیم دقیق یک ایست بازرسی چند زبانه برای ده زبان،.

ما دو مسیر را برای دریافت بهترین مدل مقایسه می‌کنیم:. (الف) آموزش از ابتدا روی زبان مقصد یا (ب) تنظیم دقیق از یک ایست بازرسی چند زبانه قوی.

"یونیمکس". گزینه (ب) احتمالاً بهترین عملکرد را با حداقل محاسبات اضافی خواهد داشت،.

زیرا این مدل در حال حاضر در بین زبان‌ها بسیار قوی است. با این حال،.

اگر بتوان مدل را برای مدت طولانی‌تری آموزش داد،. گزینه (الف) اغلب می‌تواند نتایج بلندمدت بهتری به همراه داشته باشد.

هدف ما این است که بر اساس مقدار محاسبه‌ای که سازنده مدل باید خرج کند،. نقطه متقاطع بین دو منحنی آموزشی را پیدا کنیم.

نتایج ما نشان می‌دهد که تنظیم دقیق زودهنگام برنده می‌شود،. اما قبل از تمرین زمانی پیشی می‌گیرد که بتوانید به اندازه کافی توکن تهیه کنید.

در اجراهای ما،. متقاطع معمولاً بین ~144B و 283B توکن (وابسته به زبان) برای مدل‌هایی با پارامترهای 2B رخ می‌دهد.

بعد، نقطه متقاطع را به‌عنوان تابعی از اندازه مدل رسم کردیم. این یک بتن می‌دهد،.

قانون کلی آگاه از بودجه:. اگر توکن و بودجه محاسبه شما کمتر از نقطه متقاطع اندازه مدل شما است،.

از یک ایست بازرسی چند زبانه شروع کنید. در غیر این صورت، پیش تمرین از ابتدا معمولاً به پایان می‌رسد.

توجه داشته باشید که آستانه‌های دقیق به مدل پایه و مخلوط بستگی دارد. خودتان آن را امتحان کنید ATLAS با حرکت فراتر از مقیاس بندی انگلیسی محور،.

نقشه راه را برای توسعه دهندگان مدل جهانی ارائه می‌دهد. می‌توان آن را مستقیماً با کمک به توسعه‌دهندگان در مقیاس مدل‌های زبانی فراتر از انگلیسی به کار برد:.

آیا قصد دارید یک مدل چندزبانه یا غیرانگلیسی جدید آموزش دهید؟ از شکل 1 یا جدول C.

1 از مقاله استفاده کنید تا به قوانین مقیاس بندی بالقوه بر اساس واژگان یا انتخاب‌های آموزشی. پی ببرید.

ترکیب آموزشی جدیدی را انتخاب می‌کنید؟ با ماتریس انتقال (شکل 2) مشورت کنید تا زبان‌های مبدأ را انتخاب کنید که به‌طور تجربی به.

اهداف شما کمک می‌کنند - به ویژه آنهایی که اسکریپت/خانواده یکسانی دارند. آیا یک مدل جدید با زبان‌های بیشتری آموزش می‌دهید؟

با بخش 5 مشورت کنید تا مشخص کنید چگونه می‌توانید اندازه مدل و اندازه داده خود را. به بهترین نحو گسترش دهید تا اثرات نفرین چند زبانه بودن را کاهش دهید.

محاسبات محدود است؟ با بخش 6 مشورت کنید تا تصمیم بگیرید که آیا باید یک مدل چندزبانه را دقیق تنظیم کنید.

یا از ابتدا آموزش دهید. امیدواریم این کار نسل جدیدی را قادر سازد مدل‌های چند زبانه که به میلیاردها غیر انگلیسی زبان خدمت.

می‌کنند. قدردانی‌ها ما از لوک زتلمویر،.

کاترین آرنت و استلا بیدرمن برای بحث‌های مفید در مورد مقاله تشکر می‌کنیم. ما از بیائو ژانگ و خاویر گارسیا برای بحث‌های فنی و بازخورد درباره دستورالعمل‌های اولیه تشکر می‌کنیم.

چرا مهم است

اهمیت این خبر در این است که روی استفاده واقعی از AI و تصمیم‌گیری سازمانی اثر می‌گذارد.

منبع

لینک منبع اصلی در کارت و صفحه مقاله نمایش داده می‌شود.

اعتبار

چرایی اعتماد به این خبر

امتیاز اعتبار، منطق اعتماد، وضعیت راستی‌آزمایی و لاگ تغییرات در یک نگاه.

اعتبار خبر۴۳ / 100
اعتبار منبع۱۳ / 100
اعتبار موضوع۱۰۰ / 100
تازگی۳۲ / 100
مرحله عمر خبرNEEDS_UPDATE
نیاز به به‌روزرسانیبله
نیازمند تقویتنیازمند تقویتمرجع قوینیازمند بازبینینیازمند به‌روزرسانی

تصمیم انسانی تحریریه

خلاصه تصمیم تحریریه

سیگنال بازبینی باز استresearch review requiredنیاز بازبینی قابل مشاهده استstandard editorial path

این مقاله در مسیر research review required قرار دارد و بخشی از سیگنال‌های review هنوز باید تکمیل یا شفاف‌تر شود.

دلیل انتشار: محتوای پژوهشی باید citation، سطح‌بندی مخاطب و نکات کلیدی را قبل از انتشار با بازبینی انسانی روشن کند. وضعیت فعلی: fact-check not_started و checklist ۰٪.

کلاس خبرRESEARCH
سخت‌گیری بازبینیREQUIRED
بازبینثبت عمومی نشده

موارد بازبینی که باید شفاف‌تر شوند

صحت و منبع اصلی تایید شدتیتر بازبینی و حرفه‌ای شدخلاصه برای کارت و SEO تایید شدنکات کلیدی بازبینی شدنسخه‌های سطح‌بندی‌شده بررسی شدبازخوانی نهایی انجام شد
سیاست تحریریه و اصلاحاتچرا به هوش‌گیت اعتماد کنیم؟

چرا این خبر قابل اعتماد است

    شفافیت راستی‌آزمایی ادعاها

    ادعای تاییدشده۰
    نیازمند بازبینی۰
    میانگین اطمینان۰٪

    چرا هنوز مهم است

    این خبر هنوز بازدید، کامنت یا follow-up کافی دارد و از چرخه توجه مخاطب خارج نشده است.

    تقویت اعتبار

    وجود follow-up و پوشش مرتبط، authority این خبر را در طول زمان تقویت می‌کند.

    پیگیری به‌روزرسانی

    این خبر evergreen است و برای حفظ authority به refresh تحریریه نیاز دارد.

    بخش منابع و ارجاع‌ها

    لینک‌های منبع اصلی، ارجاع‌های ادعا و referenceهای مکمل برای پیگیری مستقیم.

    research.googleمنبع اصلی

    research.google/blog/atlas-practical-scaling-laws-for-multilingual-model

    research.googleارجاع تکمیلی

    research.google/blog/

    پوشش‌های پیگیری

    پیگیری‌های بعدی، توضیح‌دهنده‌های مرتبط یا خبرهای مکملی که عمر این موضوع را بعد از انتشار ادامه می‌دهند.

    یک روش گالرکین ناپیوسته ترکیبی همگرا برای انیشتین -- معادلات اسکالر

    پیگیری بعدی

    1405/01/29 15:44

    یک اپراتور فتوآکوستیک فوروآکوستیک-پیوسته سازگار با قانون متقابل

    پیگیری بعدی

    1405/01/29 15:44

    عدم وجود احتمالات و دم پایین در رژیم بحرانی از طریق انتشار باور

    پیگیری بعدی

    1405/01/29 15:44

    توابع مانع کنترل ماتریس مرتبه بالا: حالت خوب و امکان سنجی از طریق درجه نسبی ماتریس

    پیگیری بعدی

    1405/01/29 15:44

    تعامل کاربران و کیفیت خبر

    امتیاز بدهید، نظر ثبت کنید یا اگر خطایی دیدید گزارش اصلاح بفرستید. moderation، trust contributor و کیفیت thread به‌صورت شفاف نمایش داده می‌شود.

    بازدید

    ۰

    کلیک روی خبر

    ۰

    امتیاز میانگین

    0.00 / 5

    دیدگاه تایید شده

    ۰

    وضعیت trust گفتگو

    کیفیت thread براساس reputation contributorها، رأی‌ها و moderation سنجیده می‌شود.

    در حال بارگذاری

    امتیاز thread

    ۰ / 100

    دیدگاه متخصص

    ۰

    دیدگاه مفید

    ۰

    خروجی moderation و قوانین

    تاییدشده: ۰pending: ۰hidden/spam: ۰

      حضور انسانی در این گفتگو

      این بخش کمک می‌کند thread فقط حول personaها دیده نشود و contributorهای انسانی واقعی هم واضح باشند.

      contributor انسانی: ۰trusted: ۰expert: ۰
      هنوز contributor انسانی برجسته‌ای در این thread دیده نشده است.

      امتیاز شما به خبر

      هنوز امتیاز نداده‌اید.

      واکنش سریع به خبر

      به‌جای لایک کلی، نوع برداشت خودتان را مشخص کنید.

      ثبت دیدگاه

      دیدگاه‌های کم‌ارزش یا spam به‌صورت خودکار محدود می‌شوند و نتیجه moderation در همین صفحه قابل مشاهده است.

      گزارش اصلاح یا بهبود

      اگر claim، ترجمه، منبع یا framing خبر نیاز به اصلاح دارد، این مسیر مستقیم برای تیم تحریریه است.

      آخرین دیدگاه‌ها

      هنوز دیدگاهی ثبت نشده است.

      مقایسه سه سطح مطالعه

      برای همین خبر، نسخه ساده، عمومی و تخصصی کنار هم خلاصه شده‌اند.

      ساده

      ۷٬۸۷۰ کاراکتر

      زبان است. 1) زبان مقصد،. ده زبان،.

      • بیش از 50 درصد از کاربران مدل هوش مصنوعی به زبان‌های غیرانگلیسی.
      • صحبت می‌کنند،.
      • با این حال قوانین مقیاس‌بندی در دسترس عموم عمدتاً بر زبان انگلیسی.
      • متمرکز هستند.

      عمومی

      ۷٬۹۳۴ کاراکتر

      1) زبان مقصد،. روی چندین زبان آموزش دیده‌اند،. با هر زبان جدید،.

      • بیش از 50 درصد از کاربران مدل هوش مصنوعی به زبان‌های غیرانگلیسی صحبت می‌کنند،.
      • با این حال قوانین مقیاس‌بندی در دسترس عموم عمدتاً بر زبان انگلیسی متمرکز هستند.
      • این عدم تعادل شکاف مهمی‌را در تحقیقات عمومی ایجاد می‌کند و سازندگان مدل را موظف به ارائه.
      • خدمات به میلیاردها کاربر بین‌المللی و چند زبانه می‌کند،.

      تخصصی

      ۸٬۰۳۱ کاراکتر

      1) زبان مقصد،. برای شش زبان - انگلیسی (EN)،. با هر زبان جدید،.

      • بیش از 50 درصد از کاربران مدل هوش مصنوعی به زبان‌های غیرانگلیسی صحبت می‌کنند، با این حال قوانین مقیاس‌بندی...
      • این عدم تعادل شکاف مهمی‌را در تحقیقات عمومی ایجاد می‌کند و سازندگان مدل را موظف به ارائه خدمات به میلیاردها...
      • بدون راهنمایی مبتنی بر داده برای تصمیم‌گیری‌های توسعه کلیدی در مورد کارایی،.
      • کیفیت و هزینه در هنگام ساختن برای زبان‌های غیر انگلیسی یا با مخلوط‌های زبانی خاص.

      هایلایت‌ها و یادداشت‌ها

      متن دلخواه را در خبر انتخاب کنید و با یک کلیک هایلایت بزنید. فقط برای شما قابل مشاهده است.

      برای استفاده از هایلایت و یادداشت، وارد حساب کاربری شوید.

      منابع اولیه

      لینک‌های اصلی این خبر، شامل منبع اصلی و ارجاع‌های claim panel.

      • https://research.google/blog/atlas-practical-scaling-laws-for-multilingual-models/
      • https://research.google/blog/

      کاوش این مقاله

      از این خبر به موضوع، persona، درس، پروژه و مسیر یادگیری مرتبط برسید.

      پرسش از هوش‌گیت

      موضوع‌های این مقاله

      سیاست‌گذاری و حاکمیتزیرساخت و محاسباتآموزش و یادگیریپژوهش پیشرفته

      موجودیت‌های این مقاله

      هنوز موجودیت ثبت‌شده‌ای برای این مقاله دیده نمی‌شود.

      چهره‌های مرتبط

      هنوز persona signal معناداری برای این مقاله ثبت نشده است.

      درس‌های مرتبط

      هنوز درس مرتبطی برای این مقاله پیدا نشده است.

      پروژه‌های مرتبط

      سامانه تریاژ و ارجاع هوشمند برای شکایت‌ها، درخواست‌ها و ارجاع بین واحدی

      پیاده‌سازی یک workflow عملیاتی مبتنی بر classification، priority scoring و queue orchestration برای شکایت‌ها، درخواست‌ها و ارجاع بین واحدی در یک سازمان دولتی یا حاکمیتی که کیفیت او…

      agents · product-industry

      مربی عملیاتی هوشمند برای آموزش کارکنان جدید بر پایه آیین‌نامه و سناریوهای واقعی

      پیاده‌سازی یک workflow عملیاتی مبتنی بر microlearning، scenario simulation و feedback workflow برای آموزش کارکنان جدید بر پایه آیین‌نامه و سناریوهای واقعی در یک سازمان دولتی یا حاک…

      learning · prompt-design

      اتوماسیون بازبینی و استخراج داده برای نامه‌ها، مصوبه‌ها و پرونده‌های اداری

      ساخت یک سامانه قابل‌گسترش بر پایه OCR/ingestion، extraction، validation rule و human review برای نامه‌ها، مصوبه‌ها و پرونده‌های اداری در یک سازمان دولتی یا حاکمیتی که سرعت پردازش،…

      agents · product-industry

      پایش ناهنجاری و ریسک برای الگوهای غیرعادی در یارانه‌ها، درخواست‌ها و تراکنش‌های حساس

      پیاده‌سازی یک workflow عملیاتی مبتنی بر monitoring rule، anomaly scoring و case review برای الگوهای غیرعادی در یارانه‌ها، درخواست‌ها و تراکنش‌های حساس در یک سازمان دولتی یا حاکمیتی…

      llm-evaluation · infrastructure-compute

      دستیار دانش و پاسخ‌گویی برای قوانین، خدمات و وضعیت پرونده‌های میز خدمت شهروندی

      طراحی و استقرار یک راهکار RAG فارسی، کنترل استناد و workflow پاسخ‌گویی برای قوانین، خدمات و وضعیت پرونده‌های میز خدمت شهروندی در یک سازمان دولتی یا حاکمیتی که زمان یافتن پاسخ، کیفی…

      rag · agents

      مسیرهای یادگیری

      هنوز مسیر یادگیری نزدیکی برای این مقاله پیدا نشده است.

      پست‌های مرتبط نبض هوش

      چهره‌های تخصصی هوش‌گیت این خبر را از زاویه نقش و تخصص خودشان تحلیل کرده‌اند.

      رفتن به شبکه

      هنوز پست تخصصی برای این خبر منتشر نشده است.

      با انتشار یا backfill پست‌های شبکه، تحلیل‌های مرتبط اینجا نمایش داده می‌شوند.

      خبرهای مرتبط

      خبرهای نزدیک به همین موضوع برای ادامه مطالعه.

      یک روش گالرکین ناپیوسته ترکیبی همگرا برای انیشتین -- معادلات اسکالرarXiv (math.NA)یک اپراتور فتوآکوستیک فوروآکوستیک-پیوسته سازگار با قانون متقابلarXiv (math.NA)عدم وجود احتمالات و دم پایین در رژیم بحرانی از طریق انتشار باورarXiv (math.PR)توابع مانع کنترل ماتریس مرتبه بالا: حالت خوب و امکان سنجی از طریق درجه نسبی ماتریسarXiv (math.OC)

      بعدش چی بخونم؟

      پیشنهادها براساس موضوعات، موجودیت‌ها و سابقه مطالعه شما انتخاب می‌شوند.

      خانواده GPT و gpt-oss چیست و چه زمانی انتخاب درستی است؟OpenAI API Docsاین overview توضیح می‌دهد خانواده GPT و gpt-oss دقیقاً چه جایگاهی در stack مدل‌های مولد دارد، برای چه تیم‌هایی مناسب است، چه مزیت...راهنمای مقایسه خانواده GPT و gpt-oss: کدام مسیر برای تیم شما بهتر است؟OpenAI API Docsاین comparison guide به‌جای لیست کردن سطحی مدل‌ها، تصمیم واقعی داخل خانواده GPT و gpt-oss را توضیح می‌دهد: کدام گزینه برای کیفیت...آموزش عملی خانواده GPT و gpt-oss: ساخت دستیار تحلیل مکاتبات و اقدام بعدیOpenAI API Docsاین tutorial نشان می‌دهد چطور خانواده GPT و gpt-oss را از حالت demo بیرون بیاورید و در یک workflow واقعی با ورودی روشن، خروجی ساخ...نصب و راه‌اندازی خانواده GPT و gpt-oss: از اولین درخواست تا مسیر پایدارOpenAI API Docsمبانی استفاده حرفه‌ای از دستیارهای زبانی در تیم: از مسئله تا خروجی قابل اتکاHooshgate Learn Deskاین راهنمای بنیادین توضیح می‌دهد استفاده حرفه‌ای از دستیارهای زبانی در تیم فقط کنار هم چیدن چند ابزار نیست و چگونه باید با دامنه...
      دسته‌های مرتبط:پژوهش
      برچسب‌ها:RAGNLP
      فهرست خبرها