Modal Blogمعتبر1404/08/07 21:00پژوهش پیشرفته

Modal + Datalab: هوشمندی سند با توان عملیاتی بالا را در کمتر از 5 دقیقه به کار می‌گیرد

مدل‌ها. ابزار Surya OCR استفاده کند. این در پشت صحنه Modal مستقر شده است!

منبع: Modal Blog

پژوهش پیشرفته متن‌باز و جامعه آموزش و یادگیری

نسخه مطالعهعمومی

منبعModal Blog

انتشار1404/08/07 21:00

اشتراک در تلگرام اشتراک در X اشتراک در LinkedIn

share-ready · لینک کمپین آماده است

متن پیش‌نمایش telegram با ۴۸۸ کاراکتر ساخته شده است.

اگر این خبر برایتان مفید بود، حساب بسازید.

با حساب هوش‌گیت می‌توانید خبرها را ذخیره کنید، موضوع‌ها و چهره‌های تخصصی را دنبال کنید و مسیر یادگیری یا پروژه مناسب خودتان را سریع‌تر پیدا کنید.

ساخت حساب ورود برای ذخیره و دنبال‌کردن

Modal + Datalab: هوشمندی سند با توان عملیاتی بالا را در کمتر از 5 دقیقه به کار می‌گیرد

پیگیری گفتگو

بازگشت سریع به همین گفتگو

این گفت‌وگو را ذخیره کن، آن را دنبال کن و اگر لازم است یک یادداشت کوتاه برای بازگشت بعدی بگذار.

لایه انسانی

نویسنده انسانی، یادداشت کارشناس و شفافیت نویسندگی

این سطح مشخص می‌کند کجا انتشار با حضور انسان تقویت شده و کجا newsroom هوش مصنوعی هنوز نقش اصلی را دارد.

لایه newsroom با کمک هوش مصنوعیبدون author انسانی عمومیreview with confidence

این خبر فعلاً بیشتر در لایه newsroom و پوشش کمک‌گرفته از هوش مصنوعی قرار دارد و هنوز نویسنده انسانی مشخصی برای آن ثبت نشده است.

جانمایی امن برای اسپانسر

امتیاز جانمایی۷۰ / 100

یادداشت‌های انسانی۰

منبع در سطح trusted قرار دارد.
trust score منبع بالاست.

قدم بعدی

بعد از خواندن این خبر چه کار کنم؟

اگر این موضوع برایت مهم است، از همین‌جا آن را ذخیره کن، گفت‌وگو را دنبال کن یا به مسیر یادگیری، چهره تخصصی و پروژه مرتبط برو.

حفظ و پیگیری

این مقاله را برای بازگشت بعدی ذخیره کن، منبعش را دنبال کن یا وارد گفت‌وگوی همین خبر شو تا موضوع از دست نرود.

رفتن به گفت‌وگو

یادگیری و action بعدی

اگر می‌خواهی از خبر به فهم عمیق‌تر برسی، مسیرهای مرتبط زیر ساده‌ترین نقطه شروع‌اند.

رفتن به هاب یادگیری دیدن چهره تخصصی مرتبط پروژه مرتبط

راهنمای مطالعه

منبع اصلی، تاریخ فارسی و شاخص‌های سریع این خبر.

رفتن به منبع

تاریخ فارسی1404/08/07 21:00

داستانمستقل

نکات کلیدی

این باکس براساس سطح مطالعه شما (عمومی) تنظیم شده است.

بازگشت اخبار 29 اکتبر 2025 4 دقیقه خواندن ما مشتاقیم با Datalab،.
خالقان Marker و Surya همکاری کنیم تا توسعه دهندگان و تیم‌ها بتوانند بهترین مدل‌های هوشمند اسناد.
را سریعتر از همیشه بکار ببرند.
نشانگر یک مدل هدفمند و زیر میلیارد پارامتری است که به‌طور خاص برای ساختار سند آموزش داده شده.
تجزیه قطعی و با وفاداری بالا را بدون توهم یا بی ثباتی LLMهای بزرگتر ارائه می‌دهد.
و این کار را با کسری از هزینه انجام می‌دهد.
همراه با دیگر ابزارهای منبع‌باز Datalab،.

سیگنال تعامل

بازدید۰

کلیک۰

امتیاز0.00

دیدگاه۰

TL;DR

بازگشت اخبار 29 اکتبر 2025•4 دقیقه خواندن ما مشتاقیم با Datalab،.
خالقان Marker و Surya همکاری کنیم تا توسعه دهندگان و تیم‌ها بتوانند بهترین مدل‌های هوشمند اسناد.
را سریعتر از همیشه بکار ببرند.

چه اتفاقی افتاد

بازگشت اخبار 29 اکتبر 2025•4 دقیقه خواندن ما مشتاقیم با Datalab،. خالقان Marker و Surya همکاری کنیم تا توسعه دهندگان و تیم‌ها بتوانند بهترین مدل‌های هوشمند اسناد.

را سریعتر از همیشه بکار ببرند. نشانگر یک مدل هدفمند و زیر میلیارد پارامتری است که به‌طور خاص برای ساختار سند آموزش داده شده.

است. تجزیه قطعی و با وفاداری بالا را بدون توهم یا بی ثباتی LLMهای بزرگتر ارائه می‌دهد.

و این کار را با کسری از هزینه انجام می‌دهد. مارکر،.

همراه با دیگر ابزارهای منبع‌باز Datalab،. بیش از 48 هزار ستاره در GitHub کسب کرده است و محققان،.

استارت آپ‌ها و تیم‌های ی به‌طور یکسان به آن اعتماد دارند. Modal قبلاً به پلتفرم میزبان Datalab قدرت می‌دهد و آنها را قادر می‌سازد خدمات مدل قابل اعتماد و.

مقیاس‌پذیر را ارائه دهند و نسخه‌های جدید را به سرعت عرضه کنند:. «استفاده از Modal برای استنتاج مانند داشتن یک تیم زیرساخت اضافی است - قابل اعتماد،.

مقیاس‌پذیر و سریع است - به این معنی که من می‌توانم به تمرین بازگردم. مدل‌ها.

” — Vik Paruchuri،. موسس @ Datalab اکنون،.

هر سازنده یا تیمی‌می‌تواند از Modal برای استقرار فوری خط لوله نشانگر پیشرفته Datalab و جعبه. ابزار Surya OCR استفاده کند.

ابزارهای Datalab برای تحقیقات،. استفاده شخصی و استارت‌آپ‌ها با بودجه/درآمد 2 میلیون دلاری،.

با گزینه‌های مجوز برای مشتریان تجاری رایگان باقی می‌مانند. Quickstart Marker به راحتی شبیه‌سازی شده و به صورت محلی اجرا می‌شود،.

اما می‌توانید آن را در Modal برای به حداکثر رساندن مقیاس پذیری و توان استفاده کنید. مخزن Marker را کلون کنید و مثال Modal را در اینجا مستقر کنید،.

که یک ظرف GPU را در Modal فراهم می‌کند،. نشانگر را نصب می‌کند و عملکرد آن را در پشت نقطه پایانی FastAPI نشان می‌دهد.

همین! برای مثال کامل‌تر و دقیق‌تر،.

این مثال Modal از ساختن یک برنامه وب OCR سند سریع را بررسی کنید. Modal با 30 دلار در ماه اعتبار محاسباتی رایگان ارائه می‌شود که برای شروع کارهای OCR شما.

بسیار مناسب است. نحوه کار Modal به شما امکان می‌دهد تا نشانگر را روی GPUها در آن مستقر کنید.

ثانیه Modal همچنین GPUها را برای استقرار شما به صورت خودکار مقیاس می‌کند تا حداکثر توان. عملیاتی را در کارهای دسته‌ای بدون هیچ تلاش اضافی دریافت کنید.

آنچه در پشت صحنه اتفاق می‌افتد این است:. اول،.

وزن‌های مدل نشانگر در یک حجم مدال ذخیره می‌شوند،. که زمان شروع سرد را کاهش می‌دهد.

نیازی به بارگیری مجدد مدل‌ها در هر بار نیست،. و Volume بدون توجه به اینکه عملکرد استنتاج شما در کجا اجرا می‌شود،.

خواندن سریع را تضمین می‌کند. سپس،.

هنگامی‌که تابع استنتاج فراخوانی می‌شود،. Modal یک ظرف را با استفاده از محیط و الزامات سخت افزاری مشخص شده در دکوراتور تابع می.

چرخاند. شما نیازی به استفاده از فایل‌های پیکربندی ندارید،.

زیرا همه چیز در راستای کد برنامه تعریف شده است. آیا نیاز به پردازش هزاران فایل PDF در یک زمان دارید؟

بر اساس حجم درخواست، فوراً مقیاس خودکار معین (تا هزاران GPU) انجام می‌شود. استخرهای ظرفیت جهانی ما تضمین می‌کنند که هرگز منتظر سهمیه نخواهید بود.

چرا مارکر؟ نشانگر بیش از 90 زبان را پشتیبانی می‌کند، جداول بسیار پیچیده و متراکم را مدیریت می‌کند.

و در استخراج ریاضی از فایل‌های PDF پیشرفته است. نشانگر را می‌توان برای طیف گسترده‌ای از کارها استفاده کرد:.

نمایه‌سازی پایگاه‌های دانش PDF برای RAG تجزیه محتوای PDF چند زبانه برای آموزش استخراج اطلاعات کلیدی از اسناد. بدون ساختار برای معیارهای دقیق اینجا را ببینید معیارهای نشانگر برای دقت و توان عملیاتی در مقایسه با.

سرویس‌های ابری مانند Llamaparse و Mathpix و همچنین سایر ابزارهای منبع‌باز،. مطلوب هستند.

معیارهای دقت بالا در صفحات PDF منفرد از Common Crawl انجام شد و با استفاده از LLM-as-a-a-judge امتیاز. گرفتند.

گذردهی نشانگر 10 برابر در دقت مدال به تنهایی کافی نیست. سیستم‌های دنیای واقعی برای پردازش سریع،.

پیوسته و مقرون‌به‌صرفه میلیون‌ها سند نیازمند توان عملیاتی و قابلیت اطمینان بالایی هستند. نشانگر با در نظر گرفتن آن طراحی شده است،.

و Modal سریعترین راه برای دستیابی به مقیاس برای خود استقرار است. در M4 Mac با استفاده از Apple MPS (بدون GPU)، می‌توانید پردازش کنید حدود 0.

22 صفحه در ثانیه در Modal، می‌توانید این میزان را به حدود 2. 2 صفحه در ثانیه در هر ظرف افزایش دهید.

این افزایش 10 برابری ناشی از استفاده از سخت‌افزار قدرتمندتر (مانند GPU H100)،. بهینه‌سازی‌های Flash Attention،.

و تنظیم محیط (برای تنظیماتی مانند OMP_NUM_THREADS) است. توجه داشته باشید که در عمل،.

باید با پیکربندی‌های مختلف آزمایش کنید تا تعادل ایده‌آل خود را بین دقت،. هزینه و توان انجام دهید.

به یک راه‌حل مدیریت شده برای یک مورد استفاده تجاری نیاز دارید؟ پلتفرم API Datalab از بهینه‌سازی‌های استنتاج اضافی استفاده می‌کند تا سرعت پردازش صفحه را در حدود 3-4 صفحه.

در ثانیه فعال کند. این در پشت صحنه Modal مستقر شده است!

به کارگیری بهترین هوشمندی اسناد در کلاس ما از تعمیق همکاری خود با Datalab هیجان زده هستیم. بسیاری از کاربران ما قبلاً روی آورده اند به Modal برای بهترین شیوه‌ها در مورد استقرار Marker و.

Surya،. و این همکاری اکنون این کار را یکپارچه می‌کند.

همین امروز با این مثال شروع کنید.

چرا مهم است

اهمیت این خبر در این است که روی استفاده واقعی از AI و تصمیم‌گیری سازمانی اثر می‌گذارد.

منبع

لینک منبع اصلی در کارت و صفحه مقاله نمایش داده می‌شود.

اعتبار

چرایی اعتماد به این خبر

امتیاز اعتبار، منطق اعتماد، وضعیت راستی‌آزمایی و لاگ تغییرات در یک نگاه.

اعتبار خبر۴۳ / 100

اعتبار منبع۱۳ / 100

اعتبار موضوع۱۰۰ / 100

تازگی۳۲ / 100

مرحله عمر خبرNEEDS_UPDATE

نیاز به به‌روزرسانیبله

نیازمند تقویتنیازمند تقویتمرجع قوینیازمند بازبینینیازمند به‌روزرسانی

تصمیم انسانی تحریریه

خلاصه تصمیم تحریریه

سیگنال بازبینی باز استstandard editorial reviewنیاز بازبینی قابل مشاهده استstandard editorial path

این مقاله در مسیر standard editorial review قرار دارد و بخشی از سیگنال‌های review هنوز باید تکمیل یا شفاف‌تر شود.

دلیل انتشار: خبرهای استاندارد با چک‌های منبع، تیتر و خلاصه منتشر می‌شوند و در صورت حساسیت بالاتر به review سخت‌تر ارتقا پیدا می‌کنند. وضعیت فعلی: fact-check not_started و checklist ۰٪.

کلاس خبرSTANDARD_NEWS

سخت‌گیری بازبینیRECOMMENDED

بازبینثبت عمومی نشده

موارد بازبینی که باید شفاف‌تر شوند

صحت و منبع اصلی تایید شدتیتر بازبینی و حرفه‌ای شدخلاصه برای کارت و SEO تایید شد

سیاست تحریریه و اصلاحات چرا به هوش‌گیت اعتماد کنیم؟

چرا این خبر قابل اعتماد است

شفافیت راستی‌آزمایی ادعاها

ادعای تاییدشده۰

نیازمند بازبینی۰

میانگین اطمینان۰٪

چرا هنوز مهم است

این خبر هنوز بازدید، کامنت یا follow-up کافی دارد و از چرخه توجه مخاطب خارج نشده است.

تقویت اعتبار

وجود follow-up و پوشش مرتبط، authority این خبر را در طول زمان تقویت می‌کند.

پیگیری به‌روزرسانی

این خبر evergreen است و برای حفظ authority به refresh تحریریه نیاز دارد.

بخش منابع و ارجاع‌ها

لینک‌های منبع اصلی، ارجاع‌های ادعا و referenceهای مکمل برای پیگیری مستقیم.

modal.comمنبع اصلی

modal.com/blog/datalab-and-modal

modal.comارجاع تکمیلی

modal.com/blog

پوشش‌های پیگیری

پیگیری‌های بعدی، توضیح‌دهنده‌های مرتبط یا خبرهای مکملی که عمر این موضوع را بعد از انتشار ادامه می‌دهند.

یک روش گالرکین ناپیوسته ترکیبی همگرا برای انیشتین -- معادلات اسکالر

پیگیری بعدی

1405/01/29 15:44

یک اپراتور فتوآکوستیک فوروآکوستیک-پیوسته سازگار با قانون متقابل

پیگیری بعدی

1405/01/29 15:44

عدم وجود احتمالات و دم پایین در رژیم بحرانی از طریق انتشار باور

پیگیری بعدی

1405/01/29 15:44

توابع مانع کنترل ماتریس مرتبه بالا: حالت خوب و امکان سنجی از طریق درجه نسبی ماتریس

پیگیری بعدی

1405/01/29 15:44

تعامل کاربران و کیفیت خبر

امتیاز بدهید، نظر ثبت کنید یا اگر خطایی دیدید گزارش اصلاح بفرستید. moderation، trust contributor و کیفیت thread به‌صورت شفاف نمایش داده می‌شود.

بازدید

کلیک روی خبر

امتیاز میانگین

0.00 / 5

دیدگاه تایید شده

وضعیت trust گفتگو

کیفیت thread براساس reputation contributorها، رأی‌ها و moderation سنجیده می‌شود.

در حال بارگذاری

امتیاز thread

۰ / 100

دیدگاه متخصص

دیدگاه مفید

خروجی moderation و قوانین

تاییدشده: ۰pending: ۰hidden/spam: ۰

حضور انسانی در این گفتگو

این بخش کمک می‌کند thread فقط حول personaها دیده نشود و contributorهای انسانی واقعی هم واضح باشند.

contributor انسانی: ۰trusted: ۰expert: ۰

هنوز contributor انسانی برجسته‌ای در این thread دیده نشده است.

امتیاز شما به خبر

هنوز امتیاز نداده‌اید.

واکنش سریع به خبر

به‌جای لایک کلی، نوع برداشت خودتان را مشخص کنید.

ثبت دیدگاه

دیدگاه‌های کم‌ارزش یا spam به‌صورت خودکار محدود می‌شوند و نتیجه moderation در همین صفحه قابل مشاهده است.

گزارش اصلاح یا بهبود

اگر claim، ترجمه، منبع یا framing خبر نیاز به اصلاح دارد، این مسیر مستقیم برای تیم تحریریه است.

آخرین دیدگاه‌ها

هنوز دیدگاهی ثبت نشده است.

مقایسه سه سطح مطالعه

برای همین خبر، نسخه ساده، عمومی و تخصصی کنار هم خلاصه شده‌اند.

ساده

۴٬۹۸۱ کاراکتر

مدل‌ها. پذیری و توان استفاده کنید. کنید،.

بازگشت اخبار 29 اکتبر 2025 4 دقیقه خواندن ما مشتاقیم با Datalab،.
خالقان Marker و Surya همکاری کنیم تا توسعه دهندگان و تیم‌ها.
بتوانند بهترین مدل‌های هوشمند اسناد را سریعتر از همیشه بکار ببرند.
نشانگر یک مدل هدفمند و زیر میلیارد پارامتری است که به‌طور خاص.

عمومی

۴٬۹۵۷ کاراکتر

مدل‌ها. ابزار Surya OCR استفاده کند. این در پشت صحنه Modal مستقر شده است!

بازگشت اخبار 29 اکتبر 2025 4 دقیقه خواندن ما مشتاقیم با Datalab،.
خالقان Marker و Surya همکاری کنیم تا توسعه دهندگان و تیم‌ها بتوانند بهترین مدل‌های هوشمند اسناد.
را سریعتر از همیشه بکار ببرند.
نشانگر یک مدل هدفمند و زیر میلیارد پارامتری است که به‌طور خاص برای ساختار سند آموزش داده شده.

تخصصی

۵٬۰۲۹ کاراکتر

دهد. مدل‌ها. نحوه کار Modal به شما امکان می‌دهد تا نشانگر را روی GPUها در آن مستقر کنید ثانیه Modal همچنین GPUها را برای استقرار شما به.

بازگشت اخبار 29 اکتبر 2025 4 دقیقه خواندن ما مشتاقیم با Datalab،.
خالقان Marker و Surya همکاری کنیم تا توسعه دهندگان و تیم‌ها بتوانند بهترین مدل‌های هوشمند اسناد را سریعتر ا...
نشانگر یک مدل هدفمند و زیر میلیارد پارامتری است که به‌طور خاص برای ساختار سند آموزش داده شده است.
تجزیه قطعی و با وفاداری بالا را بدون توهم یا بی ثباتی LLMهای بزرگتر ارائه می‌دهد و این کار را با کسری از هز...

هایلایت‌ها و یادداشت‌ها

متن دلخواه را در خبر انتخاب کنید و با یک کلیک هایلایت بزنید. فقط برای شما قابل مشاهده است.

برای استفاده از هایلایت و یادداشت، وارد حساب کاربری شوید.

منابع اولیه

لینک‌های اصلی این خبر، شامل منبع اصلی و ارجاع‌های claim panel.

کاوش این مقاله

از این خبر به موضوع، persona، درس، پروژه و مسیر یادگیری مرتبط برسید.

پرسش از هوش‌گیت

موضوع‌های این مقاله

پژوهش پیشرفته متن‌باز و جامعه آموزش و یادگیری زیرساخت و محاسبات

موجودیت‌های این مقاله

هنوز موجودیت ثبت‌شده‌ای برای این مقاله دیده نمی‌شود.

چهره‌های مرتبط

آتنا سازه‌گر

عضو هیئت علمی هوش مصنوعی با تمرکز روی دانشگاه، پژوهش و علم و ترجمه خبرهای AI به تصمیم‌های واقعی، قابل‌فهم و اجرایی.