Hooshgate Models Center

مرجع فارسی انتخاب مدل، setup، integration و deployment

این بخش playground یا inference UI نیست. اینجا برای browse، مقایسه، انتخاب مسیر local/API/self-host و رسیدن به guideهای درست ساخته شده است. در بازسازی فعلی، فقط مرز curated و قابل‌اتکا روی surface عمومی مانده است.

مرجع و directoryopen-source / open-weightproprietary / API-firstsetup / integration / deployment

مرز عمومی فعلی

بازسازی با فهرست curated

در این فاز فقط صفحه‌هایی روی /fa/models دیده می‌شوند که برای reference، selection یا guide عملی ارزش روشن دارند.

کل صفحه‌های visible

۸۶

خانواده و مدل

۳۳

guide و tooling

۵۳

متن‌باز

۳۰

وزن‌باز

۲۳

صفحه‌های proprietary

۳۳

اگر دنبال عمق هستید، از guideها شروع کنید. family pageها بیشتر برای فهم fit، trade-off و shortlist هستند؛ setup و deployment عمیق معمولاً روی pageهای dedicated باز می‌شوند.

جست‌وجوی دقیق‌تر

مرتب‌سازی

نوع صفحه

خانواده مدل۳۳اکوسیستم / ابزار۱۸راهنمای نصب۱۰راهنمای یکپارچه‌سازی۷راهنمای استقرار۷مقایسه تصمیم‌یار۷راهنمای پیاده‌سازی۴

مودالیته

وظیفه

باز بودن مدل

اختصاصی۳۳وزن‌باز۲۳متن‌باز۳۰

مسیر اجرا

Vendor / خانواده

اکوسیستم و runtime

سازگارسازی

سناریوی استفاده

نوع لایسنس

API تجاری۲۸پلتفرم مدیریت‌شده۱وزن‌باز با مجوز انجمنی۱۲مجوز باز با شروط ویژه۱متن‌باز با مجوز آزاد۳۲ترکیبی / متغیر۱۲

محیط و سیستم

برگشت به مرز فعلی

Browse سریع

۲۹ صفحه در مرز عمومی فعلی

مرکز مدل‌ها فعلاً فقط روی curated boundary اجرا می‌شود تا surface تمیز، قابل‌جست‌وجو و مرجع‌گونه بماند.

صوت و گفتار

خانواده‌های پایه LLM

برای انتخاب بین GPT، Claude، Gemini، Llama، Qwen و Mistral از اینجا شروع کنید.

۱۴ صفحه

کدنویسی و workflow توسعه

مدل‌ها و guideهایی برای code assistant، repo workflow و انتخاب coding stack.

۴۱ صفحه

Embedding، RAG و reranking

برای retrieval stack، document AI و search quality مسیرهای مرتبط را اینجا ببینید.

۴۶ صفحه

تصویر، ویدئو و صوت

مدل‌های media و voice را کنار هم ببینید و بعد بین API و self-host تصمیم بگیرید.

۳۷ صفحه

اکوسیستم و serving

برای Ollama، vLLM، TGI، Hugging Face و runtimeهای محلی و production.

۱۸ صفحه

نصب، integration و deployment

اگر دنبال جواب اجرایی هستید، به‌جای family pages از guideها شروع کنید.

۳۱ صفحه

عمق M4B

عمق را از نوع guide وارد کنید

برای این فاز، landing نقش hub دارد نه card dump. از laneهای curated وارد setup، comparison، deployment، implementation، local/self-host و API-first شوید.

setup / install

از macOS local تا API-first، Windows local و Linux self-host؛ برای onboarding عملی از این مسیر شروع کنید.

۱۰ صفحه

comparison / decision

برای local در برابر API و self-host، open در برابر proprietary و serving stackها این lane را ببینید.

۷ صفحه

deployment / serving

اگر از pilot گذشته‌اید و به rollout، latency، cost و hardware فکر می‌کنید، این guideها مقصد بعدی‌اند.

۷ صفحه

implementation / integration

برای backend integration، coding workflow، RAG، document AI و voice stack از این صفحه‌ها وارد شوید.

۱۱ صفحه

local / self-host

برای مسیرهای local، Linux/macOS و self-host production؛ مناسب وقتی data boundary یا کنترل infra مهم است.

۶۲ صفحه

API-first

برای تیم‌هایی که می‌خواهند سریع‌تر به محصول برسند و serving را فعلاً به provider بسپارند.

۴۵ صفحه

open / proprietary

برای مقایسه مسیر open-weight، open-source و proprietary بدون تبدیل landing به لیست خام.

۷ صفحه

ورود از مسیر task

اگر use-case را می‌دانید، از task شروع کنید و بعد vendor یا runtime را باریک کنید.

چت و دستیار (۵۵)استدلال و تحلیل (۱۵)کدنویسی (۴۱)workflow عامل‌محور (۳۵)RAG و دانش سازمانی (۴۵)تحلیل سند (۳۳)جست‌وجوی معنایی (۲۰)تولید تصویر (۱۴)

ورود از مسیر ecosystem

اگر stack را می‌دانید، از Hugging Face، Ollama، vLLM یا runtimeهای محلی وارد شوید.

OpenAI ecosystem (۱۹)Anthropic ecosystem (۱۱)Google / Gemini (۱۳)Midjourney (۲)Qwen ecosystem (۷)Mistral ecosystem (۴)NVIDIA Riva (۲)NVIDIA NeMo (۲)

نقطه‌های شروع خوب

چند صفحه برای شروع سریع

اگر هنوز مطمئن نیستید از کجا شروع کنید، یکی از این صفحه‌های مرجع یا guide را باز کنید.

خانواده مدل

خانواده GPT

اگر تیم شما به مدل API-first با ابزار، structured outputs و اکوسیستم بالغ نیاز دارد، GPT معمولاً نقطه شروع استاندارد است.

راهنمای نصب

مدل هاي local روي macOS

اگر قرار است local AI را روي مک جدي و قابل تکرار جلو ببريد، اين صفحه تفاوت Ollama، MLX و LM Studio را از نگاه hardware fit، developer workflow و مسير migration روشن مي کند.

مقایسه تصمیم‌یار

مقايسه مدل هاي proprietary و open-weight

اين comparison براي تصميم ايدئولوژيک نوشته نشده است؛ براي وقتي است که بايد بين quality آماده، time-to-market و enterprise support از يک سو، و data control، local/self-host و flexibility از سوي ديگر انتخاب عملي کنيد.

مقایسه تصمیم‌یار

مقايسه stackهاي serving و inference

وقتي open model انتخاب شده، سؤال بعدي فقط «کجا deploy کنيم؟» نيست؛ سؤال اين است که vLLM، TGI، endpoint managed يا cloud serving براي latency، throughput، ownership و migration path شما کدام trade-off را مي سازند.

مقایسه تصمیم‌یار

مقایسه خانواده‌های هوش مصنوعی ویدئو

این راهنما برای انتخاب عملی بین text-to-video، image-to-video، video editing و video understanding است؛ با این نگاه که ویدئو هنوز گران، کند، policy-heavy و وابسته به workflow انسانی است.

راهنمای استقرار

راه اندازي self-host براي LLM در production

اين guide براي لحظه اي است که self-host از demo و benchmark عبور مي کند و بايد به سرويس پايدار، monitorable و rollbackable تبديل شود؛ با owner روشن براي GPU، gateway، observability و incident response.

راهنمای استقرار

استقرار realtime voice stack در production

این guide برای لحظه‌ای است که voice agent از demo عبور می‌کند و باید با latency بودجه‌بندی‌شده، barge-in، streaming، fallback، observability و policy ضبط صدا وارد production شود.

راهنمای پیاده‌سازی

GitHub Copilot Coding Agent

GitHub Copilot Coding Agent برای تیم‌هایی مهم است که می‌خواهند issue-to-PR automation را داخل همان workflow گیت‌هاب خودشان جلو ببرند، با review و policyهای سازمانی نزدیک به محل کار اصلی تیم.

راهنمای پیاده‌سازی

پیاده‌سازی voice stack و voice agent

voice product فقط STT یا TTS نیست. این guide نشان می‌دهد برای ساخت voice agent باید latency زنجیره‌ای، barge-in، fallback و انتخاب بین managed voice stack و local/self-host را چطور ببینید.

Hooshgate Referenceمقایسه تصمیم‌یاروزن‌باز

مقایسه local، API و self-host

مهم‌ترین سؤال عملی بسیاری از تیم‌ها همین است: local run کنم، API بگیرم یا self-host شوم؟ این صفحه به‌جای پاسخ شعاری، trade-off تصمیم را شفاف می‌کند.

متن و چتچندوجهیچت و دستیارکدنویسی

کجا به کار می‌آید؟

تیم‌های product، infra و enterprise که باید تصمیم deployment بگیرند و نمی‌خواهند تحت‌تأثیر hype یک مسیر اشتباه انتخاب کنند.

مسیر شروع

decision framework

پوشش صفحه

۴ کامل / ۱ خلاصه

راه‌اندازی

محیط محلی • API

محیط

Cloud managed

نکته‌ی مهم: هیچ مسیر «همیشه درست» وجود ندارد؛ تصمیم باید بر اساس latency target، داده، team maturity و economics workload گرفته شود.

ورود به راهنما

Hooshgate Referenceراهنمای استقراراختصاصی

Guardrails، observability و evaluation

بخش بزرگی از production readiness نه در مدل، بلکه در guardrails، observability و evaluation است. این صفحه نشان می‌دهد چطور AI feature را قابل‌پایش، قابل‌کنترل و قابل‌اعتماد نگه دارید.

متن و چتچندوجهیچت و دستیارworkflow عامل‌محور

کجا به کار می‌آید؟

هر تیمی که AI را از demo وارد محصول یا فرایند سازمانی می‌کند؛ مخصوصاً محیط‌های حساس، customer-facing و agentic.

مسیر شروع

ops and safety layer

پوشش صفحه

۵ کامل / ۴ خلاصه

راه‌اندازی

API • استقرار روی زیرساخت خودتان

محیط

Cloud managed

نکته‌ی مهم: بدون quality review، trace و policy checks، حتی بهترین مدل‌ها هم به‌مرور drift می‌کنند و اعتماد کاربر را از بین می‌برند.

ورود به راهنما

Hooshgate Referenceراهنمای استقراراختصاصی

راهنمای deployment برای محصول و سازمان

deployment حرفه‌ای با «انتخاب مدل» تمام نمی‌شود. این guide از phaseهای rollout تا security، observability، guardrails و maintenance trade-off را برای محصول و سازمان جمع می‌کند.

متن و چتچندوجهیچت و دستیارworkflow عامل‌محور

کجا به کار می‌آید؟

tech leadها، infra leadها و product ownerهایی که باید یک AI feature را به‌شکل production-grade وارد سیستم واقعی کنند.

مسیر شروع

production operations

پوشش صفحه

۵ کامل / ۴ خلاصه

راه‌اندازی

API • استقرار روی زیرساخت خودتان

محیط

Cloud managed

نکته‌ی مهم: بیشتر شکست‌های production نه از خود مدل، بلکه از فقدان rollout phase، logging، fallback و ownership عملیاتی می‌آید.

ورود به راهنما

Hugging Faceاکوسیستم / ابزارمتن‌باز

اکوسیستم Hugging Face

Hugging Face یک ابزار واحد نیست؛ لایه‌ای است که model discovery، artifact management، dataset handling، docs و deployment path بسیاری از تیم‌های open-weight را به هم وصل می‌کند.

متن و چتچندوجهیچت و دستیارکدنویسی

کجا به کار می‌آید؟

تیم‌هایی که می‌خواهند مدل‌ها را مقایسه، weightها را مدیریت، dataset و adapter را منتشر و از یک ecosystem منسجم برای open model workflow استفاده کنند.

مسیر شروع

ecosystem backbone

پوشش صفحه

۹ کامل / ۰ خلاصه

راه‌اندازی

API • محیط محلی

محیط

Cloud managed

نکته‌ی مهم: داشتن model card روی Hugging Face به معنی production-ready بودن مدل یا روشن‌بودن license آن نیست؛ governance و review هنوز بر عهده شماست.

ورود به راهنما

Hooshgate Referenceراهنمای نصبمتن‌باز

راهنمای شروع local روی ویندوز، مک و لینوکس

اگر نمی‌دانید برای local AI از کجا شروع کنید، این صفحه مسیر ساده‌تر را برای Windows، macOS و Linux روشن می‌کند و می‌گوید چه زمانی سراغ Ollama، LM Studio یا llama.cpp بروید.

متن و چتچندوجهیچت و دستیارکدنویسی

کجا به کار می‌آید؟

تیم‌ها و افرادی که می‌خواهند با حداقل friction اولین local run را انجام دهند و فرق بین desktop evaluation و local API را بفهمند.

مسیر شروع

desktop و workstation

پوشش صفحه

۵ کامل / ۲ خلاصه

راه‌اندازی

محیط محلی

محیط

Windows • macOS

نکته‌ی مهم: local run همیشه بهترین انتخاب نیست؛ اگر هدف شما محصول چندکاربره یا SLAدار است، باید بعد از pilot تصمیم serving را دوباره بگیرید.

ورود به راهنما

Hooshgate Referenceراهنمای یکپارچه‌سازیاختصاصی

راهنمای API-first برای مدل‌های proprietary

اگر نمی‌خواهید وارد serving شوید و زمان رسیدن به MVP برایتان حیاتی است، مسیر API-first هنوز سریع‌ترین راه حرفه‌ای است؛ به‌شرط اینکه cost، lock-in و governance را از ابتدا مهندسی کنید.

متن و چتچندوجهیچت و دستیارکدنویسی

کجا به کار می‌آید؟

محصولات agentic، document AI، multimodal appها و تیم‌هایی که زیرساخت inference را نمی‌خواهند خودشان نگه دارند.

مسیر شروع

API-managed path

پوشش صفحه

۵ کامل / ۴ خلاصه

راه‌اندازی

API • ابر مدیریت‌شده

محیط

Linux • macOS

نکته‌ی مهم: ساده‌بودن integration اولیه باعث می‌شود بسیاری از تیم‌ها logging، budget، fallback و data boundary را دیرتر از حد لازم طراحی کنند.

ورود به راهنما

Ollamaاکوسیستم / ابزارمتن‌باز

اکوسیستم Ollama

Ollama بهترین نقطه شروع برای تیم‌هایی است که می‌خواهند بدون درگیرشدن با serving stackهای سنگین، مدل را روی لپ‌تاپ، ورک‌استیشن یا سرور کوچک بالا بیاورند.

متن و چتچندوجهیچت و دستیارکدنویسی

کجا به کار می‌آید؟

prototype محلی، ارزیابی اولیه مدل‌های open-weight، demo داخلی، RAG سبک و backendهایی که OpenAI-compatible local endpoint می‌خواهند.

مسیر شروع

local-first و self-host سبک

پوشش صفحه

۹ کامل / ۰ خلاصه

راه‌اندازی

محیط محلی • استقرار روی زیرساخت خودتان

محیط

macOS • Linux

نکته‌ی مهم: وقتی concurrency بالا، batching پیشرفته یا multi-tenant production می‌خواهید، Ollama معمولاً باید جای خود را به runtimeهای جدی‌تری مثل vLLM بدهد.

ورود به راهنما

ggml-org / llama.cppاکوسیستم / ابزارمتن‌باز

اکوسیستم llama.cpp

llama.cpp برای وقتی مناسب است که کنترل دقیق روی GGUF، اجرای CPU-friendly، edge deployment یا بسته‌بندی محلی برایتان مهم‌تر از سادگی UX باشد.

متن و چتچندوجهیچت و دستیارکدنویسی

کجا به کار می‌آید؟

GGUF، edge، inference روی CPU یا GPUهای کوچک، embedded apps و تیم‌هایی که می‌خواهند behavior runtime را دقیق‌تر کنترل کنند.

مسیر شروع

local و edge-oriented

پوشش صفحه

۹ کامل / ۰ خلاصه

راه‌اندازی

محیط محلی • استقرار روی زیرساخت خودتان

محیط

Linux • macOS

نکته‌ی مهم: اگر فقط می‌خواهید سریع demo بگیرید، llama.cpp معمولاً نقطه شروع راحتی نیست و Ollama یا LM Studio friction کمتری دارند.

ورود به راهنما

Hooshgate Referenceاکوسیستم / ابزارمتن‌باز

مرور اکوسیستم fine-tuning

همه مسائل با fine-tuning حل نمی‌شود. این صفحه کمک می‌کند بفهمید چه زمانی tuning واقعاً ارزش دارد، چه زمانی retrieval یا prompt بهتر است و کدام ecosystem برای LoRA یا full training مناسب‌تر است.

متن و چتچندوجهیچت و دستیارکدنویسی

کجا به کار می‌آید؟

تیم‌هایی که بعد از رسیدن به baseline خوب، به adaptation جدی فکر می‌کنند و نمی‌خواهند زودتر از موعد وارد training pipeline پرهزینه شوند.

مسیر شروع

adaptation decision guide

پوشش صفحه

۱۰ کامل / ۰ خلاصه

راه‌اندازی

محیط محلی • استقرار روی زیرساخت خودتان

محیط

Cloud managed

نکته‌ی مهم: بزرگ‌ترین اشتباه، رفتن سراغ tuning قبل از داشتن eval set، failure taxonomy و baseline درست است.

ورود به راهنما

Hugging Faceاکوسیستم / ابزارمتن‌باز

Transformers stack

Transformers stack زمانی مناسب است که می‌خواهید روی اجرای مدل، pre/post-processing و training/inference workflow کنترل عمیق داشته باشید و حاضر باشید از سادگی runtimeهای turnkey صرف‌نظر کنید.

متن و چتچندوجهیچت و دستیارکدنویسی

کجا به کار می‌آید؟

تیم‌های فنی، سرویس‌های سفارشی Python، inference با منطق اختصاصی، training/fine-tuning و کار با مدل‌هایی که runtime آماده برایشان کافی نیست.

مسیر شروع

custom Python stack

پوشش صفحه

۹ کامل / ۰ خلاصه

راه‌اندازی

محیط محلی • استقرار روی زیرساخت خودتان

محیط

Linux • macOS

نکته‌ی مهم: اگر فقط endpoint production می‌خواهید، بسیاری از تیم‌ها با vLLM یا TGI سریع‌تر به نتیجه می‌رسند؛ Transformers انعطاف می‌دهد اما burden بیشتری هم می‌آورد.

ورود به راهنما

Deepgramخانواده مدلاختصاصی

Deepgram

Deepgram برای تیم‌هایی مناسب است که STT/TTS/voice-agent stack می‌خواهند و به‌جای چسباندن چند سرویس جدا، یک platform صوتی متمرکز ترجیح می‌دهند.

صوت و گفتارتبدیل گفتار به متنتبدیل متن به گفتار

کجا به کار می‌آید؟

realtime voice agents، transcription، multilingual speech apps و محصولاتی که کیفیت، latency و turn handling در آن‌ها مهم است.

مسیر شروع

API-first با self-host option

پوشش صفحه

۵ کامل / ۵ خلاصه

راه‌اندازی

API • ابر مدیریت‌شده

محیط

Cloud managed

نکته‌ی مهم: برای voice apps، باید latency end-to-end، retention، redaction و تعامل بین STT/TTS/LLM را باهم طراحی کنید.

ورود به صفحه مرجع

Hooshgate Referenceراهنمای پیاده‌سازیاختصاصی

پیاده‌سازی voice stack و voice agent

صوت و گفتارمتن و چتتبدیل گفتار به متنتبدیل متن به گفتار

کجا به کار می‌آید؟

تیم‌هایی که می‌خواهند voice assistant، call automation یا spoken UI بسازند و نیاز دارند کل زنجیره STT → reasoning → TTS را حرفه‌ای طراحی کنند.

مسیر شروع

voice workflow guide

پوشش صفحه

۵ کامل / ۳ خلاصه

راه‌اندازی

API • استقرار روی زیرساخت خودتان

محیط

وابسته به stack انتخابی

نکته‌ی مهم: اندازه‌گیری latency فقط روی مدل اصلی اشتباه است؛ voice UX را tail latency، interruptibility و کیفیت turn-taking می‌سازند.

ورود به راهنما

Mistral AIخانواده مدلوزن‌باز

خانواده Mistral

Mistral برای تیم‌هایی جذاب است که هم self-host می‌خواهند و هم سبدی از مدل‌های تخصصی‌تر مثل coding، multimodal و document AI را در یک خانواده ببینند.

متن و چتچندوجهیچت و دستیاراستدلال و تحلیل

کجا به کار می‌آید؟

سازمان‌هایی که بین API و self-host جابه‌جا می‌شوند و می‌خواهند از مدل‌های متنوع این خانواده برای code، vision و enterprise search استفاده کنند.

مسیر شروع

API + self-host

پوشش صفحه

۵ کامل / ۵ خلاصه

راه‌اندازی

API • محیط محلی

محیط

Linux • Container / Docker

نکته‌ی مهم: تنوع مدل‌ها مزیت است، اما بدون taxonomy داخلی و استاندارد انتخاب مدل، تیم به‌سرعت سردرگم می‌شود.

ورود به صفحه مرجع

Hooshgate Referenceراهنمای استقراراختصاصی

استقرار realtime voice stack در production

صوت و گفتارمتن و چتدستیار صوتیتبدیل گفتار به متن

کجا به کار می‌آید؟

تیم‌هایی که voice assistant، call automation، spoken UI یا voice support را با کاربر واقعی اجرا می‌کنند و باید chain کامل STT → reasoning → tools/RAG → TTS را قابل اتکا کنند.

مسیر شروع

managed-first with selective self-host

پوشش صفحه

۵ کامل / ۴ خلاصه

راه‌اندازی

API • ابر مدیریت‌شده

محیط

Cloud managed

نکته‌ی مهم: اگر هنوز conversational design، privacy policy، on-call owner یا fallback text channel ندارید، deployment صوتی real-time زود است.

ورود به راهنما

Hooshgate Referenceراهنمای نصباختصاصی

راه اندازي API-first براي مدل هاي تجاري

اين راهنما براي تيمي است که مي خواهد مدل تجاري را به شکل API-first وارد محصول يا backend کند، بدون اين که ساده بودن SDK او را از schema، cost guardrail، fallback و ownership عملي غافل کند.

متن و چتچندوجهیچت و دستیارworkflow عامل‌محور

کجا به کار می‌آید؟

MVP سريع، backendهاي product-first، appهاي agentic يا document-heavy و تيم هايي که مي خواهند قبل از self-host سراغ value عملي بروند.

مسیر شروع

delivery سريع با governance لازم

پوشش صفحه

۵ کامل / ۲ خلاصه

راه‌اندازی

API • ابر مدیریت‌شده

محیط

Serverless • Cloud managed

نکته‌ی مهم: API-first burden serving را کم مي کند، اما cost، vendor dependency، retention policy و failure handling را از بين نمي برد.

ورود به راهنما

Hugging Faceاکوسیستم / ابزارمتن‌باز

اکوسیستم PEFT

PEFT در hub به این خاطر مهم است که لایه adaptation عملی برای modelهای باز را پوشش می‌دهد؛ یعنی جایی بین prompt-only و full fine-tuning.

متن و چتچندوجهیچت و دستیارکدنویسی

کجا به کار می‌آید؟

LoRA، adapter-based tuning، domain adaptation کم‌هزینه و تیم‌هایی که می‌خواهند experimentation را بدون full training شروع کنند.

مسیر شروع

training-adaptation toolkit

پوشش صفحه

۹ کامل / ۰ خلاصه

راه‌اندازی

محیط محلی • استقرار روی زیرساخت خودتان

محیط

Linux • Cloud managed

نکته‌ی مهم: بدون baseline، eval و data curation، PEFT فقط complexity اضافه می‌کند و الزاماً quality بهتر نمی‌دهد.

ورود به راهنما

Googleراهنمای یکپارچه‌سازیاختصاصی

Gemini Live API

Gemini Live API وقتی مهم می‌شود که شما به تعامل کم‌تاخیر صوت/ویدئو نیاز دارید و می‌خواهید conversation به سبک real-time را داخل محصول خودتان بسازید.

چندوجهیصوت و گفتاردستیار صوتیچت و دستیار

کجا به کار می‌آید؟

voice assistant، multimodal sessions، use-caseهای real-time و محصولاتی که interruption، turn-taking و media streaming برایشان مهم است.

مسیر شروع

managed low-latency media path

پوشش صفحه

۵ کامل / ۴ خلاصه

راه‌اندازی

API • ابر مدیریت‌شده

محیط

Cloud managed

نکته‌ی مهم: real-time بودن به‌معنای complexity بالاتر در session control، interruption handling، media pipeline و observability است.

ورود به راهنما

Hooshgate Referenceراهنمای نصبمتن‌باز

راهنمای self-host روی لینوکس

این guide برای تیمی است که واقعاً می‌خواهد روی Linux self-host کند: انتخاب بین vLLM، TGI، GGUF، container و incident path.

متن و چتچندوجهیچت و دستیارکدنویسی

کجا به کار می‌آید؟

stack self-host، private infra، rollout مدل‌های باز و تیم‌هایی که production serving را روی Linux جلو می‌برند.

مسیر شروع

Linux production-minded

پوشش صفحه

۵ کامل / ۲ خلاصه

راه‌اندازی

استقرار روی زیرساخت خودتان

محیط

Linux • Container / Docker

نکته‌ی مهم: self-host فقط نصب مدل نیست؛ queueing، logging، incident، security و upgrade path هم باید روشن باشند.

ورود به راهنما

Alibaba / Qwenخانواده مدلوزن‌باز

Qwen Omni

Qwen Omni برای تیم‌هایی مهم است که مدل باز چندوجهی با ورودی متن، تصویر و صدا می‌خواهند و می‌خواهند آن را در stack خودشان ادغام کنند.

چندوجهیصوت و گفتارچت و دستیارتحلیل سند

کجا به کار می‌آید؟

multimodal chat، voice-enabled assistant، image + text workflows و تجربه‌های unified که نمی‌خواهند کاملاً وابسته به API بسته باشند.

مسیر شروع

self-host ممکن

پوشش صفحه

۵ کامل / ۵ خلاصه

راه‌اندازی

استقرار روی زیرساخت خودتان • ابر مدیریت‌شده

محیط

Linux • Cloud managed

نکته‌ی مهم: مدل‌های omni به‌سادگی روی paper خوب به نظر می‌رسند، اما در محصول واقعی complexity orchestration و testing آن‌ها بالاست.

ورود به صفحه مرجع

ElevenLabsخانواده مدلاختصاصی

ElevenLabs

ElevenLabs برای تیم‌هایی مهم است که voice quality، TTS حرفه‌ای و STT/voice-agent workflow را به‌صورت یکپارچه می‌خواهند.

صوت و گفتارتبدیل متن به گفتارتبدیل گفتار به متن

کجا به کار می‌آید؟

voice interfaces، audiobook-like narration، realtime agents و pipelineهای صوتی محصولی.

مسیر شروع

API-only

پوشش صفحه

۵ کامل / ۵ خلاصه

راه‌اندازی

API

محیط

Linux • macOS

نکته‌ی مهم: در voice systems، text normalization، rights و human review برای برخی use-caseها حیاتی است.

ورود به صفحه مرجع

AWS / Amazonاکوسیستم / ابزاراختصاصی

اکوسیستم Amazon Bedrock

Amazon Bedrock برای تیم‌هایی مهم است که multi-model access را در بستر AWS و با دغدغه enterprise governance می‌خواهند.

متن و چتچندوجهیچت و دستیارworkflow عامل‌محور

کجا به کار می‌آید؟

سازمان‌هایی که already در AWS هستند، policy و governance برایشان مهم است و می‌خواهند model access را داخل همان cloud plane نگه دارند.

مسیر شروع

managed cloud platform

پوشش صفحه

۹ کامل / ۰ خلاصه

راه‌اندازی

API • ابر مدیریت‌شده

محیط

Cloud managed • Serverless

نکته‌ی مهم: Bedrock یک model family واحد نیست؛ quality و ops آن به provider انتخابی، region و service design شما وابسته است.

ورود به راهنما

Googleاکوسیستم / ابزاراختصاصی

اکوسیستم Vertex AI Model Garden

Vertex AI Model Garden برای تیم‌هایی مهم است که در Google Cloud هستند و می‌خواهند هم مدل‌های گوگل و هم بعضی model familyهای third-party را از یک cloud plane ببینند.

متن و چتچندوجهیچت و دستیارRAG و دانش سازمانی

کجا به کار می‌آید؟

Google Cloud-native teams، managed AI platform، teamهای data/ML که already روی Vertex و GCP workflow دارند.

مسیر شروع

managed cloud platform

پوشش صفحه

۹ کامل / ۰ خلاصه

راه‌اندازی

API • ابر مدیریت‌شده

محیط

Cloud managed

نکته‌ی مهم: Model Garden هم یک platform layer است؛ باید کیفیت هر family را جدا benchmark و governance آن را جدا طراحی کنید.

ورود به راهنما

Open WebUIاکوسیستم / ابزارمتن‌باز

اکوسیستم Open WebUI

Open WebUI برای تیم‌هایی مهم است که UI و control plane برای local یا self-host مدل‌ها می‌خواهند، نه فقط یک inference server خام.

متن و چتچندوجهیچت و دستیارRAG و دانش سازمانی

کجا به کار می‌آید؟

chat UI داخلی، RAG demo، تیم‌های غیرزیرساختی که می‌خواهند model access، user-facing interface و tooling را سریع ببینند.

مسیر شروع

UI + orchestration layer

پوشش صفحه

۹ کامل / ۰ خلاصه

راه‌اندازی

محیط محلی • استقرار روی زیرساخت خودتان

محیط

Container / Docker • Linux

نکته‌ی مهم: Open WebUI خودِ serving stack نهایی نیست و برای enterprise production باید auth، audit، policy و backend ownership را جدا ببینید.

ورود به راهنما

NVIDIAراهنمای استقراراختصاصی

NVIDIA Riva

NVIDIA Riva برای تیم‌هایی مهم است که speech stack را با performance بالا و ownership زیرساختی بیشتر روی GPU خودشان می‌خواهند، نه صرفاً یک API بیرونی برای STT/TTS.

صوت و گفتارتبدیل گفتار به متنتبدیل متن به گفتار

کجا به کار می‌آید؟

voice assistantهای خصوصی، speech pipelines سازمانی، on-prem یا edge-adjacent deployment و تیم‌هایی که speech AI را درون infra خودشان می‌آورند.

مسیر شروع

self-host speech stack

پوشش صفحه

۵ کامل / ۴ خلاصه

راه‌اندازی

استقرار روی زیرساخت خودتان • ابر مدیریت‌شده

محیط

Cloud managed • Edge / Device

نکته‌ی مهم: اگر فقط به STT/TTS ساده نیاز دارید، Riva می‌تواند از نظر ops و hardware بسیار بیشتر از نیاز واقعی شما باشد.

ورود به راهنما

Microsoftاکوسیستم / ابزاراختصاصی

اکوسیستم Azure AI Foundry

Azure AI Foundry برای سازمان‌هایی مهم است که enterprise controls مایکروسافتی و model access را در یک platform واحد می‌خواهند.

متن و چتچندوجهیچت و دستیارRAG و دانش سازمانی

کجا به کار می‌آید؟

Azure-centric organizations، enterprise governance، app teams که می‌خواهند model access و security controls را داخل Azure نگه دارند.

مسیر شروع

managed enterprise platform

پوشش صفحه

۹ کامل / ۰ خلاصه

راه‌اندازی

API • ابر مدیریت‌شده

محیط

Cloud managed

نکته‌ی مهم: مثل بقیه platform pageها، اینجا درباره delivery و governance حرف می‌زنیم نه تضمین کیفیت هر model family.

ورود به راهنما

OpenAIخانواده مدلاختصاصی

Whisper

Whisper هنوز هم یک مرجع مهم برای speech-to-text عمومی است، مخصوصاً وقتی به چندزبانه بودن و سادگی API نیاز دارید.

صوت و گفتارتبدیل گفتار به متن

کجا به کار می‌آید؟

رونویسی فایل‌های صوتی، meeting notes، archive search و pipelineهای پایه STT.

مسیر شروع

API-first

پوشش صفحه

۵ کامل / ۴ خلاصه

راه‌اندازی

API

محیط

Linux • macOS

نکته‌ی مهم: اگر accuracy خیلی بالا، diarization پیشرفته یا workflowهای زنده لازم دارید، گزینه‌های جدیدتر را هم کنار آن بسنجید.

ورود به صفحه مرجع

Microsoftخانواده مدلوزن‌باز

خانواده Phi

Phi بیشتر وقتی مهم می‌شود که مدل کوچک‌تر، deployment سبک و integration با اکوسیستم مایکروسافت برایتان مهم باشد.

متن و چتچندوجهیچت و دستیاراستدلال و تحلیل

کجا به کار می‌آید؟

copilotهای داخلی سبک، edge deployment و تیم‌هایی که Azure و Windows/ONNX مسیر مهمشان است.

مسیر شروع

edge / local

پوشش صفحه

۵ کامل / ۵ خلاصه

راه‌اندازی

محیط محلی • استقرار روی زیرساخت خودتان

محیط

Windows • Linux

نکته‌ی مهم: برای همه taskها نباید Phi را به‌عنوان جایگزین مستقیم frontier modelها دید؛ strength آن بیشتر در efficiency است.

ورود به صفحه مرجع

Rhasspyخانواده مدلمتن‌باز

Piper

Piper برای TTS محلی و روی‌دستگاه بسیار مهم است؛ مخصوصاً وقتی privacy، سرعت و اجرای بدون cloud برایتان مهم‌تر از voice expressiveness بسیار بالا است.

صوت و گفتارتبدیل متن به گفتار

کجا به کار می‌آید؟

local TTS، edge devices، Home Assistant-style setups و محصولاتی که باید آفلاین یا در شبکه داخلی کار کنند.

مسیر شروع

local / edge

پوشش صفحه

۵ کامل / ۴ خلاصه

راه‌اندازی

محیط محلی • لبه / روی دستگاه

محیط

Linux • Edge / Device

نکته‌ی مهم: خود Piper باز است، اما license هر voice جداگانه است؛ قبل از استفاده تجاری حتماً model card هر صدا را بررسی کنید.

ورود به صفحه مرجع

LiteLLMاکوسیستم / ابزارمتن‌باز

اکوسیستم LiteLLM

LiteLLM برای تیم‌هایی مهم است که multi-provider gateway، routing و compatibility layer می‌خواهند و نمی‌خواهند هر provider را جدا در backend پیاده کنند.

متن و چتچندوجهیچت و دستیارworkflow عامل‌محور

کجا به کار می‌آید؟

provider routing، fallback، cost control، unified API surface و backendهایی که چند vendor را هم‌زمان مصرف می‌کنند.

مسیر شروع

gateway and routing layer

پوشش صفحه

۹ کامل / ۰ خلاصه

راه‌اندازی

استقرار روی زیرساخت خودتان • API

محیط

وابسته به stack انتخابی

نکته‌ی مهم: gateway جای benchmark و model selection را نمی‌گیرد؛ فقط integration layer را یکدست‌تر می‌کند.

ورود به راهنما