Hooshgate Models Center

مرجع فارسی انتخاب مدل، setup، integration و deployment

این بخش playground یا inference UI نیست. اینجا برای browse، مقایسه، انتخاب مسیر local/API/self-host و رسیدن به guideهای درست ساخته شده است. در بازسازی فعلی، فقط مرز curated و قابل‌اتکا روی surface عمومی مانده است.

مرجع و directoryopen-source / open-weightproprietary / API-firstsetup / integration / deployment

مرز عمومی فعلی

بازسازی با فهرست curated

در این فاز فقط صفحه‌هایی روی /fa/models دیده می‌شوند که برای reference، selection یا guide عملی ارزش روشن دارند.

کل صفحه‌های visible

۸۶

خانواده و مدل

۳۳

guide و tooling

۵۳

متن‌باز

۳۰

وزن‌باز

۲۳

صفحه‌های proprietary

۳۳

اگر دنبال عمق هستید، از guideها شروع کنید. family pageها بیشتر برای فهم fit، trade-off و shortlist هستند؛ setup و deployment عمیق معمولاً روی pageهای dedicated باز می‌شوند.

جست‌وجوی دقیق‌تر

مرتب‌سازی

نوع صفحه

خانواده مدل۳۳اکوسیستم / ابزار۱۸راهنمای نصب۱۰راهنمای یکپارچه‌سازی۷راهنمای استقرار۷مقایسه تصمیم‌یار۷راهنمای پیاده‌سازی۴

مودالیته

وظیفه

باز بودن مدل

اختصاصی۳۳وزن‌باز۲۳متن‌باز۳۰

مسیر اجرا

Vendor / خانواده

اکوسیستم و runtime

سازگارسازی

سناریوی استفاده

نوع لایسنس

API تجاری۲۸پلتفرم مدیریت‌شده۱وزن‌باز با مجوز انجمنی۱۲مجوز باز با شروط ویژه۱متن‌باز با مجوز آزاد۳۲ترکیبی / متغیر۱۲

محیط و سیستم

برگشت به مرز فعلی

Browse سریع

۸۶ صفحه در مرز عمومی فعلی

مرکز مدل‌ها فعلاً فقط روی curated boundary اجرا می‌شود تا surface تمیز، قابل‌جست‌وجو و مرجع‌گونه بماند.

همه‌ی صفحه‌های curated

خانواده‌های پایه LLM

برای انتخاب بین GPT، Claude، Gemini، Llama، Qwen و Mistral از اینجا شروع کنید.

۱۴ صفحه

کدنویسی و workflow توسعه

مدل‌ها و guideهایی برای code assistant، repo workflow و انتخاب coding stack.

۴۱ صفحه

Embedding، RAG و reranking

برای retrieval stack، document AI و search quality مسیرهای مرتبط را اینجا ببینید.

۴۶ صفحه

تصویر، ویدئو و صوت

مدل‌های media و voice را کنار هم ببینید و بعد بین API و self-host تصمیم بگیرید.

۳۷ صفحه

اکوسیستم و serving

برای Ollama، vLLM، TGI، Hugging Face و runtimeهای محلی و production.

۱۸ صفحه

نصب، integration و deployment

اگر دنبال جواب اجرایی هستید، به‌جای family pages از guideها شروع کنید.

۳۱ صفحه

عمق M4B

عمق را از نوع guide وارد کنید

برای این فاز، landing نقش hub دارد نه card dump. از laneهای curated وارد setup، comparison، deployment، implementation، local/self-host و API-first شوید.

setup / install

از macOS local تا API-first، Windows local و Linux self-host؛ برای onboarding عملی از این مسیر شروع کنید.

۱۰ صفحه

comparison / decision

برای local در برابر API و self-host، open در برابر proprietary و serving stackها این lane را ببینید.

۷ صفحه

deployment / serving

اگر از pilot گذشته‌اید و به rollout، latency، cost و hardware فکر می‌کنید، این guideها مقصد بعدی‌اند.

۷ صفحه

implementation / integration

برای backend integration، coding workflow، RAG، document AI و voice stack از این صفحه‌ها وارد شوید.

۱۱ صفحه

local / self-host

برای مسیرهای local، Linux/macOS و self-host production؛ مناسب وقتی data boundary یا کنترل infra مهم است.

۶۲ صفحه

API-first

برای تیم‌هایی که می‌خواهند سریع‌تر به محصول برسند و serving را فعلاً به provider بسپارند.

۴۵ صفحه

open / proprietary

برای مقایسه مسیر open-weight، open-source و proprietary بدون تبدیل landing به لیست خام.

۷ صفحه

ورود از مسیر task

اگر use-case را می‌دانید، از task شروع کنید و بعد vendor یا runtime را باریک کنید.

چت و دستیار (۵۵)استدلال و تحلیل (۱۵)کدنویسی (۴۱)workflow عامل‌محور (۳۵)RAG و دانش سازمانی (۴۵)تحلیل سند (۳۳)جست‌وجوی معنایی (۲۰)تولید تصویر (۱۴)

ورود از مسیر ecosystem

اگر stack را می‌دانید، از Hugging Face، Ollama، vLLM یا runtimeهای محلی وارد شوید.

OpenAI ecosystem (۱۹)Anthropic ecosystem (۱۱)Google / Gemini (۱۳)Midjourney (۲)Qwen ecosystem (۷)Mistral ecosystem (۴)NVIDIA Riva (۲)NVIDIA NeMo (۲)

نقطه‌های شروع خوب

چند صفحه برای شروع سریع

اگر هنوز مطمئن نیستید از کجا شروع کنید، یکی از این صفحه‌های مرجع یا guide را باز کنید.

خانواده مدل

خانواده GPT

اگر تیم شما به مدل API-first با ابزار، structured outputs و اکوسیستم بالغ نیاز دارد، GPT معمولاً نقطه شروع استاندارد است.

راهنمای نصب

مدل هاي local روي macOS

اگر قرار است local AI را روي مک جدي و قابل تکرار جلو ببريد، اين صفحه تفاوت Ollama، MLX و LM Studio را از نگاه hardware fit، developer workflow و مسير migration روشن مي کند.

مقایسه تصمیم‌یار

مقايسه مدل هاي proprietary و open-weight

اين comparison براي تصميم ايدئولوژيک نوشته نشده است؛ براي وقتي است که بايد بين quality آماده، time-to-market و enterprise support از يک سو، و data control، local/self-host و flexibility از سوي ديگر انتخاب عملي کنيد.

مقایسه تصمیم‌یار

مقايسه stackهاي serving و inference

وقتي open model انتخاب شده، سؤال بعدي فقط «کجا deploy کنيم؟» نيست؛ سؤال اين است که vLLM، TGI، endpoint managed يا cloud serving براي latency، throughput، ownership و migration path شما کدام trade-off را مي سازند.

مقایسه تصمیم‌یار

مقایسه خانواده‌های هوش مصنوعی ویدئو

این راهنما برای انتخاب عملی بین text-to-video، image-to-video، video editing و video understanding است؛ با این نگاه که ویدئو هنوز گران، کند، policy-heavy و وابسته به workflow انسانی است.

راهنمای استقرار

راه اندازي self-host براي LLM در production

اين guide براي لحظه اي است که self-host از demo و benchmark عبور مي کند و بايد به سرويس پايدار، monitorable و rollbackable تبديل شود؛ با owner روشن براي GPU، gateway، observability و incident response.

راهنمای استقرار

استقرار realtime voice stack در production

این guide برای لحظه‌ای است که voice agent از demo عبور می‌کند و باید با latency بودجه‌بندی‌شده، barge-in، streaming، fallback، observability و policy ضبط صدا وارد production شود.

راهنمای پیاده‌سازی

GitHub Copilot Coding Agent

GitHub Copilot Coding Agent برای تیم‌هایی مهم است که می‌خواهند issue-to-PR automation را داخل همان workflow گیت‌هاب خودشان جلو ببرند، با review و policyهای سازمانی نزدیک به محل کار اصلی تیم.

راهنمای پیاده‌سازی

پیاده‌سازی voice stack و voice agent

voice product فقط STT یا TTS نیست. این guide نشان می‌دهد برای ساخت voice agent باید latency زنجیره‌ای، barge-in، fallback و انتخاب بین managed voice stack و local/self-host را چطور ببینید.

OpenAIخانواده مدلاختصاصی

خانواده GPT

اگر تیم شما به مدل API-first با ابزار، structured outputs و اکوسیستم بالغ نیاز دارد، GPT معمولاً نقطه شروع استاندارد است.

متن و چتچندوجهیچت و دستیاراستدلال و تحلیل

کجا به کار می‌آید؟

محصولات agentic، backofficeهای سندمحور، workflowهای کدنویسی و تیم‌هایی که می‌خواهند عملیات inference را برون‌سپاری کنند.

مسیر شروع

API-first

پوشش صفحه

۵ کامل / ۵ خلاصه

راه‌اندازی

API • ابر مدیریت‌شده

محیط

Linux • macOS

نکته‌ی مهم: برای self-host گزینه اصلی نیست؛ باید هزینه، حریم خصوصی و lock-in را از ابتدا در معماری لحاظ کنید.

ورود به صفحه مرجع

Hooshgate Referenceمقایسه تصمیم‌یاروزن‌باز

مقایسه local، API و self-host

مهم‌ترین سؤال عملی بسیاری از تیم‌ها همین است: local run کنم، API بگیرم یا self-host شوم؟ این صفحه به‌جای پاسخ شعاری، trade-off تصمیم را شفاف می‌کند.

متن و چتچندوجهیچت و دستیارکدنویسی

کجا به کار می‌آید؟

تیم‌های product، infra و enterprise که باید تصمیم deployment بگیرند و نمی‌خواهند تحت‌تأثیر hype یک مسیر اشتباه انتخاب کنند.

مسیر شروع

decision framework

پوشش صفحه

۴ کامل / ۱ خلاصه

راه‌اندازی

محیط محلی • API

محیط

Cloud managed

نکته‌ی مهم: هیچ مسیر «همیشه درست» وجود ندارد؛ تصمیم باید بر اساس latency target، داده، team maturity و economics workload گرفته شود.

ورود به راهنما

Hooshgate Referenceراهنمای یکپارچه‌سازیوزن‌باز

راهنمای integration برای RAG

RAG با وصل‌کردن یک LLM به vector DB حل نمی‌شود. این guide مسیر حرفه‌ای integration را از ingest تا retrieval، reranking، answer synthesis و evaluation توضیح می‌دهد.

متن و چتEmbedding / بردارسازیRAG و دانش سازمانیجست‌وجوی معنایی

کجا به کار می‌آید؟

تیم‌هایی که می‌خواهند روی اسناد داخلی، دانش سازمانی، policy و document assistant یک RAG قابل‌نگهداری بسازند.

مسیر شروع

integration-focused

پوشش صفحه

۵ کامل / ۴ خلاصه

راه‌اندازی

API • استقرار روی زیرساخت خودتان

محیط

Cloud managed

نکته‌ی مهم: بدون dataset ارزیابی، metadata درست و failure taxonomy، بیشتر RAGها فقط demo خوب هستند نه محصول قابل اتکا.

ورود به راهنما

Hooshgate Referenceراهنمای استقراراختصاصی

Guardrails، observability و evaluation

بخش بزرگی از production readiness نه در مدل، بلکه در guardrails، observability و evaluation است. این صفحه نشان می‌دهد چطور AI feature را قابل‌پایش، قابل‌کنترل و قابل‌اعتماد نگه دارید.

متن و چتچندوجهیچت و دستیارworkflow عامل‌محور

کجا به کار می‌آید؟

هر تیمی که AI را از demo وارد محصول یا فرایند سازمانی می‌کند؛ مخصوصاً محیط‌های حساس، customer-facing و agentic.

مسیر شروع

ops and safety layer

پوشش صفحه

۵ کامل / ۴ خلاصه

راه‌اندازی

API • استقرار روی زیرساخت خودتان

محیط

Cloud managed

نکته‌ی مهم: بدون quality review، trace و policy checks، حتی بهترین مدل‌ها هم به‌مرور drift می‌کنند و اعتماد کاربر را از بین می‌برند.

ورود به راهنما

Anthropicخانواده مدلاختصاصی

خانواده Claude

Claude برای تیم‌هایی مناسب است که long-context، کیفیت نوشتار و رفتار پایدار در workflowهای document-heavy می‌خواهند.

متن و چتچندوجهیچت و دستیاراستدلال و تحلیل

کجا به کار می‌آید؟

تحلیل سند، agentهای دانشی، بازنویسی حرفه‌ای و تیم‌هایی که روی Bedrock یا Vertex AI نیز deployment می‌خواهند.

مسیر شروع

API-first

پوشش صفحه

۵ کامل / ۵ خلاصه

راه‌اندازی

API • ابر مدیریت‌شده

محیط

Linux • macOS

نکته‌ی مهم: مثل GPT، self-host در مسیر اصلی ندارد و باید economics و data boundary جداگانه مدیریت شود.

ورود به صفحه مرجع

vLLM Projectاکوسیستم / ابزارمتن‌باز

اکوسیستم vLLM

vLLM یکی از جدی‌ترین انتخاب‌ها برای serving مدل‌های open-weight در production است؛ مخصوصاً وقتی throughput، OpenAI-compatible API و batching برایتان مهم است.

متن و چتچندوجهیچت و دستیارکدنویسی

کجا به کار می‌آید؟

LLM serving سازمانی، endpointهای چندکاربره، self-host در مقیاس متوسط تا بالا، embedding service و migration از pilot local به production.

مسیر شروع

self-host production-grade

پوشش صفحه

۹ کامل / ۰ خلاصه

راه‌اندازی

استقرار روی زیرساخت خودتان • ابر مدیریت‌شده

محیط

Linux • Container / Docker

نکته‌ی مهم: vLLM ابزار onboarding مبتدی نیست؛ بدون GPU sizing، model selection و observability خوب، deployment آن می‌تواند پرهزینه و ناپایدار شود.

ورود به راهنما

Hooshgate Referenceراهنمای استقراراختصاصی

راهنمای deployment برای محصول و سازمان

deployment حرفه‌ای با «انتخاب مدل» تمام نمی‌شود. این guide از phaseهای rollout تا security، observability، guardrails و maintenance trade-off را برای محصول و سازمان جمع می‌کند.

متن و چتچندوجهیچت و دستیارworkflow عامل‌محور

کجا به کار می‌آید؟

tech leadها، infra leadها و product ownerهایی که باید یک AI feature را به‌شکل production-grade وارد سیستم واقعی کنند.

مسیر شروع

production operations

پوشش صفحه

۵ کامل / ۴ خلاصه

راه‌اندازی

API • استقرار روی زیرساخت خودتان

محیط

Cloud managed

نکته‌ی مهم: بیشتر شکست‌های production نه از خود مدل، بلکه از فقدان rollout phase، logging، fallback و ownership عملیاتی می‌آید.

ورود به راهنما

Googleخانواده مدلاختصاصی

خانواده Gemini

Gemini برای تیم‌هایی جذاب است که از ورودی‌های چندوجهی، PDF، ویدئو یا Google stack استفاده می‌کنند و می‌خواهند API و cloud-native workflow یکپارچه باشد.

متن و چتچندوجهیچت و دستیاراستدلال و تحلیل

کجا به کار می‌آید؟

محصولات multimodal، تحلیل PDF و ویدئو، RAGهای اسنادی و تیم‌هایی که روی Google Cloud یا Vertex AI کار می‌کنند.

مسیر شروع

API-first

پوشش صفحه

۵ کامل / ۵ خلاصه

راه‌اندازی

API • ابر مدیریت‌شده

محیط

Linux • macOS

نکته‌ی مهم: اگر تیم شما vendor-neutral یا self-host-first است، Gemini شاید بهترین نقطه شروع نباشد.

ورود به صفحه مرجع

Hugging Faceاکوسیستم / ابزارمتن‌باز

اکوسیستم Hugging Face

Hugging Face یک ابزار واحد نیست؛ لایه‌ای است که model discovery، artifact management، dataset handling، docs و deployment path بسیاری از تیم‌های open-weight را به هم وصل می‌کند.

متن و چتچندوجهیچت و دستیارکدنویسی

کجا به کار می‌آید؟

تیم‌هایی که می‌خواهند مدل‌ها را مقایسه، weightها را مدیریت، dataset و adapter را منتشر و از یک ecosystem منسجم برای open model workflow استفاده کنند.

مسیر شروع

ecosystem backbone

پوشش صفحه

۹ کامل / ۰ خلاصه

راه‌اندازی

API • محیط محلی

محیط

Cloud managed

نکته‌ی مهم: داشتن model card روی Hugging Face به معنی production-ready بودن مدل یا روشن‌بودن license آن نیست؛ governance و review هنوز بر عهده شماست.

ورود به راهنما

Hooshgate Referenceراهنمای نصبمتن‌باز

راهنمای شروع local روی ویندوز، مک و لینوکس

اگر نمی‌دانید برای local AI از کجا شروع کنید، این صفحه مسیر ساده‌تر را برای Windows، macOS و Linux روشن می‌کند و می‌گوید چه زمانی سراغ Ollama، LM Studio یا llama.cpp بروید.

متن و چتچندوجهیچت و دستیارکدنویسی

کجا به کار می‌آید؟

تیم‌ها و افرادی که می‌خواهند با حداقل friction اولین local run را انجام دهند و فرق بین desktop evaluation و local API را بفهمند.

مسیر شروع

desktop و workstation

پوشش صفحه

۵ کامل / ۲ خلاصه

راه‌اندازی

محیط محلی

محیط

Windows • macOS

نکته‌ی مهم: local run همیشه بهترین انتخاب نیست؛ اگر هدف شما محصول چندکاربره یا SLAدار است، باید بعد از pilot تصمیم serving را دوباره بگیرید.

ورود به راهنما

Hooshgate Referenceراهنمای یکپارچه‌سازیاختصاصی

راهنمای API-first برای مدل‌های proprietary

اگر نمی‌خواهید وارد serving شوید و زمان رسیدن به MVP برایتان حیاتی است، مسیر API-first هنوز سریع‌ترین راه حرفه‌ای است؛ به‌شرط اینکه cost، lock-in و governance را از ابتدا مهندسی کنید.

متن و چتچندوجهیچت و دستیارکدنویسی

کجا به کار می‌آید؟

محصولات agentic، document AI، multimodal appها و تیم‌هایی که زیرساخت inference را نمی‌خواهند خودشان نگه دارند.

مسیر شروع

API-managed path

پوشش صفحه

۵ کامل / ۴ خلاصه

راه‌اندازی

API • ابر مدیریت‌شده

محیط

Linux • macOS

نکته‌ی مهم: ساده‌بودن integration اولیه باعث می‌شود بسیاری از تیم‌ها logging، budget، fallback و data boundary را دیرتر از حد لازم طراحی کنند.

ورود به راهنما

Metaخانواده مدلوزن‌باز

خانواده Llama

Llama یکی از مهم‌ترین خانواده‌های open-weight برای self-host، سفارشی‌سازی و ساخت stack مستقل سازمانی است.

متن و چتچندوجهیچت و دستیاراستدلال و تحلیل

کجا به کار می‌آید؟

تیم‌هایی که می‌خواهند مدل را داخل زیرساخت خودشان اجرا کنند، quantize کنند، LoRA بزنند و control بیشتری روی داده و serving داشته باشند.

مسیر شروع

self-host قوی

پوشش صفحه

۵ کامل / ۵ خلاصه

راه‌اندازی

محیط محلی • استقرار روی زیرساخت خودتان

محیط

Linux • macOS

نکته‌ی مهم: راه‌اندازی حرفه‌ای Llama بدون شناخت vLLM، quantization، monitoring و hardware sizing به‌هم می‌ریزد.

ورود به صفحه مرجع

Ollamaاکوسیستم / ابزارمتن‌باز

اکوسیستم Ollama

Ollama بهترین نقطه شروع برای تیم‌هایی است که می‌خواهند بدون درگیرشدن با serving stackهای سنگین، مدل را روی لپ‌تاپ، ورک‌استیشن یا سرور کوچک بالا بیاورند.

متن و چتچندوجهیچت و دستیارکدنویسی

کجا به کار می‌آید؟

prototype محلی، ارزیابی اولیه مدل‌های open-weight، demo داخلی، RAG سبک و backendهایی که OpenAI-compatible local endpoint می‌خواهند.

مسیر شروع

local-first و self-host سبک

پوشش صفحه

۹ کامل / ۰ خلاصه

راه‌اندازی

محیط محلی • استقرار روی زیرساخت خودتان

محیط

macOS • Linux

نکته‌ی مهم: وقتی concurrency بالا، batching پیشرفته یا multi-tenant production می‌خواهید، Ollama معمولاً باید جای خود را به runtimeهای جدی‌تری مثل vLLM بدهد.

ورود به راهنما

Hooshgate Referenceراهنمای پیاده‌سازیوزن‌باز

پیاده‌سازی document AI و سندمحور

document AI فقط OCR یا chat با PDF نیست. این guide نشان می‌دهد برای ingestion، extraction، validation، citation و human review چطور یک pipeline سندمحور قابل‌اعتماد بسازید.

چندوجهیمتن و چتتحلیل سندRAG و دانش سازمانی

کجا به کار می‌آید؟

workflowهای قرارداد، فاکتور، policy، proposal review و هر use-case که سند source-of-truth است.

مسیر شروع

use-case implementation

پوشش صفحه

۵ کامل / ۳ خلاصه

راه‌اندازی

API • استقرار روی زیرساخت خودتان

محیط

Cloud managed

نکته‌ی مهم: بزرگ‌ترین خطا این است که extraction را مستقیماً به مدل بسپارید بدون schema، validator و review path.

ورود به راهنما

Alibaba / Qwen Teamخانواده مدلوزن‌باز

خانواده Qwen

Qwen یکی از خانواده‌های open-weight مهم برای تیم‌هایی است که هم multilingual support می‌خواهند و هم self-host و fine-tuning.

متن و چتچندوجهیچت و دستیاراستدلال و تحلیل

کجا به کار می‌آید؟

محصولات چندزبانه، assistantهای self-host، coding workflowها و تیم‌هایی که stack open-weight اما مدرن می‌خواهند.

مسیر شروع

self-host قوی

پوشش صفحه

۵ کامل / ۵ خلاصه

راه‌اندازی

محیط محلی • استقرار روی زیرساخت خودتان

محیط

Linux • Windows

نکته‌ی مهم: مثل Llama، کیفیت نهایی به runtime، quantization، prompt template و discipline deployment گره خورده است.

ورود به صفحه مرجع

ggml-org / llama.cppاکوسیستم / ابزارمتن‌باز

اکوسیستم llama.cpp

llama.cpp برای وقتی مناسب است که کنترل دقیق روی GGUF، اجرای CPU-friendly، edge deployment یا بسته‌بندی محلی برایتان مهم‌تر از سادگی UX باشد.

متن و چتچندوجهیچت و دستیارکدنویسی

کجا به کار می‌آید؟

GGUF، edge، inference روی CPU یا GPUهای کوچک، embedded apps و تیم‌هایی که می‌خواهند behavior runtime را دقیق‌تر کنترل کنند.

مسیر شروع

local و edge-oriented

پوشش صفحه

۹ کامل / ۰ خلاصه

راه‌اندازی

محیط محلی • استقرار روی زیرساخت خودتان

محیط

Linux • macOS

نکته‌ی مهم: اگر فقط می‌خواهید سریع demo بگیرید، llama.cpp معمولاً نقطه شروع راحتی نیست و Ollama یا LM Studio friction کمتری دارند.

ورود به راهنما

Hooshgate Referenceاکوسیستم / ابزارمتن‌باز

مرور اکوسیستم fine-tuning

همه مسائل با fine-tuning حل نمی‌شود. این صفحه کمک می‌کند بفهمید چه زمانی tuning واقعاً ارزش دارد، چه زمانی retrieval یا prompt بهتر است و کدام ecosystem برای LoRA یا full training مناسب‌تر است.

متن و چتچندوجهیچت و دستیارکدنویسی

کجا به کار می‌آید؟

تیم‌هایی که بعد از رسیدن به baseline خوب، به adaptation جدی فکر می‌کنند و نمی‌خواهند زودتر از موعد وارد training pipeline پرهزینه شوند.

مسیر شروع

adaptation decision guide

پوشش صفحه

۱۰ کامل / ۰ خلاصه

راه‌اندازی

محیط محلی • استقرار روی زیرساخت خودتان

محیط

Cloud managed

نکته‌ی مهم: بزرگ‌ترین اشتباه، رفتن سراغ tuning قبل از داشتن eval set، failure taxonomy و baseline درست است.

ورود به راهنما

Mistral AIخانواده مدلوزن‌باز

Pixtral

Pixtral برای تیم‌هایی مناسب است که vision + text را با امکان self-host می‌خواهند و نمی‌خواهند برای OCR، سندخوانی و VLM صرفاً به APIهای بسته متکی بمانند.

چندوجهیچت و دستیارتحلیل سند

کجا به کار می‌آید؟

document AI، تحلیل تصویر و PDF، بازرسی کیفیت محتوای تصویری و workflowهای چندوجهی که باید روی زیرساخت خودتان هم قابل اجرا باشند.

مسیر شروع

API یا self-host

پوشش صفحه

۵ کامل / ۵ خلاصه

راه‌اندازی

API • استقرار روی زیرساخت خودتان

محیط

Linux • Container / Docker

نکته‌ی مهم: کیفیت Pixtral در ورودی‌های تصویری ساخت‌یافته خوب است، اما برای سناریوهای فوق‌حساس باید latency، VRAM و دقت extraction را با دیتای خودتان benchmark کنید.

ورود به صفحه مرجع

Hooshgate Referenceراهنمای استقراروزن‌باز

راه اندازي self-host براي LLM در production

متن و چتچندوجهیچت و دستیاراستدلال و تحلیل

کجا به کار می‌آید؟

تيم هايي که workload پايدار، data boundary روشن و آمادگي on-call و capacity planning دارند و مي خواهند self-host را واقعا وارد production کنند.

مسیر شروع

production self-host with explicit ownership

پوشش صفحه

۵ کامل / ۴ خلاصه

راه‌اندازی

استقرار روی زیرساخت خودتان • ابر مدیریت‌شده

محیط

Linux • Cloud managed

نکته‌ی مهم: اگر تيم شما هنوز owner عملياتي براي GPU، rollout و incident ندارد، self-host production بيشتر از آن که صرفه اقتصادي بسازد، debt و downtime مي سازد.

ورود به راهنما

Mistral AIخانواده مدلاختصاصی

Mistral OCR

Mistral OCR برای تیم‌هایی مهم است که OCR و document extraction را به‌عنوان یک API production-ready می‌خواهند و نمی‌خواهند از صفر pipeline بینایی و parsing بسازند.

چندوجهیتحلیل سندچت و دستیار

کجا به کار می‌آید؟

استخراج متن و ساختار از PDF، workflowهای سندمحور، backofficeهای فرم‌محور و archiveهای سازمانی.

مسیر شروع

API-first document path

پوشش صفحه

۵ کامل / ۴ خلاصه

راه‌اندازی

API • ابر مدیریت‌شده

محیط

Cloud managed

نکته‌ی مهم: اگر residency داده، self-host یا pipeline کاملاً تحت‌کنترل لازم دارید، باید گزینه‌های باز و self-host را هم کنار این API benchmark کنید.

ورود به صفحه مرجع

Hugging Faceاکوسیستم / ابزارمتن‌باز

Transformers stack

Transformers stack زمانی مناسب است که می‌خواهید روی اجرای مدل، pre/post-processing و training/inference workflow کنترل عمیق داشته باشید و حاضر باشید از سادگی runtimeهای turnkey صرف‌نظر کنید.

متن و چتچندوجهیچت و دستیارکدنویسی

کجا به کار می‌آید؟

تیم‌های فنی، سرویس‌های سفارشی Python، inference با منطق اختصاصی، training/fine-tuning و کار با مدل‌هایی که runtime آماده برایشان کافی نیست.

مسیر شروع

custom Python stack

پوشش صفحه

۹ کامل / ۰ خلاصه

راه‌اندازی

محیط محلی • استقرار روی زیرساخت خودتان

محیط

Linux • macOS

نکته‌ی مهم: اگر فقط endpoint production می‌خواهید، بسیاری از تیم‌ها با vLLM یا TGI سریع‌تر به نتیجه می‌رسند؛ Transformers انعطاف می‌دهد اما burden بیشتری هم می‌آورد.

ورود به راهنما

Hooshgate Referenceراهنمای نصبمتن‌باز

راهنمای GGUF و بسته‌بندی local

GGUF برای local AI فقط یک فرمت فایل نیست؛ تصمیمی است درباره portability، quantization و trade-off کیفیت در برابر resource. این صفحه می‌گوید چه زمانی GGUF منطقی است و چه زمانی نه.

متن و چتچندوجهیچت و دستیارکدنویسی

کجا به کار می‌آید؟

local deployment، edge، laptop inference و تیم‌هایی که می‌خواهند مدل را با footprint کوچک‌تر اجرا و جابه‌جا کنند.

مسیر شروع

portable local packaging

پوشش صفحه

۵ کامل / ۲ خلاصه

راه‌اندازی

محیط محلی • لبه / روی دستگاه

محیط

Edge / Device

نکته‌ی مهم: هر GGUF خوب نیست و هر quantization به‌صرفه هم لزوماً برای task شما مناسب نیست؛ باید quality را روی use-case واقعی بسنجید.

ورود به راهنما

Alibaba / Qwenخانواده مدلوزن‌باز

Qwen Embedding و Reranker

خانواده Qwen Embedding/Reranker برای تیم‌هایی مهم است که retrieval چندزبانه، RAG جدی و کنترل بیشتر روی embedding stack می‌خواهند.

Embedding / بردارسازیReranking / بازرتبه‌بندیجست‌وجوی معناییRAG و دانش سازمانی

کجا به کار می‌آید؟

RAG چندزبانه، semantic search، reranking روی corpus سازمانی و pipelineهایی که کیفیت retrieval برایشان حیاتی‌تر از chat model است.

مسیر شروع

self-host یا API

پوشش صفحه

۵ کامل / ۵ خلاصه

راه‌اندازی

API • استقرار روی زیرساخت خودتان

محیط

Linux • Container / Docker

نکته‌ی مهم: اگر chunking، indexing و evaluation را درست طراحی نکنید، حتی embedding قوی هم retrieval خوبی به شما نمی‌دهد.

ورود به صفحه مرجع

Deepgramخانواده مدلاختصاصی

Deepgram

Deepgram برای تیم‌هایی مناسب است که STT/TTS/voice-agent stack می‌خواهند و به‌جای چسباندن چند سرویس جدا، یک platform صوتی متمرکز ترجیح می‌دهند.

صوت و گفتارتبدیل گفتار به متنتبدیل متن به گفتار

کجا به کار می‌آید؟

realtime voice agents، transcription، multilingual speech apps و محصولاتی که کیفیت، latency و turn handling در آن‌ها مهم است.

مسیر شروع

API-first با self-host option

پوشش صفحه

۵ کامل / ۵ خلاصه

راه‌اندازی

API • ابر مدیریت‌شده

محیط

Cloud managed

نکته‌ی مهم: برای voice apps، باید latency end-to-end، retention، redaction و تعامل بین STT/TTS/LLM را باهم طراحی کنید.

ورود به صفحه مرجع

Hooshgate Referenceمقایسه تصمیم‌یاروزن‌باز

مقايسه مدل هاي proprietary و open-weight

متن و چتچندوجهیچت و دستیاراستدلال و تحلیل

کجا به کار می‌آید؟

CTO، tech lead و product/infra teamهايي که بايد baseline مدل را براي محصول، coding workflow يا assistant سازماني انتخاب کنند.

مسیر شروع

decision layer بين API و open infra

پوشش صفحه

۴ کامل / ۱ خلاصه

راه‌اندازی

API • محیط محلی

محیط

Linux • Cloud managed

نکته‌ی مهم: هيچ کدام ذاتا برنده مطلق نيستند؛ proprietary و open فقط وقتي معنا دارند که task، budget، data boundary و ops ownership را کنار هم ببينيد.

ورود به راهنما

Hooshgate Referenceراهنمای پیاده‌سازیاختصاصی

پیاده‌سازی voice stack و voice agent

صوت و گفتارمتن و چتتبدیل گفتار به متنتبدیل متن به گفتار

کجا به کار می‌آید؟

تیم‌هایی که می‌خواهند voice assistant، call automation یا spoken UI بسازند و نیاز دارند کل زنجیره STT → reasoning → TTS را حرفه‌ای طراحی کنند.

مسیر شروع

voice workflow guide

پوشش صفحه

۵ کامل / ۳ خلاصه

راه‌اندازی

API • استقرار روی زیرساخت خودتان

محیط

وابسته به stack انتخابی

نکته‌ی مهم: اندازه‌گیری latency فقط روی مدل اصلی اشتباه است؛ voice UX را tail latency، interruptibility و کیفیت turn-taking می‌سازند.

ورود به راهنما

Mistral AIخانواده مدلوزن‌باز

خانواده Mistral

Mistral برای تیم‌هایی جذاب است که هم self-host می‌خواهند و هم سبدی از مدل‌های تخصصی‌تر مثل coding، multimodal و document AI را در یک خانواده ببینند.

متن و چتچندوجهیچت و دستیاراستدلال و تحلیل

کجا به کار می‌آید؟

سازمان‌هایی که بین API و self-host جابه‌جا می‌شوند و می‌خواهند از مدل‌های متنوع این خانواده برای code، vision و enterprise search استفاده کنند.

مسیر شروع

API + self-host

پوشش صفحه

۵ کامل / ۵ خلاصه

راه‌اندازی

API • محیط محلی

محیط

Linux • Container / Docker

نکته‌ی مهم: تنوع مدل‌ها مزیت است، اما بدون taxonomy داخلی و استاندارد انتخاب مدل، تیم به‌سرعت سردرگم می‌شود.

ورود به صفحه مرجع

Alibaba / Qwenخانواده مدلوزن‌باز

Qwen VL

Qwen VL خانواده‌ای است برای تیم‌هایی که VLM باز، قوی در document understanding و قابل self-host می‌خواهند و نمی‌خواهند همه چیز را به APIهای بسته بسپارند.

چندوجهیچت و دستیارتحلیل سند

کجا به کار می‌آید؟

OCR-aware workflows، document AI، visual QA، agentهای چندوجهی و محیط‌هایی که latency و data boundary باید داخل infra خودتان کنترل شود.

مسیر شروع

self-host یا managed endpoint

پوشش صفحه

۵ کامل / ۵ خلاصه

راه‌اندازی

محیط محلی • استقرار روی زیرساخت خودتان

محیط

Linux • Container / Docker

نکته‌ی مهم: برای rollout حساس باید VRAM، throughput و کیفیت extraction را روی سندهای واقعی خودتان benchmark کنید.

ورود به صفحه مرجع

Hugging Faceاکوسیستم / ابزارمتن‌باز

Diffusers stack

Diffusers بهترین انتخاب برای تیم‌هایی است که می‌خواهند image/video generation را با pipelineهای سفارشی، LoRA، control و experimentation مهندسی کنند.

تولید تصویرویدئوتولید تصویرتولید ویدئو

کجا به کار می‌آید؟

تیم‌های تولید تصویر، پژوهش، pipelineهای visual generation، custom workflows و integration با adapterها و controlهای متنوع.

مسیر شروع

custom generation stack

پوشش صفحه

۹ کامل / ۰ خلاصه

راه‌اندازی

محیط محلی • استقرار روی زیرساخت خودتان

محیط

Linux

نکته‌ی مهم: اگر فقط یک API آماده برای image generation می‌خواهید، Diffusers برای شروع بیش از حد فنی است و runtime یا provider آماده می‌تواند مناسب‌تر باشد.

ورود به راهنما

LM Studioاکوسیستم / ابزارمتن‌باز

LM Studio و runtimeهای desktop

LM Studio برای تیم‌هایی مناسب است که می‌خواهند بدون درگیری با CLI و serving stack، مدل محلی را روی desktop اجرا، مقایسه و برای demo یا evaluation آماده کنند.

متن و چتچندوجهیچت و دستیارکدنویسی

کجا به کار می‌آید؟

product discovery، مقایسه سریع مدل‌های محلی، demo برای غیرتوسعه‌دهنده‌ها و تیم‌هایی که GUI desktop می‌خواهند.

مسیر شروع

desktop local GUI

پوشش صفحه

۹ کامل / ۰ خلاصه

راه‌اندازی

محیط محلی

محیط

Windows • macOS

نکته‌ی مهم: LM Studio معمولاً مقصد نهایی production نیست؛ اگر نیاز backend shared یا API سازمانی دارید باید به stackهای دیگر مهاجرت کنید.

ورود به راهنما

Hugging Faceاکوسیستم / ابزارمتن‌باز

Text Embeddings Inference

TEI یکی از مهم‌ترین runtimeهای hub برای embedding و reranking است؛ چون self-host retrieval را از مرحله notebook به سرویس production نزدیک می‌کند.

Embedding / بردارسازیReranking / بازرتبه‌بندیجست‌وجوی معناییRAG و دانش سازمانی

کجا به کار می‌آید؟

embedding و reranking service، RAG داخلی، search production و تیم‌هایی که می‌خواهند open models را با runtime مخصوص retrieval بالا بیاورند.

مسیر شروع

serving تخصصی retrieval

پوشش صفحه

۹ کامل / ۰ خلاصه

راه‌اندازی

استقرار روی زیرساخت خودتان • ابر مدیریت‌شده

محیط

Container / Docker • Linux

نکته‌ی مهم: اگر stack شما heterogeneous است، باید آن را کنار vLLM، custom services و managed embedding APIها هم بسنجید.

ورود به راهنما

OpenAIراهنمای یکپارچه‌سازیاختصاصی

Responses API در OpenAI

Responses API در این hub به‌عنوان integration-guide آمده چون برای بسیاری از تیم‌ها امروز contract اصلی OpenAI برای ساخت appهای agentic و multimodal است، نه صرفاً یک endpoint چت دیگر.

متن و چتچندوجهیچت و دستیارworkflow عامل‌محور

کجا به کار می‌آید؟

backendهای API-first، appهای agentic، workflowهای structured output و تیم‌هایی که می‌خواهند contract جدیدتر OpenAI را جدی و production-safe پیاده کنند.

مسیر شروع

API-first orchestration

پوشش صفحه

۵ کامل / ۴ خلاصه

راه‌اندازی

API • ابر مدیریت‌شده

محیط

Serverless • Cloud managed

نکته‌ی مهم: ساده‌بودن API اولیه نباید شما را از طراحی schema validation، fallback، observability و cost guardrail غافل کند.

ورود به راهنما

Alibaba / Qwenخانواده مدلوزن‌باز

Qwen Coder

Qwen Coder برای تیم‌هایی جذاب است که coding مدل باز با ecosystem قوی Qwen، vLLM، Ollama و GGUF می‌خواهند.

متن و چتکدنویسیworkflow عامل‌محور

کجا به کار می‌آید؟

code generation، repo-aware workflows سبک، local coding assistants و self-host روی stackهای رایج.

مسیر شروع

local / self-host

پوشش صفحه

۵ کامل / ۵ خلاصه

راه‌اندازی

محیط محلی • استقرار روی زیرساخت خودتان

محیط

Linux • macOS

نکته‌ی مهم: کیفیت coding model بدون context builder، eval و policy مناسب خیلی زود سقف خود را نشان می‌دهد.

ورود به صفحه مرجع

Hooshgate Referenceراهنمای نصبمتن‌باز

مدل هاي local روي macOS

متن و چتچندوجهیچت و دستیارکدنویسی

کجا به کار می‌آید؟

Apple Silicon workstationها، تيم هاي developer يا knowledge worker که مي خواهند local pilot، coding workflow يا RAG سبک را بدون رفتن فوري به سرور Linux شروع کنند.

مسیر شروع

Apple Silicon local-first

پوشش صفحه

۵ کامل / ۲ خلاصه

راه‌اندازی

محیط محلی • استقرار روی زیرساخت خودتان

محیط

macOS

نکته‌ی مهم: macOS نقطه شروع خوبي براي evaluation و workflow شخصي است، اما shared serving يا rollout چندکاربره را نبايد با production-ready بودن يکي گرفت؛ مخصوصا روي Intel Mac.

ورود به راهنما

Hooshgate Referenceمقایسه تصمیم‌یارمتن‌باز

مقايسه stackهاي serving و inference

متن و چتچندوجهیچت و دستیاراستدلال و تحلیل

کجا به کار می‌آید؟

platform teamها، infra ownerها و تيم هايي که از pilot گذشته اند و حالا بايد serving stack را بر اساس workload، hardware و on-call reality انتخاب کنند.

مسیر شروع

engine و platform selection

پوشش صفحه

۴ کامل / ۱ خلاصه

راه‌اندازی

استقرار روی زیرساخت خودتان • ابر مدیریت‌شده

محیط

Cloud managed • Container / Docker

نکته‌ی مهم: engine benchmark به تنهايي براي انتخاب stack کافي نيست؛ observability، upgrade path، batching behavior و incident ownership هم بخشي از تصميم هستند.

ورود به راهنما

Hooshgate Referenceراهنمای استقراراختصاصی

استقرار realtime voice stack در production

صوت و گفتارمتن و چتدستیار صوتیتبدیل گفتار به متن

کجا به کار می‌آید؟

تیم‌هایی که voice assistant، call automation، spoken UI یا voice support را با کاربر واقعی اجرا می‌کنند و باید chain کامل STT → reasoning → tools/RAG → TTS را قابل اتکا کنند.

مسیر شروع

managed-first with selective self-host

پوشش صفحه

۵ کامل / ۴ خلاصه

راه‌اندازی

API • ابر مدیریت‌شده

محیط

Cloud managed

نکته‌ی مهم: اگر هنوز conversational design، privacy policy، on-call owner یا fallback text channel ندارید، deployment صوتی real-time زود است.

ورود به راهنما

DeepSeekخانواده مدلوزن‌باز

خانواده DeepSeek

DeepSeek برای تیم‌هایی مهم است که reasoning و coding را با رویکرد open-weight یا API اقتصادی‌تر بررسی می‌کنند.

متن و چتچت و دستیاراستدلال و تحلیل

کجا به کار می‌آید؟

ارزیابی‌های comparative، code-heavy workloads و سازمان‌هایی که می‌خواهند بین API و self-host انعطاف داشته باشند.

مسیر شروع

API + self-host

پوشش صفحه

۵ کامل / ۵ خلاصه

راه‌اندازی

API • محیط محلی

محیط

Linux • Container / Docker

نکته‌ی مهم: برای adoption سازمانی باید maturity عملیات، policy و dependencyها را مثل هر family open-weight دیگر جدی بگیرید.

ورود به صفحه مرجع

Midjourneyخانواده مدلاختصاصی

Midjourney

Midjourney بیشتر برای تیم‌هایی مهم است که خروجی تصویری premium و workflow خلاقه سریع می‌خواهند، نه الزاماً یک API production-first یا graph کاملاً قابل‌کنترل.

تولید تصویرتولید تصویر

کجا به کار می‌آید؟

creative exploration، concept art، storyboard سریع و تیم‌هایی که asset تصویری را با review انسانی جلو می‌برند.

مسیر شروع

managed creative workflow

پوشش صفحه

۵ کامل / ۴ خلاصه

راه‌اندازی

ابر مدیریت‌شده

محیط

Cloud managed

نکته‌ی مهم: برای product integration عمیق، automation سنگین یا pipeline سخت‌گیر enterprise باید محدودیت API، governance و reproducibility را از ابتدا بپذیرید.

ورود به صفحه مرجع

Hugging Faceاکوسیستم / ابزارمتن‌باز

Text Generation Inference (TGI)

TGI سرور inference مربوط به Hugging Face است و برای تیم‌هایی معنا دارد که stack آن‌ها از قبل حول artifactهای Hugging Face، containerized serving و الگوهای سازمانی آن شکل گرفته است.

متن و چتچندوجهیچت و دستیارکدنویسی

کجا به کار می‌آید؟

سازمان‌هایی که از قبل روی Hugging Face ecosystem سرمایه‌گذاری کرده‌اند، container-based serving می‌خواهند و deployment inference را با artifact management رسمی HF می‌بینند.

مسیر شروع

HF-oriented self-host

پوشش صفحه

۹ کامل / ۰ خلاصه

راه‌اندازی

استقرار روی زیرساخت خودتان • ابر مدیریت‌شده

محیط

Linux • Container / Docker

نکته‌ی مهم: اگر صرفاً دنبال ساده‌ترین مسیر serving هستید، در عمل بسیاری از تیم‌ها vLLM را روان‌تر می‌یابند؛ TGI را بیشتر وقتی انتخاب کنید که ecosystem fit آن برای شما روشن است.

ورود به راهنما

Anthropicراهنمای یکپارچه‌سازیاختصاصی

Tool Use در Anthropic

این صفحه برای زمانی است که انتخاب شما خود Claude family نیست، بلکه طراحی درست لایه tool use و boundaryهای integration در Anthropic است.

متن و چتworkflow عامل‌محورچت و دستیار

کجا به کار می‌آید؟

agentهای tool-backed، workflowهای call-and-validate، backofficeهای حساس و تیم‌هایی که می‌خواهند tool use را تمیز و قابل‌کنترل پیاده کنند.

مسیر شروع

API-first with tool contracts

پوشش صفحه

۵ کامل / ۴ خلاصه

راه‌اندازی

API • ابر مدیریت‌شده

محیط

Cloud managed

نکته‌ی مهم: tool use بدون schema دقیق، permission layer و review path می‌تواند بسیار سریع به failureهای silent و expensive تبدیل شود.

ورود به راهنما

Anthropicراهنمای نصباختصاصی

Claude Code

Claude Code در hub به‌عنوان setup-guide آمده چون ارزش اصلی آن برای تیم‌ها در نصب، permission model، repo boundary و روش استفاده درست از terminal agent است.

متن و چتکدنویسیworkflow عامل‌محور

کجا به کار می‌آید؟

تیم‌هایی که می‌خواهند coding agent را از داخل ترمینال و روی repo واقعی تجربه کنند، با امکان چندفایلی و workflow مهندسی نزدیک به کار روزمره.

مسیر شروع

local CLI + remote model

پوشش صفحه

۵ کامل / ۲ خلاصه

راه‌اندازی

محیط محلی • API

محیط

وابسته به stack انتخابی

نکته‌ی مهم: اگر permission boundary، review discipline و task scoping شل باشد، terminal agent خیلی سریع از ابزار مفید به ریسک عملیاتی تبدیل می‌شود.

ورود به راهنما

Hooshgate Referenceراهنمای نصباختصاصی

راه اندازي API-first براي مدل هاي تجاري

اين راهنما براي تيمي است که مي خواهد مدل تجاري را به شکل API-first وارد محصول يا backend کند، بدون اين که ساده بودن SDK او را از schema، cost guardrail، fallback و ownership عملي غافل کند.

متن و چتچندوجهیچت و دستیارworkflow عامل‌محور

کجا به کار می‌آید؟

MVP سريع، backendهاي product-first، appهاي agentic يا document-heavy و تيم هايي که مي خواهند قبل از self-host سراغ value عملي بروند.

مسیر شروع

delivery سريع با governance لازم

پوشش صفحه

۵ کامل / ۲ خلاصه

راه‌اندازی

API • ابر مدیریت‌شده

محیط

Serverless • Cloud managed

نکته‌ی مهم: API-first burden serving را کم مي کند، اما cost، vendor dependency، retention policy و failure handling را از بين نمي برد.

ورود به راهنما

Hooshgate Referenceمقایسه تصمیم‌یاراختصاصی

مقایسه خانواده‌های هوش مصنوعی ویدئو

ویدئوچندوجهیتولید ویدئوتولید تصویر

کجا به کار می‌آید؟

تیم‌های محصول، رسانه، آموزش، مارکتینگ و AI tooling که می‌خواهند ویدئو را به شکل کنترل‌شده وارد prototype، تولید asset یا تحلیل محتوای ویدئویی کنند.

مسیر شروع

managed-first, open-weight experimental

پوشش صفحه

۴ کامل / ۱ خلاصه

راه‌اندازی

API • ابر مدیریت‌شده

محیط

Cloud managed

نکته‌ی مهم: اگر دنبال inference ارزان، self-host ساده یا تولید انبوه بدون review حقوقی و انسانی هستید، ویدئو معمولاً انتخاب اول خوبی نیست.

ورود به راهنما

OpenAIخانواده مدلاختصاصی

OpenAI Embeddings

اگر به embedding API ساده، پایدار و کم‌دردسر نیاز دارید، خانواده text-embedding-3 یکی از baselineهای حرفه‌ای بازار است.

Embedding / بردارسازیجست‌وجوی معناییRAG و دانش سازمانی

کجا به کار می‌آید؟

RAG، semantic search، deduplication و هر جایی که می‌خواهید embedding به‌عنوان سرویس مدیریت شود.

مسیر شروع

API-only

پوشش صفحه

۵ کامل / ۴ خلاصه

راه‌اندازی

API

محیط

Linux • macOS

نکته‌ی مهم: مثل هر embedding API دیگر، هزینه در scale بالا باید با حجم سند، refresh index و dimension strategy سنجیده شود.

ورود به صفحه مرجع

Voyage AIخانواده مدلاختصاصی

Voyage Rerank

Voyage Rerank برای تیم‌هایی مهم است که retrieval stack آن‌ها embedding خوبی دارد اما برای precision نهایی و ranking enterprise-grade به یک مرحله reranking تمیز نیاز دارند.

Reranking / بازرتبه‌بندیجست‌وجوی معناییRAG و دانش سازمانی

کجا به کار می‌آید؟

RAG چندمرحله‌ای، search stack سازمانی، ranking مجدد روی top-k و تیم‌هایی که می‌خواهند answer quality را بدون ساخت مدل خودشان بهتر کنند.

مسیر شروع

API reranking layer

پوشش صفحه

۵ کامل / ۴ خلاصه

راه‌اندازی

API • ابر مدیریت‌شده

محیط

Cloud managed

نکته‌ی مهم: reranker جایگزین corpus hygiene، chunking درست یا ارزیابی retrieval نیست؛ فقط لایه دوم تصمیم است.

ورود به صفحه مرجع

Hugging Faceاکوسیستم / ابزارمتن‌باز

اکوسیستم PEFT

PEFT در hub به این خاطر مهم است که لایه adaptation عملی برای modelهای باز را پوشش می‌دهد؛ یعنی جایی بین prompt-only و full fine-tuning.

متن و چتچندوجهیچت و دستیارکدنویسی

کجا به کار می‌آید؟

LoRA، adapter-based tuning، domain adaptation کم‌هزینه و تیم‌هایی که می‌خواهند experimentation را بدون full training شروع کنند.

مسیر شروع

training-adaptation toolkit

پوشش صفحه

۹ کامل / ۰ خلاصه

راه‌اندازی

محیط محلی • استقرار روی زیرساخت خودتان

محیط

Linux • Cloud managed

نکته‌ی مهم: بدون baseline، eval و data curation، PEFT فقط complexity اضافه می‌کند و الزاماً quality بهتر نمی‌دهد.

ورود به راهنما

Googleراهنمای یکپارچه‌سازیاختصاصی

Gemini Live API

Gemini Live API وقتی مهم می‌شود که شما به تعامل کم‌تاخیر صوت/ویدئو نیاز دارید و می‌خواهید conversation به سبک real-time را داخل محصول خودتان بسازید.

چندوجهیصوت و گفتاردستیار صوتیچت و دستیار

کجا به کار می‌آید؟

voice assistant، multimodal sessions، use-caseهای real-time و محصولاتی که interruption، turn-taking و media streaming برایشان مهم است.

مسیر شروع

managed low-latency media path

پوشش صفحه

۵ کامل / ۴ خلاصه

راه‌اندازی

API • ابر مدیریت‌شده

محیط

Cloud managed

نکته‌ی مهم: real-time بودن به‌معنای complexity بالاتر در session control، interruption handling، media pipeline و observability است.

ورود به راهنما

DeepSeekخانواده مدلوزن‌باز

DeepSeek Coder

DeepSeek Coder برای تیم‌هایی مهم است که coding model باز می‌خواهند و می‌خواهند code completion، refactor و repo Q&A را داخل infra خودشان جلو ببرند.

متن و چتکدنویسیچت و دستیار

کجا به کار می‌آید؟

IDE assistant داخلی، code review helper، generation روی repo خصوصی و pipelineهایی که self-host و cost control مهم است.

مسیر شروع

local یا self-host

پوشش صفحه

۵ کامل / ۵ خلاصه

راه‌اندازی

محیط محلی • استقرار روی زیرساخت خودتان

محیط

Linux • Container / Docker

نکته‌ی مهم: برای codebaseهای بزرگ باید retrieval، file selection و eval harness را کنار خود مدل طراحی کنید؛ مدل تنها کافی نیست.

ورود به صفحه مرجع

Hooshgate Referenceراهنمای نصبمتن‌باز

راهنمای self-host روی لینوکس

این guide برای تیمی است که واقعاً می‌خواهد روی Linux self-host کند: انتخاب بین vLLM، TGI، GGUF، container و incident path.

متن و چتچندوجهیچت و دستیارکدنویسی

کجا به کار می‌آید؟

stack self-host، private infra، rollout مدل‌های باز و تیم‌هایی که production serving را روی Linux جلو می‌برند.

مسیر شروع

Linux production-minded

پوشش صفحه

۵ کامل / ۲ خلاصه

راه‌اندازی

استقرار روی زیرساخت خودتان

محیط

Linux • Container / Docker

نکته‌ی مهم: self-host فقط نصب مدل نیست؛ queueing، logging، incident، security و upgrade path هم باید روشن باشند.

ورود به راهنما

Alibaba / Qwenخانواده مدلوزن‌باز

Qwen Omni

Qwen Omni برای تیم‌هایی مهم است که مدل باز چندوجهی با ورودی متن، تصویر و صدا می‌خواهند و می‌خواهند آن را در stack خودشان ادغام کنند.

چندوجهیصوت و گفتارچت و دستیارتحلیل سند

کجا به کار می‌آید؟

multimodal chat، voice-enabled assistant، image + text workflows و تجربه‌های unified که نمی‌خواهند کاملاً وابسته به API بسته باشند.

مسیر شروع

self-host ممکن

پوشش صفحه

۵ کامل / ۵ خلاصه

راه‌اندازی

استقرار روی زیرساخت خودتان • ابر مدیریت‌شده

محیط

Linux • Cloud managed

نکته‌ی مهم: مدل‌های omni به‌سادگی روی paper خوب به نظر می‌رسند، اما در محصول واقعی complexity orchestration و testing آن‌ها بالاست.

ورود به صفحه مرجع

Ideogramخانواده مدلاختصاصی

Ideogram

Ideogram برای تیم‌هایی مهم است که API text-to-image با کیفیت خوب، style presets و توانایی بهتر در text rendering می‌خواهند.

تولید تصویرتولید تصویر

کجا به کار می‌آید؟

marketing visuals، image generation محصولی، character consistency و تیم‌هایی که می‌خواهند سریع‌تر از open stack وارد تولید تصویر شوند.

مسیر شروع

API-first

پوشش صفحه

۵ کامل / ۵ خلاصه

راه‌اندازی

API • ابر مدیریت‌شده

محیط

Serverless • Cloud managed

نکته‌ی مهم: برای خروجی‌های برندمحور یا حقوقی حساس، review انسانی و policy مالکیت/استفاده را از ابتدا مشخص کنید.

ورود به صفحه مرجع

GitHubراهنمای پیاده‌سازیاختصاصی

GitHub Copilot Coding Agent

متن و چتکدنویسیworkflow عامل‌محور

کجا به کار می‌آید؟

issue delegation، background coding tasks، PR-based iteration و تیم‌هایی که می‌خواهند coding agent را در GitHub workflow عملیاتی کنند.

مسیر شروع

managed issue-to-PR workflow

پوشش صفحه

۵ کامل / ۳ خلاصه

راه‌اندازی

ابر مدیریت‌شده

محیط

Cloud managed

نکته‌ی مهم: background agent فقط زمانی مفید است که task sizing، review policy و repo protections روشن باشند؛ وگرنه فقط PRهای noisy بیشتری می‌سازد.

ورود به راهنما

Googleخانواده مدلوزن‌باز

خانواده Gemma

Gemma برای تیم‌هایی مناسب است که مدل باز و سبک‌تر می‌خواهند، اما همچنان می‌خواهند از lineage و tooling گوگل بهره ببرند.

متن و چتچندوجهیچت و دستیاراستدلال و تحلیل

کجا به کار می‌آید؟

edge و local AI، prototypeهای self-host و تیم‌هایی که مدل بازتر اما manageable می‌خواهند.

مسیر شروع

local / edge friendly

پوشش صفحه

۵ کامل / ۵ خلاصه

راه‌اندازی

محیط محلی • استقرار روی زیرساخت خودتان

محیط

Linux • macOS

نکته‌ی مهم: Gemma family variantهای متنوعی دارد؛ باید بین core، code و multimodal فرق بگذارید.

ورود به صفحه مرجع

Alibaba / Wanخانواده مدلوزن‌باز

Wan Video

Wan Video برای تیم‌هایی مهم است که text-to-video باز می‌خواهند و آماده‌اند در عوض آزادی deployment، complexity سخت‌افزار و زمان setup بیشتری بپذیرند.

ویدئوتولید ویدئو

کجا به کار می‌آید؟

video experimentation، pipelineهای داخلی تولید ویدئو و تیم‌هایی که می‌خواهند open stack را با ComfyUI یا runtimeهای خودشان جلو ببرند.

مسیر شروع

self-host video stack

پوشش صفحه

۵ کامل / ۵ خلاصه

راه‌اندازی

محیط محلی • استقرار روی زیرساخت خودتان

محیط

Linux • Container / Docker

نکته‌ی مهم: بدون GPU planning، storage و queue management، text-to-video باز خیلی سریع به bottleneck عملیاتی تبدیل می‌شود.

ورود به صفحه مرجع

ElevenLabsخانواده مدلاختصاصی

ElevenLabs

ElevenLabs برای تیم‌هایی مهم است که voice quality، TTS حرفه‌ای و STT/voice-agent workflow را به‌صورت یکپارچه می‌خواهند.

صوت و گفتارتبدیل متن به گفتارتبدیل گفتار به متن

کجا به کار می‌آید؟

voice interfaces، audiobook-like narration، realtime agents و pipelineهای صوتی محصولی.

مسیر شروع

API-only

پوشش صفحه

۵ کامل / ۵ خلاصه

راه‌اندازی

API

محیط

Linux • macOS

نکته‌ی مهم: در voice systems، text normalization، rights و human review برای برخی use-caseها حیاتی است.

ورود به صفحه مرجع

Hugging Faceاکوسیستم / ابزارمتن‌باز

اکوسیستم TRL

TRL برای تیم‌هایی مهم است که از adaptation ساده عبور کرده‌اند و به SFT، DPO یا post-training جدی‌تر فکر می‌کنند.

متن و چتچندوجهیچت و دستیارworkflow عامل‌محور

کجا به کار می‌آید؟

SFT، preference optimization، reward modeling و تیم‌هایی که می‌خواهند post-training را reproducible و scriptable جلو ببرند.

مسیر شروع

post-training toolkit

پوشش صفحه

۹ کامل / ۰ خلاصه

راه‌اندازی

استقرار روی زیرساخت خودتان • ابر مدیریت‌شده

محیط

Linux • Cloud managed

نکته‌ی مهم: TRL بدون dataset format، eval loop و resource planning خیلی سریع به experiment بی‌نتیجه تبدیل می‌شود.

ورود به راهنما

Hugging Faceراهنمای استقراراختصاصی

Inference Endpoints در Hugging Face

Hugging Face Inference Endpoints برای تیم‌هایی مهم است که می‌خواهند مدل‌های Hub را با burden کمتر وارد production کنند، اما هنوز انتخاب engine، model و cost را با دقت نگه دارند.

متن و چتچندوجهیچت و دستیارجست‌وجوی معنایی

کجا به کار می‌آید؟

deployment managed برای مدل‌های Hub، endpoint اختصاصی برای text یا embedding و تیم‌هایی که زمان setup infra داخلی ندارند.

مسیر شروع

managed production path

پوشش صفحه

۵ کامل / ۴ خلاصه

راه‌اندازی

ابر مدیریت‌شده

محیط

Cloud managed

نکته‌ی مهم: managed بودن به‌معنای حذف تصمیم‌های سخت نیست؛ هنوز باید engine، model، autoscaling، cost و observability را آگاهانه انتخاب کنید.

ورود به راهنما

Hooshgate Referenceمقایسه تصمیم‌یاروزن‌باز

مقایسه embedding و reranking

این comparison guide برای تیم‌هایی است که می‌خواهند retrieval stack را جدی انتخاب کنند: فقط embedding، embedding + reranker، یا managed retrieval API.

Embedding / بردارسازیReranking / بازرتبه‌بندیجست‌وجوی معناییRAG و دانش سازمانی

کجا به کار می‌آید؟

RAG system design، enterprise search selection و تیم‌هایی که retrieval quality برایشان KPI واقعی است.

مسیر شروع

self-host یا managed retrieval

پوشش صفحه

۴ کامل / ۱ خلاصه

راه‌اندازی

محیط محلی • استقرار روی زیرساخت خودتان

محیط

Container / Docker

نکته‌ی مهم: embedding leaderboards به‌تنهایی کافی نیستند؛ query set، chunking و corpus behavior تعیین‌کننده‌اند.

ورود به راهنما

FlagOpen / BAAIخانواده مدلمتن‌باز

خانواده BGE / FlagEmbedding

BGE برای تیم‌هایی مهم است که retrieval stack را کاملاً open و self-host می‌خواهند؛ از embedding تا reranker.

Embedding / بردارسازیReranking / بازرتبه‌بندیجست‌وجوی معناییRAG و دانش سازمانی

کجا به کار می‌آید؟

RAG self-host، enterprise search داخل VPC و تیم‌هایی که می‌خواهند retrieval را تا لایه مدل کنترل کنند.

مسیر شروع

کاملاً self-host

پوشش صفحه

۵ کامل / ۵ خلاصه

راه‌اندازی

محیط محلی • استقرار روی زیرساخت خودتان

محیط

Linux • Container / Docker

نکته‌ی مهم: بدون دانش کافی در ارزیابی retrieval، open بودن به‌تنهایی مزیت عملیاتی نمی‌سازد.

ورود به صفحه مرجع

AWS / Amazonاکوسیستم / ابزاراختصاصی

اکوسیستم Amazon Bedrock

Amazon Bedrock برای تیم‌هایی مهم است که multi-model access را در بستر AWS و با دغدغه enterprise governance می‌خواهند.

متن و چتچندوجهیچت و دستیارworkflow عامل‌محور

کجا به کار می‌آید؟

سازمان‌هایی که already در AWS هستند، policy و governance برایشان مهم است و می‌خواهند model access را داخل همان cloud plane نگه دارند.

مسیر شروع

managed cloud platform

پوشش صفحه

۹ کامل / ۰ خلاصه

راه‌اندازی

API • ابر مدیریت‌شده

محیط

Cloud managed • Serverless

نکته‌ی مهم: Bedrock یک model family واحد نیست؛ quality و ops آن به provider انتخابی، region و service design شما وابسته است.

ورود به راهنما

Googleاکوسیستم / ابزاراختصاصی

اکوسیستم Vertex AI Model Garden

Vertex AI Model Garden برای تیم‌هایی مهم است که در Google Cloud هستند و می‌خواهند هم مدل‌های گوگل و هم بعضی model familyهای third-party را از یک cloud plane ببینند.

متن و چتچندوجهیچت و دستیارRAG و دانش سازمانی

کجا به کار می‌آید؟

Google Cloud-native teams، managed AI platform، teamهای data/ML که already روی Vertex و GCP workflow دارند.

مسیر شروع

managed cloud platform

پوشش صفحه

۹ کامل / ۰ خلاصه

راه‌اندازی

API • ابر مدیریت‌شده

محیط

Cloud managed

نکته‌ی مهم: Model Garden هم یک platform layer است؛ باید کیفیت هر family را جدا benchmark و governance آن را جدا طراحی کنید.

ورود به راهنما

Hooshgate Referenceمقایسه تصمیم‌یاراختصاصی

مقايسه خانواده هاي توليد تصوير

براي تصوير، سؤال واقعي اين نيست که «بهترين مدل» چيست؛ سؤال اين است که آيا شما exploratory creativity، typography و brand asset، API-first generation يا self-host diffusion control مي خواهيد.

تولید تصویرتولید تصویر

کجا به کار می‌آید؟

تيم هاي طراحي، مارکتينگ، creative tooling و product teamهايي که بايد بين Midjourney، Ideogram، Stable Diffusion و stackهاي مشابه بر اساس workflow واقعي انتخاب کنند.

مسیر شروع

creative workflow selection

پوشش صفحه

۴ کامل / ۱ خلاصه

راه‌اندازی

API • محیط محلی

محیط

وابسته به stack انتخابی

نکته‌ی مهم: خروجي تصوير به prompt، review loop و tooling اطراف هم وابسته است؛ اين صفحه shortcut براي حذف design review يا human selection نيست.

ورود به راهنما

Hugging Face / BigCodeخانواده مدلوزن‌باز

StarCoder2

StarCoder2 برای تیم‌هایی مهم است که code family باز، HF-native و قابل benchmark روی workflow توسعه خودشان می‌خواهند؛ مخصوصاً اگر portability و tooling باز برایشان مهم باشد.

متن و چتکدنویسیچت و دستیار

کجا به کار می‌آید؟

code generation، completion، repo assistance سبک‌تر و تیم‌هایی که code model باز را روی infra خودشان ارزیابی می‌کنند.

مسیر شروع

local یا self-host

پوشش صفحه

۵ کامل / ۵ خلاصه

راه‌اندازی

محیط محلی • استقرار روی زیرساخت خودتان

محیط

Linux • Cloud managed

نکته‌ی مهم: بدون eval harness، repo context strategy و file selection، حتی code model خوب هم روی کار واقعی تیم شما overperform نمی‌کند.

ورود به صفحه مرجع

Hugging Face / ViDoReخانواده مدلوزن‌باز

ColQwen2

ColQwen2 برای تیم‌هایی مهم است که visual retrieval و document search را به‌صورت باز و self-hostable می‌خواهند، نه فقط OCR یا embedding متنی ساده.

چندوجهیEmbedding / بردارسازیتحلیل سندجست‌وجوی معنایی

کجا به کار می‌آید؟

PDF retrieval، visual search در اسناد پیچیده، pipelineهای RAG سندی و محیط‌هایی که می‌خواهند retrieval تصویر-محور را خودشان کنترل کنند.

مسیر شروع

self-host retrieval stack

پوشش صفحه

۵ کامل / ۵ خلاصه

راه‌اندازی

محیط محلی • استقرار روی زیرساخت خودتان

محیط

Cloud managed

نکته‌ی مهم: اگر هنوز retrieval pipeline و eval سندی شما ساده است، ممکن است ColQwen2 زودتر از نیاز واقعی‌تان پیچیدگی وارد کند.

ورود به صفحه مرجع

Stability AI ecosystemخانواده مدلمتن‌باز

Stable Diffusion

Stable Diffusion هنوز هم reference مهمی برای self-host، LoRA، style adaptation و freedom در generation تصویری است.

تولید تصویرتولید تصویر

کجا به کار می‌آید؟

تیم‌هایی که می‌خواهند image generation را خودشان host و tune کنند یا pipeline خلاقه داخلی بسازند.

مسیر شروع

self-host قوی

پوشش صفحه

۵ کامل / ۵ خلاصه

راه‌اندازی

محیط محلی • استقرار روی زیرساخت خودتان

محیط

Linux • Windows

نکته‌ی مهم: آزادی بالا با burden بالای safety، storage و ops همراه است.

ورود به صفحه مرجع

Open WebUIاکوسیستم / ابزارمتن‌باز

اکوسیستم Open WebUI

Open WebUI برای تیم‌هایی مهم است که UI و control plane برای local یا self-host مدل‌ها می‌خواهند، نه فقط یک inference server خام.

متن و چتچندوجهیچت و دستیارRAG و دانش سازمانی

کجا به کار می‌آید؟

chat UI داخلی، RAG demo، تیم‌های غیرزیرساختی که می‌خواهند model access، user-facing interface و tooling را سریع ببینند.

مسیر شروع

UI + orchestration layer

پوشش صفحه

۹ کامل / ۰ خلاصه

راه‌اندازی

محیط محلی • استقرار روی زیرساخت خودتان

محیط

Container / Docker • Linux

نکته‌ی مهم: Open WebUI خودِ serving stack نهایی نیست و برای enterprise production باید auth، audit، policy و backend ownership را جدا ببینید.

ورود به راهنما

Aider-AIراهنمای نصبمتن‌باز

Aider

Aider در hub به‌عنوان setup-guide آمده چون برای بسیاری از تیم‌ها یک entry practical و کم‌تشریفات به pair programming در ترمینال است؛ مخصوصاً وقتی می‌خواهند بین providerهای مختلف جابه‌جا شوند.

متن و چتکدنویسی

کجا به کار می‌آید؟

pair programming در ترمینال، patch-oriented coding، repoهای gitمحور و تیم‌هایی که open-source CLI با provider flexibility می‌خواهند.

مسیر شروع

local CLI با multi-provider path

پوشش صفحه

۵ کامل / ۲ خلاصه

راه‌اندازی

محیط محلی • API

محیط

وابسته به stack انتخابی

نکته‌ی مهم: بدون policy برای commit/review و بدون انتخاب درست مدل، Aider هم می‌تواند سریعاً به ابزار noisy تبدیل شود.

ورود به راهنما

Hooshgate Referenceمقایسه تصمیم‌یاروزن‌باز

مقایسه مدل‌های کدنویسی

این comparison guide برای تیم‌هایی است که بین GPT، Qwen Coder، DeepSeek Coder، Codestral و code modelهای مشابه گیر کرده‌اند و می‌خواهند trade-off عملی را ببینند.

متن و چتکدنویسیworkflow عامل‌محور

کجا به کار می‌آید؟

انتخاب coding assistant، تعیین build-vs-buy، و تصمیم بین API proprietary و self-host code modelها.

مسیر شروع

API یا self-host

پوشش صفحه

۴ کامل / ۱ خلاصه

راه‌اندازی

API • محیط محلی

محیط

macOS

نکته‌ی مهم: هیچ coding model بدون benchmark روی repo شما انتخاب نمی‌شود؛ leaderboard و demo کافی نیست.

ورود به راهنما

NVIDIAراهنمای استقراراختصاصی

NVIDIA Riva

NVIDIA Riva برای تیم‌هایی مهم است که speech stack را با performance بالا و ownership زیرساختی بیشتر روی GPU خودشان می‌خواهند، نه صرفاً یک API بیرونی برای STT/TTS.

صوت و گفتارتبدیل گفتار به متنتبدیل متن به گفتار

کجا به کار می‌آید؟

voice assistantهای خصوصی، speech pipelines سازمانی، on-prem یا edge-adjacent deployment و تیم‌هایی که speech AI را درون infra خودشان می‌آورند.

مسیر شروع

self-host speech stack

پوشش صفحه

۵ کامل / ۴ خلاصه

راه‌اندازی

استقرار روی زیرساخت خودتان • ابر مدیریت‌شده

محیط

Cloud managed • Edge / Device

نکته‌ی مهم: اگر فقط به STT/TTS ساده نیاز دارید، Riva می‌تواند از نظر ops و hardware بسیار بیشتر از نیاز واقعی شما باشد.

ورود به راهنما

LangChainراهنمای یکپارچه‌سازیمتن‌باز

راهنمای RAG با LangChain

این guide برای تیم‌هایی است که RAG را واقعاً implement می‌کنند و دنبال wiring بین retriever، prompt، model و evaluation هستند.

متن و چتEmbedding / بردارسازیRAG و دانش سازمانیجست‌وجوی معنایی

کجا به کار می‌آید؟

prototype تا implementation RAG، document pipeline، retrieval orchestration و تیم‌هایی که chain-level composition می‌خواهند.

مسیر شروع

orchestration-first

پوشش صفحه

۵ کامل / ۴ خلاصه

راه‌اندازی

محیط محلی • استقرار روی زیرساخت خودتان

محیط

وابسته به stack انتخابی

نکته‌ی مهم: LangChain خودِ answer quality را تضمین نمی‌کند؛ retrieval quality، schema و evaluation هنوز مسئولیت تیم است.

ورود به راهنما

NVIDIAخانواده مدلوزن‌باز

Sana

Sana برای تیم‌هایی مهم است که text-to-image باز با کیفیت بالا و مسیر self-host می‌خواهند و در stack تصویری باز فعال‌اند.

تولید تصویرتولید تصویر

کجا به کار می‌آید؟

text-to-image، experimentation تصویری، تولید محتوای خلاق و تیم‌هایی که diffusion باز را در کنار Stable Diffusion و FLUX می‌سنجند.

مسیر شروع

local / self-host

پوشش صفحه

۵ کامل / ۵ خلاصه

راه‌اندازی

محیط محلی • استقرار روی زیرساخت خودتان

محیط

Linux

نکته‌ی مهم: کیفیت نهایی text-to-image به prompt system، post-processing و سبک use-case وابسته است؛ فقط نام مدل را نبینید.

ورود به صفحه مرجع

Googleخانواده مدلاختصاصی

Gemini Embedding

Gemini Embedding برای تیم‌هایی مناسب است که retrieval stack خود را روی Google ecosystem نگه می‌دارند.

Embedding / بردارسازیجست‌وجوی معناییRAG و دانش سازمانی

کجا به کار می‌آید؟

RAG، semantic retrieval و pipelineهایی که هم generation و هم embedding را در Google stack می‌خواهند.

مسیر شروع

API-only

پوشش صفحه

۵ کامل / ۴ خلاصه

راه‌اندازی

API • ابر مدیریت‌شده

محیط

Linux • macOS

نکته‌ی مهم: اگر vendor-neutrality مهم است، abstraction layer لازم است.

ورود به صفحه مرجع

Microsoftاکوسیستم / ابزاراختصاصی

اکوسیستم Azure AI Foundry

Azure AI Foundry برای سازمان‌هایی مهم است که enterprise controls مایکروسافتی و model access را در یک platform واحد می‌خواهند.

متن و چتچندوجهیچت و دستیارRAG و دانش سازمانی

کجا به کار می‌آید؟

Azure-centric organizations، enterprise governance، app teams که می‌خواهند model access و security controls را داخل Azure نگه دارند.

مسیر شروع

managed enterprise platform

پوشش صفحه

۹ کامل / ۰ خلاصه

راه‌اندازی

API • ابر مدیریت‌شده

محیط

Cloud managed

نکته‌ی مهم: مثل بقیه platform pageها، اینجا درباره delivery و governance حرف می‌زنیم نه تضمین کیفیت هر model family.

ورود به راهنما

OpenAIخانواده مدلاختصاصی

Whisper

Whisper هنوز هم یک مرجع مهم برای speech-to-text عمومی است، مخصوصاً وقتی به چندزبانه بودن و سادگی API نیاز دارید.

صوت و گفتارتبدیل گفتار به متن

کجا به کار می‌آید؟

رونویسی فایل‌های صوتی، meeting notes، archive search و pipelineهای پایه STT.

مسیر شروع

API-first

پوشش صفحه

۵ کامل / ۴ خلاصه

راه‌اندازی

API

محیط

Linux • macOS

نکته‌ی مهم: اگر accuracy خیلی بالا، diarization پیشرفته یا workflowهای زنده لازم دارید، گزینه‌های جدیدتر را هم کنار آن بسنجید.

ورود به صفحه مرجع

Continueراهنمای نصبمتن‌باز

Continue.dev

Continue.dev برای تیم‌هایی مهم است که می‌خواهند coding assistant را در IDE و agent workflow خودشان با مدل‌های محلی یا remote ترکیب کنند و ownership بیشتری روی config و MCP داشته باشند.

متن و چتکدنویسیworkflow عامل‌محور

کجا به کار می‌آید؟

IDE-centric teams، local/offline coding flows، model switching و setupهایی که باید با MCP و configهای reusable کار کنند.

مسیر شروع

IDE + local/remote model mix

پوشش صفحه

۵ کامل / ۲ خلاصه

راه‌اندازی

محیط محلی • API

محیط

وابسته به stack انتخابی

نکته‌ی مهم: Continue فقط با نصب افزونه ارزش عملی نمی‌سازد؛ باید مدل، rule، tool و workflow repo را واقعاً تنظیم و محدود کنید.

ورود به راهنما

Microsoftخانواده مدلوزن‌باز

خانواده Phi

Phi بیشتر وقتی مهم می‌شود که مدل کوچک‌تر، deployment سبک و integration با اکوسیستم مایکروسافت برایتان مهم باشد.

متن و چتچندوجهیچت و دستیاراستدلال و تحلیل

کجا به کار می‌آید؟

copilotهای داخلی سبک، edge deployment و تیم‌هایی که Azure و Windows/ONNX مسیر مهمشان است.

مسیر شروع

edge / local

پوشش صفحه

۵ کامل / ۵ خلاصه

راه‌اندازی

محیط محلی • استقرار روی زیرساخت خودتان

محیط

Windows • Linux

نکته‌ی مهم: برای همه taskها نباید Phi را به‌عنوان جایگزین مستقیم frontier modelها دید؛ strength آن بیشتر در efficiency است.

ورود به صفحه مرجع

Apple MLX communityاکوسیستم / ابزارمتن‌باز

اکوسیستم MLX / mlx-lm

MLX / mlx-lm برای تیم‌هایی مهم است که macOS و Apple Silicon را به‌عنوان مسیر واقعی local AI می‌بینند، نه فقط fallback development machine.

متن و چتچندوجهیچت و دستیارکدنویسی

کجا به کار می‌آید؟

local inference روی مک، developer workflow، ارزیابی مدل‌های باز روی Apple Silicon و تیم‌هایی که pilot را روی لپ‌تاپ‌های مک جلو می‌برند.

مسیر شروع

macOS local-native

پوشش صفحه

۹ کامل / ۰ خلاصه

راه‌اندازی

محیط محلی

محیط

macOS

نکته‌ی مهم: اگر deployment نهایی شما روی Linux/GPU است، pilot مک را با production stack یکی نگیرید.

ورود به راهنما

Hooshgate Referenceراهنمای نصبمتن‌باز

راهنمای Open WebUI + Ollama

این setup guide دقیقاً برای تیمی است که می‌خواهد سریع‌ترین مسیر usable برای local یا internal chat stack را با Ollama و Open WebUI ببندد.

متن و چتچندوجهیچت و دستیارRAG و دانش سازمانی

کجا به کار می‌آید؟

pilot داخلی، chat portal تیمی، RAG سبک و تیم‌هایی که می‌خواهند بدون serving سنگین سریع به surface usable برسند.

مسیر شروع

local or single-node stack

پوشش صفحه

۵ کامل / ۲ خلاصه

راه‌اندازی

محیط محلی • استقرار روی زیرساخت خودتان

محیط

macOS • Linux

نکته‌ی مهم: اگر concurrency بالا، audit سخت یا enterprise governance می‌خواهید، این stack را solution نهایی فرض نکنید.

ورود به راهنما

Rhasspyخانواده مدلمتن‌باز

Piper

Piper برای TTS محلی و روی‌دستگاه بسیار مهم است؛ مخصوصاً وقتی privacy، سرعت و اجرای بدون cloud برایتان مهم‌تر از voice expressiveness بسیار بالا است.

صوت و گفتارتبدیل متن به گفتار

کجا به کار می‌آید؟

local TTS، edge devices، Home Assistant-style setups و محصولاتی که باید آفلاین یا در شبکه داخلی کار کنند.

مسیر شروع

local / edge

پوشش صفحه

۵ کامل / ۴ خلاصه

راه‌اندازی

محیط محلی • لبه / روی دستگاه

محیط

Linux • Edge / Device

نکته‌ی مهم: خود Piper باز است، اما license هر voice جداگانه است؛ قبل از استفاده تجاری حتماً model card هر صدا را بررسی کنید.

ورود به صفحه مرجع

LangChainراهنمای پیاده‌سازیمتن‌باز

راهنمای agent با LangGraph

این guide برای تیم‌هایی است که agent را به‌صورت graph و stateful workflow می‌بینند، نه فقط یک chain ساده یا tool call تک‌مرحله‌ای.

متن و چتچندوجهیworkflow عامل‌محورچت و دستیار

کجا به کار می‌آید؟

agent workflow چندمرحله‌ای، stateful execution، tool orchestration و تیم‌هایی که graph-based control می‌خواهند.

مسیر شروع

agent orchestration layer

پوشش صفحه

۵ کامل / ۳ خلاصه

راه‌اندازی

استقرار روی زیرساخت خودتان • API

محیط

وابسته به stack انتخابی

نکته‌ی مهم: LangGraph complexity را کم نمی‌کند؛ فقط آن را ساختاریافته‌تر می‌کند. اگر task ساده است، graph لازم نیست.

ورود به راهنما

Hooshgate Referenceراهنمای نصبمتن‌باز

مدل‌های local روی ویندوز

این setup guide دقیقاً برای کاربر ویندوز است: از local LLM روی لپ‌تاپ یا ورک‌استیشن شروع کنید، بدون اینکه pretend کنیم همه setupها یکسان هستند.

متن و چتچندوجهیچت و دستیارکدنویسی

کجا به کار می‌آید؟

developer workstation ویندوز، pilot محلی، تست code assistant و تیم‌هایی که local AI را روی Windows/WSL می‌خواهند.

مسیر شروع

Windows / WSL local-first

پوشش صفحه

۵ کامل / ۲ خلاصه

راه‌اندازی

محیط محلی

محیط

Windows

نکته‌ی مهم: Windows setup با Linux production یکی نیست؛ local success را با production parity اشتباه نگیرید.

ورود به راهنما

Cohereخانواده مدلاختصاصی

خانواده Command

Command برای تیم‌هایی مهم است که RAG، agents و multilingual enterprise workload را با API مصرف می‌کنند.

متن و چتچندوجهیچت و دستیاراستدلال و تحلیل

کجا به کار می‌آید؟

دانش سازمانی، search-heavy assistantها و تیم‌هایی که روی retrieval و citation حساس‌اند.

مسیر شروع

API / managed

پوشش صفحه

۵ کامل / ۵ خلاصه

راه‌اندازی

API • ابر مدیریت‌شده

محیط

Linux • macOS

نکته‌ی مهم: برای همه use-caseها گزینه پیش‌فرض نیست؛ بیشترین ارزشش را در retrieval-heavy enterprise appها نشان می‌دهد.

ورود به صفحه مرجع

AWS / Amazonراهنمای استقراراختصاصی

استقرار LLM روی SageMaker

این guide برای تیم‌هایی است که می‌خواهند serving مدل‌های باز یا سفارشی را روی SageMaker جلو ببرند و به rollout، endpoint lifecycle و cloud ops فکر می‌کنند.

متن و چتچندوجهیچت و دستیارRAG و دانش سازمانی

کجا به کار می‌آید؟

سازمان‌های AWS-centric که endpoint، autoscaling، model package و rollout cloud-managed می‌خواهند.

مسیر شروع

managed cloud deployment

پوشش صفحه

۵ کامل / ۴ خلاصه

راه‌اندازی

ابر مدیریت‌شده

محیط

Cloud managed

نکته‌ی مهم: اگر فقط یک pilot ساده دارید، complexity این مسیر می‌تواند از نیاز واقعی شما بیشتر باشد.

ورود به راهنما

deepsetراهنمای یکپارچه‌سازیمتن‌باز

راهنمای RAG با Haystack

این guide Haystack را به‌عنوان implementation route برای search و RAG پوشش می‌دهد؛ مخصوص تیم‌هایی که pipelineهای retrieval را structured می‌خواهند.

متن و چتEmbedding / بردارسازیRAG و دانش سازمانیجست‌وجوی معنایی

کجا به کار می‌آید؟

pipelineهای retrieval، document-centric systems و تیم‌هایی که Haystack-style component model را ترجیح می‌دهند.

مسیر شروع

component-based RAG

پوشش صفحه

۵ کامل / ۴ خلاصه

راه‌اندازی

استقرار روی زیرساخت خودتان • API

محیط

وابسته به stack انتخابی

نکته‌ی مهم: Framework choice مسئله اصلی نیست؛ corpus quality، evaluation و answer rubric هنوز تعیین‌کننده‌اند.

ورود به راهنما

LiteLLMاکوسیستم / ابزارمتن‌باز

اکوسیستم LiteLLM

LiteLLM برای تیم‌هایی مهم است که multi-provider gateway، routing و compatibility layer می‌خواهند و نمی‌خواهند هر provider را جدا در backend پیاده کنند.

متن و چتچندوجهیچت و دستیارworkflow عامل‌محور

کجا به کار می‌آید؟

provider routing، fallback، cost control، unified API surface و backendهایی که چند vendor را هم‌زمان مصرف می‌کنند.

مسیر شروع

gateway and routing layer

پوشش صفحه

۹ کامل / ۰ خلاصه

راه‌اندازی

استقرار روی زیرساخت خودتان • API

محیط

وابسته به stack انتخابی

نکته‌ی مهم: gateway جای benchmark و model selection را نمی‌گیرد؛ فقط integration layer را یکدست‌تر می‌کند.

ورود به راهنما

AWSخانواده مدلاختصاصی

خانواده Amazon Nova

Nova برای تیم‌هایی مناسب است که روی AWS هستند و می‌خواهند از مدل‌های چندوجهی با governance و integration بومی آمازون استفاده کنند.

متن و چتچندوجهیچت و دستیاراستدلال و تحلیل

کجا به کار می‌آید؟

سازمان‌های AWS-first، RAG و assistantهای enterprise با integration نزدیک به Bedrock و خدمات ابری آمازون.

مسیر شروع

Bedrock / AWS-managed

پوشش صفحه

۵ کامل / ۵ خلاصه

راه‌اندازی

ابر مدیریت‌شده • API

محیط

Cloud managed

نکته‌ی مهم: برای تیم‌های خارج از AWS، lock-in و معماری cloud-native باید آگاهانه مدیریت شود.

ورود به صفحه مرجع