Hooshgate Models Center

مرجع فارسی انتخاب مدل، setup، integration و deployment

این بخش playground یا inference UI نیست. اینجا برای browse، مقایسه، انتخاب مسیر local/API/self-host و رسیدن به guideهای درست ساخته شده است. در بازسازی فعلی، فقط مرز curated و قابل‌اتکا روی surface عمومی مانده است.

مرجع و directoryopen-source / open-weightproprietary / API-firstsetup / integration / deployment

مرز عمومی فعلی

بازسازی با فهرست curated

در این فاز فقط صفحه‌هایی روی /fa/models دیده می‌شوند که برای reference، selection یا guide عملی ارزش روشن دارند.

کل صفحه‌های visible

۸۶

خانواده و مدل

۳۳

guide و tooling

۵۳

متن‌باز

۳۰

وزن‌باز

۲۳

صفحه‌های proprietary

۳۳

اگر دنبال عمق هستید، از guideها شروع کنید. family pageها بیشتر برای فهم fit، trade-off و shortlist هستند؛ setup و deployment عمیق معمولاً روی pageهای dedicated باز می‌شوند.

جست‌وجوی دقیق‌تر

مرتب‌سازی

نوع صفحه

خانواده مدل۳۳اکوسیستم / ابزار۱۸راهنمای نصب۱۰راهنمای یکپارچه‌سازی۷راهنمای استقرار۷مقایسه تصمیم‌یار۷راهنمای پیاده‌سازی۴

مودالیته

وظیفه

باز بودن مدل

اختصاصی۳۳وزن‌باز۲۳متن‌باز۳۰

مسیر اجرا

Vendor / خانواده

اکوسیستم و runtime

سازگارسازی

سناریوی استفاده

نوع لایسنس

API تجاری۲۸پلتفرم مدیریت‌شده۱وزن‌باز با مجوز انجمنی۱۲مجوز باز با شروط ویژه۱متن‌باز با مجوز آزاد۳۲ترکیبی / متغیر۱۲

محیط و سیستم

برگشت به مرز فعلی

Browse سریع

۱۳ صفحه در مرز عمومی فعلی

مرکز مدل‌ها فعلاً فقط روی curated boundary اجرا می‌شود تا surface تمیز، قابل‌جست‌وجو و مرجع‌گونه بماند.

Google / Gemini

خانواده‌های پایه LLM

برای انتخاب بین GPT، Claude، Gemini، Llama، Qwen و Mistral از اینجا شروع کنید.

۱۴ صفحه

کدنویسی و workflow توسعه

مدل‌ها و guideهایی برای code assistant، repo workflow و انتخاب coding stack.

۴۱ صفحه

Embedding، RAG و reranking

برای retrieval stack، document AI و search quality مسیرهای مرتبط را اینجا ببینید.

۴۶ صفحه

تصویر، ویدئو و صوت

مدل‌های media و voice را کنار هم ببینید و بعد بین API و self-host تصمیم بگیرید.

۳۷ صفحه

اکوسیستم و serving

برای Ollama، vLLM، TGI، Hugging Face و runtimeهای محلی و production.

۱۸ صفحه

نصب، integration و deployment

اگر دنبال جواب اجرایی هستید، به‌جای family pages از guideها شروع کنید.

۳۱ صفحه

عمق M4B

عمق را از نوع guide وارد کنید

برای این فاز، landing نقش hub دارد نه card dump. از laneهای curated وارد setup، comparison، deployment، implementation، local/self-host و API-first شوید.

setup / install

از macOS local تا API-first، Windows local و Linux self-host؛ برای onboarding عملی از این مسیر شروع کنید.

۱۰ صفحه

comparison / decision

برای local در برابر API و self-host، open در برابر proprietary و serving stackها این lane را ببینید.

۷ صفحه

deployment / serving

اگر از pilot گذشته‌اید و به rollout، latency، cost و hardware فکر می‌کنید، این guideها مقصد بعدی‌اند.

۷ صفحه

implementation / integration

برای backend integration، coding workflow، RAG، document AI و voice stack از این صفحه‌ها وارد شوید.

۱۱ صفحه

local / self-host

برای مسیرهای local، Linux/macOS و self-host production؛ مناسب وقتی data boundary یا کنترل infra مهم است.

۶۲ صفحه

API-first

برای تیم‌هایی که می‌خواهند سریع‌تر به محصول برسند و serving را فعلاً به provider بسپارند.

۴۵ صفحه

open / proprietary

برای مقایسه مسیر open-weight، open-source و proprietary بدون تبدیل landing به لیست خام.

۷ صفحه

ورود از مسیر task

اگر use-case را می‌دانید، از task شروع کنید و بعد vendor یا runtime را باریک کنید.

چت و دستیار (۵۵)استدلال و تحلیل (۱۵)کدنویسی (۴۱)workflow عامل‌محور (۳۵)RAG و دانش سازمانی (۴۵)تحلیل سند (۳۳)جست‌وجوی معنایی (۲۰)تولید تصویر (۱۴)

ورود از مسیر ecosystem

اگر stack را می‌دانید، از Hugging Face، Ollama، vLLM یا runtimeهای محلی وارد شوید.

OpenAI ecosystem (۱۹)Anthropic ecosystem (۱۱)Google / Gemini (۱۳)Midjourney (۲)Qwen ecosystem (۷)Mistral ecosystem (۴)NVIDIA Riva (۲)NVIDIA NeMo (۲)

نقطه‌های شروع خوب

چند صفحه برای شروع سریع

اگر هنوز مطمئن نیستید از کجا شروع کنید، یکی از این صفحه‌های مرجع یا guide را باز کنید.

خانواده مدل

خانواده GPT

اگر تیم شما به مدل API-first با ابزار، structured outputs و اکوسیستم بالغ نیاز دارد، GPT معمولاً نقطه شروع استاندارد است.

راهنمای نصب

مدل هاي local روي macOS

اگر قرار است local AI را روي مک جدي و قابل تکرار جلو ببريد، اين صفحه تفاوت Ollama، MLX و LM Studio را از نگاه hardware fit، developer workflow و مسير migration روشن مي کند.

مقایسه تصمیم‌یار

مقايسه مدل هاي proprietary و open-weight

اين comparison براي تصميم ايدئولوژيک نوشته نشده است؛ براي وقتي است که بايد بين quality آماده، time-to-market و enterprise support از يک سو، و data control، local/self-host و flexibility از سوي ديگر انتخاب عملي کنيد.

مقایسه تصمیم‌یار

مقايسه stackهاي serving و inference

وقتي open model انتخاب شده، سؤال بعدي فقط «کجا deploy کنيم؟» نيست؛ سؤال اين است که vLLM، TGI، endpoint managed يا cloud serving براي latency، throughput، ownership و migration path شما کدام trade-off را مي سازند.

مقایسه تصمیم‌یار

مقایسه خانواده‌های هوش مصنوعی ویدئو

این راهنما برای انتخاب عملی بین text-to-video، image-to-video، video editing و video understanding است؛ با این نگاه که ویدئو هنوز گران، کند، policy-heavy و وابسته به workflow انسانی است.

راهنمای استقرار

راه اندازي self-host براي LLM در production

اين guide براي لحظه اي است که self-host از demo و benchmark عبور مي کند و بايد به سرويس پايدار، monitorable و rollbackable تبديل شود؛ با owner روشن براي GPU، gateway، observability و incident response.

راهنمای استقرار

استقرار realtime voice stack در production

این guide برای لحظه‌ای است که voice agent از demo عبور می‌کند و باید با latency بودجه‌بندی‌شده، barge-in، streaming، fallback، observability و policy ضبط صدا وارد production شود.

راهنمای پیاده‌سازی

GitHub Copilot Coding Agent

GitHub Copilot Coding Agent برای تیم‌هایی مهم است که می‌خواهند issue-to-PR automation را داخل همان workflow گیت‌هاب خودشان جلو ببرند، با review و policyهای سازمانی نزدیک به محل کار اصلی تیم.

راهنمای پیاده‌سازی

پیاده‌سازی voice stack و voice agent

voice product فقط STT یا TTS نیست. این guide نشان می‌دهد برای ساخت voice agent باید latency زنجیره‌ای، barge-in، fallback و انتخاب بین managed voice stack و local/self-host را چطور ببینید.

Hooshgate Referenceمقایسه تصمیم‌یاروزن‌باز

مقایسه local، API و self-host

مهم‌ترین سؤال عملی بسیاری از تیم‌ها همین است: local run کنم، API بگیرم یا self-host شوم؟ این صفحه به‌جای پاسخ شعاری، trade-off تصمیم را شفاف می‌کند.

متن و چتچندوجهیچت و دستیارکدنویسی

کجا به کار می‌آید؟

تیم‌های product، infra و enterprise که باید تصمیم deployment بگیرند و نمی‌خواهند تحت‌تأثیر hype یک مسیر اشتباه انتخاب کنند.

مسیر شروع

decision framework

پوشش صفحه

۴ کامل / ۱ خلاصه

راه‌اندازی

محیط محلی • API

محیط

Cloud managed

نکته‌ی مهم: هیچ مسیر «همیشه درست» وجود ندارد؛ تصمیم باید بر اساس latency target، داده، team maturity و economics workload گرفته شود.

ورود به راهنما

Hooshgate Referenceراهنمای استقراراختصاصی

Guardrails، observability و evaluation

بخش بزرگی از production readiness نه در مدل، بلکه در guardrails، observability و evaluation است. این صفحه نشان می‌دهد چطور AI feature را قابل‌پایش، قابل‌کنترل و قابل‌اعتماد نگه دارید.

متن و چتچندوجهیچت و دستیارworkflow عامل‌محور

کجا به کار می‌آید؟

هر تیمی که AI را از demo وارد محصول یا فرایند سازمانی می‌کند؛ مخصوصاً محیط‌های حساس، customer-facing و agentic.

مسیر شروع

ops and safety layer

پوشش صفحه

۵ کامل / ۴ خلاصه

راه‌اندازی

API • استقرار روی زیرساخت خودتان

محیط

Cloud managed

نکته‌ی مهم: بدون quality review، trace و policy checks، حتی بهترین مدل‌ها هم به‌مرور drift می‌کنند و اعتماد کاربر را از بین می‌برند.

ورود به راهنما

Hooshgate Referenceراهنمای استقراراختصاصی

راهنمای deployment برای محصول و سازمان

deployment حرفه‌ای با «انتخاب مدل» تمام نمی‌شود. این guide از phaseهای rollout تا security، observability، guardrails و maintenance trade-off را برای محصول و سازمان جمع می‌کند.

متن و چتچندوجهیچت و دستیارworkflow عامل‌محور

کجا به کار می‌آید؟

tech leadها، infra leadها و product ownerهایی که باید یک AI feature را به‌شکل production-grade وارد سیستم واقعی کنند.

مسیر شروع

production operations

پوشش صفحه

۵ کامل / ۴ خلاصه

راه‌اندازی

API • استقرار روی زیرساخت خودتان

محیط

Cloud managed

نکته‌ی مهم: بیشتر شکست‌های production نه از خود مدل، بلکه از فقدان rollout phase، logging، fallback و ownership عملیاتی می‌آید.

ورود به راهنما

Googleخانواده مدلاختصاصی

خانواده Gemini

Gemini برای تیم‌هایی جذاب است که از ورودی‌های چندوجهی، PDF، ویدئو یا Google stack استفاده می‌کنند و می‌خواهند API و cloud-native workflow یکپارچه باشد.

متن و چتچندوجهیچت و دستیاراستدلال و تحلیل

کجا به کار می‌آید؟

محصولات multimodal، تحلیل PDF و ویدئو، RAGهای اسنادی و تیم‌هایی که روی Google Cloud یا Vertex AI کار می‌کنند.

مسیر شروع

API-first

پوشش صفحه

۵ کامل / ۵ خلاصه

راه‌اندازی

API • ابر مدیریت‌شده

محیط

Linux • macOS

نکته‌ی مهم: اگر تیم شما vendor-neutral یا self-host-first است، Gemini شاید بهترین نقطه شروع نباشد.

ورود به صفحه مرجع

Hooshgate Referenceراهنمای یکپارچه‌سازیاختصاصی

راهنمای API-first برای مدل‌های proprietary

اگر نمی‌خواهید وارد serving شوید و زمان رسیدن به MVP برایتان حیاتی است، مسیر API-first هنوز سریع‌ترین راه حرفه‌ای است؛ به‌شرط اینکه cost، lock-in و governance را از ابتدا مهندسی کنید.

متن و چتچندوجهیچت و دستیارکدنویسی

کجا به کار می‌آید؟

محصولات agentic، document AI، multimodal appها و تیم‌هایی که زیرساخت inference را نمی‌خواهند خودشان نگه دارند.

مسیر شروع

API-managed path

پوشش صفحه

۵ کامل / ۴ خلاصه

راه‌اندازی

API • ابر مدیریت‌شده

محیط

Linux • macOS

نکته‌ی مهم: ساده‌بودن integration اولیه باعث می‌شود بسیاری از تیم‌ها logging، budget، fallback و data boundary را دیرتر از حد لازم طراحی کنند.

ورود به راهنما

Hooshgate Referenceراهنمای پیاده‌سازیوزن‌باز

پیاده‌سازی document AI و سندمحور

document AI فقط OCR یا chat با PDF نیست. این guide نشان می‌دهد برای ingestion، extraction، validation، citation و human review چطور یک pipeline سندمحور قابل‌اعتماد بسازید.

چندوجهیمتن و چتتحلیل سندRAG و دانش سازمانی

کجا به کار می‌آید؟

workflowهای قرارداد، فاکتور، policy، proposal review و هر use-case که سند source-of-truth است.

مسیر شروع

use-case implementation

پوشش صفحه

۵ کامل / ۳ خلاصه

راه‌اندازی

API • استقرار روی زیرساخت خودتان

محیط

Cloud managed

نکته‌ی مهم: بزرگ‌ترین خطا این است که extraction را مستقیماً به مدل بسپارید بدون schema، validator و review path.

ورود به راهنما

Hooshgate Referenceمقایسه تصمیم‌یاروزن‌باز

مقايسه مدل هاي proprietary و open-weight

متن و چتچندوجهیچت و دستیاراستدلال و تحلیل

کجا به کار می‌آید؟

CTO، tech lead و product/infra teamهايي که بايد baseline مدل را براي محصول، coding workflow يا assistant سازماني انتخاب کنند.

مسیر شروع

decision layer بين API و open infra

پوشش صفحه

۴ کامل / ۱ خلاصه

راه‌اندازی

API • محیط محلی

محیط

Linux • Cloud managed

نکته‌ی مهم: هيچ کدام ذاتا برنده مطلق نيستند؛ proprietary و open فقط وقتي معنا دارند که task، budget، data boundary و ops ownership را کنار هم ببينيد.

ورود به راهنما

Hooshgate Referenceراهنمای نصباختصاصی

راه اندازي API-first براي مدل هاي تجاري

اين راهنما براي تيمي است که مي خواهد مدل تجاري را به شکل API-first وارد محصول يا backend کند، بدون اين که ساده بودن SDK او را از schema، cost guardrail، fallback و ownership عملي غافل کند.

متن و چتچندوجهیچت و دستیارworkflow عامل‌محور

کجا به کار می‌آید؟

MVP سريع، backendهاي product-first، appهاي agentic يا document-heavy و تيم هايي که مي خواهند قبل از self-host سراغ value عملي بروند.

مسیر شروع

delivery سريع با governance لازم

پوشش صفحه

۵ کامل / ۲ خلاصه

راه‌اندازی

API • ابر مدیریت‌شده

محیط

Serverless • Cloud managed

نکته‌ی مهم: API-first burden serving را کم مي کند، اما cost، vendor dependency، retention policy و failure handling را از بين نمي برد.

ورود به راهنما

Hooshgate Referenceمقایسه تصمیم‌یاراختصاصی

مقایسه خانواده‌های هوش مصنوعی ویدئو

ویدئوچندوجهیتولید ویدئوتولید تصویر

کجا به کار می‌آید؟

تیم‌های محصول، رسانه، آموزش، مارکتینگ و AI tooling که می‌خواهند ویدئو را به شکل کنترل‌شده وارد prototype، تولید asset یا تحلیل محتوای ویدئویی کنند.

مسیر شروع

managed-first, open-weight experimental

پوشش صفحه

۴ کامل / ۱ خلاصه

راه‌اندازی

API • ابر مدیریت‌شده

محیط

Cloud managed

نکته‌ی مهم: اگر دنبال inference ارزان، self-host ساده یا تولید انبوه بدون review حقوقی و انسانی هستید، ویدئو معمولاً انتخاب اول خوبی نیست.

ورود به راهنما

Googleراهنمای یکپارچه‌سازیاختصاصی

Gemini Live API

Gemini Live API وقتی مهم می‌شود که شما به تعامل کم‌تاخیر صوت/ویدئو نیاز دارید و می‌خواهید conversation به سبک real-time را داخل محصول خودتان بسازید.

چندوجهیصوت و گفتاردستیار صوتیچت و دستیار

کجا به کار می‌آید؟

voice assistant، multimodal sessions، use-caseهای real-time و محصولاتی که interruption، turn-taking و media streaming برایشان مهم است.

مسیر شروع

managed low-latency media path

پوشش صفحه

۵ کامل / ۴ خلاصه

راه‌اندازی

API • ابر مدیریت‌شده

محیط

Cloud managed

نکته‌ی مهم: real-time بودن به‌معنای complexity بالاتر در session control، interruption handling، media pipeline و observability است.

ورود به راهنما

Googleخانواده مدلوزن‌باز

خانواده Gemma

Gemma برای تیم‌هایی مناسب است که مدل باز و سبک‌تر می‌خواهند، اما همچنان می‌خواهند از lineage و tooling گوگل بهره ببرند.

متن و چتچندوجهیچت و دستیاراستدلال و تحلیل

کجا به کار می‌آید؟

edge و local AI، prototypeهای self-host و تیم‌هایی که مدل بازتر اما manageable می‌خواهند.

مسیر شروع

local / edge friendly

پوشش صفحه

۵ کامل / ۵ خلاصه

راه‌اندازی

محیط محلی • استقرار روی زیرساخت خودتان

محیط

Linux • macOS

نکته‌ی مهم: Gemma family variantهای متنوعی دارد؛ باید بین core، code و multimodal فرق بگذارید.

ورود به صفحه مرجع

Googleخانواده مدلاختصاصی

Gemini Embedding

Gemini Embedding برای تیم‌هایی مناسب است که retrieval stack خود را روی Google ecosystem نگه می‌دارند.

Embedding / بردارسازیجست‌وجوی معناییRAG و دانش سازمانی

کجا به کار می‌آید؟

RAG، semantic retrieval و pipelineهایی که هم generation و هم embedding را در Google stack می‌خواهند.

مسیر شروع

API-only

پوشش صفحه

۵ کامل / ۴ خلاصه

راه‌اندازی

API • ابر مدیریت‌شده

محیط

Linux • macOS

نکته‌ی مهم: اگر vendor-neutrality مهم است، abstraction layer لازم است.

ورود به صفحه مرجع

LiteLLMاکوسیستم / ابزارمتن‌باز

اکوسیستم LiteLLM

LiteLLM برای تیم‌هایی مهم است که multi-provider gateway، routing و compatibility layer می‌خواهند و نمی‌خواهند هر provider را جدا در backend پیاده کنند.

متن و چتچندوجهیچت و دستیارworkflow عامل‌محور

کجا به کار می‌آید؟

provider routing، fallback، cost control، unified API surface و backendهایی که چند vendor را هم‌زمان مصرف می‌کنند.

مسیر شروع

gateway and routing layer

پوشش صفحه

۹ کامل / ۰ خلاصه

راه‌اندازی

استقرار روی زیرساخت خودتان • API

محیط

وابسته به stack انتخابی

نکته‌ی مهم: gateway جای benchmark و model selection را نمی‌گیرد؛ فقط integration layer را یکدست‌تر می‌کند.

ورود به راهنما