Hooshgate Models Center

مرجع فارسی انتخاب مدل، setup، integration و deployment

این بخش playground یا inference UI نیست. اینجا برای browse، مقایسه، انتخاب مسیر local/API/self-host و رسیدن به guideهای درست ساخته شده است. در بازسازی فعلی، فقط مرز curated و قابل‌اتکا روی surface عمومی مانده است.

مرجع و directoryopen-source / open-weightproprietary / API-firstsetup / integration / deployment

مرز عمومی فعلی

بازسازی با فهرست curated

در این فاز فقط صفحه‌هایی روی /fa/models دیده می‌شوند که برای reference، selection یا guide عملی ارزش روشن دارند.

کل صفحه‌های visible

۸۶

خانواده و مدل

۳۳

guide و tooling

۵۳

متن‌باز

۳۰

وزن‌باز

۲۳

صفحه‌های proprietary

۳۳

اگر دنبال عمق هستید، از guideها شروع کنید. family pageها بیشتر برای فهم fit، trade-off و shortlist هستند؛ setup و deployment عمیق معمولاً روی pageهای dedicated باز می‌شوند.

جست‌وجوی دقیق‌تر

مرتب‌سازی

نوع صفحه

خانواده مدل۳۳اکوسیستم / ابزار۱۸راهنمای نصب۱۰راهنمای یکپارچه‌سازی۷راهنمای استقرار۷مقایسه تصمیم‌یار۷راهنمای پیاده‌سازی۴

مودالیته

وظیفه

باز بودن مدل

اختصاصی۳۳وزن‌باز۲۳متن‌باز۳۰

مسیر اجرا

Vendor / خانواده

اکوسیستم و runtime

سازگارسازی

سناریوی استفاده

نوع لایسنس

API تجاری۲۸پلتفرم مدیریت‌شده۱وزن‌باز با مجوز انجمنی۱۲مجوز باز با شروط ویژه۱متن‌باز با مجوز آزاد۳۲ترکیبی / متغیر۱۲

محیط و سیستم

برگشت به مرز فعلی

Browse سریع

۸ صفحه در مرز عمومی فعلی

مرکز مدل‌ها فعلاً فقط روی curated boundary اجرا می‌شود تا surface تمیز، قابل‌جست‌وجو و مرجع‌گونه بماند.

Reranking / بازرتبه‌بندی

خانواده‌های پایه LLM

برای انتخاب بین GPT، Claude، Gemini، Llama، Qwen و Mistral از اینجا شروع کنید.

۱۴ صفحه

کدنویسی و workflow توسعه

مدل‌ها و guideهایی برای code assistant، repo workflow و انتخاب coding stack.

۴۱ صفحه

Embedding، RAG و reranking

برای retrieval stack، document AI و search quality مسیرهای مرتبط را اینجا ببینید.

۴۶ صفحه

تصویر، ویدئو و صوت

مدل‌های media و voice را کنار هم ببینید و بعد بین API و self-host تصمیم بگیرید.

۳۷ صفحه

اکوسیستم و serving

برای Ollama، vLLM، TGI، Hugging Face و runtimeهای محلی و production.

۱۸ صفحه

نصب، integration و deployment

اگر دنبال جواب اجرایی هستید، به‌جای family pages از guideها شروع کنید.

۳۱ صفحه

عمق M4B

عمق را از نوع guide وارد کنید

برای این فاز، landing نقش hub دارد نه card dump. از laneهای curated وارد setup، comparison، deployment، implementation، local/self-host و API-first شوید.

setup / install

از macOS local تا API-first، Windows local و Linux self-host؛ برای onboarding عملی از این مسیر شروع کنید.

۱۰ صفحه

comparison / decision

برای local در برابر API و self-host، open در برابر proprietary و serving stackها این lane را ببینید.

۷ صفحه

deployment / serving

اگر از pilot گذشته‌اید و به rollout، latency، cost و hardware فکر می‌کنید، این guideها مقصد بعدی‌اند.

۷ صفحه

implementation / integration

برای backend integration، coding workflow، RAG، document AI و voice stack از این صفحه‌ها وارد شوید.

۱۱ صفحه

local / self-host

برای مسیرهای local، Linux/macOS و self-host production؛ مناسب وقتی data boundary یا کنترل infra مهم است.

۶۲ صفحه

API-first

برای تیم‌هایی که می‌خواهند سریع‌تر به محصول برسند و serving را فعلاً به provider بسپارند.

۴۵ صفحه

open / proprietary

برای مقایسه مسیر open-weight، open-source و proprietary بدون تبدیل landing به لیست خام.

۷ صفحه

ورود از مسیر task

اگر use-case را می‌دانید، از task شروع کنید و بعد vendor یا runtime را باریک کنید.

چت و دستیار (۵۵)استدلال و تحلیل (۱۵)کدنویسی (۴۱)workflow عامل‌محور (۳۵)RAG و دانش سازمانی (۴۵)تحلیل سند (۳۳)جست‌وجوی معنایی (۲۰)تولید تصویر (۱۴)

ورود از مسیر ecosystem

اگر stack را می‌دانید، از Hugging Face، Ollama، vLLM یا runtimeهای محلی وارد شوید.

OpenAI ecosystem (۱۹)Anthropic ecosystem (۱۱)Google / Gemini (۱۳)Midjourney (۲)Qwen ecosystem (۷)Mistral ecosystem (۴)NVIDIA Riva (۲)NVIDIA NeMo (۲)

نقطه‌های شروع خوب

چند صفحه برای شروع سریع

اگر هنوز مطمئن نیستید از کجا شروع کنید، یکی از این صفحه‌های مرجع یا guide را باز کنید.

خانواده مدل

خانواده GPT

اگر تیم شما به مدل API-first با ابزار، structured outputs و اکوسیستم بالغ نیاز دارد، GPT معمولاً نقطه شروع استاندارد است.

راهنمای نصب

مدل هاي local روي macOS

اگر قرار است local AI را روي مک جدي و قابل تکرار جلو ببريد، اين صفحه تفاوت Ollama، MLX و LM Studio را از نگاه hardware fit، developer workflow و مسير migration روشن مي کند.

مقایسه تصمیم‌یار

مقايسه مدل هاي proprietary و open-weight

اين comparison براي تصميم ايدئولوژيک نوشته نشده است؛ براي وقتي است که بايد بين quality آماده، time-to-market و enterprise support از يک سو، و data control، local/self-host و flexibility از سوي ديگر انتخاب عملي کنيد.

مقایسه تصمیم‌یار

مقايسه stackهاي serving و inference

وقتي open model انتخاب شده، سؤال بعدي فقط «کجا deploy کنيم؟» نيست؛ سؤال اين است که vLLM، TGI، endpoint managed يا cloud serving براي latency، throughput، ownership و migration path شما کدام trade-off را مي سازند.

مقایسه تصمیم‌یار

مقایسه خانواده‌های هوش مصنوعی ویدئو

این راهنما برای انتخاب عملی بین text-to-video، image-to-video، video editing و video understanding است؛ با این نگاه که ویدئو هنوز گران، کند، policy-heavy و وابسته به workflow انسانی است.

راهنمای استقرار

راه اندازي self-host براي LLM در production

اين guide براي لحظه اي است که self-host از demo و benchmark عبور مي کند و بايد به سرويس پايدار، monitorable و rollbackable تبديل شود؛ با owner روشن براي GPU، gateway، observability و incident response.

راهنمای استقرار

استقرار realtime voice stack در production

این guide برای لحظه‌ای است که voice agent از demo عبور می‌کند و باید با latency بودجه‌بندی‌شده، barge-in، streaming، fallback، observability و policy ضبط صدا وارد production شود.

راهنمای پیاده‌سازی

GitHub Copilot Coding Agent

GitHub Copilot Coding Agent برای تیم‌هایی مهم است که می‌خواهند issue-to-PR automation را داخل همان workflow گیت‌هاب خودشان جلو ببرند، با review و policyهای سازمانی نزدیک به محل کار اصلی تیم.

راهنمای پیاده‌سازی

پیاده‌سازی voice stack و voice agent

voice product فقط STT یا TTS نیست. این guide نشان می‌دهد برای ساخت voice agent باید latency زنجیره‌ای، barge-in، fallback و انتخاب بین managed voice stack و local/self-host را چطور ببینید.

Hooshgate Referenceراهنمای یکپارچه‌سازیوزن‌باز

راهنمای integration برای RAG

RAG با وصل‌کردن یک LLM به vector DB حل نمی‌شود. این guide مسیر حرفه‌ای integration را از ingest تا retrieval، reranking، answer synthesis و evaluation توضیح می‌دهد.

متن و چتEmbedding / بردارسازیRAG و دانش سازمانیجست‌وجوی معنایی

کجا به کار می‌آید؟

تیم‌هایی که می‌خواهند روی اسناد داخلی، دانش سازمانی، policy و document assistant یک RAG قابل‌نگهداری بسازند.

مسیر شروع

integration-focused

پوشش صفحه

۵ کامل / ۴ خلاصه

راه‌اندازی

API • استقرار روی زیرساخت خودتان

محیط

Cloud managed

نکته‌ی مهم: بدون dataset ارزیابی، metadata درست و failure taxonomy، بیشتر RAGها فقط demo خوب هستند نه محصول قابل اتکا.

ورود به راهنما

Alibaba / Qwenخانواده مدلوزن‌باز

Qwen Embedding و Reranker

خانواده Qwen Embedding/Reranker برای تیم‌هایی مهم است که retrieval چندزبانه، RAG جدی و کنترل بیشتر روی embedding stack می‌خواهند.

Embedding / بردارسازیReranking / بازرتبه‌بندیجست‌وجوی معناییRAG و دانش سازمانی

کجا به کار می‌آید؟

RAG چندزبانه، semantic search، reranking روی corpus سازمانی و pipelineهایی که کیفیت retrieval برایشان حیاتی‌تر از chat model است.

مسیر شروع

self-host یا API

پوشش صفحه

۵ کامل / ۵ خلاصه

راه‌اندازی

API • استقرار روی زیرساخت خودتان

محیط

Linux • Container / Docker

نکته‌ی مهم: اگر chunking، indexing و evaluation را درست طراحی نکنید، حتی embedding قوی هم retrieval خوبی به شما نمی‌دهد.

ورود به صفحه مرجع

Hugging Faceاکوسیستم / ابزارمتن‌باز

Text Embeddings Inference

TEI یکی از مهم‌ترین runtimeهای hub برای embedding و reranking است؛ چون self-host retrieval را از مرحله notebook به سرویس production نزدیک می‌کند.

Embedding / بردارسازیReranking / بازرتبه‌بندیجست‌وجوی معناییRAG و دانش سازمانی

کجا به کار می‌آید؟

embedding و reranking service، RAG داخلی، search production و تیم‌هایی که می‌خواهند open models را با runtime مخصوص retrieval بالا بیاورند.

مسیر شروع

serving تخصصی retrieval

پوشش صفحه

۹ کامل / ۰ خلاصه

راه‌اندازی

استقرار روی زیرساخت خودتان • ابر مدیریت‌شده

محیط

Container / Docker • Linux

نکته‌ی مهم: اگر stack شما heterogeneous است، باید آن را کنار vLLM، custom services و managed embedding APIها هم بسنجید.

ورود به راهنما

Voyage AIخانواده مدلاختصاصی

Voyage Rerank

Voyage Rerank برای تیم‌هایی مهم است که retrieval stack آن‌ها embedding خوبی دارد اما برای precision نهایی و ranking enterprise-grade به یک مرحله reranking تمیز نیاز دارند.

Reranking / بازرتبه‌بندیجست‌وجوی معناییRAG و دانش سازمانی

کجا به کار می‌آید؟

RAG چندمرحله‌ای، search stack سازمانی، ranking مجدد روی top-k و تیم‌هایی که می‌خواهند answer quality را بدون ساخت مدل خودشان بهتر کنند.

مسیر شروع

API reranking layer

پوشش صفحه

۵ کامل / ۴ خلاصه

راه‌اندازی

API • ابر مدیریت‌شده

محیط

Cloud managed

نکته‌ی مهم: reranker جایگزین corpus hygiene، chunking درست یا ارزیابی retrieval نیست؛ فقط لایه دوم تصمیم است.

ورود به صفحه مرجع

Hooshgate Referenceمقایسه تصمیم‌یاروزن‌باز

مقایسه embedding و reranking

این comparison guide برای تیم‌هایی است که می‌خواهند retrieval stack را جدی انتخاب کنند: فقط embedding، embedding + reranker، یا managed retrieval API.

Embedding / بردارسازیReranking / بازرتبه‌بندیجست‌وجوی معناییRAG و دانش سازمانی

کجا به کار می‌آید؟

RAG system design، enterprise search selection و تیم‌هایی که retrieval quality برایشان KPI واقعی است.

مسیر شروع

self-host یا managed retrieval

پوشش صفحه

۴ کامل / ۱ خلاصه

راه‌اندازی

محیط محلی • استقرار روی زیرساخت خودتان

محیط

Container / Docker

نکته‌ی مهم: embedding leaderboards به‌تنهایی کافی نیستند؛ query set، chunking و corpus behavior تعیین‌کننده‌اند.

ورود به راهنما

FlagOpen / BAAIخانواده مدلمتن‌باز

خانواده BGE / FlagEmbedding

BGE برای تیم‌هایی مهم است که retrieval stack را کاملاً open و self-host می‌خواهند؛ از embedding تا reranker.

Embedding / بردارسازیReranking / بازرتبه‌بندیجست‌وجوی معناییRAG و دانش سازمانی

کجا به کار می‌آید؟

RAG self-host، enterprise search داخل VPC و تیم‌هایی که می‌خواهند retrieval را تا لایه مدل کنترل کنند.

مسیر شروع

کاملاً self-host

پوشش صفحه

۵ کامل / ۵ خلاصه

راه‌اندازی

محیط محلی • استقرار روی زیرساخت خودتان

محیط

Linux • Container / Docker

نکته‌ی مهم: بدون دانش کافی در ارزیابی retrieval، open بودن به‌تنهایی مزیت عملیاتی نمی‌سازد.

ورود به صفحه مرجع

LangChainراهنمای یکپارچه‌سازیمتن‌باز

راهنمای RAG با LangChain

این guide برای تیم‌هایی است که RAG را واقعاً implement می‌کنند و دنبال wiring بین retriever، prompt، model و evaluation هستند.

متن و چتEmbedding / بردارسازیRAG و دانش سازمانیجست‌وجوی معنایی

کجا به کار می‌آید؟

prototype تا implementation RAG، document pipeline، retrieval orchestration و تیم‌هایی که chain-level composition می‌خواهند.

مسیر شروع

orchestration-first

پوشش صفحه

۵ کامل / ۴ خلاصه

راه‌اندازی

محیط محلی • استقرار روی زیرساخت خودتان

محیط

وابسته به stack انتخابی

نکته‌ی مهم: LangChain خودِ answer quality را تضمین نمی‌کند؛ retrieval quality، schema و evaluation هنوز مسئولیت تیم است.

ورود به راهنما

deepsetراهنمای یکپارچه‌سازیمتن‌باز

راهنمای RAG با Haystack

این guide Haystack را به‌عنوان implementation route برای search و RAG پوشش می‌دهد؛ مخصوص تیم‌هایی که pipelineهای retrieval را structured می‌خواهند.

متن و چتEmbedding / بردارسازیRAG و دانش سازمانیجست‌وجوی معنایی

کجا به کار می‌آید؟

pipelineهای retrieval، document-centric systems و تیم‌هایی که Haystack-style component model را ترجیح می‌دهند.

مسیر شروع

component-based RAG

پوشش صفحه

۵ کامل / ۴ خلاصه

راه‌اندازی

استقرار روی زیرساخت خودتان • API

محیط

وابسته به stack انتخابی

نکته‌ی مهم: Framework choice مسئله اصلی نیست؛ corpus quality، evaluation و answer rubric هنوز تعیین‌کننده‌اند.

ورود به راهنما