TL;DR
- در گزارش Octoverse 2018، متوجه شدیم که یادگیری ماشین و علم داده محبوب GitHub هستند.
- tensorflow/tensorflow یکی از بیشترین مشارکت در پروژهها بود،.
- pytorch/pytorch یکی از سریعترین پروژههای در حال رشد و پایتون سومین زبان محبوب در GitHub بود.
چه اتفاقی افتاد
در گزارش Octoverse 2018، متوجه شدیم که یادگیری ماشین و علم داده محبوب GitHub هستند. tensorflow/tensorflow یکی از بیشترین مشارکت در پروژهها بود،.
pytorch/pytorch یکی از سریعترین پروژههای در حال رشد و پایتون سومین زبان محبوب در GitHub بود. ما تصمیم گرفتیم کمیعمیقتر به وضعیت یادگیری ماشین و علم داده در GitHub بپردازیم.
ما دادههای مربوط به مشارکتها را بین ۱ ژانویه ۲۰۱۸ تا ۳۱ دسامبر ۲۰۱۸ جمعآوری کردیم. مشارکتها میتواند شامل فشار دادن کد،.
باز کردن یک مشکل یا درخواست کشش،. نظر دادن درباره یک مشکل یا درخواست کشش،.
یا بررسی یک درخواست کشش باشد. برای بستههای وارداتی،.
از دادههای نمودار وابستگی استفاده کردیم که شامل تمام مخازن عمومیو مخازن خصوصی است که در نمودار. وابستگی شرکت کردهاند.
زبانهای برنامهنویسی ما به مشارکتکنندگان در مخازن برچسبگذاری شده با موضوع «یادگیری ماشینی» نگاه کردیم و. رایجترین زبانهای اصلی مخازن را رتبهبندی کردیم.
پایتون رایجترین زبان در بین مخازن یادگیری ماشینی است و بهطور کلی سومین زبان رایج در GitHub. است.
با این حال،. همه یادگیری ماشینی در پایتون اتفاق نمیافتد:.
برخی از رایجترین زبانها در GitHub نیز زبانهای رایج برای پروژههای یادگیری ماشین هستند. C++،.
JavaScript،. Java،.
C#،. Shell و TypeScript همگی در 10 زبان برتر GitHub و 10 زبان برتر برای پروژههای یادگیری ماشین.
هستند. جولیا،.
آر و اسکالا همگی در 10 پروژه برتر یادگیری ماشین ظاهر میشوند اما بهطور کلی برای GitHub. نه.
Julia و R هر دو زبانهایی هستند که معمولاً توسط دانشمندان داده استفاده میشوند و Scala هنگام تعامل. با سیستمهای داده بزرگ مانند Apache Spark رایجتر میشود.
بستههای محبوب یادگیری ماشین و علم داده ما دادهها را از نمودار وابستگی استخراج کردیم تا درصد. پروژههایی با یادگیری ماشین یا علم داده را که بستههای محبوب پایتون وارد میکنند محاسبه کنیم.
لیست بالا ده بسته برتر وارد شده توسط این پروژهها را نشان میدهد. این چیزی است که ما پیدا کردیم:.
Numpy - بستهای با پشتیبانی از عملیات ریاضی روی دادههای چند بعدی - بیشترین بسته وارداتی. بود که در تقریباً سه چهارم پروژههای یادگیری ماشین و علم داده استفاده شد.
Scipy،. بستهای برای محاسبات علمی،.
پانداها،. بستهای برای مدیریت مجموعه دادهها،.
و matplotlib،. یک کتابخانه تجسمی،.
همگی در بیش از 40 درصد از پروژههای یادگیری ماشین و علم داده استفاده میشوند. Scikit-learn یک بسته یادگیری ماشینی محبوب است که شامل پیادهسازی تعداد زیادی از الگوریتمهای یادگیری ماشین است -.
تقریباً 40 ٪ از پروژهها از آن استفاده میکنند. Tensorflow،.
بستهای برای کار با شبکههای عصبی،. در نزدیک به یک چهارم بستهها استفاده میشود.
بقیه دهها بستههای کاربردی هستند:. شش یک کتابخانه سازگار با پایتون 2 و 3 است و python-dateutil و Pytz بستههایی برای کار با.
تاریخ هستند. پروژههای محبوب یادگیری ماشینی ما همچنین بررسی کردیم که کدام پروژههای منبعباز با برچسب «یادگیری ماشین».
بیشترین مشارکتکنندگان را در سال 2018 داشتهاند. Tensorflow با بیش از پنج برابر تعداد مشارکتکنندگان دومین پروژه پرطرفدار، scikit-learn، محبوبترین بود.
دو پروژه، explosion/spaCy و RasaHQ/rasa_nlu، بر مشکلات پردازش زبان طبیعی متمرکز شدهاند. چهار پروژه دیگر، CMU-Perceptual-Computing-Lab/openpose، thtrieu/darkflow، ageitgey/face_cognition، و tesseract-ocr/tesseract، بر پردازش تصویر متمرکز هستند.
کد منبع زبان جولیا نیز یکی از بیشترین مشارکت در پروژهها در سال 2018 بود. ما عاشق دیدن پروژههای شگفت انگیزی هستیم که با استفاده از یادگیری ماشین ساخته اید.
اگر میخواهید بیشتر از این پروژهها را در GitHub کاوش کنید، صفحه کاوش را بررسی کنید. نوشته شده توسط پستهای مرتبط از GitHub بیشتر کاوش کنید اسناد همه چیزهایی که برای تسلط بر.
GitHub نیاز دارید،. همه در یک مکان.
به Docs بروید GitHub در GitHub آنچه در آینده است بسازید،. مکانی برای هر کسی از هر کجا که بتواند هر چیزی بسازد.
شروع به ساختن کنید داستانهای مشتری با شرکتها و تیمهای مهندسی که با GitHub می. سازند آشنا شوید.
بیشتر بدانید پادکست GitHub پادکست GitHub را دنبال کنید،. نمایشی که به،.
روندها،. داستانها و فرهنگ در داخل و اطراف جامعه توسعه دهندگان منبعباز در GitHub اختصاص دارد.
حالا گوش کن.
چرا مهم است
اهمیت این خبر در این است که روی استفاده واقعی از AI و تصمیمگیری سازمانی اثر میگذارد.
منبع
لینک منبع اصلی در کارت و صفحه مقاله نمایش داده میشود.
