TL;DR
- چکیده:.
- استخراج اطلاعات ساختاریافته از ادبیات علمیبرای گرفتن مفاهیم اصلی و روندهای نوظهور در زمینههای تخصصی بسیار.
- مهم است.
چه اتفاقی افتاد
چکیده:. استخراج اطلاعات ساختاریافته از ادبیات علمیبرای گرفتن مفاهیم اصلی و روندهای نوظهور در زمینههای تخصصی بسیار.
مهم است. در حالی که مجموعه دادههای موجود به توسعه مدل کمک میکنند،.
بیشتر آنها به دلیل پیچیدگی دامنه و هزینه بالای حاشیهنویسی متون علمی،. بر بخشهای انتشار خاص تمرکز میکنند.
برای رفع این محدودیت،. SciNLP را معرفی میکنیم - یک معیار تخصصی برای استخراج موجودیت متن کامل و استخراج رابطه در حوزه.
پردازش زبان طبیعی (NLP). مجموعه داده شامل 60 نشریه NLP متن کامل با حاشیه نویسی دستی است که 6409 موجودیت و 1648.
رابطه را پوشش میدهد. در مقایسه با تحقیقات موجود،.
SciNLP اولین مجموعه دادهای است که حاشیه نویسی متن کامل موجودیتها و روابط آنها در حوزه. NLP را ارائه میدهد.
برای تأیید اثربخشی SciNLP،. آزمایشهای مقایسهای را با مجموعه دادههای مشابه انجام دادیم و عملکرد مدلهای نظارت شده پیشرفته در این.
مجموعه داده. نتایج، قابلیتهای استخراج متفاوت مدلهای موجود را در متون دانشگاهی با طولهای مختلف نشان میدهد.
مقایسه متقابل با مجموعه دادههای موجود نشان میدهد که SciNLP به بهبود عملکرد قابل توجهی در. مدلهای پایه خاص دست مییابد.
با استفاده از مدلهای آموزش دیده در SciNLP،. ما ساخت خودکار یک نمودار دانش ریز دانه را برای دامنه NLP پیادهسازی کردیم.
KG ما دارای میانگین درجه گره 3. 3 در هر موجودیت است،.
که نشان دهنده اطلاعات توپولوژیکی معنایی غنی است که برنامههای کاربردی پایین دست را افزایش میدهد. مجموعه داده به صورت عمومیدر این آدرس https در دسترس است.
EMNLP 2025 اصلی محاسبات و زبان (cs. CL); کتابخانههای دیجیتال (cs.
DL)؛ بازیابی اطلاعات (cs. IR) استناد بهعنوان: (یا v4 [cs.
CL] برای این نسخه) https:. // شده توسط arXiv از طریق DataCite تاریخچه ارسال از:.
Chengzhi Zhang [مشاهده ایمیل] [v1] سه شنبه،. 9 سپتامبر 2025،.
14:. 41:.
40 UTC (515 KB) [v2] چهارشنبه،. 10 سپتامبر 2025،.
12:. 09:.
56 UTC (352 KB) [v3] شنبه،. 20 سپتامبر 2025،.
02:. 06:.
27 UTC (679 KB) [v4] جمعه،. 3 آوریل 2026،.
13:. 16:.
07 UTC (514 KB).
چرا مهم است
اهمیت این خبر در این است که روی استفاده واقعی از AI و تصمیمگیری سازمانی اثر میگذارد.
منبع
لینک منبع اصلی در کارت و صفحه مقاله نمایش داده میشود.
