TL;DR
- چکیده:.
- صدای فضایی برای تجربههای ویدیویی 360 درجه بسیار مهم است،.
- با این حال اکثر ویدیوهای 360 درجه به دلیل دشواری ضبط صدای فضایی در حین ضبط،.
چه اتفاقی افتاد
چکیده:. صدای فضایی برای تجربههای ویدیویی 360 درجه بسیار مهم است،.
با این حال اکثر ویدیوهای 360 درجه به دلیل دشواری ضبط صدای فضایی در حین ضبط،. فاقد آن هستند.
بنابراین تولید خودکار صدای فضایی مانند آمبیسونیک مرتبه اول (FOA) از ویدیو یک مشکل مهم اما چالش برانگیز. باقی مانده است.
در صحنههای پیچیده،. درک صدا نه تنها به مکان منبع صدا بلکه به هندسه صحنه،.
مواد و تعاملات دینامیکی با محیط نیز بستگی دارد. با این حال،.
رویکردهای موجود تنها به نشانههای بصری متکی هستند و در مدلسازی منابع پویا و جلوههای صوتی مانند انسداد،. بازتابها و طنین ناکام هستند.
برای پرداختن به این چالشها،. ما DynFOA را پیشنهاد میکنیم،.
یک چارچوب مولد که FOA را از ویدیوهای 360 درجه با ادغام بازسازی صحنه پویا با مدلسازی انتشار. شرطی ترکیب میکند.
DynFOA ورودی را تجزیه و تحلیل میکند ویدئو برای شناسایی و بومیسازی منابع صوتی پویا،. تخمین عمق و معناشناسی،.
و بازسازی هندسه صحنه و مواد با استفاده از 3D Splatting گاوسی (3DGS). بازنمایی صحنه بازسازیشده ویژگیهای زمیندار فیزیکی را فراهم میکند که تعاملات صوتی بین منابع،.
محیط و دیدگاه شنونده را ثبت میکند. مشروط بر این ویژگیها، یک مدل انتشار صدای فضایی سازگار با دینامیک صحنه و زمینه صوتی تولید میکند.
ما M2G-360 را معرفی میکنیم،. مجموعه دادهای از 600 کلیپ دنیای واقعی که به زیرمجموعههای MoveSources،.
Multi-Source و Geometry برای ارزیابی استحکام در شرایط مختلف تقسیم میشوند. آزمایشها نشان میدهند که DynFOA بهطور مداوم از روشهای موجود در دقت فضایی،.
وفاداری صوتی،. تطبیق توزیع و تجربه غوطهوری درک شده بهتر عمل میکند.
توجه مدیر arXiv: همپوشانی متن با صدا (cs. SD) استناد بهعنوان: (یا v1 [cs.
SD] برای این نسخه) https:. // شده توسط arXiv از طریق DataCite (در انتظار ثبت نام) تاریخچه ارسال از:.
Ziyu Luo [مشاهده ایمیل] [v1] جمعه،. 3 آوریل 2026،.
06:. 46:.
57 UTC (10,. 129 KB).
چرا مهم است
اهمیت این خبر در این است که روی استفاده واقعی از AI و تصمیمگیری سازمانی اثر میگذارد.
منبع
لینک منبع اصلی در کارت و صفحه مقاله نمایش داده میشود.
