سلام
یه الگوریتم پردازش سیگنال دارم که داخلش از FFT استفاده شده ...

الگوریتم در یک ماژول یا همون کلاس پیاده سازی شده و قابلیت موازی شدن داره بطوریکه میشه n تا Instance از اون ساخت و بطور موازی اجرا کرد ... خب تا اینجا پياده سازي تو CPU انجام شده.

با همین رویکرد میخوام یه تابع Kernel بنویسم و اون n تا ماژول رو به اون بدم ... اما به یه مشکلی خوردم ...

بعد از یه مقدار Search و بررسی یه سری نمونه پروژه، متوجه شدم که ظاهرا ماژول محاسبه FFT تو Cuda فقط در سمت Host قابل اجراست و داخل Device و به تبع اون داخل تابع Kernel نمیشه از اون استفاده کرد!

این مساله با الگوریتم مورد نظر، نمیخونه ! که قراره به دفعات FFT بگیره و از نتایجش استفاده کنه.

حالا سوال اینه که وجود کتابخونه CuFFT تو Cuda وقتی قرار نیست تو Kernel ازش استفاده بشه، چه لزومی داشت!!!

اگه راه حلی پیدا نشه، شاید باید الگوریتم تغییر کنه که اون وقت شاید دیگه نشه به اون صورت موازیش کرد.

ممنون از توجه شما