طراحی یک الگوریتم برای Voice recognition و خواندن متن از طریق کامپیوتر

**Adriaan** · چهارشنبه 27 مهر 1390, 14:20 عصر

دوستان سلام و خسته نباشید.
دوستان وارد در بحث هوش مصنوعی سوالی داشتم ، می خواستم بدونم چطوری میشه ویس ریکاگنیشنی نوشت که فرق بین کلمه ی حیات و حیاط رو در گفتار تشخیص بده؟؟؟
از طرفی، یک سوال دیگه هم داشتم، می خوام بدونم بهترین الگوریتم برای خوندن حروف فارسی از طریق کامپیوتر و اطلاعات داده شده به دیتا بیس چی هست؟
مثالی برای ملموس تر شدن ارائه می کنم.
اگر ما نیاز به یک دستگاهی داشته باشیم که بخواد نام و نام خانوادگی افراد رو به فارسی بخونه، مثلا : پایلاک پطروسیان چه روشی استفاده شه بهتره؟
ما می تونیم یه AudioDatabase ایجاد کنیم، و تمامی کلمات الفبا رو از طریق میکروفون ضبط و وارد دیتا بیس کنیم.
حالا سوال اینجاست، کلمات ترکیبی رو چطور وارد کنیم؟؟
مثال کلمه ی "پ" : باید به چندین نوع خونده بشه و تعریف بشه >> ترکیب با "ی" و "الف" علاوه بر تعریف ضمه کسره و فتحه و حتی ساکن حروف. پس حرف پ بصورت >> "پا" ، "پی" ، "پـَ " ، "پُ " "پِ "و با حالت ساکن باید قرائت شه برای همه ی کلمات همینطور تا بشه اون رو در کلمات مختلف تطبق اثر داد.
مثلا: "پا" - "ی (بصورت ساکن)" - " لا (لام بصورت ترکیبی با الف) و " ک (بصورت ساکن)"
و کلمه ای چون پدرامی : "پــِ" - "د (بصورت ساکن)" - "را" ("ر" بصورت ترکیبی با الف) - می (بصورت ترکیبی با ی)

الگوریتم بهتری هست؟ یا این الگوریتم بهترینه؟ این مشکلاتی هم داره، تعداد حروف برای خوندن بالا میره.
تقریبا هر حرف باید به 4 نوع خونده شه 32*6 = تقریبا 192 مدل ، کمی کار سخت میشه درسته؟
البته "ز" - "ظ" - "ذ" - "ض" یک نوع هستند در قرائت و همچنین "هـ" - "ح" و "ث"-"ص"-"س" هم یک نوع خونده میشن که الگوریتم هر دسته ی اینا رو یکی حساب میکنیم و حاصل میشه 156 حالت، که اگه ، "عا" رو هم جز "آ" محسوب کنیم و "قا " رو جز "غا" کمی سبک تر میشه، اما می خوام بدونم روش بهتری هست؟

نام تاپیک: طراحی یک الگوریتم برای Voice recognition و خواندن متن از طریق کامپیوتر

ابزار های تاپیک

نمایش

Threaded View

طراحی یک الگوریتم برای Voice recognition و خواندن متن از طریق کامپیوتر

قوانین ایجاد تاپیک در تالار