نمایش نتایج 1 تا 15 از 15

نام تاپیک: سیستم جستجوی متون فارسی مستقل از حجم

  1. #1

    سیستم جستجوی متون فارسی مستقل از حجم

    با سلام / جستجو در متون فارسی آن هم مستقل از هم یکی از مواردی هست که کمتر به آنها به طور تخصصی پرداخته شده و عموم دوستان توی این مورد کمتر تجربه مفید دارن / چند سالی هست که دنبال آماده سازی سامانه جستجوگر برای متون فارسی که مستقل از حجم عمل کنه هستم / از دوستانی که میخوان همراهی کنن و یا اینکه ما رو در این مسیر راهنمایی و .... کنند میخام که موافقت خودشون اعلام کنن

    همین.

    با تشکر / فواد

  2. #2
    فواد جان ممکنه در مورد کاری که قصدش رو داری کمی شرح بدی..

  3. #3

    جستجوی مستقل از حجم در متون فارسی

    با سلام

    راستش با اینکه برنامه نویس حرفه ای زیاد داریم ولی یه سری موضوعات هست که هنوز کسی توش به صورت کامل و جامع کار نکرده / من خودم نزدیک 2 سال هست که از مدعیان مختلف عرصه نرم افزار درباره جستجو در متون سنگین سوال کرده ام ولی کسی نبوده که روش کامل و بی نقصی و بهینه ای داشته باشه که تمام نیازهای یه سیستم جستجو رو شامل باشه

    مثال جستجوی سریع / کلمات مشابه / همخانواده / هم معنی / مستقل از حجم / مستقل از اعراب / فیلتر کردن / دامنه جستجو / ترکیبهای مختلف/ عطفی / فصلی / نفی و ....

    همین / فواد

  4. #4
    دوست عزیزم،
    Full Text Search در SQL Server قابلیتهای زیادی در جستجو بروی متون انگلیسی داره و این اجازه رو به شما میده که FTS رو برای زبان دلخواه خودتون Customize کنین. مثلا ترکیبات مختلف برای زبان انگلیسی در ابتدا در FTS قرار داده شده اما برای زبان فارسی نه. لذا اگر روی Customize کردن FTS وقت بزارید، ارزش بیشتری داره.
    از طرفی، صرفا انجام جستجو مهم نیست، بلکه سرعت اون بسیار حائز اهمیته. فکر نمیکنم قصد داشته باشید یک Search Engine بنویسید که از FTS سریعتر باشه!! چون قطعا امکان پذیر نیست. پس تلاش برای افزایش امکانات FTS روی زبان فارسی از هر حیث بهتره. اگر در این زمینه کمکی از دستم ساخته باشه حتما در خدمتم.
    موفق باشید

  5. #5
    با سلام و تشکر / من هم دقیقا همین مسئله مد نظرم بود / یعنی برای زبان مظلوم فارسی یه کاری کنیم وگرنه برای زبونای فرنگی که مشکلی نیست / با این حال از شما و دیگر دوستان علاقه مند میخام که اعلام آمادگی کنند / با تشکر

  6. #6
    بنیان گذار Barnamenevis آواتار مهدی کرامتی
    تاریخ عضویت
    اسفند 1381
    محل زندگی
    کرج، گلشهر
    سن
    46
    پست
    6,379
    FTS رو چطور میشه برای زبان فارسی Customize کرد؟

  7. #7
    کاربر دائمی
    تاریخ عضویت
    بهمن 1382
    محل زندگی
    فعلا ایران - فعلا تهران
    پست
    2,628
    آیا SQL Server این FTS رو در اختیار کاربر قرار میده ؟ چطوری و آیا این سیستم رو در نسخه جدیدش هم در اختیار داریم؟

  8. #8
    سرویس FTS منحصر به SQL Server نیست و در حقیقت SQL Server یکی از نرم افزارهایی هستش که از اون استفاده میکنه.
    برای Customize کردن، شاید این لینکها نقطه خوبی برای شروع باشند اگر چه شخصا روی این موضوع کار نکردم:
    http://msdn.microsoft.com/library/de...asp?frame=true

    http://www.microsoft.com/middleeast/...v/beta/search/

    http://msdn.microsoft.com/library/de...bicsupport.asp
    آخرین ویرایش به وسیله AminSobati : دوشنبه 27 تیر 1384 در 10:37 صبح

  9. #9
    سرویس FTS منحصر به SQL Server نیست و در حقیقت SQL Server یکی از نرم افزارهایی هستش که از اون استفاده میکنه
    یعنی FTS از Indexing Service استفاده می کنه ؟ (عطف به لینک اول شما) یا اصلا این دو تا به هم مربوط هستند ؟
    (سوالم جنبه استفهام انکاری نداره)
    آخرین ویرایش به وسیله titbasoft : دوشنبه 27 تیر 1384 در 13:18 عصر
    هر که بر مرکب باطل نشیند ، در سراى پیشمانى فرودش مى‏آورند

  10. #10
    بله هاشم جان، Full-Text Indexing همچنین به Exchange Server هم سرویس میده..
    آخرین ویرایش به وسیله AminSobati : دوشنبه 27 تیر 1384 در 20:58 عصر

  11. #11
    البته خودتون هم می تونید همچین سرویس طراحی کنید (بستگی به زبان برنامه نویسی اتان دارد)
    من قدیم ها (حدود 5 سال پیش) الگوریتمی مشابه سرویس fts که از قابلیت indexing استفاده می کرد برنامه نرم افزاری در محیط داس طراحی کردم که کارش سرچ بر روی اطلاعات مختلف (فیش، متن و...) بود و دارای سرعت بالایی بود
    نرم افزار به سفارش یکی از مراکز حوزوی قم بود که حدود 580 مگابایت اطلاعات را بصورت نرم افزار معجم می خواستند با قابلیت های جستجوی ساده، ترکیبی، همخانواده ها، مستقل از اعراب ، جستجوی نقیض و تعیین دامنه بر روی متون قابل سرچ و ... و در نهایت خوب بود (سرعت جستجو در تک کلمه ها بدون معطلی (صفر ثانیه) و در جستجو های ترکیبی (and or xor , ...) بستگی به تعداد کلمات عبارت جستجو بین 3 تا 10 ثانیه (بر روی یک سیستم پنتیوم 2 ) بود
    و همه این قابلیت ها مدیون کار indexing (لیست گیری کلمات بصورت غیرتکراری) و ایجاد عملیات کدینگ بر روی متن و ذخیره آن بصورت فشرده و انجام عملیات جستجو بر روی آنها بود (خروجی متون حدود 60مگابایت بود)

  12. #12
    من خیلی صاحب نظر نیستم ولی صاحب نظرها میگن : buy it don't build it
    دلایلش هم پر واضحه
    تازه ما که پول هم لازم نیست بدیم.

    در ضمن جناب ثباتی برای من که الان درگیر یک کار جستجوی متن هستم ، اونهم از نوع فارسی ، مقاله های بسیار جالبی بود. هنوز فرصت نکردم بجر تاپیک هاش چیز دیگه ای رو مطالعه کنم ولی حتما خیلی کمکم خواهد کرد. از لطفتون ممنونم.
    هر که بر مرکب باطل نشیند ، در سراى پیشمانى فرودش مى‏آورند

  13. #13
    آخر بحث چی شد
    جستجو بدون در نظر گرفتن اعراب چگونه است؟

  14. #14
    توی 2000 فقط در نظر گرفتن 2 نسخه از متن.

  15. #15
    ایجاد یک تابع برای ایجاد لیست غیر تکراری کلمات و ساختن کلمات بدون اعراب آنها و
    استفاده از آن در جستجو بهتر است

قوانین ایجاد تاپیک در تالار

  • شما نمی توانید تاپیک جدید ایجاد کنید
  • شما نمی توانید به تاپیک ها پاسخ دهید
  • شما نمی توانید ضمیمه ارسال کنید
  • شما نمی توانید پاسخ هایتان را ویرایش کنید
  •