پروژه روش های محاسبه میزان شباهت جملات (کد پروژه 792)

تاریخ ثبت :
19 شهریور 1397
ثبت کننده :
ژيلا ترابي زاده
4.1
امتیاز
150,000 تومان

چکیده پروژه : پروژه روش های محاسبه میزان شباهت جملات (کد پروژه 792)

معیارهای تعیین شباهت بین جملات نقش مهم و روز افزونی در پژوهش های مرتبط با متن دارند؛ تعیین شباهت کاربردهای گسترده ای در حوزه هایی مانند استخراج متن، بازیابی صفحات وب ، پاسخگویی سوالات، خلاصه سازی، اصلاح پرس و جوهای جستجو، غلط یابی معنایی، مقایسه اسناد و دیگر زمینه های کاربردی در بازیابی اطلاعات دارد. معیارهای موجود برای محاسبه شباهت جملات از روش های به کاربرده شده برای اسناد متنی بزرگ اقتباس شده اند. این روش ها جملات را در فضایی با بعد بسیار بالا پردازش می کنند و در نتیجه ناکارآمد، نیازمند دخالت انسان ، و یا ناسازگار با برخی از حوزه های کاربرد هستند. تعیین شباهت جملات محدودیت ها و پیچیدگی هایی دارد و به نسبت پژوهش های کمی به طور مستقیم به موضوع تعیین شباهت میان متن های بسیار کوتاه یا جملات پرداخته اند؛ با این حال این موضوع در سال های اخیر اهمیت و جذابیت بسیاری برای پژوشگران پیدا کرده است. در بخش نظری این پروژه ، مفاهیم اصلی مرتبط با تعیین شیاهت، پیش پردازش های مورد نیاز معیارهای شباهت، روش های عمومی تعیین شباهت میان رشته ها و متون، شباهت معنایی میان کلمات و معرفی کوتاهی بر پژوهش های اخیر بر روی شباهت جملات ارایه شده است. تعدادی از این معیارها را نیز برای پیاده سازی و ارزیابی انتخاب کرده ایم.

پروژه های مشابه

توضیحات پروژه : پروژه روش های محاسبه میزان شباهت جملات (کد پروژه 792)

شباهت جمله به عنوان مبنای بسیاری از کارهای زبان طبیعی همانند بازیابی اطلاعات، دسته بندی اطلاعات، تشخیص موضوع، ردیابی موضوع، تولید پرسش، پاسخگویی سوالات، امتیازدهی مقالات، ترجمه ماشینی، خلاصه سازی متن در نظر گرفته می شود. هدف معیارهای شباهت جمله پیاده سازی یک روش اثر بخش برای محاسبه شباهت بین متون بسیار کوتاه ، معمولا به طول یک جمله است. این معیارهای محاسبه شباهت می توانند در کاربردهای مرتبط با اینترنت نیز مفید باشند. برای مثال ، در بهبود بازیابی صفحات وب، که در آن برای دستیابی به جستجوی صفحه وب دقیق تر به جای ارایه متن واقعی صفحه وب عناوین آن ارائه می شوند و با مقایسه پرس و جو و عناوین صفحات وب نتایج دقیق تری را به دست می آید. روش های سنتی برای شناسایی شباهت بین متون بلند (اسناد) بر اساس تحلیل کلمات مشترک است. چنین روش هایی زمانی کارآمد هستند که با متون بلند سر و کار داشته باشیم؛ چرا که متون بلند متشابه معمولا محتوی درجه ای از هم-رخدادی کلمات هستند. با این حال، در متون کوتاه هم-رخدادی کلمه ممکن است نادر و یا حتی تهی باشد. این مسئله عمدتا به خاطر انعطاف پذیری ذاتی زبان طبیعی است که انسان را قادر به بیان معانی مشابه با استفاده از جمله های کاملا متفاوت از نظر ساختار و محتوای کلمه می سازد. از آنجا که چنین سطحی از اطلاعات در متون کوتاه بسیار محدود است، این مسئله یک چالش محاسباتی دشوار را به وجود آورده است. از آنجا که جمله ها از کلمات تشکیل شده است؛ یافتن شباهت بین کلمات نیز بخش اساسی درتشخیص شباهت متن می باشد؛ که سپس به عنوان یک مرحله اولیه برای روش های تعیین شباهت جمله ، پاراگراف و اسناد به کار گرفته می شود. دو جمله داده می شود ، با توجه به تنوع بیان زبان طبیعی، یک روش روتین تعیین میزان شباهت موثر باید توانایی تعیین اینکه آیا جملات به صورت معنایی معادل هستند یا نه ، را دارا باشد. کلمات به دو روش می توانند شباهت داشته باشند. لغوی و معنایی. کلمات به شکل لغوی مشابهند اگر ترتیب حروف مشابهی داشته باشند. در روش معنایی کلمات مشابه هستند اگر یک وجه مشترک داشته باشند، متضاد یکدیگر باشند یا به یک شکل استفاده شوند. جمله ها داری ساختار گرامری نیز هستند ، بنابراین در مقیاس جمله ها شباهت نحوی نیز باید مورد توجه قرار گیرد، که این بر پیچیدگی معیارهای تعیین شباهت جملات می افزاید. در این پروژه به موضوع تعیین شباهت بین جمله های و روش های آن می پردازیم.
0

نظرات کاربران

امتیاز کاربران به: پروژه روش های محاسبه میزان شباهت جملات (کد پروژه 792)

4.1 از 5 ( 45 نفر ) شما هم می توانید در مورد این کالا نظر بدهید.

برای ثبت نظرات، نقد و بررسی شما لازم است ابتدا وارد حساب کاربری خود شوید. اگر این محصول را قبلا خریده باشید، نظر شما به عنوان مالک محصول ثبت خواهد شد.

مشخصات پروژه

مقطع تحصیلی :
زبان های برنامه نویسی شده :
نوع پروژه :
حجم فایل اصلی :
0.72 MB
فایل ورد دارد؟
سورس کد به صورت فایل مجزا دارد ؟
مهم ! حتما بخوانید
کد ها در داخل داکیومنت توضیح داده شده است ؟
فایل pdf دارد ؟
ژيلا ترابي زاده مدت زمان عضویت در نمره الف :۶ ماه
۶۸.۶% ۷
رضایت خرید: ۶۸.۶ % / (۷) رای
  • کاملا راضی ۲۸.۵۷ ٪
  • راضی ۲۸.۵۷ ٪
  • نظری ندارم ۱۴.۲۹ ٪
  • ناراضی ۱۴.۲۹ ٪
  • کاملا ناراضی ۱۴.۲۹ ٪
4.8
Votes : 23