شاخص های شباهت جهانی

شاخص های شباهت جهانی

 

شاخص کاتز

این شاخص مبتنی بر مجموعه تمام مسیرها ی اثر گذار و بیانگر مجموعه ای از مسیرهای کامل و نمایی با طول معین  که نشان دهنده ی کوتاه ترین مسیربا  بیشترین وزن است.

در فرمول این شاخص β  باید کمتر از بزرگترین مقدار ویژه ماتریس A باشد زیرا برای اطمینان از همگرایی معادله این شاخص است.

شاخص LHN2))

 این شاخص یک نوع از شاخص کاتز است. بر اساس این مفهوم است که دو گره مشابه تنها همسایگان خود فقط خودشان هستند.

شاخص میانگین رفت و آمد زمان (ACT).

معرف (X، Y) که متوسط تعداد مراحل مورد نیاز توسط حرکت کننده تصادفی با شروع از گره x برای رسیدن به گره Y، متوسط زمان رفت و آمد بین x و y است .

شاخص کسینوس بر اساس+ L.

 این شاخص اندازه گیری مبتنی بر محتوای درونی است.

شاخص پیاده روی تصادفی با راه اندازی مجدد (RWR).

این شاخص یک برنامه مستقیم از الگوریتم PageRank است. وبیانگر یک واکر تصادفی با شروع از گره xکه به طور مکرر به همسایه تصادفی با احتمال C رفت و برگشت خواهد کرد که احتمال بازگشت به گره x برابر با احتمال 1 - C است.

شاخص SimRank شبیه به LHN2

وبدین گونه تعریف می شود با فرض اینکه که اگر دو گره مشابه با هم متصل به دوگره مشابه دیگر باشند.

شاخص ماتریس جنگل (MFI)

که در آن شباهت بین x و y می تواند به عنوان نسبت تعداد ماتریسهای جنگل پوشا متعلق به ریشه یک درخت ازگره x و y است  نسبت به یک عضو از ماتریس جنگل ریشه مربوط به گره x است.

شاخص مسیر محلی (LP)

 به ارائه یک راه حل مناسب و خوب از لحاظ دقت و پیچیدگی محاسباتی می پردازدویک شاخص با در نظر گرفتن راههای محلی با افق گسترده تر از CNاست .

شاخص تصادفی پیاده روی محلی (LRW)

 برای اندازه گیری شباهت بین گره x و y، واکر تصادفی در ابتدا در گره x قرار داده و در نتیجه تراکم اولیه با هر مرحله tافزایش می یابد.

شاخص تصادفی منطبق بر پیاده رویSRW))

مشابه به شاخص RWR ، که در آن واکر تصادفی است به طور مداوم از نقطه شروع اغاز می کند، و در نتیجه بالاترین شباهت برابربا  بین شباهت گره هدف و نزدیکترین گره به ان هست.

 

شاخص شباهت شمار توییت (T)

T(u) تعداد توییت‌هایی را که برای گره‌ی u در یک هفته جمع شده‌اند، اندازه‌گیری می‌کند. این شاخص، کمیت شباهت شمارش توییت‌های دو فرد را اندازه‌گیری می‌کنند، که 1 نشان دهنده‌ی شمار‌های توییت یکسان و 0 نشان دهنده‌ی شمارهای توییت غیر مشابه می‌باشد.

شاخص شباهت شادی (H)

در پژوهش قبلی امتیازهای(H)به عنوان میانگین امتیازهایHبرای کلمات تالیفی کاربران u وv  در طول هفته‌ی تجزیه و تحلیل، محاسبه شدند.

شاخص شباهت کلمه (w) 

برای یک مجموعه‌ی متشکل از 50000 کلمه‌ی به کار رفته در توییتر از 2008 تا 2011، شباهت کلمات به کار رفته توسط u و v با فاصله‌ی همینگ اصلاح شده، محاسبه می‌شود. که در آن   نشان دهنده‌ی فراوانی نرمال کاربرد کلمه‌ی nام با کاربر u می‌باشد. مقدارw(u,v) از 0 ( کاربرد کلمات غیر مشابه ) تا1(کاربرد کلمات مشابه)می‌باشد

 

 

 

نظرات 0 + ارسال نظر
امکان ثبت نظر جدید برای این مطلب وجود ندارد.