مجموعه داده ها (DATA SET)ممکن است برای اشاره به داده ها در یک مجموعه ای از جداول نزدیک ومرتبط ، مربوط به یک آزمایش یا رویداد خاص مورد استفاده قرار گیرد. توضیحات زیرمربوط به یک نمونه از این نوع مجموعه داده ه ای جمع آوری شده توسطXu Feng, Jichang Zhao and، KeXua برای پیش بینی لینک در شبکه های پیچیده با در نظر گرفتن خوشه بندی است.
مطالعه شبکه های پیچیده فراگیر موجود در دنیای واقعی و تجربی نشان می دهد که بسیاری از این شبکه اکثرا از نوع "مقیاس ازاد"، (مدل بارباسی البرت) هستند که این مدل شبکه ای قابل گسترش، برای توضیح مکانیسم "قانون قدرت توزیع"، شناخته شده است .به عنوان مثال مدل BAرا در نظر بگیرید.ما از این مدل برای تولید شبکه های مصنوعی استفاده می کنیم. شبکه تولید شده توسط مدل BA را به عنوان(BA (N M در نظر می گیریم که در آن N اندازه شبکه تولید شده، m تعداد لینک هایی که با اضافه شدن گره های جدید ایجاد خواهند شد و همچنین درجه متوسط شبکه 2mاست. ما پنج شبکه را دراین DATA SET تولید میکنیم.
ما همچنین از سه شبکه پیچیده از رشته های مختلف در دنیای واقعی استفاده کرده ایم که به شرح زیر است:
شبکه دانش، شبکه ای از دانشمندان که جدیدترین تالیفات خودشان را در موضوعات مختلف باهم به اشتراک می گذارند. در این شبکه 1589 دانشمند وجود دارد و 128 نفر از آنها از شبکه جدا شده اند که ما از انها در این آزمایش استفاده نمی کنیم.
شبکه برق یک شبکه برق به خوبی نشان دهنده شبکه پیچیده است، که در آن گره ها را ژنراتورها، ترانسفورماتور ها و پستها تشکیل می دهند و لبه (لینک ها ) خطوط انتقال بین آنها است
شبکه وبلاگ سیاسی که متشکل از سیاستمداران است که در اینجا ما پیوندهای بین انها را بدون جهت در نظر می گیریم و ارتباطات بین خودشان حذف گردیده است. شرح مفصلی از این مجموعه داده ها در جدول 1 ذکر شده است.
شبکه |
| V | |
| E | |
k |
C |
fGCC
|
BA(1000,2) |
1000 |
1997 |
4 |
0.027 |
1 |
BA(1000,5) |
1000 |
4985 |
10 |
0.039 |
1 |
BA(1000,10) |
1000 |
9945 |
20 |
0.064 |
1 |
BA(2000,5) |
2000 |
9985 |
10 |
0.024 |
1 |
BA(4000,5) |
4000 |
19985 |
10 |
0.017 |
1 |
شبکه دانش |
1461 |
2742 |
3.75 |
0.878 |
0.26 |
توزیع برق |
4941 |
6594 |
2.67 |
0.107 |
1 |
وبلاگ سیاسی |
1224 |
16715 |
27.31 |
0.36 |
0.998 |
جدول 1. مجموعه داده های مصنوعی و دنیای واقعی