Results (
Indonesian) 2:
[Copy]Copied!
Kendala utama tentang analisis jaringan sosial jaringan telekomunikasi adalah
luasnya dataset. Analisis jaringan yang terdiri dari jutaan benda yang terhubung
biasanya sangat komputasi mahal dan dapat mengambil beberapa waktu untuk melakukan [6]. Sebagai
jawaban terhadap masalah set data yang sangat besar, serta masalah terkait, de-
Pembangunan diarahkan proses paralel [7]. Contoh ini dapat ditemukan dalam
komputasi komoditas dan awan-jasa. Idenya adalah untuk membagi masalah menjadi bagian-bagian dan
biarkan beberapa mesin proses itu pada saat yang sama, secara terpisah. Solusi ini umumnya
disukai sebelum satu komputer yang kuat tunggal, mungkin dengan prosesor ganda, karena eko
nomically lebih murah. Google adalah, seperti yang sekarang, pelopor pendekatan ini dengan perangkat lunak mereka
solusi MapReduce [8] dan Pregel [9]. Namun, alternatif open-source, yang paling promi-
nently Hadoop [10], membuat jalan ke industri.
Pendekatan erent agak di? Adalah bahwa menggunakan database grafik. Alih-alih yang ketat
agar ditemukan dalam database relasional, seperti SQL, database grafik tidak memerlukan
pola yang diberikan di mana entri de didefinisikan. Contohnya adalah Neo4j [11]. Database Neo4j
terdiri dari satu set node dan hubungan, yang keduanya memiliki sifat yang berhubungan dengan mereka. Node
dan hubungan dianggap sebagai sama pentingnya, dan ini membuat traversals dari grafik
lebih cepat daripada untuk RDBMSs.
Tugas di tangan analisis jaringan sosial besar yang merupakan representasi dari salam
jaringan telekomunikasi. Pendekatan yang disebutkan di atas diuji untuk
menentukan kemampuan mereka untuk memecahkan masalah ini.
Analisis ini melibatkan mengukur pentingnya setiap pelanggan dalam jaringan.
Untuk ini, metrik diduga terkait dengan kemampuan pelanggan untuk menyebarkan informasi
dalam sebuah jaringan dihitung. Untuk melakukan hal ini memuaskan seluruh grafik harus tersedia.
Hal ini dapat menyebabkan masalah untuk grafik besar jika ukuran penyimpanan lebih besar dari ukuran
hard drive. Selain itu, pemecahan masalah secara paralel menggunakan Hadoop im- MapReduce atau
lapisan menyimpan di? Bagian erent data pada hard drive yang terpisah. Setiap proses kemudian mengakses
hanya bagian disimpan secara lokal dari data ini, sehingga hanya con ned bagian dari grafik-wakil
senting jaringan. Algoritma pintar, dengan mempertimbangkan isu-isu paralelisasi,
adalah solusi untuk ini. Dalam database grafik, seperti Neo4j, tanpa paralelisasi seluruh
grafik akan tersedia setiap saat, tetapi masalah grafik lebih besar dari ruang disk masih ada.
Menggunakan teknologi dari kerangka Hadoop dan memanfaatkan pengetahuan membentuk
bidang pembelajaran mesin , prototipe untuk mendeteksi pelanggan kepentingan tertentu
dikembangkan. Ini menggunakan panggilan Detil Records (CDR) yang dihasilkan oleh operator, untuk pengisian
tujuan, sebagai masukan. Dari mereka grafik di buat dan metrik analisis jaringan sosial
ditentukan untuk setiap pelanggan. Satu set pelatihan disediakan untuk membuat model keputusan untuk
mengklasifikasikan pelanggan.
Being translated, please wait..
