Sosyal Ağ (Graph) Analizi ile Covid 19 Virüsünün Hızlı Yayılımının Analizi

Oluşturma Tarihi : 09.05.2020

Tüm dünyayı derinden etkileyen Covid 19 salgını, verilerin, veriyle konuşma ve analitiğin önemini bir kere daha ortaya koydu. Bazı ülkeler salgınla ilgili açıkladıkları verilerle araştırmacılara zengin kaynak sunuyor.

Tüm dünyayı derinden etkileyen Covid 19 salgını, verilerin, veriyle konuşma ve analitiğin önemini bir kere daha ortaya koydu. Bazı ülkeler salgınla ilgili açıkladıkları verilerle araştırmacılara zengin kaynak sunuyor. Bu açık veriler hastalığı hem daha iyi anlamamıza hem de sahada çalışan sağlık çalışanlarına destek olabilecek yeni çıkarımlar ve öngörüler yapmamızı mümkün kılıyor.

Pek çok ülkede Covid 19 salgını ve alınan önlemler devam ediyor. Salgınla ilgili internette yayımlanan veriler küçük, parçalı, belirli bir sistematikten yoksun. Bu nedenle genellemeler ve büyük çıkarımlar yapmak oldukça tehlikeli olsa da hastalığı anlamamıza destek olacak belli öngörüleri de içinde barındırıyor. Önümüzdeki 10 yıllar boyunca, salgın araştırmaları çok sayıda bilimsel disiplinin kritik gündemi olacak ve bu konuda binlerce bilimsel araştırma yapılarak, şu an farkında olmadığımız çok sayıda bulgu bilimsel yöntemlerle ortaya konulacak. Ancak yine de bu esnada veriyle uğraşan kişiler olarak, kamuya açılan verileri analiz ederek spesifik örneklerde ne olup bittiğini anlamak, önümüzü görebilmek için küçük de olsa ışıklar yakmak mümkün.

Veri ve Yaklaşım Yukarıdaki perspektifle, Korea Centers for Disease Control & Prevention (KCDC) kurumu tarafından Kaggle’de paylaşılan (1) açık Covid 19 salgın verilerini sosyal ağ analizi metotlarıyla analiz ettik ve aşağıda özetlediğimiz sonuçları ortaya çıkardık. Bu analizde ağırlıklı olarak Doç Dr. Mehmet Gençer tarafından yazılan “Sosyal Ağ Analizi: Ağ Kuramları ve Uygulamaları” kitabındaki yöntem ve yaklaşımlar kullanılmıştır.

Sosyal Ağ Analizi Nedir? Sosyal ağ analizi, sosyal yapıları, yapı bileşenleri ve onların arasındaki ilişkilerin ağ analiz metotlarıyla analiz edilmesi olarak tanımlanabilir.

Şekil 1 3 düğümlü (A-B-C) ve 2 çizgeli (AC, AB) basit bir ağ

Sosyal ağ analizinde, bileşenler birer düğüm (node), aralarındaki ilişkiler ise birer çizge (edge) olarak temsil edilir. Çizgeler tek ya da çift yönlü olduğu gibi farklı ağırlıklarda da olabilirler. Düğümler ve çizgelerin görselleştirilmesi yoluyla bir ağ edilir ve merkezilik, geçişkenlik, modularite gibi metriklerin hesaplanması yoluyla da ağın dinamikleri ortaya çıkartılır.

Kore Salgın Verileri üzerine Sosyal Ağ Yaklaşımı Covid 19 salgınıyla ilgili en detay açık veri sağlayan ülkelerden bir Güney Kore oldu. Kore Hastalık Kontrol ve Önleme Merkezi (KCDC) tarafından Kaggle’da yayımlanan veriler sınırlı da olsa Covid hastalarının hastalığı kimden aldıklarını ve hastalığın hızla kişiden kişiye nasıl yayıldığına dair önemli bilgileri içeriyor. Veri seti üzerinde yaptığımız ön analizlere göre veri seti içerisinde detaylı bilgileri yayımlanan 3389 hastanın 822’sine (%24) hastalığın kimden bulaştığı tespit edilmiş. Kişileri birer düğüm, virüs bulaştırma eylemini de bir çizge olarak ele alarak, bu veriyi açık kaynak kodlu sosyal ağ analiz aracı Gephi’de görselleştirdik ve analiz ettik. Örneğin veri setinin küçük bir kesiti üzerinde şekil 2’deki gibi bunu görsel olarak ifade etmek istersek; 1 No’lu kişi, virüsü 2-3-4 ve 5 No’lu kişilere bulaştırmış 5 No’lu kişi 6 No’lu kişiye 6 No’lu kişi de 7 No’lu kişiye bulaştırmış.

Şekil 2 Kore salgın sosyal ağ gösteriminden bir kesit

Bu mantıkla tüm Kore salgın sosyal ağ verisi force-directed ağ çizim algoritmaları kullanılarak şekil 3’deki gibi görselleştirilmiştir.

Şekil 3 Kore Covid salgın sosyal ağı

Ağdaki her düğüm bir kişiyi Bağlantısız her bir küme bir kişi etrafındaki enfekte hastaları Düğümlerin büyüklükleri, kişilerin virüs bulaştırma sayılarına bakarak etkisini Düğümlerin renkleri de ağdaki alt hub’ları temsil etmektedir.

Şimdi bu gösterimden çıkan bazı ilginç noktaları vurgulayalım:

Kore verisinde en yoğun kümeye bakacak olursak sadece bir kişinin izolasyonu ile vakaların %6’sını engellemek mümkün olabilirdi;

Şekil 4 En fazla bulaştıran kişinin hub’ı

En fazla yayılıma sahip kişinin (B kişisi) bulunduğu hub toplamda 67 hastadan oluşmaktadır. Ağ detaylı incelendiğinde görülebileceği gibi, A kişisi 6 kişiye virüs bulaştırmıştır. Bunlardan 4’ü hiç kimseye bulaştırmamış 1’i 1 kişiye virüs bulaştırmıştır. Ancak bulaştırdığı kişilerden biri olan B kişisi ne yazık ki hastalığın 51 kişiye yayılmasına neden olmuştur. Yani, A kişisinin izole edildiği bir durumda, sadece onun direkt virüs bulaştırdığı 6 kişi değil, aynı zamanda dolaylı olarak virüs bulaşmasına neden olunan 51 kişi ve hatta onların da yaydığı toplamda 67 kişiye virüsün bulaşması engellenebilecekti. Elimizdeki veri kısıtlı da olsa, bir kişinin izolasyonunun sadece o kişinin bağlantıda olduğu yakınları için değil aynı zamanda çok daha geniş bir kümedeki insanlar için de önem taşıyacağını net bir şekilde gösteriyor.

Hastaların%64’ü kimseye virüs bulaştırmadığı halde, ortalama bulaştırma sayısı 1’e yakındır (0.78) İncelediğimiz veri Covid 19 virüsünün yayılma riskinin çok yüksek olduğuna dair salgın uzmanlarından gelen yorumları desteklemektedir.

Tablo 1 Kore örneğinde bulaştırma değerleri

Tablo 1’de görülebileceği gibi Kore örneğindeki hastaların %64’ü kimseye virüs bulaştırmadığı halde, bir kişi ortalamada 0.78 kişiye bulaştırmıştır. Hiç kimseye virüsü bulaştırmayanları çıkardığımızda, ortalama virüsün bulaştırıldığı kişi sayısı 2.22’ye yükselmektedir. Virüsün yayılımı açısından kaç kişiye bulaştırdığınız kadar, sosyal ağ içerisindeki yeriniz (merkeziliğiniz) de kritiktir. Şekil 5’de benzer sayıda kişi sayısına sahip 2 tane alt segmenti görebilirsiniz. Yeşil kümede 37 kişi, turuncu kümede ise 41 kişi yer alıyor. Virüsün yayılımı açısından sadece bulaştırılan kişi sayısına bakıldığında turuncu kümedeki A kişisinin son derece kritik olduğu gözükmektedir. Bu kişi virüsü tek başına 27 kişiye bulaştırmıştır. Ancak sosyal ağ gözüyle baktığımızda yeşil kümedeki B-C-D-E kişilerinin de salgının yayılmasına kilit rolde olduğunu görebiliriz. A kişisine kıyasla çok daha az sayıda kişiye virüs bulaştırmış olmalarına rağmen toplamda yayılım etkileri benzer bir sonuç yaratmıştır.

Şekil 5 Bulaştırma sayısına ölçeklendirilmiş benzer kişi sayısına sahip 2 küme

Bu nedenle virüsün yayılımı açısından çok sayıda kişiye bulaştırma derecesi önemli olduğu kadar, kişilerin farklı gruplar arasındaki köprülük, merkezilik dereceleri de kritik önem taşımaktadır. Sosyal ağ analizinde kişilerin merkeziliğini ölçmek için çok sayıda metrik geliştirilmiştir. Bunlardan bir tanesi olan eccentricity merkezilik değeri hesaplanıp düğümler bu değere göre ölçeklendirilirse, yeşil kümedeki B-C-D-E düğümlerinin salgının yayılımı açısından kritik rol taşıdıkları gözlemlenebilmektedir.

Şekil 6 Eccentricity merkezilik değerine göre ölçeklendirilmiş kümeler

Sonuç: Kesin tedavi bulununcaya kadar Covid 19 ve salgın gerçeğiyle yaşamayı öğrenmek zorundayız. Bu nedenle virüs yayılım dinamiklerini anlamak, alacağımız önlemlerin daha rasyonel ve toplum nezdinde daha ikna edici olması için kritik. Bunun için de sosyal ağ analizinin oldukça güçlü bir metodolojik yaklaşım sunduğunu düşünüyoruz.
Son derece dar kapsamlı ve ufak bir örnek verinin bile, salgın dinamiklerini daha iyi anlamak için bize önemli fırsatlar sunduğunu gördük. Ülkelerin sağlık kurumları tarafından paylaşılan verilerin miktarı ve uzun vadeli saha çalışmaları arttıkça, daha genellenebilir çıkarımlar yapmak mümkün olacaktır. Hastalığın teşhisi ne kadar önemliyse teşhis sonrası yapılacak çalışmalar da bir o kadar önemlidir. Sağlık Bakanlığı’nın açıklamalarında son zamanlarda adını çok duyduğumuz “Filyasyon” isimli özel saha ekipleri; tam da bu alanda çalışan, hastanın tüm temas noktalarını araştıran ve hasta yayılım hub’larını izole etmeye çalışan ekiplerdir. Sosyal Ağ Analizi (SNA) yöntemiyle açık bir veri üzerinde yaptığımız bu çalışma hem bakanlık tarafından uygulanan Filyasyon’un önemini, hem de veriye dayalı analiz ve analitikle bu çalışmaların desteklenmesi gerektiğini göstermektedir.

Özgür AkarsuKoçDigital

Sosyal Ağ (Graph) Analizi ile Covid 19 Virüsünün Hızlı Yayılımının Analizi

Oluşturma Tarihi : 09.05.2020

Sizi arayabilmemiz için iletişim bilgilerinizi bırakabilirsiniz.

KoçDigital'in kurumlara değer yaratan çözümleri ile tanışın!

Şirketimize ileteceğiniz her türlü talep, şikayet ve önerilerin değerlendirilmesi ve sonuçlandırılması ile izin vermiş olmanız halinde tarafınıza ticari elektronik ileti gönderilmesi amacıyla kişisel verilerinizin işlenmesine yönelik detaylı bilgilere Müşteri Aydınlatma Metni üzerinden erişebilirsiniz. Bize iletmiş olduğunuz talep veya şikayetinizde aşağıda sıralanan özel nitelikli kişisel verilerin yer almadığından emin olmanızı rica ederiz: ırk, etnik köken, siyasi düşünce, felsefi inanç, kılık ve kıyafet, dernek, vakıf ya da sendika üyeliği, sağlık, cinsel hayata ilişkin veriler, ceza mahkûmiyeti ve güvenlik tedbirleriyle ilgili veriler, biyometrik ve genetik veriler.

×