Veri yönetimi konusunda çalışan profesyonellerin bir süredir gündeminde olan 2 kavram var.
Data Governance ve Data Mesh.
Çok genel hatlarıyla baktığımızda günümüzdeki veri dünyasının özellikle ülkemizdeki gündemi data warehouse, data lake ve son dönemde de data lakehouse gibi konulara odaklanmış durumda. Ya da tamamen analitik çözümlere veya raporlama ve BI çözümlerine odaklanılmış durumda.
Bu da son derece normal elbette. Özellikle iş çıktılarına dokunan ve somut fayda üreten teknolojilere yoğunlaşmak ve bu konularda çalışmalar üretmek günümüz ekonomik koşullarını düşündüğümüzde bir gereklilik haline gelmiş durumda.
Bu yazımda bahsedeceğim 2 kavram biraz daha hem anlatması hem de kabul ettirmesi zor kavramlar. Özellikle şirket yönetimlerine dolaylı faydayı anlatmak zorlayıcı olabiliyor. Gelin bu kavramları biraz daha detaylandırmaya çalışalım.
Data Governance (Veri Yönetişimi)
Daha önceki yazılarımda veri yönetişiminin öneminden ve veriden değer yaratmak istiyorsak bu prensipleri uygulamak zorunda olduğumuzdan bol bol bahsetmiştim. Burada da biraz daha özet ve somut bilgiler aktarmaya çalışacağım.
Veri Yönetişimini, veri dünyasının trafik kuralları olarak düşünebilirsiniz. Nasıl ki trafikte herkesin uyması gereken kurallar varsa, veri yönetiminde de benzer prensipler geçerli.
Bu yaklaşım şunları içeriyor:
-
• Veri tanımları ve standartları (yani kurumda herkes aynı dili konuşsun, herhangi bir kavram veya iş teriminden herkes aynı şeyi anlasın)
- • Veri kalitesi (verilerimiz bozuk ve eksik olmasın)
- • Veri güvenliği (kimsenin verileri çalmasını istemeyiz)
- • Veri sahipliği (kimin hangi veriye erişebileceği, hangi veri hakkında karar verici olduğu)
Buradaki önemli paradigma değişikliği ise verilerimiz hakkında karar vermesi gereken kişilerin artık BT değil iş birimleri olması gerektiği. BT burada alt yapının yönetiminden sorumlu olmalı. Örneğin bir ciro hesabı yaparken hangi kriterlerin göz önüne alınacağını (misal KDV dahil satış mı, e-ticaret satışları dahil mi, vb.) en iyi ilgili iş birimi verecektir. Bu nedenle bu tanımı ve sahipliğini ilgili iş birimi üstlenmeli. Bu sayede birçok iş terimimiz için bir standart oluşturmuş oluruz ve kurumumuzdaki herkes bir iş terimi için aynı şeyi anlar ve hesaplar. Böylece birden fazla ve hepsi de birbirinden farklı KPI’lara ulaşmamış oluruz.
Veri yönetişiminin en güzel yanı, herkesin aynı sayfada olmasını sağlaması. Böylece kararlar daha tutarlı ve doğru oluyor, veri kalitesi artıyor ve yasal uyum da kolaylaşıyor.
Data Mesh (Veri Ağı)
Data Mesh aslında veri yönetişiminde belli bir olgunluğa ulaşmış şirketlerce uygulanabileceği düşünülen bir kavram. Veri yönetişimini belli bir süredir uyguluyor olmak ve bunu kurum genelinde yapıyor olmak önemli. Data Mesh’in çıkış noktası biraz da Data Governance’ın yeterli olmadığı konularda bir çözüm üretebilmek.
Thoughtworks’te çalıştığı dönemlerde bu kavramı ortaya çıkartan Zhamak Dehghani’nin adını böyle bir yazıda anlamak olmaz. Agile konusunda ismi en çok bilinen kişilerden biri olan Martin Fowler’ın kendi web sitesinde ilk olarak bahsettiği bu kavram kısa zamanda ilgi ve kabul gördü diyebiliriz.
Burada çok basit bir anlatımla herkes kendi verisinden sorumlu diyebiliriz. Yazılım dünyasında micro service mimarisi nasıl bir değişim yarattıysa, data mesh de veri dünyasında benzer bir etkiyi yarattı demek mümkün.
Data Product kavramı da bu yeni konseptin kullandığı terimlerden bir tanesi. Birimler kendi verilerinden ve bunun yönetiminden sorumlu. Veriler aslında bir ürün ve şirket içinde veya dışında istenen şekilde servis edilebiliyor. Örneğin A birimi kendi verisinin her şekilde kalitesinden ve güvenliğinden sorumlu ve B birimi bu bilgilerden herhangi bir tanesini kullanmak istiyorsa da bunu bir ürün gibi tüketebiliyor. Burada A birimi elbette sunduğu veya servis ettiği veri ile ilgili bahsettiğim gibi tüm kalitesi vs. taahhüt ediyor. B birimi de bu bilgiye güvenerek istediği gibi kullanıyor.
Data Mesh, veri yönetimine dağıtık ve alan odaklı bir yaklaşım sunuyor. Geleneksel veri platformlarında, tüm veriler merkezi bir veri ambarı ya da data lake üzerinde toplanır ve veri işleme ve analitik sorumluluğu genellikle bir merkezî ekip tarafından yürütülür. Data Mesh ise bu merkeziyetçi yapının ötesine geçerek, veri sahipliğini ve yönetimini belirli üretim ekiplerine dağıtmayı hedefliyor. Bu ekipler, kendi alanlarına özgü verilerin sahibi ve sorumlusu olur.
Data Mesh’in temel prensiplerini şu şekilde özetlemek mümkün:
- • Alan Odaklı Veri Sahipliği (Domain-Driven Ownership): Veri sorumluluğu, şirketin ya da organizasyonun çeşitli iş alanlarına dağıtılır. Bu, veri ekiplerinin ilgili alanın iş ihtiyaçlarını daha iyi anlamalarını sağlar.
- • Veri Ürünü Düşüncesi (Data as a Product): Veriler, sadece ham bilgi değil, kullanıcı dostu, güvenilir ve çok amacılı ürünler olarak tasarlanır.
- • Otonom Veri Platformları: Teknolojik altyapı, her alanın bağımsız bir şekilde veri üretip yönetmesine imkan tanır.
- • Federatif Veri Yönetimi: Veri paylaşımı, kalite ve uyumluluk gibi standartlar çapraz ekipler tarafından koordineli bir şekilde yürütülür.
Data Mesh, modern veri yönetiminin en çığır açıcı yaklaşımlarından biri demekte bir sakınca yok. Veri sahipliğinin ve yönetiminin dağıtık hale gelmesi, organizasyonlara daha fazla esneklik, hız ve inovasyon imkânı sağlıyor. Ancak bu modelin başarıyla uygulanabilmesi için şirketlerin hem teknik altyapılarını hem de iş kültürlerini dönüştürmeleri gerekiyor. Data Mesh’in sunduğu potansiyeli değerlendirmek, geleceğin veri odaklı organizasyonları için kritik bir adım.
Sonuç olarak;
Verilerimiz son derece değerli. Kurumlar olarak geçen sürede bunu öğrendik, kabul ettik ve içselleştirdik. Artık bunu nasıl daha iyi yönetiriz ve bundan daha çok nasıl değer yaratabiliriz buna bakmanın zamanı geldi.
Veri odaklı bakış açısının bir kurum stratejisi olması son derece kritik. Kurumların verilerini nasıl yöneteceklerine dair bir yaklaşımlarının da olması aynı şekilde önemli. Önümüzdeki dönemde verinin önemi artmaya ve daha fazla sayıda kurumun odağı olmaya devam edecek gibi gözüküyor.