Veri Kalitesi: Kurumsal Kültürün Bir Parçası
CerebraVeri analizi sürecinin kalitesi ve etkinliği çoğunlukla “veri kalitesi” ne bağlıdır. Bugünlerdeki verinin önemiyle ilgili aydınlanma trendi ve veri analistlerinden şirkete değer sağlamaları yönündeki yüksek beklenti, ne yazık ki doğru, tam, tutarlı, geçerli, tekil ve zamanında sağlanan veri yapısı olmadan temelsiz kalmaktadır.
Veri artık bir organizasyonun temel varlıklarından biri olarak görülmektedir. Doğru kararı vermek için doğru zamanda ve doğru veriye sahip olmak bir fayda değil, bir organizasyonun başarısının veya başarısızlığının önemli bir bileşenidir. Veri analitiği sonucunda elde edilen bilgi, maksimum rekabet avantajı elde etmek için tüm kurumlarda ödüllendirilmeli, yönetilmeli ve güçlendirilmelidir.
Bir hammadde olarak veri, üretim faktörü emsallerinden belirgin bir şekilde farklıdır. Bilgi bir “kullanım” ürünü değildir; veri analizinde klonlanabilir, taşınabilir, dönüştürülebilir ve yeniden konumlandırılabilir bir faktördür. Ancak veriler yalnızca yüksek kalitede olması durumunda kullanışlıdır. “İlk seferinde doğru olmak” ve “kullanıma uygunluk”, kalite güvence sanatını tanımlamak için kullanılan popüler ifadelerden ikisidir.
İyi kalitede verilerle desteklenerek geliştirilmiş veri analizi, bir kurumda daha iyi karar alma, hedef kitleye daha doğru ulaşma, daha etkili içerik ve pazarlama kampanyaları hazırlama, müşterilerle daha iyi ilişkiler kurma, verilerin daha kolay uygulanması, rekabet avantajı, en son ama kesinlikle daha önemsiz olmayan, daha fazla kârlılığa yol açar.
Veri kalitesinin bilgi zinciri üzerindeki etkisi, büyük ölçekli verilerin işlenmesinin ve analizinin başlangıcından beri yaygın olarak kabul edilmektedir. Ayrıca son yıllardaki büyük veri, verinin daha önce görülmemiş bir şekilde dağılması ve paylaşılmasına yol açan yüksek ulaşılabilirlik, verinin ortaya çıkmasındaki amaç ile daha sonrasındaki kullanım amaçlarının farklılaşması, verinin doğası ve kullanılmasında önemli değişikliklere yol açtı.
Veri yönetimine proaktif bir yaklaşım, veri kalitesini çeşitli kalite boyutlarında ele alır:
- Doğruluk: Veri kalitesinin en görünür ve en önemli boyutudur. Kaydedilen verinin gerçek değere uygunluğu olarak tanımlanır. Tam, %100 doğruluk elde edilemeyebilir, ancak sürekli bir gelişim süreci hataları ortadan kaldıracak, yeni veri özelliklerini tanımlayacak ve verilerin kullanım ömrü boyunca üzerinde kontrol sağlayacaktır.
- Tamlık: Beklenen kapsamlılık olarak tanımlanır. Veriler beklentileri karşıladığı sürece tamamlanmış sayılır.
- Tutarlılık: Tüm sistemlerdeki verilerin aynı bilgileri yansıttığı ve kurum genelinde birbiriyle senkronize olduğu anlamına gelir. Bir şeyin belirli bir tanımına göre yapılan iki veya daha fazla gösterimini karşılaştırırken farkın olmaması durumudur.
- Geçerlilik: Veriler, tanımlarının gerektirdiği sözdizimine (format, tür, aralık açısından) uygunsa geçerlidir.
- Tekillik: Bir şeyin tanımlandığı şeklinde birden fazla kez tanımlanamayacağı, sadece bir kere tanımlanabileceği anlamına gelir.
- Zamanlılık: Verilerin zaman içinde ve istenilen noktada gerçekliği temsil etme derecesini ifade eder.
Yukarıdaki altı boyutun tamamı tatmin edici görülse bile, veriler halen istenen amaca ulaşmada başarısız kalabilir. Ek olarak verilerin anlaşılabilirliğini, basitliğini, uygunluğunu, erişilebilirliğini ve kullanılabilirliğini doğru kesinlik düzeyinde kontrol etmemiz gerekir.
Veri kalitesini öncelikli hale getirmek, veri girişini otomatikleştirmek, yinelemeleri önlemek, sadece düzeltmekle kalmamak ve hem ana hem de meta verilere özen göstermek veri kalitesini yükseltmeye yardımcı olabilecek en iyi uygulamalar olacaktır.
Şirketler, verilerinin kalitesi etrafında bir Anahtar Performans Göstergesi (KPI) üretemezken, bazıları veri kalitesi programlarının örgütsel değeri konusunda bile ikna olamamaktadır. Şirketler, şüpheli veri kalitesine rağmen, en kritik kararlarını vermek için mevcut verilerine güvenmektedirler. Bu süreçte, veri hatalarını arama ve düzeltmeye çalışma gibi üretken olmayan işler için harcanan zaman nedeniyle, “çöp içeri, çöp dışarı” yaklaşımının maliyetli kaynakları üzerindeki etkisini fark etmeye başlamışlardır.
Birçok kuruluş “kirli verileri” temizlemek için projeler başlatmakta, ancak belirli bir standart, politika ve veri yaşam döngüsü yönetimi çerçevesinde gerçekleştirilmedikleri için, projelerin etkileri düşük kalmakta ve kötü veri kalitesinin temel nedenini çözememektedir.
Kötü veri kalitesinin nedenlerinden bazılarını şöyle sayabiliriz:
- El ile yapılan girişler, veri taşıma ve dönüşüm projeleri, kaynak sistemlerinde yapılan değişiklikler, birden fazla kullanıcının yaptığı karışık girişler, yazılım güncellemeleri, yetersiz test süresi yoluyla verilerin yaratılması veya aktarılması sırasında yaşanan hatalar,
- Ürün satılması ya da finansal bir işlemin tamamlanması ile karşılaştırıldığında veri kalitesinin “seksi bir konu” olmaması,
- İnsanların çoğunlukla işlerini halletmek için “Excel’de kendim yaparım” yaklaşımına sahip olması,
- Siloların oluşması ve veri entegrasyonuna yönelik departmansal yaklaşımlara doğru ilerlenerek her departmanın “kendi kopyasına” sahip olması,
- Verilerin katlanarak artmasına rağmen, kullanılmayan ya da fazladan duran verinin elden çıkarılmasının atlanması.
Veriler, “kuruluşunuzun hedeflerine ulaşmasına yardımcı olmak için” bulundurulur. Bu nedenle sağlam bir veri yönetim planıyla ilerlemesi gereken bir işletme varlığı olarak tanınmalıdırlar. Böyle bir planı uygulamaya başlamadan önce dikkate alınması gereken temel zorunluluklar şöyledir:
- Üst düzey yönetim katılımının sağlanması,
- Verilerin kullanıcılarının ve kullanım amaçlarının belirlenmesi,
- Meta veri yönetiminin temeli olarak bir sözlük oluşturulması,
- Ortaya çıkarılan her veri kalitesi sorunu için, bir kök neden analizi ile başlanması,
- Mevcut veriler için hedef yapı – mevcut durum farkı analizinin eksiksiz yapılması,
- Çalışanlarınızın veri analizinden faydalı bilgiler elde etme becerilerini geliştirmek,
- Verilerin artan birikimi ve artan kullanımı ile oluşan yeni çevrenin farkında olmak,
- Verileri analizde kullanmak için iş zekâsı araçlarındaki gelişmelerden haberdar olmak,
- Veri erişimini açarak, veri okuryazarlığını arttırarak, verileri iş hedefleriyle hizalayarak şirket kültürünün veri odaklı bir yaklaşıma dönüştürülmesi.
Verileri etkin bir şekilde kullanmak ve şirket genelinde veri kalitesini korumak için veri yönetimi gereklidir. En iyi modeli seçmek, doğru ekip üyelerini seçmek ve politikalara ve prosedürlere sürekli uyumu sağlamak, bir kurumun verilerini yıllarca geliştirecek etkili ve başarılı bir program oluşturmanın temelidir. Veri kalitesinin sadece bilgi teknolojileri departmanının görevi değil kurumdaki tüm katılımcıların sorumluluğu olduğu görüşünü yaymak kaçınılmaz hale gelmiştir.