Python ile Veri Görselleştirme: Matplotlib ve Seaborn Kullanımı

Python ile Veri Görselleştirme Matplotlib ve Seaborn Kullanımı.webp

Veri bilimi ve makine öğrenimi dünyasında verilerin sadece sayısal tablolar halinde değil, görsel olarak da ifade edilmesi büyük önem taşır. Görselleştirme, karmaşık veri setlerini daha anlaşılır kılar, eğilimleri ve ilişkileri ortaya çıkarır, ayrıca sonuçların daha etkili şekilde sunulmasına imkân verir. Python ekosistemi bu konuda oldukça zengindir. Özellikle Matplotlib ve Seaborn kütüphaneleri, veri görselleştirmede en çok tercih edilen iki güçlü araçtır. Bu yazıda, her iki kütüphaneyi tanıyacak, kullanım alanlarını görecek ve örneklerle nasıl daha etkili grafikler üretebileceğimizi inceleyeceğiz.

Matplotlib Nedir?
indir (1).webp

Matplotlib, Python için en eski ve en kapsamlı 2D veri görselleştirme kütüphanesidir. İlk olarak bilimsel hesaplamalarda kullanılmak üzere geliştirilmiştir. Çizgi grafiklerden çubuk grafiklere, histogramlardan saçılım grafiklerine kadar çok çeşitli görselleştirme imkânı sunar. Matplotlib’in en büyük avantajı, esneklik sağlamasıdır. Her bir grafik öğesini (başlık, eksen isimleri, renkler, işaretçiler) detaylıca özelleştirebilirsiniz.


Basit Bir Matplotlib Örneği:

import matplotlib.pyplot as plt

x = [1, 2, 3, 4, 5]
y = [2, 4, 6, 8, 10]

plt.plot(x, y, marker="o", color="b", linestyle="--")
plt.title("Basit Çizgi Grafiği")
plt.xlabel("X Ekseni")
plt.ylabel("Y Ekseni")
plt.show()


Bu örnekte, plot() fonksiyonu kullanılarak bir çizgi grafiği çizilmiştir. Renk, işaretçi tipi ve çizgi stili tamamen özelleştirilebilir.

Seaborn Nedir?​

indir.webp
Seaborn, Matplotlib üzerine inşa edilmiş daha modern ve yüksek seviyeli bir görselleştirme kütüphanesidir. İstatistiksel görselleştirme üzerine odaklanmıştır. Özellikle pandas DataFrame yapıları ile uyumlu çalışması, veri analistleri için büyük kolaylık sağlar. Seaborn, yalnızca daha şık grafikler üretmekle kalmaz, aynı zamanda istatistiksel analizleri de görselleştirir. Örneğin dağılım grafikleri, regresyon çizgileri, ısı haritaları ve kutu grafikleri gibi istatistiksel grafikler tek bir komutla kolayca oluşturulabilir.

Basit Bir Seaborn Örneği:
import seaborn as sns
import matplotlib.pyplot as plt

tips = sns.load_dataset("tips")
sns.scatterplot(data=tips, x="total_bill", y="tip", hue="sex")
plt.title("Toplam Hesap ve Bahşiş İlişkisi")
plt.show()


Bu örnekte Seaborn’un hazır veri setlerinden tips kullanılmış ve toplam hesap ile bahşiş arasındaki ilişki görselleştirilmiştir. hue parametresi sayesinde veriler cinsiyete göre renklendirilmiştir.

Matplotlib ve Seaborn Karşılaştırması​

  • Matplotlib, düşük seviyeli kontrol sağlar. Her ayrıntıyı özelleştirebilir, grafik üzerinde tam hâkimiyet kurabilirsiniz.
  • Seaborn, daha yüksek seviyeli bir soyutlama sunar. Varsayılan stilleri modern ve estetiktir. Daha az kodla daha güzel grafikler elde edebilirsiniz.
  • Matplotlib, temel görselleştirme için idealdir.
  • Seaborn, özellikle istatistiksel analizlerde güçlüdür.

Kısacası, Matplotlib temel taş iken Seaborn onun üzerine kurulmuş, işleri kolaylaştıran bir eklenti gibidir.


Veri Analizinde Kullanım Örnekleri​

  1. Çizgi Grafikler: Zaman serisi verilerinde eğilimleri görmek için kullanılır.
  2. Histogramlar: Veri dağılımını anlamada yardımcıdır.
  3. Kutu Grafikler (Boxplot): Verilerin dağılımı, medyanı ve aykırı değerlerini incelemek için idealdir.
  4. Isı Haritaları (Heatmap): Korelasyon matrislerini görselleştirmede oldukça yaygındır.
  5. Dağılım Grafikler (Scatterplot): İki değişken arasındaki ilişkiyi görmeye yarar.

Seaborn sayesinde bu grafikler birkaç satır kod ile oluşturulabilir.

Veri görselleştirme, yalnızca estetik bir sunum aracı değil, aynı zamanda veri analiz sürecinin ayrılmaz bir parçasıdır. Python’da Matplotlib, temel ve kapsamlı görselleştirme imkânları sunarken, Seaborn daha istatistiksel ve görsel açıdan tatmin edici grafikler oluşturmayı kolaylaştırır. İki kütüphane birlikte kullanıldığında hem esneklik hem de şıklık elde edilir.

Veri biliminde güçlü bir görselleştirme becerisi kazanmak isteyen herkes, Matplotlib’in detaylarını öğrenmeli ve Seaborn’un sunduğu kolaylıklardan faydalanmalıdır. Böylece, karmaşık veri setleri daha anlaşılır hale gelir ve elde edilen sonuçlar çok daha etkili şekilde aktarılabilir.