Pandas
Gezinti kısmına atla
Arama kısmına atla
pandas, Python programlama dili için geliştirilmiş açık kaynaklı bir veri analizi ve veri işleme kütüphanesidir. Tablo benzeri (DataFrame) ve seri benzeri (Series) veri yapıları sağlar. Veri biliminde, finansal analizlerde, istatistiksel modellemede ve makine öğrenmesi uygulamalarında yaygın olarak kullanılır.
Özellikler
- Hızlı ve esnek DataFrame veri yapısı
- CSV, Excel, SQL, JSON gibi birçok formatı okuma/yazma desteği
- İleri düzey indeksleme ve dilimleme
- Eksik veri işleme (NaN değerleri doldurma, temizleme)
- Zaman serisi analiz desteği
- NumPy ile uyumlu çalışma
Temel Veri Yapıları
Series
Tek boyutlu, etiketlenmiş veri yapısıdır.
import pandas as pd
s = pd.Series([10, 20, 30], index=["a", "b", "c"])
print(s)
DataFrame
İki boyutlu tablo benzeri veri yapısıdır.
import pandas as pd
data = {
"Ad": ["Ali", "Ayşe", "Mehmet"],
"Yaş": [25, 30, 35],
"Şehir": ["Ankara", "İstanbul", "İzmir"]
}
df = pd.DataFrame(data)
print(df)
Veri Okuma / Yazma
pandas, birçok formatı destekler:
# CSV dosyası okuma
df = pd.read_csv("veri.csv")
# Excel dosyası okuma
df = pd.read_excel("veri.xlsx")
# SQL sorgusu ile veri çekme
import sqlite3
con = sqlite3.connect("veritabani.db")
df = pd.read_sql_query("SELECT * FROM tablo", con)
Kullanım Alanları
- Veri temizleme ve dönüştürme
- İstatistiksel analiz
- Finansal veri işleme
- Makine öğrenmesi için veri hazırlama
- Zaman serisi analizi