Python'da Veri Çerçevelerini Nasıl Birleştireceğinizi Öğrenin

Python'da Veri Çerçevelerini Nasıl Birleştireceğinizi Öğrenin

Python'u en basit görevler için bile kullanıyorsanız, muhtemelen üçüncü taraf kitaplıklarının öneminin farkındasınızdır. Pandas kütüphanesi, DataFrames için mükemmel desteği ile böyle bir kütüphanedir.





Birden çok dosya türünü Python DataFrame'e aktarabilir ve farklı veri kümelerini depolamak için çeşitli sürümler oluşturabilirsiniz. DataFrame'leri kullanarak verilerinizi içe aktardıktan sonra, ayrıntılı analiz yapmak için bunları birleştirebilirsiniz.





Temelleri Ele Almak

Birleştirmeye başlamadan önce, birleştirilecek DataFrames'e sahip olmanız gerekir. Geliştirme amacıyla, deneme yapmak için bazı yapay veriler oluşturabilirsiniz.





Python'da DataFrame'leri oluşturun

İlk adım olarak, Pandas kitaplığını Python dosyanıza aktarın. Pandas, Python'da DataFrame'leri işleyen bir üçüncü taraf kitaplığıdır. kullanabilirsiniz içe aktarmak kütüphaneyi kullanma ifadesi aşağıdaki gibidir:

import pandas as pd

Kod referanslarınızı kısaltmak için kitaplık adına bir takma ad atayabilirsiniz.



DataFrame'lere dönüştürebileceğiniz sözlükler oluşturmanız gerekir. En iyi sonuçlar için iki sözlük değişkeni oluşturun— dict1 ve dict2— belirli bilgi parçalarını saklamak için:

dict1 = {"user_id": ["001", "002", "003", "004", "005"], 
"FName": ["John", "Brad", "Ron", "Roald", "Chris"],
"LName": ["Harley", "Cohen", "Dahl", "Harrington", "Kerr-Hislop"]}

dict2 = {"user_id": ["001", "002", "003", "004"], "Age": [15, 28, 34, 24]}

Daha sonra DataFrame'lerinizi birleştirmek için birincil anahtar olarak hareket etmek için her iki sözlük değerinde de ortak bir öğeye sahip olmanız gerektiğini unutmayın.





Sözlüklerinizi DataFrame'lere Dönüştürün

Sözlük değerlerinizi DataFrame'lere dönüştürmek için aşağıdaki yöntemi kullanabilirsiniz:

df1 = pd.DataFrame(dict1) 
df2 = pd.DataFrame(dict2)

Bazı IDE'ler, DataFrame işlevine başvurarak ve düğmesine basarak DataFrame içindeki değerleri kontrol etmenizi sağlar. Çalıştır/Yürüt . Çok var Python uyumlu IDE'ler , böylece öğrenmesi en kolay olanı seçip seçebilirsiniz.





beni bu numaradan arayan bedava
  Jupyter Notebook kod parçacığı

DataFrame'lerinizin içeriğinden memnun kaldığınızda birleştirme adımına geçebilirsiniz.

Çerçeveleri Birleştirme İşleviyle Birleştirme

Birleştirme işlevi, iki DataFrame'i birleştirmek için kullanabileceğiniz ilk Python işlevidir. Bu işlev aşağıdaki varsayılan bağımsız değişkenleri alır:

pd.merge(DataFrame1, DataFrame2, how= type of merge)

Neresi:

  • pd Pandalar kitaplığı için bir takma addır.
  • birleştirmek DataFrames'ı birleştiren fonksiyondur.
  • Veri Çerçevesi1 ve Veri Çerçevesi2 birleştirilecek iki DataFrame'dir.
  • nasıl birleştirme türünü tanımlar.

Karmaşık bir veri yapınız olduğunda kullanabileceğiniz bazı ekstra isteğe bağlı argümanlar mevcuttur.

Gerçekleştirilecek birleştirme türünü tanımlamak için nasıl parametresi için farklı değerler kullanabilirsiniz. Bu tür birleştirmeler tanıdık gelecektir. veritabanı tablolarını birleştirmek için kullanılan SQL .

Sol Birleştirme

Sol birleştirme türü, ilk DataFrame'in değerlerini olduğu gibi tutar ve eşleşen değerleri ikinci DataFrame'den çeker.

  Jupyter Notebook kod parçacığı

Sağ Birleştirme

Doğru birleştirme türü, ikinci DataFrame'in değerlerini olduğu gibi tutar ve eşleşen değerleri ilk DataFrame'den çeker.

  Jupyter Notebook kod parçacığı

İç Birleştirme

İç birleştirme türü, her iki DataFrame'den eşleşen değerleri korur ve eşleşmeyen değerleri kaldırır.

  Jupyter Notebook kod parçacığı

Dış Birleştirme

Dış birleştirme türü, eşleşen ve eşleşmeyen tüm değerleri korur ve DataFrame'leri birlikte birleştirir.

  Jupyter Notebook kod parçacığı

Concat İşlevi Nasıl Kullanılır

bu concat function, Python'un diğer bazı birleştirme işlevlerine kıyasla esnek bir seçenektir. concat işleviyle DataFrame'leri dikey ve yatay olarak birleştirebilirsiniz.

Ancak, bu işlevi kullanmanın dezavantajı, varsayılan olarak eşleşmeyen değerleri atmasıdır. Diğer ilgili işlevler gibi, bu işlevin de birkaç argümanı vardır ve bunlardan yalnızca birkaçı başarılı bir birleştirme için gereklidir.

concat(dataframes, axis=0, join='outer'/inner)

Neresi:

  • concat DataFrame'leri birleştiren işlevdir.
  • veri çerçeveleri birleştirilecek bir DataFrame dizisidir.
  • eksen 0 yatay, 1 dikey olmak üzere birleştirme yönünü temsil eder.
  • katılmak bir dış veya iç birleşim belirtir.

Yukarıdaki iki DataFrame'i kullanarak concat işlevini aşağıdaki gibi deneyebilirsiniz:

C7D9532E6E400D036831857B2E2FD81842F4BONCUK

Yukarıdaki kodda eksen ve birleştirme argümanlarının olmaması, iki veri kümesini birleştirir. Ortaya çıkan çıktı, eşleşme durumundan bağımsız olarak tüm girişleri içerir.

Benzer şekilde, concat işlevinin yönünü ve çıktısını kontrol etmek için ek argümanlar kullanabilirsiniz.

Çıktıyı tüm eşleşen girişlerle kontrol etmek için:

# Concatenating all matching values between the two dataframes based on their columns 
df_merged_concat = pd.concat([df1, df2], axis=1, join = 'inner')

print(df_merged_concat)

Sonuç, yalnızca iki DataFrame arasındaki tüm eşleşen değerleri içerir.

  Jupyter Notebook kod parçacığı

Python ile DataFrames Birleştirme

DataFrames, esneklikleri ve işlevsellikleri göz önüne alındığında Python'un ayrılmaz bir parçasıdır. Çok yönlü kullanımları göz önüne alındığında, bunları çeşitli görevleri son derece kolay bir şekilde gerçekleştirmek için kapsamlı bir şekilde kullanabilirsiniz.

Hâlâ Python DataFrame'leri öğreniyorsanız, bazı Excel dosyalarını içe aktarmayı deneyin ve ardından bunları farklı yaklaşımlarla birleştirin.