Featured image of post Pandas Column Renaming Made Easy: Methods and Best Practices

Pandas Column Renaming Made Easy: Methods and Best Practices

Bu kılavuzu Panda'larda sütunları nasıl isimlendireceğinizi anlamak için keşfedin. Ayrıca, sütunları adlandırmak için en iyi uygulamaları ve kongreleri kontrol edin.

Bu makale, Panda’larda sütunları nasıl yeniden adlandırmak için bir kılavuzdur.

Pandas, veri setleriyle uğraşmak için bir Python kütüphanesidir. Veriler farklı dosya formatlarından kolayca okur Kataloğu JSON ve SQL. Veriler Pandalara yüklenirken, bir DataFrame nesnesinde depolanır.

Bir DataFrame iki boyutlu bir nesnedir, yani veriler satırlar ve sütunlar ile masa gibi bir formatta depolanır. Bu, API’de verileri depolamak veya tablo dosyaları yaymak gibidir. Veriler yüklerken, pandalar veri set kaynağı dosyasından sütun isimlerini almaya çalışacak.

columns

Ancak, yüklenen sütun isimleri ideal olmayabilir ve sütunları daha anlamlı bir şeye dönüştürmek isteyebilirsiniz.

Bu makalede ilk olarak Pandas sütunları adlandırmak için en iyi uygulamaları tartışacağız. Daha sonra, ana konuya gideceğiz, bu da onları yeniden adlandırmanın yöntemleri.

Panda’larda Naming Köşeleri için En İyi Uygulamalar

Bu makalenin renaming kılavuz bölümüne girmeden önce, burada pandalarda sütunlarınızı adlandırmak istediğiniz en iyi uygulamalar ve kongreler.

. Use descriptive names. Cryptic isimleri gibi col_1 Veri setinde bulunan veriler hakkında çok fazla bilgi iletmemek zordur.

sütunları adlandırmada yılan davasını kullanın. yılan durumunda, sütun isimleriniz böyle görünecek: number_of_people Bunun yerine bunun gibi NumberOfPeople .

yılan davası tercih edilirken, orijinal veri setinizin kullandığı adlandırma kongresini kullanmalısınız. Bu, veri setiniz ve Pandas’ DataFrame nesnesi arasında hareket ederken karışıklıktan kaçınır.

Kullandığınız kongreyi isimlendiren, veri kümesi boyunca tutarlı kalır. PascalCase ve yılan_case kullanarak bazı sütunları adlandırmaktan kaçının.

Son olarak, daha kısa isimleri kullanmaya çalışın. Bunlar kod önerisi ve dizüstü bilgisayarlarda tamamlanması genellikle altpar. Bu, bir not defterinde kodlamanın bir çok manuel kod yazmak gerektirdiği anlamına gelir ve daha kısa isimler hayatı daha kolay hale getirir.

Panda’larda Nasıl Rename Köşeleri

Bu makalenin içeriğini iki şekilde kullanabilirsiniz. İlk olarak, bunu referans olarak okuyabilirsiniz. İkincisi, takip edebilirsiniz, kodlama Ayrıca, bu yüzden tartışılan kavramları hatırlamak için daha iyi bir şansınız var. İkinci yöntemi öneririm.

Kod için Google Colab ile barındırılan bir not defteri kullanacağım. Bir tane de yaratabilir ve takip edebilirsiniz; tamamen ücretsizdir. Bu derste yazdığım tüm kodla not defteri mevcut. İşte burada burada .

Defteri kurmak

Pandas’taki kolonları yeniden başlatmadan önce, bazı örnek verileri not edelim. Aşağıdaki kodu kullanarak bir kod hücresi oluşturun ve pandas ithal edin.

1
import pandas as pd

Pandas ithal ettikten sonra, yükleyebilirsiniz california_housing_data Google Colab defteri oluştururken örnek bir veri kümesi olarak varsayılan olarak mevcut olan dataset.

1
housing_data = pd.read_csv('/content/sample_data/california_housing_train.csv')

Kod kullanarak veri kümesinin ilk birkaç satırını görebilirsiniz:

1
housing_data.head()

Aşağıdaki verilerle mevcut sütunları da listeleyebilirsiniz:

1
housing_data.columns

Bu aşağıdaki çıktıyı üretmelidir:

1
Index(['longitude', 'latitude', 'housing_median_age', 'total_rooms',       'total_bedrooms', 'population', 'households', 'median_income',       'median_house_value'],      dtype='object')

Bu, verilerinizin doğru yüklendiği anlamına gelir ve DataFrame ihtiyacımız olan şeye sahiptir.

Yöntem 1: Rename function

Pandastaki sütunları adlandırmanın en kolay yolu, kullanmak rename DataFrame nesnesinin yöntemi. Bu yöntemi kullanarak, sen rename İsim yöntemi çağırarak bir sütun. Yöntem birden fazla tartışmaya ihtiyaç duyar.

Bu durumda, bir sütunu yeniden kurmakla ilgileniyoruz, bu yüzden sütun anahtar kelime argümanına geçeceğiz. Bu argümanın değeri, girişlerin eski sütun isimlerinden yenilere haritasını temsil eden bir sözlüktir. İşte, adını verdiğimiz bir örnek. households sütuna houses .

1
housing_data.rename(columns={ 'households': 'houses' })

Bu aşağıdaki çıktıyı üretmelidir:

Housing data after renaming pandas dataframe column

Gördüğünüz gibi, anahtarın eski sütun adı olduğu bir sözlükte geçiyoruz ve değer yeni sütun adı. Değer sadece bir dize olmak zorunda değildir. Ayrıca fonksiyon tarafından iade edilen değerin yeni sütun adı olduğu bir işlev olabilir. Daha fazla sütun oluşturmak istiyorsanız, sözlüğe daha fazla giriş ekleyebilirsiniz.

Yöntem 2: Köşe Yaymasına Girin

Pandas’taki renaming sütunları için kullanabileceğiniz başka bir yöntem, bir DataFrame sütun dizesini değiştiriyor. Şu anda adı verilen sütunu yeniden adlandırmak istediğinizi varsayalım population toklanmak için number_of_people . Bu yöntemi kullanarak aşağıdaki kodu yazabilirsiniz:

1
housing_data.columns = housing_data.columns.str.replace('population', 'number_of_people')

Değiştirilen listeyi yazdırmak için aşağıdaki kodu kullanırız:

1
housing_data

Bu, aşağıdaki çıktıyı ekrana üretmelidir:

Screenshot-from-2023-04-04-07-35-06

Yöntem 3: Bir Köşe İsimleri Listesine kaydolun

Alternatif olarak, DataFrame’nin sütunlarına bir liste tayin ederek Panda’larda sütunları ekleyebilirsiniz. Bu örnek için, tüm sütunları yeniden adlandırmak istedim, böylece tüm sayıları kullanırlar, aşağıdaki kodu kullanabilirim:

1
housing_data.columns = [x for x in range(9)]

Bu örnekte, ben belirledim housing_data.columns 0 ila 8. Listeyi oluşturmak için, liste anlamayı kullandım, bu uygun şekilde bir değer listesi kullanarak uygun bir şekilde bir yerel Python özelliği for döngü.

Bu yöntemi kullanmanın dezavantajı, sütun isimlerinin tüm setlerini yeniden adlandırmanız gerekir; sadece sütunların bir alt kümesi olarak adlandırılamazsınız. İdeal olarak, sütun isimleriniz daha açıklayıcı bir şey olmalıdır, ama sadece bir gösteri olarak burada sayıları kullanıyorum.

Çıktıyı aşağıdaki yazı ile görebilirsiniz:

1
housing_data

Screenshot-from-2023-04-04-05-58-41

Yöntem 4: Set_axis() Pandas’taki Rename Sütunu Yeniden Tanımlamak

Tartışmamız gereken yöntem, DataFrame nesnesinin ayarlı yöntemidir. Bu yöntem, Pandas’daki iki eksenin herhangi biri için eksen değerleri olarak bir değerleri belirlemek için kullanılır. Renaming sütunları olduğumuz için, ayarlıyoruz axis 1 . Bu yöntemi kullanmak için aşağıdaki kodu kullanırız:

1
column_names = [str(x) for x in range(8, -1, -1)]housing_data.set_axis(column_names, axis=1, inplace=True)

İlk satır 8 ila 0 arasında bir değer listesi üretir ve onları depolar. column_names değişken. İkinci çizgide, set_ksi yöntemi diyoruz, sağlar column_names Bir argüman olarak ve eksen ayarlaması eksen 1 olarak değiştirilebilir. Biz de ayarlıyoruz inplace toklanmak için True Böylece orijinal DataFrame’yi modlar.

DataFrame’ı yazı ile görebiliriz:

1
housing_data

Bu aşağıdakileri üretmelidir:

Screenshot-from-2023-04-04-06-47-20

Son Kelimeler

Bu makale kısaca, verilerin pandalarda tabular formatında nasıl saklandığını tanıttı. Ayrıca, hayatlarımızı daha kolay hale getirmek için Pandas’taki sütunları isimlendirmek için en iyi uygulamaları tartıştık.

Son olarak ve en önemlisi, pandalarda renaming sütunlarının farklı yöntemlerini de tartıştık.

Sonraki, kontrol et Bir Pandas DataFrame [örneğin] nasıl oluşturulur .