Bu makale, Panda’larda sütunları nasıl yeniden adlandırmak için bir kılavuzdur.
Pandas, veri setleriyle uğraşmak için bir Python kütüphanesidir. Veriler farklı dosya formatlarından kolayca okur Kataloğu JSON ve SQL. Veriler Pandalara yüklenirken, bir DataFrame nesnesinde depolanır.
Bir DataFrame iki boyutlu bir nesnedir, yani veriler satırlar ve sütunlar ile masa gibi bir formatta depolanır. Bu, API’de verileri depolamak veya tablo dosyaları yaymak gibidir. Veriler yüklerken, pandalar veri set kaynağı dosyasından sütun isimlerini almaya çalışacak.
Ancak, yüklenen sütun isimleri ideal olmayabilir ve sütunları daha anlamlı bir şeye dönüştürmek isteyebilirsiniz.
Bu makalede ilk olarak Pandas sütunları adlandırmak için en iyi uygulamaları tartışacağız. Daha sonra, ana konuya gideceğiz, bu da onları yeniden adlandırmanın yöntemleri.
Panda’larda Naming Köşeleri için En İyi Uygulamalar
Bu makalenin renaming kılavuz bölümüne girmeden önce, burada pandalarda sütunlarınızı adlandırmak istediğiniz en iyi uygulamalar ve kongreler.
. Use descriptive names. Cryptic isimleri gibi col_1
Veri setinde bulunan veriler hakkında çok fazla bilgi iletmemek zordur.
sütunları adlandırmada yılan davasını kullanın. yılan durumunda, sütun isimleriniz böyle görünecek: number_of_people
Bunun yerine bunun gibi NumberOfPeople
.
yılan davası tercih edilirken, orijinal veri setinizin kullandığı adlandırma kongresini kullanmalısınız. Bu, veri setiniz ve Pandas’ DataFrame nesnesi arasında hareket ederken karışıklıktan kaçınır.
Kullandığınız kongreyi isimlendiren, veri kümesi boyunca tutarlı kalır. PascalCase ve yılan_case kullanarak bazı sütunları adlandırmaktan kaçının.
Son olarak, daha kısa isimleri kullanmaya çalışın. Bunlar kod önerisi ve dizüstü bilgisayarlarda tamamlanması genellikle altpar. Bu, bir not defterinde kodlamanın bir çok manuel kod yazmak gerektirdiği anlamına gelir ve daha kısa isimler hayatı daha kolay hale getirir.
Panda’larda Nasıl Rename Köşeleri
Bu makalenin içeriğini iki şekilde kullanabilirsiniz. İlk olarak, bunu referans olarak okuyabilirsiniz. İkincisi, takip edebilirsiniz, kodlama Ayrıca, bu yüzden tartışılan kavramları hatırlamak için daha iyi bir şansınız var. İkinci yöntemi öneririm.
Kod için Google Colab ile barındırılan bir not defteri kullanacağım. Bir tane de yaratabilir ve takip edebilirsiniz; tamamen ücretsizdir. Bu derste yazdığım tüm kodla not defteri mevcut. İşte burada burada .
Defteri kurmak
Pandas’taki kolonları yeniden başlatmadan önce, bazı örnek verileri not edelim. Aşağıdaki kodu kullanarak bir kod hücresi oluşturun ve pandas ithal edin.
|
|
Pandas ithal ettikten sonra, yükleyebilirsiniz california_housing_data
Google Colab defteri oluştururken örnek bir veri kümesi olarak varsayılan olarak mevcut olan dataset.
|
|
Kod kullanarak veri kümesinin ilk birkaç satırını görebilirsiniz:
|
|
Aşağıdaki verilerle mevcut sütunları da listeleyebilirsiniz:
|
|
Bu aşağıdaki çıktıyı üretmelidir:
|
|
Bu, verilerinizin doğru yüklendiği anlamına gelir ve DataFrame ihtiyacımız olan şeye sahiptir.
Yöntem 1: Rename function
Pandastaki sütunları adlandırmanın en kolay yolu, kullanmak rename
DataFrame nesnesinin yöntemi. Bu yöntemi kullanarak, sen rename
İsim yöntemi çağırarak bir sütun. Yöntem birden fazla tartışmaya ihtiyaç duyar.
Bu durumda, bir sütunu yeniden kurmakla ilgileniyoruz, bu yüzden sütun anahtar kelime argümanına geçeceğiz. Bu argümanın değeri, girişlerin eski sütun isimlerinden yenilere haritasını temsil eden bir sözlüktir. İşte, adını verdiğimiz bir örnek. households
sütuna houses
.
|
|
Bu aşağıdaki çıktıyı üretmelidir:
Gördüğünüz gibi, anahtarın eski sütun adı olduğu bir sözlükte geçiyoruz ve değer yeni sütun adı. Değer sadece bir dize olmak zorunda değildir. Ayrıca fonksiyon tarafından iade edilen değerin yeni sütun adı olduğu bir işlev olabilir. Daha fazla sütun oluşturmak istiyorsanız, sözlüğe daha fazla giriş ekleyebilirsiniz.
Yöntem 2: Köşe Yaymasına Girin
Pandas’taki renaming sütunları için kullanabileceğiniz başka bir yöntem, bir DataFrame sütun dizesini değiştiriyor. Şu anda adı verilen sütunu yeniden adlandırmak istediğinizi varsayalım population
toklanmak için number_of_people
. Bu yöntemi kullanarak aşağıdaki kodu yazabilirsiniz:
|
|
Değiştirilen listeyi yazdırmak için aşağıdaki kodu kullanırız:
|
|
Bu, aşağıdaki çıktıyı ekrana üretmelidir:
Yöntem 3: Bir Köşe İsimleri Listesine kaydolun
Alternatif olarak, DataFrame’nin sütunlarına bir liste tayin ederek Panda’larda sütunları ekleyebilirsiniz. Bu örnek için, tüm sütunları yeniden adlandırmak istedim, böylece tüm sayıları kullanırlar, aşağıdaki kodu kullanabilirim:
|
|
Bu örnekte, ben belirledim housing_data.columns
0 ila 8. Listeyi oluşturmak için, liste anlamayı kullandım, bu uygun şekilde bir değer listesi kullanarak uygun bir şekilde bir yerel Python özelliği for
döngü.
Bu yöntemi kullanmanın dezavantajı, sütun isimlerinin tüm setlerini yeniden adlandırmanız gerekir; sadece sütunların bir alt kümesi olarak adlandırılamazsınız. İdeal olarak, sütun isimleriniz daha açıklayıcı bir şey olmalıdır, ama sadece bir gösteri olarak burada sayıları kullanıyorum.
Çıktıyı aşağıdaki yazı ile görebilirsiniz:
|
|
Yöntem 4: Set_axis() Pandas’taki Rename Sütunu Yeniden Tanımlamak
Tartışmamız gereken yöntem, DataFrame nesnesinin ayarlı yöntemidir. Bu yöntem, Pandas’daki iki eksenin herhangi biri için eksen değerleri olarak bir değerleri belirlemek için kullanılır. Renaming sütunları olduğumuz için, ayarlıyoruz axis 1
. Bu yöntemi kullanmak için aşağıdaki kodu kullanırız:
|
|
İlk satır 8 ila 0 arasında bir değer listesi üretir ve onları depolar. column_names
değişken. İkinci çizgide, set_ksi yöntemi diyoruz, sağlar column_names
Bir argüman olarak ve eksen ayarlaması eksen 1 olarak değiştirilebilir. Biz de ayarlıyoruz inplace
toklanmak için True
Böylece orijinal DataFrame’yi modlar.
DataFrame’ı yazı ile görebiliriz:
|
|
Bu aşağıdakileri üretmelidir:
Son Kelimeler
Bu makale kısaca, verilerin pandalarda tabular formatında nasıl saklandığını tanıttı. Ayrıca, hayatlarımızı daha kolay hale getirmek için Pandas’taki sütunları isimlendirmek için en iyi uygulamaları tartıştık.
Son olarak ve en önemlisi, pandalarda renaming sütunlarının farklı yöntemlerini de tartıştık.
Sonraki, kontrol et Bir Pandas DataFrame [örneğin] nasıl oluşturulur .