Coding

Membaca File .csv pada Python

Membaca File .csv pada Python

Dalam dunia pemrograman, file .csv (comma separated value) seringkali digunakan untuk merepresentasikan sebuah data. Format ini termasuk dalam standar file ASCII. Layaknya file .xls pada MS Excel atau format data JSON dalam JavaScript atau XML dalam penerapan web services.

File .csv merupakan format yang sederhana. Setiap baris dipisahkan dengan ganti baris (Enter) dan setiap kolom dipisahkan oleh tanda koma. Cara membuatnya pun sangat mudah, yaitu dengan menggunakan teks editor biasa, kemudian menyimpannya ke dalam ekstensi .csv. File .csv juga bisa didapatkan dengan cara mengekspor sebuah file MS Excel atau aplikasi pengolah data lainnya.

Keunggulan file .csv dibanding format data lainnya adalah soal kompatibilitas. File .csv dapat digunakan, diolah, diekspor/impor, dan dimodifikasi menggunakan berbagai macam perangkat lunak dan bahasa pemrograman, misalnya Microsoft Office, Notepad, UltraEdit, MySql, Oracle, OpenOffice, vim, dll.

Secara default, Python mempunyai kemampuan untuk membaca sebuah file .csv. Misal isi sebuah file contoh.csv adalah sebagai berikut:

nomor, nama klub, jumlah main, poin
1, Manchester City, 8, 19
2, Arsenal, 8, 18
3, Tottenham Hotspurs, 8, 18
4, Liverpool, 8, 17
5, Chelsea, 8, 16
6, Everton, 8, 15
7, Manchester United, 8, 14 
8, Southampton, 8, 12
9, AFC Bournemouth, 8, 12
10, Crystal Palace, 8, 11

Kode yang diperlukan untuk membaca file .csv tersebut yaitu sbb:

import csv
with open('contoh.csv') as csvfile:
readCSV = csv.reader(csvfile, delimiter=',')
for row in readCSV:
print(row)

Kode di atas memberikan perintah kepada console untuk membaca file .csv dengan cara memisahkan data berdasarkan tanda pemisah ‘,’.

Output script membaca file .csv di atas yaitu sebagai berikut:

Python mempunyai banyak modul siap pakai untuk analisis data, salah satunya adalah Pandas. Pandas dibangun di atas modul NumPy yang memiliki beberapa keunggulan, yaitu menawarkan struktur data yang kaya dan memiliki banyak fungsi siap pakai untuk bekerja dengan data secara cepat dan mudah.

Penggunaan API yang memiliki konsistensi tinggi membuatnya menjadi lebih mudah dipakai oleh para analis data.

Berikut adalah script untuk membaca file csv dengan modul Pandas.
import pandas as pd
df1=pd.read_csv("example.csv")
print(df1)

Output untuk script di atas tampak dalam gambar di bawah ini. Jika diperhatikan, output yang dikeluarkan lebih rapi dan lebih nyaman dibaca ketimbang script tanpa menggunakan modul Pandas.

Semoga bermanfaat.