Tuesday, October 8, 2019
Menampilkan data yang tepotong pada Pandas
Okay, kali ini kita akan belajar bagaimana menampilkan data secara keseluruhan. Pada posting kali ini yang akan digunakan adalah library Pandas,dan jupyter notebook.
kode 1:
menghitung jumlah row dan kolom
langkahnya :
a. bikin data dulu ya :
misal :
data karyawan
karyawan = [('jack', 34, 'Sydney', 5, 111, 112, 134, 122, 445, 122, 111, 15, 111, 112, 134, 122, 1445, 122, 111, 15, 111, 112, 134, 122, 445, 122, 111),
('Riti', 31, 'Delhiaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa', 27, 211, 212, 234, 222, 2445, 222, 211, 25, 211, 212, 234, 222, 2445, 222, 211, 25, 211, 212, 234, 222, 2445, 222, 211),
('Aadi', 16, 'Tokyo', 39, 311, 312, 334, 322, 3445, 322, 311, 35, 311, 312, 334, 322, 3445, 322, 311, 35,311, 312, 334, 322, 3445, 322, 311),
('Sunil', 41, 'Delhi', 412, 411, 412, 434, 422, 4445, 422, 411, 45, 411, 412, 434, 422, 4445, 422, 411,45, 411, 412, 434, 422, 4445, 422, 411),
('Veena', 33, 'Delhi', 54, 511, 512, 534, 522, 5445, 522, 511, 55, 511, 512, 534, 522, 5445, 522, 511,55, 511, 512, 534, 522, 5445, 522, 511),
('Shaunak', 35, 'Mumbai', 665, 611, 612, 634, 622, 6445, 622, 611, 65, 611, 612, 634, 622, 6445, 622,611, 65, 611, 612, 634, 622, 6445, 622, 611),
('Shaun', 35, 'Colombo', 711, 711, 712, 734, 722, 7445, 722, 711, 75, 711, 712, 734, 722, 7445, 722, 711,75, 711, 712, 734, 722, 7445, 722, 711)
]
Dibikin data frame dengan menggunakan pd.DataFrame(karyawan, column (nama kolom) = ['A'... sampai 'AA'])
empDfObj = pd.DataFrame(karyawan, columns=['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H', 'I', 'J', 'K', 'L', 'M', 'N', 'O', 'P','Q', 'R', 'S', 'T', 'U', 'V', 'W', 'X', 'Y', 'Z', 'AA'])
nambah row
empDfObj = empDfObj.append([empDfObj] * 8, ignore_index=True)
tampilkan jumlah kolom dan baris :
print('Jumlah kolom di Dataframe : ', len(empDfObj.columns))
print('Jumlah baris di Dataframe : ', len(empDfObj.index))
columns = kolom
index = row / baris
Tampilannya akan dipersingkat dan akan banyak yang disembunyikan
Pandas memiliki settingan tambahan untuk menampilkan isi data
pd.set_option(pat, value)
pat : display.max_rows, .max_columns, width.max_colwidth value : None, -1
pd.set_option('display.max_rows', None) menampilkan semua baris
pd.set_option('display.max_columns', None) menampilkan semua kolom (minimum kolom yang ditampilkan 10) , none dapat diganti angka diatas 10
pd.set_option('display.width', None)
pd.set_option('display.max_colwidth', -1)
Wednesday, October 2, 2019
Serendipity pada sistem rekomendasi
Sharing - sharing ah... setelah sekian lama ndak ngupdate Blog ini. Sekalian mendokumentasikan proses kepusingan dalam menyelesaikan tugas belajar. Fyi, saat ini saya baru berusaha untuk menyelesaikan tantangan. tantangan itu adalah mendapatkan apa yang dinamakan nilai "serendipity" dalam sistem rekomendasi. Jadi apa yang harus dipelajari :
1. apakah itu sistem rekomendasi ?
2. bagaimana cara kerja sistem rekomendasi ?
3. data apa yang akan dipakai ?
4. apakah serendipity ?
5. bagaimana menemukan serendipity ?
6. apa yang sudah dilakukan orang orang dalam upaya menemukan serendipity ?
7. alat apa yang dipakai untuk menemukan serendipity ?
8. apakah ukuran serendipity itu ?
Okayyy.... jadi dalam menjawab pertanyaan itu semua diawali dengan referensi yang akan dipakai, karena tanpa referensi sepertihalnya mo lomba tapi g ada titik startnya. hehehehe... gimana mo dimulai. Referensi yang dipake adalah data dari movielens yang berkaitan dengan sistem rekomendasi serendipity. ni link ke sumbernya: https://grouplens.org/datasets/serendipity-2018/
Next kita bongkar isinya, kita donwload paper yang berkaitan, kita pelajari then kita cari bagaimana cara mengimprovenya.
Subscribe to:
Comments (Atom)