Tuesday, October 8, 2019

Menampilkan data yang tepotong pada Pandas

Okay, kali ini kita akan belajar bagaimana menampilkan data secara keseluruhan. Pada posting kali ini yang akan digunakan adalah library Pandas,dan jupyter notebook. kode 1: menghitung jumlah row dan kolom langkahnya : a. bikin data dulu ya : misal : data karyawan karyawan = [('jack', 34, 'Sydney', 5, 111, 112, 134, 122, 445, 122, 111, 15, 111, 112, 134, 122, 1445, 122, 111, 15, 111, 112, 134, 122, 445, 122, 111), ('Riti', 31, 'Delhiaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa', 27, 211, 212, 234, 222, 2445, 222, 211, 25, 211, 212, 234, 222, 2445, 222, 211, 25, 211, 212, 234, 222, 2445, 222, 211), ('Aadi', 16, 'Tokyo', 39, 311, 312, 334, 322, 3445, 322, 311, 35, 311, 312, 334, 322, 3445, 322, 311, 35,311, 312, 334, 322, 3445, 322, 311), ('Sunil', 41, 'Delhi', 412, 411, 412, 434, 422, 4445, 422, 411, 45, 411, 412, 434, 422, 4445, 422, 411,45, 411, 412, 434, 422, 4445, 422, 411), ('Veena', 33, 'Delhi', 54, 511, 512, 534, 522, 5445, 522, 511, 55, 511, 512, 534, 522, 5445, 522, 511,55, 511, 512, 534, 522, 5445, 522, 511), ('Shaunak', 35, 'Mumbai', 665, 611, 612, 634, 622, 6445, 622, 611, 65, 611, 612, 634, 622, 6445, 622,611, 65, 611, 612, 634, 622, 6445, 622, 611), ('Shaun', 35, 'Colombo', 711, 711, 712, 734, 722, 7445, 722, 711, 75, 711, 712, 734, 722, 7445, 722, 711,75, 711, 712, 734, 722, 7445, 722, 711) ] Dibikin data frame dengan menggunakan pd.DataFrame(karyawan, column (nama kolom) = ['A'... sampai 'AA']) empDfObj = pd.DataFrame(karyawan, columns=['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H', 'I', 'J', 'K', 'L', 'M', 'N', 'O', 'P','Q', 'R', 'S', 'T', 'U', 'V', 'W', 'X', 'Y', 'Z', 'AA']) nambah row empDfObj = empDfObj.append([empDfObj] * 8, ignore_index=True) tampilkan jumlah kolom dan baris : print('Jumlah kolom di Dataframe : ', len(empDfObj.columns)) print('Jumlah baris di Dataframe : ', len(empDfObj.index)) columns = kolom index = row / baris Tampilannya akan dipersingkat dan akan banyak yang disembunyikan Pandas memiliki settingan tambahan untuk menampilkan isi data pd.set_option(pat, value) pat : display.max_rows, .max_columns, width.max_colwidth value : None, -1 pd.set_option('display.max_rows', None) menampilkan semua baris pd.set_option('display.max_columns', None) menampilkan semua kolom (minimum kolom yang ditampilkan 10) , none dapat diganti angka diatas 10 pd.set_option('display.width', None) pd.set_option('display.max_colwidth', -1)

Wednesday, October 2, 2019

Serendipity pada sistem rekomendasi

Sharing - sharing ah... setelah sekian lama ndak ngupdate Blog ini. Sekalian mendokumentasikan proses kepusingan dalam menyelesaikan tugas belajar. Fyi, saat ini saya baru berusaha untuk menyelesaikan tantangan. tantangan itu adalah mendapatkan apa yang dinamakan nilai "serendipity" dalam sistem rekomendasi. Jadi apa yang harus dipelajari : 1. apakah itu sistem rekomendasi ? 2. bagaimana cara kerja sistem rekomendasi ? 3. data apa yang akan dipakai ? 4. apakah serendipity ? 5. bagaimana menemukan serendipity ? 6. apa yang sudah dilakukan orang orang dalam upaya menemukan serendipity ? 7. alat apa yang dipakai untuk menemukan serendipity ? 8. apakah ukuran serendipity itu ? Okayyy.... jadi dalam menjawab pertanyaan itu semua diawali dengan referensi yang akan dipakai, karena tanpa referensi sepertihalnya mo lomba tapi g ada titik startnya. hehehehe... gimana mo dimulai. Referensi yang dipake adalah data dari movielens yang berkaitan dengan sistem rekomendasi serendipity. ni link ke sumbernya: https://grouplens.org/datasets/serendipity-2018/ Next kita bongkar isinya, kita donwload paper yang berkaitan, kita pelajari then kita cari bagaimana cara mengimprovenya.