Menghitung Term Frequency (tf)
Term frequency (tf) merupakan frekuensi kemunculan term (t) pada dokumen (d).
Contoh:
Terdapat kalimat:
Saya sedang belajar menghitung tf.idf. Tf.idf merupakan frekuensi
kemunculan term pada dokumen. Langkah awal perhitungan tersebut adalah
menghitung tf, kemudian menghitung df dan idf. Langkah terakhir
menghitung nilai tf.idf. Mari kita belajar!
Catatan: tiap kalimat dianggap sebagai dokumen.
Tentukan nilai tf!
Jawaban:
Jadi dokumen tiap kalimat ditandai:
Saya sedang belajar menghitung tf.idf. Tf.idf merupakan frekuensi kemunculan term pada dokumen. Langkah awal perhitungan tersebut adalah menghitung tf, kemudian menghitung df dan idf. Langkah terakhir menghitung nilai tf.idf. Mari kita belajar!
Tabel tf:
Menghitung document frequency (df)
Document frequency (df) adalah banyaknya dokumen dimana suatu term (t) muncul.
Contoh: Dari soal yang sama pada menghitung tf, tentukan nilai df!
Jawaban:
Nilai df:
Atau:
Menghitung invers document frequency (idf)
Contoh: Dari soal yang sama pada menghitung df, hitung nilai idf!
Jawaban:
Contoh: Dari soal yang sama pada menghitung df, hitung nilai idf! (dengan jumlah dokumen=N)
Jawaban:
Contoh: Dari soal yang sama pada menghitung df, hitung nilai idf! (N=1000)
Jawaban:
Menghitung tf.idf
Hasil kali tf x idf
Contoh: Dari soal yang sama pada menghitung df, hitung nilai tf.idf! (dengan jumlah dokumen=N)
Jawaban:
Download this article: Pembobotan tf.idf
Term "Hitung" kok df-nya 3 ya? Bukan 5?
BalasHapusMinta penjelasannya, trims 😃
https://temukembaliinformasi.wordpress.com/2009/08/26/pembobotan-tf-idf/
BalasHapusSilahkan dilihat pada comment halaman tersebut.
Semoga membantu.