Cari Blog Ini

Jumat, 21 Oktober 2011

konsep pembobotan tf.idf

Menghitung Term Frequency (tf)
Term frequency (tf) merupakan frekuensi kemunculan term (t) pada dokumen (d).
Contoh:
Terdapat kalimat:
Saya sedang belajar menghitung tf.idf. Tf.idf merupakan frekuensi kemunculan term pada dokumen. Langkah awal perhitungan tersebut adalah menghitung tf, kemudian menghitung df dan idf. Langkah terakhir menghitung nilai tf.idf. Mari kita belajar!
Catatan: tiap kalimat dianggap sebagai dokumen.
Tentukan nilai tf!
Jawaban:
Jadi dokumen tiap kalimat ditandai:
Saya sedang belajar menghitung tf.idf. Tf.idf merupakan frekuensi kemunculan term pada dokumen. Langkah awal perhitungan tersebut adalah menghitung tf, kemudian menghitung df dan idf. Langkah terakhir menghitung nilai tf.idf. Mari kita belajar!
Tabel tf:
10_1
Menghitung document  frequency (df)
Document  frequency (df) adalah banyaknya dokumen dimana suatu term (t) muncul.
Contoh: Dari soal yang sama pada menghitung tf, tentukan nilai df!
Jawaban:
Nilai df:
10_2
Atau:
10_3
Menghitung invers document frequency (idf)
10_4
Contoh: Dari soal yang sama pada menghitung df, hitung nilai idf!
Jawaban:
10_5
Contoh: Dari soal yang sama pada menghitung df, hitung nilai idf! (dengan jumlah dokumen=N)
Jawaban:
Contoh: Dari soal yang sama pada menghitung df, hitung nilai idf! (N=1000)
Jawaban:
10_6
Menghitung tf.idf
Hasil kali tf x idf
Contoh: Dari soal yang sama pada menghitung df, hitung nilai tf.idf! (dengan jumlah dokumen=N)
Jawaban:
10_7
10_8
Download this article: Pembobotan tf.idf

2 komentar:

  1. Term "Hitung" kok df-nya 3 ya? Bukan 5?
    Minta penjelasannya, trims 😃

    BalasHapus
  2. https://temukembaliinformasi.wordpress.com/2009/08/26/pembobotan-tf-idf/

    Silahkan dilihat pada comment halaman tersebut.
    Semoga membantu.

    BalasHapus