tf-idf

    TF-IDF(Term Frequency - Inverse Document Frequency)

    TF-IDF(Term Frequency - Inverse Document Frequency)는 단어의 빈도와 역 문서 빈도를 사용하여 단어의 가중치를 나타내는 방법입니다. 간단하게 보겠습니다. 문서는 문장으로 이루어져 있습니다. 그리고 문장은 단어(term)로 구성됩니다. TF-IDF는 문서의 어떤 단어가 중요한지를 수치로 알려줍니다. 반대로 보면 단어가 문서에 대한 정보를 얼마나 가지고 있는가?를 의미합니다. 따라서 TF-IDF를 사용하여 문서와 단어의 관계를 수치로 확인할 수 있습니다. TF(Term Frequency) \(t\) : term \(d\) : document tf\((t,d)\) : \(d\)에 \(t\)가 나온 횟수 TF는 문서에 나온 단어의 빈도를 사용합니다. 문서에 어떤 단어가 많..