Speech and Language Processing, Daniel Jurafsky and James H. Martin, 2025 (Pearson) - 一本内容全面的教科书,涵盖了所有基础的自然语言处理技术,包括词袋模型、TF-IDF、N-grams和LSA等文本表示方法。
Introduction to Information Retrieval, Christopher D. Manning, Prabhakar Raghavan, and Hinrich Schütze, 2008 (Cambridge University Press) - 一本信息检索领域的标准教科书,详细解释了词袋模型、TF-IDF和向量空间模型等文本表示方法。